ტექსტის ამოცნობა. უფასო პროგრამა - FineReader- ის ანალოგი

Pin
Send
Share
Send

ადრე თუ გვიან, ყველას, ვინც ხშირად მუშაობს საოფისე პროგრამებთან, წინაშე დგას ტიპიური ამოცანა - წიგნის, ჟურნალის, გაზეთის, მხოლოდ ბროშურების ტექსტის სკანირება და შემდეგ ამ სურათების თარგმნა ტექსტურ ფორმატში, მაგალითად, Word დოკუმენტში.

ამისათვის თქვენ გჭირდებათ სკანერი და სპეციალური პროგრამა ტექსტის ამოცნობისთვის. ამ სტატიაში განვიხილავთ FineReader– ს უფასო კოლეგას -ლურსმული (FineReader- ში აღიარების შესახებ - იხილეთ ეს სტატია).

დავიწყოთ ...

შინაარსი

  • 1. CuneiForm პროგრამის მახასიათებლები, მახასიათებლები
  • 2. ტექსტის ამოცნობის მაგალითი
  • 3. სურათების ტექსტის ამოცნობა
  • 4. დასკვნები

1. CuneiForm პროგრამის მახასიათებლები, მახასიათებლები

ლურსმული

თქვენ შეგიძლიათ გადმოწეროთ დეველოპერის საიტიდან: //cognitiveforms.com/

ღია კოდის ამოცნობის პროგრამა. გარდა ამისა, იგი მუშაობს Windows- ის ყველა ვერსიაში: XP, Vista, 7, 8, რაც სასიამოვნოა. გარდა ამისა, დაამატეთ პროგრამის სრული რუსული თარგმანი!

დადებითი:

- მსოფლიოს 20 პოპულარულ ენაზე ტექსტის ამოცნობა (თავად ინგლისური და რუსული შედის ამ რიცხვში);

- უზარმაზარი მხარდაჭერა სხვადასხვა ბეჭდვითი შრიფტისთვის;

- შეამოწმეთ აღიარებული ტექსტის ლექსიკონი;

- მუშაობის შედეგების შენახვის შესაძლებლობა რამდენიმე გზით;

- დოკუმენტის სტრუქტურის დაცვა;

- დიდი მხარდაჭერა და მაგიდის ამოცნობა.

Cons:

- არ უჭერს მხარს ძალიან დიდ დოკუმენტებს და ფაილებს (400 დპიზე მეტი);

- უშუალოდ არ უჭერს მხარს სკანერების გარკვეულ ტიპებს (კარგად, ეს არც ისე დიდი საქმეა. სკანერის სპეციალურ პროგრამაში შედის სკანერის დრაივერები);

- დიზაინი არ ბრწყინავს (მაგრამ ვის სჭირდება ეს, თუ პროგრამა სრულად აგვარებს პრობლემას).

2. ტექსტის ამოცნობის მაგალითი

ჩვენ ვთვლით, რომ თქვენ უკვე მიგიღიათ საჭირო სურათები ცნობისთვის (იქვე დასკანერებულად, ან გადმოწერეთ წიგნი pdf / djvu ფორმატით ინტერნეტში და ამოიღეთ საჭირო სურათები მათგან. როგორ გავაკეთოთ ეს, იხილეთ ეს სტატია).

1) გახსენით სასურველი სურათი CuineForm პროგრამაში (ფაილი / გახსნა ან "Cntrl + O").

2) აღიარების დასაწყებად - პირველ რიგში უნდა აირჩიოთ სხვადასხვა სფეროები: ტექსტი, სურათები, ცხრილები და ა.შ., Cuneiform პროგრამაში, ეს შეიძლება გაკეთდეს არა მხოლოდ ხელით, არამედ ავტომატურად! ამისათვის დააჭირეთ ღილაკს "განლაგება" ფანჯრის ზედა პანელში.

3) 10-15 წამის შემდეგ. პროგრამა ავტომატურად ხაზს უსვამს ყველა ფერს სხვადასხვა ფერში. მაგალითად, ტექსტის არეალი ხაზგასმულია ლურჯ ფერში. სხვათა შორის, მან ხაზი გაუსვა ყველა სფერულს სწორად და სწრაფად. პატიოსნად, მისგან ასეთ სწრაფ და სწორ რეაქციას არ ველოდი ...

4) მათთვის, ვინც არ ენდობა ავტომატური განლაგება, შეგიძლიათ გამოიყენოთ სახელმძღვანელო. ამისათვის, არსებობს ინსტრუმენტთა პანელი (იხ. სურათი ქვემოთ), რომლის წყალობით შეგიძლიათ აირჩიოთ: ტექსტი, ცხრილი, სურათი. გადაიტანეთ, გაზარდეთ / შეამცირეთ თავდაპირველი სურათი, დაასხით კიდეები. ზოგადად, კარგი ნაკრები.

5) მას შემდეგ, რაც ყველა სფერო აღინიშნა, ჩვენ შეგვიძლია გავაგრძელოთ გაგრძელება აღიარება. ამისათვის უბრალოდ დააჭირეთ ღილაკს იმავე სახელწოდებით, როგორც ქვემოთ მოცემულ სურათზე.

6) სიტყვასიტყვით 10-20 წამში. თქვენ ნახავთ დოკუმენტს Microsoft Word- ში, აღიარებული ტექსტით. საინტერესოა, რომ ამ მაგალითისთვის ტექსტში, რა თქმა უნდა, იყო შეცდომები, მაგრამ მათ შორის ძალიან ცოტაა! უფრო მეტიც, იმის გათვალისწინებით, თუ რა არაპროგნოზირების ხარისხში იყო წყარო მასალა - სურათი.

სიჩქარე და ხარისხი საკმაოდ შედარებულია FineReader– სთან!

3. სურათების ტექსტის ამოცნობა

ამ პროგრამის ფუნქცია შეიძლება მოხერხდეს, როდესაც საჭიროა ერთდროულად აღიაროთ არა ერთი სურათი, არამედ რამდენიმე. დაწყებითი მენიუში ჩვეულებრივ იმალება ნაკრების ამოცნობის დაწყების მალსახმობი.

1) პროგრამის გახსნის შემდეგ, თქვენ უნდა შექმნათ ახალი პაკეტი, ან გახსნათ ადრე შენახული. ჩვენს მაგალითში შექმენით ახალი.

2) შემდეგ ეტაპზე ჩვენ ვაძლევთ მას სახელს, სასურველია ის, რაც იხსენებს იმას, რაც მასში ინახება ექვსი თვის შემდეგ.

3) შემდეგ, შეარჩიეთ დოკუმენტის ენა (რუსულ-ინგლისური), მიუთითეთ თუ არა თქვენს დასკანერებულ მასალაში გამოსახულებები და ცხრილი.

4) ახლა თქვენ უნდა მიუთითოთ საქაღალდე, რომელშიც მდებარეობს ფაილების ამოცნობა. სხვათა შორის, რაც საინტერესოა, პროგრამა თავად ნახავს ყველა სურათს და სხვა გრაფიკულ ფაილს, რომელსაც შეუძლია მისი ამოცნობა და პროექტში დამატება. თქვენ უბრალოდ უნდა ამოიღოთ ზედმეტი.

5) შემდეგი ნაბიჯი არ არის მნიშვნელოვანი - შეარჩიეთ რა უნდა გააკეთოთ წყაროს ფაილებთან, აღიარების შემდეგ. გირჩევთ შეარჩიოთ ყუთი "არაფრის გაკეთება".

6) რჩება მხოლოდ იმ ფორმატის არჩევა, რომელშიც შეინახება აღიარებული დოკუმენტი. არსებობს რამდენიმე ვარიანტი:

- rtf - ფაილი სიტყვიერი დოკუმენტიდან, რომელიც გაიხსნა ყველა პოპულარულ ოფისში (უფასო პირთა ჩათვლით, პროგრამების ბმული);

- txt - ტექსტის ფორმატი, შეგიძლიათ შეინახოთ მასში მხოლოდ ტექსტი, სურათები და ცხრილი არ შეიძლება იყოს;

- ჰტმ - ჰიპერტექსტის გვერდი, მოსახერხებელია, თუ საიტის ფაილების სკანირების და ამოცნობის მიზნით. ჩვენ ჩვენს მაგალითში შეარჩევს მას.

7) ღილაკზე "დასრულების" დაჭერის შემდეგ დაიწყება თქვენი პროექტის დამუშავების პროცესი.

8) პროგრამა საკმაოდ სწრაფად მუშაობს. აღიარების შემდეგ, თქვენს წინ გამოჩნდება htm ფაილების ჩანართი. თუ დააჭირეთ ასეთ ფაილს, ბრაუზერი იწყება, სადაც ნახავთ შედეგებს. სხვათა შორის, ამან შეფუთვა შეიძლება შენახული იყოს მასთან ერთად.

9) როგორც ხედავთ, შედეგები ნამუშევარი ძალიან შთამბეჭდავია. პროგრამამ ადვილად აღიარა სურათი, ხოლო მის ქვემოთ ტექსტი მარტივად იქნა აღიარებული. იმისდა მიუხედავად, რომ პროგრამა უფასოა, ის ზოგადად სუპერა!

4. დასკვნები

თუ თქვენ ხშირად არ ათვლით დოკუმენტებს და არ ამოიცნობთ, FineReader პროგრამის ყიდვას ალბათ აზრი არ აქვს. დავალებების უმეტესობას მარტივად ასრულებს CuneiForm.

მეორეს მხრივ, მას ასევე აქვს უარყოფითი მხარეები.

პირველ რიგში, შედეგების რედაქტირებისა და შემოწმების ძალიან ცოტა ინსტრუმენტი არსებობს. მეორეც, როდესაც უამრავი სურათის ამოცნობა გიწევთ, FineReader- ში უფრო მოსახერხებელია დაუყოვნებლივ დაათვალიეროთ პროექტში დასძინა ყველაფერი, მარჯვნივ სვეტში: სწრაფად ამოიღოთ არასაჭიროები, გააკეთოთ კორექტივები და ა.შ., და მესამე, CuneiForm კარგავს საბუთების აღიარებას: მე უნდა მოვიტანო დოკუმენტი მხედველობაში - შეცდომების შეცვლა, პუნქტუაციის ნიშანი, ციტირების ნიშანი და ა.შ.

ეს ყველაფერია. იცით თუ არა სხვა ღირსეული უფასო ტექსტის აღიარების პროგრამა?

Pin
Send
Share
Send