მივესალმოთ ბლოგის ყველა მკითხველს!
მე ვფიქრობ, რომ ისინი, ვინც ხშირად მუშაობენ კომპიუტერში (არ თამაშობენ, კერძოდ მუშაობენ), ტექსტის ამოცნობასთან ჰქონდა საქმე. მაგალითად, თქვენ დასკანერებული ჩანართი წიგნიდან და ახლა თქვენ უნდა ჩადოთ ეს ნაწილი თქვენს დოკუმენტში. მაგრამ დასკანერებული დოკუმენტი არის სურათი, და ჩვენ გვჭირდება ტექსტი - ამისათვის გვჭირდება სპეციალური პროგრამები და ონლაინ სერვისები სურათებისგან ტექსტის ამოცნობის მიზნით.
აღიარების პროგრამების შესახებ, მე წინა პოსტებში უკვე დავწერე:
- ტექსტის სკანირება და აღიარება FineReader– ში (ფასიანი პროგრამა);
- მუშაობა ანალოგური FineReader - CuneiForm (უფასო პროგრამა).
ამავე სტატიაში ვისურვებდი ინტერნეტ სერვისებს, ტექსტის ამოცნობისთვის. ყოველივე ამის შემდეგ, თუ საჭიროა სწრაფად მიიღოთ ტექსტი 1-2 სურათით - არ არის არანაირი აზრი, რომ შეწუხდეთ სხვადასხვა პროგრამების ინსტალაციით ...
მნიშვნელოვანია! აღიარების ხარისხი (შეცდომების რაოდენობა, წაკითხვის შესაძლებლობა და ა.შ.) ძალზე დამოკიდებულია სურათის თავდაპირველ ხარისხზე. ამიტომ, სკანირებისას (ფოტოს გადაღება და ა.შ.) შეარჩიეთ რაც შეიძლება მაღალი ხარისხი. უმეტეს შემთხვევაში, 300-400 dpi- ის ხარისხი საკმარისი იქნება (dpi არის პარამეტრი, რომელიც ახასიათებს გამოსახულების ხარისხს. თითქმის ყველა სკანერის პარამეტრებში, ეს პარამეტრი ჩვეულებრივ მითითებულია).
ონლაინ მომსახურება
იმისათვის, რომ მეჩვენებინა როგორ მუშაობს მომსახურება, გადავიღე ჩემი ერთ-ერთი სტატიის ეკრანული სურათი. ამ ეკრანის ატვირთვა აისახება ყველა სერვისზე, რომელთა აღწერა ქვემოთ მოცემულია.
1) //www.ocrconvert.com/
მე ნამდვილად მომწონს ეს მომსახურება მისი სიმარტივის გამო. საიტი, მართალია ინგლისური, მაგრამ კარგად მუშაობს რუსულ ენაზე. რეგისტრაცია არ არის საჭირო. აღიარების დასაწყებად, თქვენ უნდა გააკეთოთ 3 მოქმედება:
- ატვირთეთ თქვენი სურათი;
- შეარჩიეთ სურათში მოცემული ტექსტის ენა;
- დააჭირეთ აღიარების დაწყების ღილაკს.
ფორმატების მხარდაჭერა: PDF, GIF, BMP, JPEG.
შედეგი მოცემულია სურათზე ქვემოთ. უნდა ითქვას, რომ ტექსტი საკმაოდ კარგად არის აღიარებული. გარდა ამისა, ძალიან სწრაფად - ველოდი სიტყვასიტყვით 5-10 წამს.
2) //www.i2ocr.com/
ეს სერვისი მუშაობს ზემოთქმულის მსგავსად. აქ თქვენ ასევე უნდა გადმოწეროთ ფაილი, შეარჩიოთ აღიარების ენა და დააჭირეთ ამონაწერის ტექსტის ღილაკს. მომსახურება ძალიან სწრაფად მუშაობს: 5-6 წამი. ერთი გვერდი.
მხარდაჭერილი ფორმატები: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.
ამ ონლაინ სერვისის შედეგი ბევრად უფრო მოსახერხებელია: თქვენ დაუყოვნებლივ ხედავთ ორ ფანჯარას - პირველში, აღიარების შედეგს, მეორეში - ორიგინალურ გამოსახულებას. ამიტომ, რედაქტირების გაკეთება ადვილია. სხვათა შორის, სერვისით რეგისტრაცია ასევე არ არის აუცილებელი.
3) //www.newocr.com/
ეს მომსახურება უნიკალურია რამდენიმე გზით. პირველ რიგში, იგი მხარს უჭერს "newfangled" DJVU ფორმატს (სხვათა შორის, ფორმატის სრული სია: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). მეორეც, იგი მხარს უჭერს სურათში ტექსტური ზონების შერჩევას. ეს ძალიან სასარგებლოა, როდესაც სურათში არა მხოლოდ ტექსტური ადგილები გაქვთ, არამედ გრაფიკული ადგილები, რომელთა ამოცნობა არ გჭირდებათ.
აღიარების ხარისხი საშუალოზე მაღალია, რეგისტრაციის გაკეთება საჭირო არ არის.
4) //www.free-ocr.com/
ცნობისთვის ძალიან მარტივი სერვისი: ატვირთეთ სურათი, მიუთითეთ ენა, შეიყვანეთ captcha (სხვათა შორის, ამ სტატიაში ერთადერთი სერვისი, თუ როგორ უნდა გავაკეთოთ ეს), და დააჭირეთ ღილაკს გამოსახულების ტექსტად გადათვლისთვის. სინამდვილეში ყველაფერი!
მხარდაჭერილი ფორმატები: PDF, JPG, GIF, TIFF, BMP.
აღიარების შედეგი საშუალოა. არის შეცდომები, მაგრამ ბევრი არა. ამასთან, თუ ორიგინალური ეკრანის ხარისხი უფრო მაღალი იყო, უფრო მეტი შეცდომის შემთხვევაშიც შეინიშნება.
პ.ს.
ეს ყველაფერი დღეს არის. თუ იცით უფრო საინტერესო სერვისები ტექსტის აღიარებისთვის - გაითვალისწინეთ კომენტარი, მადლობელი ვიქნები. ერთი პირობა: სასურველია, რომ არ დაგჭირდეთ დარეგისტრირება და მომსახურება უფასოა.
ყველაფერი საუკეთესო!