როგორ ამოვიცნოთ PDF ფაილი ინტერნეტით

Send

შორს არის ყოველთვის შესაძლებელი PDF ფაილიდან ტექსტის ამოღება რეგულარული გადაწერის გამოყენებით. ხშირად ასეთი დოკუმენტების გვერდები დასკანერებულია მათი ქაღალდის ვერსიების შინაარსში. ასეთი ფაილების სრულად რედაქტირებად ტექსტურ მონაცემებად გადაქცევისთვის გამოიყენება სპეციალური პროგრამები ოპტიკური ხასიათის ამოცნობის (OCR) ფუნქციით.

ასეთი გადაწყვეტილებების განხორციელება ძალზე რთულია და, შესაბამისად, ძვირი ჯდება. თუ საჭიროა PDF– დან ტექსტის რეგულარულად ამოცნობა, სათანადო პროგრამის შეძენა მიზანშეწონილია. იშვიათი შემთხვევებისთვის, უფრო ლოგიკური იქნება მსგავსი ფუნქციების მქონე ერთ-ერთი ხელმისაწვდომი ონლაინ სერვისის გამოყენება.

როგორ ამოვიცნოთ ტექსტი PDF ინტერნეტით

რა თქმა უნდა, OCR ონლაინ სერვისის მახასიათებლების სპექტრი, სრულფასოვანი დესკტოპის გადაწყვეტილებებთან შედარებით, უფრო შეზღუდულია. მაგრამ თქვენ ასევე შეგიძლიათ იმუშაოთ ასეთი რესურსებით ან უფასოდ ან ნომინალური გადასახადი. მთავარია, რომ მათი მთავარი ამოცანა, კერძოდ ტექსტის ამოცნობა, შესაბამისი ვებ – პროგრამებიც გაუმკლავდებიან.

მეთოდი 1: ABBYY FineReader ინტერნეტით

მომსახურების განვითარების კომპანია ოპტიკური დოკუმენტის ამოცნობის სფეროში ერთ – ერთი ლიდერია. ABBYY FineReader Windows- ისა და Mac- ისთვის ძლიერი გამოსავალია PDF– ის ტექსტად გადაყვანისთვის და მასთან მუშაობის შემდგომი მუშაობისთვის

პროგრამის ვებსაიტზე დაფუძნებული ანალოგი, რა თქმა უნდა, ფუნქციონალურია მასში inferior. მიუხედავად ამისა, მომსახურებას შეუძლია ტექსტის ამოცნობა სკანირებისა და ფოტოების 190-ზე მეტ ენაზე. გადაიყვანეთ PDF ფაილები Word, Excel და ა.შ. დოკუმენტები.

ABBYY FineReader ონლაინ ონლაინ სერვისი

სანამ დაიწყებთ ხელსაწყოს მუშაობას, შექმენით ანგარიში საიტზე ან შეხვიდეთ თქვენი Facebook, Google ან Microsoft ანგარიშის გამოყენებით.

ავტორიზაციის ფანჯარაში გადასასვლელად დააჭირეთ ღილაკს "შესასვლელი" მენიუს ზედა ზოლში.
შესვლის შემდეგ, ღილაკის გამოყენებით შემოიტანეთ სასურველი PDF – დოკუმენტი FineReader– ში "ფაილების ატვირთვა".

შემდეგ დააჭირეთ "გვერდის ნომრების არჩევა" და მიუთითეთ სასურველი ინტერვალი ტექსტის აღიარებისთვის.
შემდეგი, შეარჩიეთ დოკუმენტში არსებული ენები, შედეგად მიღებული ფაილის ფორმატი და დააჭირეთ ღილაკს "ამოცნობა".
დამუშავების შემდეგ, რომლის ხანგრძლივობა მთლიანად დამოკიდებულია დოკუმენტის მოცულობაზე, შეგიძლიათ ჩამოტვირთოთ მზა ფაილი ტექსტური მონაცემებით, უბრალოდ მისი სახელის დაჭერით.

ან გაიტანეთ იგი ერთ-ერთ შესაძლო ღრუბლოვან სერვისში.

სერვისი ალბათ გამოირჩევა ყველაზე ზუსტი ტექსტის ამოცნობის ალგორითმით გამოსახულებებზე და PDF ფაილებზე. სამწუხაროდ, მისი უფასო გამოყენება თვეში მხოლოდ დამუშავებული ხუთი გვერდით შემოიფარგლება. უფრო მოცულობითი დოკუმენტებით მუშაობისთვის, თქვენ მოგიწევთ წლიური გამოწერის შეძენა.

ამასთან, თუ OCR იშვიათად არის საჭირო, ABBYY FineReader Online შესანიშნავი ვარიანტია მცირე ზომის PDF ფაილებიდან ტექსტის მოპოვებისთვის.

მეთოდი 2: უფასო ონლაინ OCR

მარტივი და მოსახერხებელი სერვისი ტექსტის ციფრული გადაღებისთვის. რეგისტრაციის გარეშე, რესურსი საშუალებას გაძლევთ საათში ამოიცნოთ 15 სრული PDF გვერდი. უფასო ონლაინ OCR სრულად მუშაობს დოკუმენტებთან 46 ენაზე და ავტორიზაციის გარეშე მხარს უჭერს ტექსტის ექსპორტის სამ ფორმატს - DOCX, XLSX და TXT.

რეგისტრაციისას, მომხმარებელს შესაძლებლობა აქვს დაამუშავოს მრავალგვერდიანი დოკუმენტები, მაგრამ ამ იმავე გვერდების უფასო რაოდენობა შემოიფარგლება 50 ერთეულით.

უფასო ონლაინ OCR ონლაინ სერვისი

PDF– ისგან როგორც „სტუმრის“ სტატუსის ამოცნობა, რესურსზე ნებართვის გარეშე, გამოიყენეთ შესაბამისი ფორმა საიტის მთავარ გვერდზე.

აირჩიეთ სასურველი დოკუმენტი ღილაკის გამოყენებით ფაილიმიუთითეთ ტექსტის ძირითადი ენა, გამომავალი ფორმატი, შემდეგ დაელოდეთ ფაილის დატვირთვას და დააჭირეთ ღილაკს კონვერტირება.
დიგიტალიზაციის პროცესის ბოლოს დააჭირეთ ღილაკს "გადმოწერეთ გამომავალი ფაილი" მზა დოკუმენტის შენახვა კომპიუტერზე ტექსტით.

უფლებამოსილი მომხმარებლებისთვის, მოქმედებების თანმიმდევრობა გარკვეულწილად განსხვავებულია.

გამოიყენეთ ღილაკი "რეგისტრაცია" ან "შესასვლელი" მენიუს ზედა ბარში, შესაბამისად, შექმენით უფასო ონლაინ OCR ანგარიში ან შედით მასში.
აღიარების პანელში ავტორიზაციის შემდეგ, დააჭირეთ ღილაკს CTRL, მოყვანილი ჩამონათვლიდან შეარჩიეთ წყარო დოკუმენტის ორ ენაზე.
მიუთითეთ PDF– ისგან ტექსტის ამოღების შემდგომი ვარიანტები და დააჭირეთ ღილაკს აირჩიეთ ფაილი სერვისში დოკუმენტის ატვირთვა.

შემდეგ, აღიარების დასაწყებად დააჭირეთ ღილაკს კონვერტირება.
დოკუმენტის დამუშავების ბოლოს დააჭირეთ შესაბამის სვეტში გამომავალი ფაილის სახელის ბმულს.

აღიარების შედეგი დაუყოვნებლივ შეინახება თქვენი კომპიუტერის მეხსიერებაში.

თუ საჭიროა ტექსტის ამონაწერი მცირე PDF – დოკუმენტიდან, შეგიძლიათ უსაფრთხოდ მიმართოთ ზემოხსენებული ინსტრუმენტის გამოყენებას. მოცულობითი ფაილებით მუშაობისთვის, მოგიწევთ დამატებითი სიმბოლოების ყიდვა Free Online OCR– ში, ან გამოიყენოთ სხვა გამოსავალი.

მეთოდი 3: NewOCR

სრულიად უფასო OCR სერვისი, რომელიც საშუალებას გაძლევთ ამონაწერი ტექსტი თითქმის ნებისმიერი გრაფიკული და ელექტრონული დოკუმენტიდან, როგორიცაა DjVu და PDF. რესურსი არ ითვალისწინებს შეზღუდვებს აღიარებული ფაილების ზომაზე და რაოდენობებზე, არ საჭიროებს რეგისტრაციას და გთავაზობთ დაკავშირებული ფუნქციების ფართო სპექტრს.

NewOCR მხარს უჭერს 106 ენას და შეუძლია სწორად დაამუშავოს თუნდაც დაბალი ხარისხის დოკუმენტების სკანირება. შესაძლებელია ფაილის გვერდზე ტექსტის ამოცნობის არეალის ხელით შერჩევა.

NewOCR ონლაინ სერვისი

ასე რომ, დაუყოვნებლივ შეგიძლიათ დაიწყოთ რესურსთან მუშაობა, ზედმეტი მოქმედებების შესრულების აუცილებლობის გარეშე.

მთავარ გვერდზე მოცემულია დოკუმენტი საიტზე შესასვლელად. ფაილის NewOCR ატვირთვისთვის გამოიყენეთ ღილაკი "ფაილის არჩევა" განყოფილებაში "აირჩიეთ თქვენი ფაილი". შემდეგ მინდორში "აღიარების ენა (ენები)" მიუთითეთ წყაროს დოკუმენტის ერთი ან რამდენიმე ენა, შემდეგ დააჭირეთ ღილაკს "ატვირთვა + OCR".
დააყენეთ სასურველი აღიარების პარამეტრები, შეარჩიეთ გვერდი, საიდანაც გსურთ ტექსტის ამოღება და დააჭირეთ ღილაკს OCR.
გვერდზე ოდნავ გადადით და დააჭირეთ ღილაკს "ჩამოტვირთვა".

დააჭირეთ მასზე და ჩამოსაშლელ სიაში შეარჩიეთ ჩამოტვირთვისთვის საჭირო დოკუმენტის ფორმატი. ამის შემდეგ, მოპოვებული ტექსტით დასრულებული ფაილი გადმოწერილი იქნება თქვენს კომპიუტერში.

ინსტრუმენტი არის მოსახერხებელი და საკმაოდ მაღალი ხარისხის აღიარებს ყველა სიმბოლოს. ამასთან, იმპორტირებული PDF დოკუმენტის თითოეული გვერდის დამუშავება დამოუკიდებლად უნდა დაიწყოს და ის ცალკე ფაილში ჩანს. თქვენ, რა თქმა უნდა, დაუყოვნებლივ შეგიძლიათ კოპირება აღიარების შედეგების ბუფერში და დააკავშიროთ ისინი სხვებთან.

მიუხედავად ამისა, ზემოთ აღწერილი ნიუანსიდან გამომდინარე, ძალიან რთულია NewOCR– ის გამოყენებით დიდი რაოდენობით ტექსტის მოპოვება. მცირე ფაილებით, სერვისს კოპირება აქვს.

მეთოდი 4: OCR.Space

მარტივი და გასაგები რესურსი ტექსტის ციფრული ჩასატარებლად, ეს საშუალებას გაძლევთ აღიაროთ PDF დოკუმენტები და გამოიტანოთ შედეგი TXT ფაილზე. გვერდების რაოდენობაზე შეზღუდვები არ არის გათვალისწინებული. ერთადერთი შეზღუდვა ისაა, რომ შეყვანის დოკუმენტის ზომა არ უნდა აღემატებოდეს 5 მეგაბაიტი.

OCR.Space ონლაინ მომსახურება

დარეგისტრირება ხელსაწყოსთან მუშაობისთვის საჭირო არ არის.

უბრალოდ მიჰყევით ზემოთ მოცემულ ბმულს და ღილაკის გამოყენებით კომპიუტერიდან ვებსაიტზე ატვირთეთ ვებ – გვერდი "ფაილის არჩევა" ან ქსელიდან - მითითებით.
ჩამოსაშლელ სიაში "აირჩიეთ OCR ენა" შეარჩიეთ იმპორტირებული დოკუმენტის ენა.

შემდეგ დაიწყეთ ტექსტის ამოცნობის პროცესი ღილაკზე დაჭერით "დაიწყეთ OCR!".
ფაილის დამუშავების ბოლოს წაიკითხეთ შედეგი ველში OCR'ed შედეგი და დააჭირეთ "ჩამოტვირთვა"დასრულებული TXT დოკუმენტის ჩამოტვირთვა.

თუ თქვენ უბრალოდ გჭირდებათ ტექსტი PDF– ის ამონაწერიდან და ამავე დროს მისი საბოლოო ფორმატირება საერთოდ არ არის მნიშვნელოვანი, OCR.Space კარგი არჩევანია. ერთადერთი ის არის, რომ დოკუმენტი უნდა იყოს ერთენოვანი, რადგან ამავდროულად ორი ან მეტი ენის აღიარება არ არის გათვალისწინებული სამსახურში.

აგრეთვე იხილეთ: FineReader- ის უფასო ანალოგები

სტატიაში წარმოდგენილი ონლაინ საშუალებების შეფასებისას, უნდა აღინიშნოს, რომ FineReader Online ABBYY– დან OCR ფუნქციას ასრულებს ყველაზე ზუსტად და ეფექტურად. თუ ტექსტის ამოცნობის მაქსიმალური სიზუსტე თქვენთვის მნიშვნელოვანია, უმჯობესია განიხილოს ეს ვარიანტი კონკრეტულად. მაგრამ, სავარაუდოდ, თქვენც მოგიწევთ გადახდა.

თუ საჭიროა მცირე ზომის დოკუმენტების ციფრული გადაღება და მზად ხართ დამოუკიდებლად გამოსწორდეს სამსახურში შეცდომები, სასურველია გამოიყენოთ NewOCR, OCR.Space ან Free Online OCR.

Send