Skelbimas

Jei norite konvertuoti bet kokį spausdintą tekstą į skaitmeninį tekstą, kurį galite nukopijuoti, įklijuoti, redaguoti ir ieškoti, turėsite naudoti optinio simbolių atpažinimo (OCR) skaitytuvus.

Kai nuspręsite nuskaityti ar fotografuoti dokumentą, jis bus išsaugotas tokiu formatu kaip JPEG ar PDF. OCR programinė įranga tada gali atpažinti raides ir skaičius šiuose dokumentuose ir paversti juos a ieškomas PDF 4 nemokamų PDF failų kūrimo ir redagavimo būdaiIš visų įprastų failų tipų, aptinkamų mūsų skaičiavimo pasaulyje, PDF yra tikriausiai vienas iš labiausiai ribojančių failų, tuo pačiu metu jis yra prieinamas visiems (visų pirma skaityti) ... Skaityti daugiau , arba į failą, kurį galite redaguoti tokiose programose kaip „Microsoft Word“.

Problema ta, kad kai kurie OCR skaitytuvai veikia daug geriau nei kiti, o patys geriausi yra gana sunkūs piniginėje.

Pavyzdžiui, „Omnipage18“ kainuoja 150 USD, tačiau ypač gerai atpažįsta skirtingas kalbas. „Adobe Acrobat Pro DC“ kainuoja akį laistydamas 400 USD, tačiau turi neįtikėtiną tikslumą.

instagram viewer
„ABBYY FineReader“ kainuoja 150 USD, tačiau yra fantastiška konvertuojant dokumentus, tokius kaip žurnalai ir brošiūros, į ieškomą tekstą. Vėliau šiame straipsnyje išbandysime „ABBYY“ internetinius pasiūlymus.

Vis dėlto, jei ieškote nemokamų alternatyvų, kurias galite parsisiųsti ir turėtumėte naudoti „Windows“ ar „OS X“ išbandykite šiuos OCR įrankius 5 geriausi OCR įrankiai tekstui iš paveikslėlių išgautiKai turite popieriaus pluoštą, kaip visą spausdintą tekstą paversti tokiu, kurį skaitmeninė programa galės atpažinti ir indeksuoti? Netoli turėkite gerą OCR programinę įrangą. Skaityti daugiau . Bet jei norėtumėte naudoti nemokamą, prisijungęs OCR įrankis, skaitykite toliau, nes išbandėme keletą geriausių, kurių rezultatai pateikiami žemiau.

Testas

Panašu, kad dabar dauguma žmonių naudojasi išmaniųjų telefonų, kad galėtų juos nuskaityti Nuskaitykite ir tvarkykite kvitus, taupykite vietą, popierių ir laikąPopieriniai kvitai yra lengvai pametami ir juos sunku rasti, kai jums jų labiausiai reikia. Laimei, skaitmeninis skaitmeninimas išsprendžia abi šias problemas. Skaityti daugiau , Nusprendžiau panaudoti „Evernote“ nuskaitymo programa (Nemokamas „iOS“ ir „Android“). Nuskaityjau pirmąjį Richardo Dawkino puslapį Neįmanoma lipti ant kalno, norėdami pamatyti, kokių rezultatų galime gauti naudodami labai paprastą formatavimą. Aš taip pat nuskaitydavau Tim Ferriss puslapį 4 valandų šefas išbandyti skaitytuvus su šiek tiek sudėtingesniu formatavimu. Aš išsaugojau visus šiuos failus kaip PDF.

Internetinių OCR testavimas

Tuomet šie dokumentai buvo paleisti naudojant kai kuriuos tariamai geriausius internetinius OCR įrankius, kad būtų galima įsitikinti, kaip gerai jiems sekėsi.

Nemokamas internetinis OCR [nebėra prieinamas]

Laimei, norint naudoti nemokamą internetinį OCR, nereikia registracijos. Ir aš buvau dvigubai sužavėtas, kai pamačiau jų reikalavimą išlaikyti mano dokumento formatavimą ir išdėstymą.

Nemokamas internetinis OCR

Teigiama, kad svetainė gali palaikyti PDF, GIF, BMP, JPEG, TIFF ir PNG. Išvestys gali būti DOC, PDF teksto dokumentas, RTF ir TXT. Deja, negalėjau sužinoti, ar jiems nustatytas failo dydžio apribojimas.

Pagrindinis dokumentas į PDF
Konvertuota absoliučiai tobulai. Nėra daug daugiau ką pasakyti! Mes pasiruošę labai gera pradžia.

Pagrindinis dokumentas DOC
Atrodo, kad tikrieji žodžiai yra nepriekaištingai paversti, išskyrus „Rushmore kalno“ „ount“, kažkaip einantį į AWOL. Vis dėlto formatavimas yra kitokia istorija. Daugelis kablelių buvo pakeisti pabraukimais, o dokumento taškuose buvo įterpti atsitiktiniai tarpai. Vėliau, kai pamatysite, kaip kokybiška programinė įranga sekėsi atliekant šį testą, tai nėra blogos pastangos iš viso.

Sudėtinis dokumentas į PDF
Dokumento konvertavimas užtruko 120 sekundžių! Baigęs visą tekstą paversti maždaug 95% tikslumu, nors teksto, esančio atskirame langelyje, esančiame puslapio dešinėje viršuje, buvo neįmanoma rasti. Keli kiti PDF failo simboliai taip pat buvo neteisingi.

Sudėtinis dokumentas DOC
Šį kartą konvertavimas užtruko tik 10 sekundžių, o tekstas vėl buvo konvertuotas maždaug 95% tikslumu. Iškilo keistų tarpelių, ir programinė įranga turėjo problemų konvertuodama šriftą dokumento viršuje, dešinėje, ir praleido kelis simbolius čia ir ten.

Verdiktas
Jei norite konvertuoti paprasto formato dokumentus į PDF, tai yra puikus įrankis. Kalbant apie konvertavimą į DOC, rezultatai neturėjo apie ką rašyti namuose.

„i2OCR“ pateikia keletą įspūdingų teiginių. Įrankis atpažįsta daugiau nei 60 kalbų, gali tvarkyti kelių stulpelių išdėstymą (pašalindamas formatavimą), neturi failų dydžio apribojimų, gali konvertuoti įkeltus failus ir iš URL. Jei norite naudoti šį įrankį, taip pat nereikia registruotis.

Paslauga veikia paprasčiausiai ištraukus tekstą iš jūsų atvaizdo, tada išvedant neformatuotą tekstą. Prieš nukopijuodami tekstą į kitas programas arba atsisiųsdami kaip DOC, PDF arba HTML, galite greitai ištaisyti šalutinio vaizdo klaidas.

Pastaba: kai bandžiau įkelti savo PDF dokumentus, „i2OCR“ juos atmetė, todėl man reikėjo juos konvertuoti į JPEG (padarydami jų ekrano kopiją, tada įkeldami failus).

Pagrindinis paprastas tekstasEkrano nuotrauka 2016-02-11 12.30.28
Dėl šio įrankio veikimo prarandamas visas formatavimas, nors vaizdas iš vaizdo į tekstą buvo konvertuotas beveik tobulai. Buvo keletas mažų klaidų, tokių kaip pastraipų tarpai, ir kai kurios kableliai buvo pakeisti taškais, tačiau tai yra maži niekučiai.

Sudėtingas paprastas tekstasEkrano nuotrauka 2016-02-11 12.39.48
Didžioji dalis teksto buvo paversta be per daug klaidų, išskyrus pavadinimą ir receptą viršuje dešinėje, kuris buvo neįskaitomas šiam įrankiui. Tai, kaip stulpeliai buvo paversti paprastu tekstu, toli gražu nebuvo idealu. Jei norite, kad ši konversija būtų įgyvendinama, eilių pertvarkymui į darnius sakinius prireiktų daug laiko.

Verdiktas
Pagrindiniams dokumentams „i2OCR“ veikia puikiai. Galimybė redaguoti tekstą prieš atsisiunčiant yra labai maloni. Sudėtingesnių dokumentų konvertavimas vis dar yra gana tikslus, tačiau teksto išleidimo būdas jūsų gyvenimo žymiai nepalengvins.

Šiuo metu internetinis OCR palaiko 46 skirtingas kalbas ir gali konvertuoti PDF, JPG, BMP, TIFF ir GIF į „Word“, „Excel“ ar paprasto teksto formatus. Svetainėje teigiama, kad „konvertuoti dokumentai atrodo tiksliai kaip originalai - lentelės, stulpeliai ir grafika“.

Versija, kurią galite naudoti be registracijos, leidžia konvertuoti iki 15 vaizdų per valandą (5mb apribojimas). Jei prisiregistruojate gauti sąskaitą, viršijus šį limitą, galite įsigyti daugiau puslapių, taip pat galėdami konvertuoti kelių puslapių dokumentus ir ZIP archyvus.

Internetiniai OCR rezultatai

Pagrindinis dokumentas DOC
Pagrindinis dokumentas nepriekaištingai pakeistas, išskyrus romėnišką skaičių nesirenkamas. Kaip pažadėjo svetainė, formatavimas buvo toks, koks buvo knygoje. Kudos į šį įrankį.

Sudėtinis dokumentas DOC
Nusivylusi ankstesniais OCR įrankiais konvertuodama sudėtingą dokumentą, mane labai sužavėjo internetinis OCR. Kaip matote aukščiau, išdėstymas buvo beveik tobulas. Tačiau vėlgi, receptas nebuvo parinktas per daug gerai, tačiau visos kitos nedidelės klaidos buvo nereikšmingos.

Verdiktas

Visiškai fantastiški internetinio OCR rezultatai. Vienintelis neigiamas dalykas, kurį matau, yra tai, kad konvertuotų dokumentų negalima atsisiųsti kaip PDF, nes minėti išvesties formatai yra tik DOCX, XLSX ir TXT.

Kaip minėta anksčiau, „ABBYY“ yra viena iš OCR programinės įrangos rinkos lyderių, kainuojanti apie 150 USD už visą atsisiunčiamą programą. Jie siūlo 10 puslapių nemokama bandomoji versija jų internetiniam įrankiui (būtina registracija). Už 5 USD prenumeratą jų internetinis įrankis leis jums kiekvieną mėnesį konvertuoti 200 puslapių.

„ABBYY FineReader Online“

Priimami failai gali būti iki 100 MB bet kuriuo iš šių formatų: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP ir PNG. „ABBYY“ taip pat atpažįsta beveik 200 kalbų. Išėjimai yra ypač įspūdingi, pasirinkus DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ir EPUB.

Bandymo metu netgi galite išbandyti keletą BETA funkcijų. Pirmasis yra galimybė išversti dokumentą į kitą kalbą. Kitas yra eksportuoti konvertuotą dokumentą į debesies saugyklos sąskaitą, nesvarbu, ar tai būtų „Dropbox“, „Google Drive“, „Evernote“, „Microsoft OneDrive“ ar „Box“.

Pagrindinis dokumentas į DOCX
Bendri rezultatai buvo geri, tačiau nenuostabu, nes tai yra aukščiausios kokybės produktas. Keitėsi kelios kableliai ir taškai, keletas apverstų kablelių buvo pakeisti žvaigždute, trūko poros didžiųjų raidžių, o vienas žodis (literatūrologas) buvo parašytas neteisingai.

Sudėtinis dokumentas į DOCX
Po konvertavimo dokumente buvo labai nedaug teksto klaidų (išskyrus OCR, vėl kovojantį su šio recepto šriftu!), Tačiau formatavimo reikėjo daug norėti.

ABBYY rezultatas

Trys stulpeliai kažkokiu būdu užėmė du puslapius, o centrinė skiltis tik pasirodantis antrame puslapyje. Jei norėtum iš tikrųjų daryti bet ką su šiuo konvertuotu dokumentu jūs galų gale išsitrauktumėte plaukus.

Pagrindinis dokumentas į PDF
Peržiūrėdamas konvertuotą PDF, aš niekaip negalėjau rasti klaidos. Galbūt mes atradome, kur „ABBYY“ pranašesnis. Fantastiški rezultatai.

Sudėtinis dokumentas į PDF
Vėlgi, neradau klaidų šiame konvertuotame faile. Akivaizdu, kad „ABBYY“ puikiai konvertuoja į PDF.

Verdiktas
Jei esate laimingi sumokėję keletą dolerių, atrodo, kad konvertavimas į PDF puikiai veikia šią paslaugą ir suteikia galimybė sinchronizuoti konvertuotus failus į saugyklos saugyklą debesyje yra ypač naudinga, jei nuskaitote didelį kiekį dokumentus. Tačiau, kaip ir kitos parinktys, „ABBYY“ vis dar nesugalvojo, kaip nepriekaištingai konvertuoti dokumentus į DOC, kad juos būtų galima lengvai redaguoti.

Galutinis rezultatas

Jei, kaip ir dauguma žmonių, jūs tik norite nuskaityti keletą žurnalų straipsnių ir kai kurias buitines sąskaitas, jums nereikės taisyti šių dokumentų. Todėl konvertuoti tiesiogiai į PDF bus jums tinkama, nes vis tiek galėsite ieškoti tuose dokumentuose. Tam tikrai nemokamas OCR buvo geriausias nemokamas įrankis, kurį išbandėme. Nepaisant to, jei norite mokėti 5 USD per mėnesį už beveik tobulumą, „ABBYY“ „FineReader Online“ buvo šiek tiek tikslesnis.

Kai reikia konvertuoti dokumentus į DOC, mums nepavyko rasti jokio tobulo sprendimo, tačiau geriausi rezultatai buvo pasiekti iš geriausių Internetinis OCR. Konversija nebuvo tobula, tačiau formatavimo vientisumas buvo beveik nepažeistas, o klaidų buvo nedaug. Palyginę šiuos rezultatus su „premium“ pasiūlymu iš „ABBYY“, jūs negalite padėti, bet didžiulį įspūdį.

Mes neįtraukėme „Google“ disko OCR galimybės šiame poste; šiek tiek už „Google“ žinomumą, bet dar labiau už tai, kad norėjome išbandyti keletą kitų nemokamų internetinių OCR paslaugų.

Jums: kokias kitas internetines OCR priemones rekomenduotumėte mūsų skaitytojams? Ir ko jūs bandėte, kad daugiau niekada nebenaudotumėte?

Robas Nightingale'as turi filosofijos laipsnį Jorko universitete, JK. Jis daugiau nei penkerius metus dirbo socialinės žiniasklaidos vadybininku ir konsultantu, rengdamas seminarus keliose šalyse. Pastaruosius dvejus metus Robas taip pat buvo technologijų rašytojas, yra „MakeUseOf“ socialinės žiniasklaidos vadybininkas ir informacinio biuletenio redaktorius. Paprastai jį rasite kelionėje...