Oglas

Če želite katero koli natisnjeno besedilo pretvoriti v digitalno besedilo, ki ga lahko kopirate, prilepite, uredite in iščete, boste morali uporabiti optične bralnike za optično prepoznavanje znakov (OCR).

Ko se odločite za optično branje ali fotografiranje dokumenta, bo to shranjeno v obliki JPEG ali PDF. OCR programska oprema lahko nato v teh dokumentih prepozna črke in številke in jih pretvori v iskalni PDF 4 načini za ustvarjanje in urejanje datotek PDF brezplačnoMed vsemi običajnimi vrstami datotek, ki jih najdemo v našem računalniškem svetu, je PDF verjetno eden najbolj restriktivnih, hkrati pa je na voljo vsem, ki ga lahko uporabljajo (predvsem za branje) ... Preberi več ali v datoteko, ki jo lahko urejate v programih, kot je Microsoft Word.

Težava je v tem, da nekateri skenerji OCR delujejo veliko bolje kot drugi, najboljši pa so precej denarni na denarnici.

Omnipage18 na primer stane 150 dolarjev, vendar je še posebej dober pri prepoznavanju različnih jezikov. Adobe Acrobat Pro DC

instagram viewer
stane očarljivih 400 dolarjev, vendar ima neverjetno natančnost. ABBYY FineReader stane 150 dolarjev, vendar je pri pretvorbi dokumentov, kot so revije in brošure, v besedilo, ki ga je mogoče, fantastično. Kasneje bomo v tem članku preizkušali spletno ponudbo ABBYY.

Če pa iščete brezplačne alternative, ki jih lahko Prenesi in uporabljati v operacijskem sistemu Windows ali OS X, bi morali preizkusite ta OCR Orodja 5 najboljših OCR orodij za črpanje besedila iz slikKo imate papirje, kako vse tiskano besedilo pretvorite v nekaj, kar bo digitalni program spoznal in indeksiral? Naj bo v bližini dobra programska oprema OCR. Preberi več . Če pa raje uporabite brezplačno, na spletu OCR orodje, branje, kot smo že preizkusili v zgornjih nekaj, s spodnjimi rezultati.

Preizkus

Zdi se, da večina ljudi zdaj uporablja svoje pametne telefone, da opravijo skeniranje zanje Optično preglejte in upravljajte svoje prejemke, prihranite prostor, papir in časPotrdila o papirju zlahka izgubite in jih je težko najti, ko jih najbolj potrebujete. Na srečo digitalna rešitev rešuje oba problema. Preberi več , Sem se odločil za uporabo Aplikacija Evernote za skeniranje (Brezplačno za iOS in Android). Prebral sem prvo stran Richarda Dawkina Plezanje na gori nemogoče, da vidimo, kakšne rezultate lahko dobimo z zelo osnovnim oblikovanjem. Skeniral sem tudi stran Tima Ferrissa Štiriurni kuhar da preizkusite optične bralnike z nekoliko bolj zapletenim oblikovanjem. Vsako od teh datotek sem shranil kot PDF.

Testiranje spletnih OCR

Ti dokumenti so bili nato predstavljeni z nekaterimi domnevno najboljšimi spletnimi orodji OCR, da bi videli, kako uspešni so.

Brezplačni spletni OCR [ni več na voljo]

Na srečo za uporabo brezplačnega spletnega OCR ni potrebna registracija. Dvakrat sem bil navdušen, ko sem videl njihovo trditev, da ohranijo oblikovanje in postavitev mojega dokumenta.

Brezplačno spletno OCR

Spletno mesto trdi, da lahko kot vhod podpira PDF, GIF, BMP, JPEG, TIFF in PNG. Izhodi so lahko DOC, dokument z besedilom PDF, RTF in TXT. Žal nisem mogel ugotoviti, ali imajo omejitev velikosti datoteke.

Osnovni dokument v PDF
Pretvoreno popolnoma popolno. Ni veliko več za povedati! Odšli smo do zelo dober začetek.

Osnovni dokument DOC
Zdi se, da so se dejanske besede brez preobrata pretvorile brez "ount" iz "Mount Rushmore-a", kar nekako AWOL. Oblikovanje je sicer drugačna zgodba. Številne vejice so bile zamenjane s podčrtaji, na točkah v celotnem dokumentu pa so bili vstavljeni naključni presledki. Ko kasneje opazite, kako se je vrhunska programska oprema lotila v tem testu, to ni slab napor nasploh.

Zapleten dokument v PDF
Pretvarjanje dokumenta je trajalo vrtoglavih 120 sekund! Ko je vse besedilo končano, je bilo celotno besedilo spremenjeno s približno 95% natančnostjo, čeprav je bilo besedilo v ločenem zgornjem desnem delu strani nedosegljivo. Tudi nekaj drugih znakov v dokumentu PDF je bilo napačno.

Zapleten dokument v DOC
Tokrat je pretvorba trajala le 10 sekund, besedilo pa se je znova spremenilo s približno 95-odstotno natančnostjo. Bilo je nekaj nenavadnih težav z razmikom, programska oprema pa je imela težave pri pretvorbi pisave v zgornjem desnem kotu dokumenta in je tu in tam izpustila nekaj znakov.

Razsodba
Če želite preprosto pretvoriti dokumente v PDF, je to fantastično orodje. Kar zadeva pretvorbo v DOC, o rezultatih ni bilo ničesar napisati doma.

i2OCR navaja nekaj impresivnih trditev. Orodje prepozna več kot 60 jezikov, zmore razporediti več stolpcev (z odstranitvijo oblikovanja), nima omejitev velikosti datoteke, lahko pretvori naložene datoteke in iz naslovov URL. In za uporabo tega orodja vam ni treba registrirati.

Storitev deluje tako, da besedilo preprosto izvlečete s slike in nato izpiše neoblikovano besedilo. Hitro lahko popravite morebitne napake v stranskem pogledu, preden kopirate besedilo v druge programe ali prenesete kot DOC, PDF ali HTML.

Opomba: ko sem poskušal naložiti svoje dokumente PDF, jih je i2OCR zavrnil, zato sem jih moral pretvoriti v JPEG (tako da sem posnel posnetek zaslona in nato naložil datoteke).

Osnovni dokument za navadno besediloPosnetek zaslona 2016-02-11 ob 12.30.28
Zaradi načina delovanja tega orodja se izgubi vse oblikovanje, čeprav je bila pretvorba iz slike v besedilo skoraj popolna. Bilo je nekaj majhnih napak, kot je razmik med odstavki, nekatere vejice pa so bile nadomeščene z obdobji, vendar gre za majhne niče.

Zapleten dokument za navadno besediloPosnetek zaslona 2016-02-11 ob 12.39.48
Večina besedila je bila pretvorjena brez preveč napak, razen naslova in recepta zgoraj desno, kar je bilo za to orodje neberljivo. Način pretvorbe stolpcev v navadno besedilo še zdaleč ni bil idealen. Če želite to pretvorbo narediti izvedljivo, bi bilo potrebnega veliko časa, da bi vrstice preuredili v skladne stavke.

Razsodba
Za osnovne dokumente i2OCR deluje odlično. Možnost urejanja besedila pred prenosom je tudi zelo prijeten dotik. Pri bolj zapletenih dokumentih je pretvorba še vedno precej natančna, vendar način, kako besedilo odda, ne bo olajšal vašega življenja.

Spletni OCR trenutno podpira 46 različnih jezikov in lahko pretvori PDF, JPG, BMP, TIFF in GIF v obliko Word, Excel ali Plain Text. Spletno mesto trdi, da "pretvorjeni dokumenti izgledajo povsem kot original - tabele, stolpci in grafike".

Različica, ki jo lahko uporabite brez registracije, vam omogoča pretvorbo do 15 slik na uro (omejitev 5mb). Če se prijavite za račun, lahko poleg te omejitve kupite več strani, hkrati pa lahko pretvarjate večstranske dokumente in ZIP arhive.

Spletni rezultati OCR

Osnovni dokument DOC
Osnovni dokument se je brez rimske številke pretvoril brezhibno jaz da se ne poberejo. Kot je spletna stran obljubila, je bilo oblikovanje točno takšno, kot je bilo v knjigi. Kudo na to orodje.

Zapleten dokument v DOC
Potem ko sem bil razočaran nad prejšnjimi orodji OCR pri pretvorbi zapletenega dokumenta, me je spletna OCR močno navdušila. Postavitev je bila skoraj popolna, kot lahko vidite zgoraj. Še enkrat, recept ni bil izbran preveč dobro, vse druge manjše napake pa so bile zanemarljive.

Razsodba

Popolnoma fantastični rezultati spletnega OCR. Edina slabost, ki jo vidim, je, da ni mogoče prenesti pretvorjenih dokumentov v PDF datoteke, ker omenjeni izhodni formati vključujejo samo DOCX, XLSX in TXT.

Kot smo že omenili, je ABBYY eden vodilnih na tržišču programske opreme OCR, za celoten prenosni program pa stane približno 150 USD. Ponujajo 10-stransko brezplačno preskušanje za njihovo spletno orodje (potrebna je registracija). Za naročnino v vrednosti 5 USD bo njihovo spletno orodje omogočilo pretvorbo 200 strani vsak mesec.

ABBYY FineReader Online

Sprejete datoteke lahko znašajo do 100 mb v katerem koli od teh oblik: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP in PNG. ABBYY priznava tudi skoraj 200 jezikov. Rezultati so še posebej impresivni, saj lahko izbirate med DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 in EPUB.

Med preizkusom lahko celo preizkusite nekaj funkcij BETA. Prva je možnost, da svoj dokument prevedete v drug jezik. Drugi je, da pretvorite pretvorjeni dokument v svoj račun za shranjevanje v oblaku, naj bo to Dropbox, Google Drive, Evernote, Microsoft OneDrive ali Box.

Osnovni dokument v DOCX
Skupni rezultati so bili dobri, vendar niso presenetljivi, saj gre za vrhunski izdelek. Naokrog so zamenjali več vejic in obdobij, več obrnjenih vejic je bilo zamenjanih z zvezdico, manjkalo je nekaj velikih črk in ena beseda (dobesedna) je bila napačno napisana.

Zapleten dokument v DOCX
Po pretvorbi je bilo v besedilu dokumenta zelo malo napak (razen OCR, ki se spet bori s pisavo tega recepta!), Vendar je oblikovanje ostalo veliko želenega.

ABBYY Rezultat

Trije stolpci so nekako zasedali dve strani, z osrednjim stolpcem samo ki se pojavljajo na drugi strani. Če bi dejansko želeli stori karkoli s tem spremenjenim dokumentom, boste na koncu potegnili lase.

Osnovni dokument v PDF
Med pregledovanjem pretvorbe PDF nisem mogel najti nobene napake. Morda smo našli tam, kjer se ABBYY odlikuje. Fantastični rezultati.

Zapleten dokument v PDF
Ponovno nisem mogel najti nobene napake v tej pretvorjeni datoteki. ABBYY očitno zna izjemno dobro pretvoriti v PDF.

Razsodba
Če z veseljem plačate nekaj dolarjev, se zdi, da je pretvorba v PDF s to storitvijo in storitvijo izjemno učinkovita zmožnost sinhronizacije pretvorjenih datotek v shrambo v oblaku je še posebej koristna, če skenirate velik obseg dokumenti. Kot pri drugih možnostih, tudi ABBYY še vedno ni ugotovil, kako brezhibno pretvoriti dokumente v DOC za enostavno urejanje.

Končni rezultat

Če si, tako kot večina ljudi, samo želite skenirati nekaj člankov iz revij in nekaj računov za gospodinjstvo, teh dokumentov ne bo treba urejati. Zato bo za vas primerna neposredna pretvorba v PDF, saj boste po teh dokumentih še vedno lahko iskali. Za to je bil Free Online OCR vsekakor najboljše brezplačno orodje, ki smo ga preizkusili. Če rečem, če želite pripraviti plačilo 5 USD na mesec za skoraj popolnost, ABBYY's FineReader Online je bil nekoliko bolj natančen.

Ko gre za pretvorbo dokumentov v DOC, nismo uspeli najti nobene rešitve, ki bi bila popolna, vendar so daleč najboljši rezultati Spletni OCR. Pretvorba ni bila popolna, celovitost oblikovanja pa je bila večinoma ohranjena in napake so bile zanemarljive. Ko primerjamo te rezultate s "premijsko" ponudbo podjetja ABBYY, ne morete pomagati, ampak ste navdušeni nad njimi.

Nismo vključili OCR funkcije Google Drive v tej objavi; malo za Googlov povsod, več pa za dejstvo, da smo želeli preizkusiti nekaj drugih brezplačnih spletnih OCR storitev tam.

Za vas: Katera druga spletna orodja za OCR bi priporočili našim bralcem? In kaj ste že poskusili, da je ne boste nikoli več uporabili?

Rob Nightingale je diplomiral iz filozofije na University of York v Veliki Britaniji. Kot vodja socialnih medijev in svetovalec je delal več kot pet let, hkrati pa je izvajal delavnice v več državah. Zadnji dve leti je Rob tudi tehnološki pisatelj in je MakeUseOfov direktor za družbene medije in urejevalnik novic. Običajno ga boste našli na potovanju...