Oglas

Izvlečenje besedila iz slik ni bilo nikoli lažje, kot je danes, zahvaljujoč tehnologiji optičnega prepoznavanja znakov (OCR).

OCR nam omogoča, da počnemo vse vrste koristnih stvari, na primer iskanje slik z besedilnimi poizvedbami, reproduciranje dokumentov, ne da bi jih ročno tipkali, in celo pretvarjanje ročno napisanega besedila v digitalno besedilo Kako spremeniti sliko z rokopisom v besedilo z uporabo OCRMorate digitalizirati ročno napisane opombe za urejanje ali jih shraniti za kasnejše? Tu so najboljša orodja OCR za pretvorbo rokopisa v besedilo. Preberi več .

Toda kaj je optično prepoznavanje znakov? Kako dejansko deluje? Lahko se vam zdi črna magija, toda do konca tega članka boste imeli dobro razumevanje, kako računalniki lahko prepoznajo črke in besede.

Kako deluje optično prepoznavanje znakov

Da bi razumeli, kako se besedilo pridobi iz slike, moramo najprej razumeti, kaj so slike in kako so shranjene v računalnikih.

A slikovnih pik je ena sama pika določene barve. An slika je v bistvu zbirka pik. Več pik v sliki, večja je ločljivost slike. Računalnik ne ve, da je slika kažipota v resnici kažipot - samo ve, da je prvi piksel te barve, naslednji piksel je te barve in prikaže vse svoje slikovne pike, ki jih lahko vidite.

instagram viewer

To pomeni, da se besedilo in besedilo ne razlikujeta od računalnika, zato je optično prepoznavanje znakov tako težko. Glede na to je opisano, kako deluje.

1. korak: predhodna obdelava slike

Preden lahko besedilo povlečete, je treba sliko masirati na določene načine, da bo ekstrakcija lažja in bolj verjetno, da bo uspela. Temu pravimo predobdelava, različne programske rešitve pa uporabljajo različne kombinacije tehnik.

Pogostejše tehnike predobdelave vključujejo:

Binarizacija
Vsak posamezen slikovni pik na sliki se pretvori v črno ali belo. Cilj je razjasniti, kateri piksli pripadajo besedilu in kateri slikovni piki pripadajo ozadju, kar pospeši dejanski proces OCR.

Binarizacija za optično prepoznavanje znakov

Deskew
Ker se dokumenti redko skenirajo s popolno poravnavo, lahko znaki na koncu poševno ali celo na glavo. Cilj je določiti vodoravne črte besedila in nato zasukati sliko, tako da so te črte dejansko vodoravne.

Despeckle
Ne glede na to, ali je bila slika dvoinarna ali ne, lahko pri identifikaciji znakov moti hrup. Opuščanje se znebi tega hrupa in poskuša zgladiti sliko.

Odstranitev vrstice
Identificira vse črte in oznake, ki verjetno niso znaki, in jih odstrani, da se dejanski postopek OCR ne zmede. Še posebej pomembno je pri skeniranju dokumentov s tabelami in polji.

Zoniranje
Sliko loči na različne koščke besedila, na primer prepoznavanje stolpcev v dokumentih z več stolpci.

Zoniranje za optično prepoznavanje znakov
Kreditna slika: WayneRay /Wikimedia

2. korak: Obdelava slike

Najprej najprej postopek OCR poskuša vzpostaviti izhodiščno točko za vsako vrstico besedila na sliki (ali če je bila zonirana v predhodni obdelavi, bo delovala skozi vsako območje posebej). Vsaka prepoznana vrstica znakov se obdeluje ena za drugo.

Programska oprema OCR za vsako vrstico znakov prepozna razmik med znaki tako, da poišče navpične črte nebesedilnih slikovnih pik (kar bi moralo biti očitno pri pravilni binarnosti). Vsak del slikovnih pik med temi besedilami brez besedila je označen kot "žeton", ki predstavlja en znak. Zato se imenuje ta korak tokenizacija.

Obdelava slik za optično prepoznavanje znakov

Ko so vsi potencialni znaki na sliki tokenizirani, lahko programska oprema OCR z dvema različnima tehnikama prepozna, kateri znaki pravzaprav so to žetone:

Prepoznavanje vzorcev
Vsak žeton se primerja med piksli in piksom s celotnim nizom znanih glifov - vključno s številkami, ločili in drugimi posebnimi simboli - in izbere se najbližje ujemanje. Ta tehnika je znana tudi kot ujemanje matric.

Tu je več pomanjkljivosti. Najprej morajo biti žetoni in glifi podobne velikosti, sicer se noben od njih ne bo ujemal. Drugič, žetone morajo biti v podobni pisavi kot glifi, ki izključujejo rokopis. Če pa je pisava žetona znana, je prepoznavanje vzorcev lahko hitro in natančno.

Izvleček lastnosti
Vsak žeton se primerja z različnimi pravili, ki opisujejo, kakšen značaj bi lahko bil. Na primer, dve navpični črti enake višine, povezani z eno samo vodoravno črto, bosta verjetno velika črka H.

Ta tehnika je uporabna, ker ni omejena na nekatere pisave ali velikosti. Prav tako je lahko bolj odtenko prepoznati tanke razlike med velikostjo I, malimi črkami L in številko 1. Slaba stran? Programiranje pravil je veliko bolj zapleteno kot preprosto primerjanje pik v žetonu s pikami v glifu.

3. korak: Obdelava slike

Ko se vse ujemanje žetona konča, lahko program OCR samo pokliče na dan in vam predstavi rezultate. Ponavadi pa je treba narediti malo več igranja, da se prepričate, da ne boste zamahnili z očmi, ki bi se lahko izmuznili.

Leksikalna omejitev
Vse besede se primerjajo z leksikonom odobrenih besed in vse, ki se ne ujemajo, se nadomestijo z najbližjo besedo. Slovar je en primer leksikona. To lahko pomaga popraviti besede z napačnimi znaki, kot je „trn“ namesto „th0rn“.

Optimizacije, specifične za uporabo
Če se OCR uporablja v nišnih nastavitvah, na primer za medicinske ali pravne dokumente, se lahko uporabi posebna vrsta OCR, ki je posebej zasnovana za to nastavitev. V teh primerih lahko programska oprema OCR išče matematične enačbe, industrijske izraze itd.

Naravni jezik
Ta napredna tehnika popravlja stavke z uporabo jezikovnega modela, ki opisuje, kako verjetno bodo nekatere besede sledile drugim besedam. Podobno je s tehnologijo, ki napoveduje, katero besedo želite natipkati na mobilni tipkovnici.

Če je dobro opravljeno, lahko to povzroči dobro berljivo besedilo.

Priporočena orodja za optično prepoznavanje znakov

Zdaj, ko veste, kako deluje OCR, bi moralo biti enostavno videti, da niso vsa orodja OCR enaka. Natančnost rezultatov bo močno odvisna od tega, kako dobro programska oprema izvaja različne tehnike OCR, obravnavane v tem članku.

Za to toplo priporočamo OneNote, kar je samo en razlog zakaj premaga Evernote za zapisovanje Evernote vs. OneNote: Katera aplikacija za beleženje je prava za vas?Evernote in OneNote sta izjemni aplikaciji za zapisovanje. Težko je izbirati med obema. Primerjali smo vse, od vmesnika do organizacije beležk, da bi vam pomagali pri izbiri. Kaj za vas najbolje deluje? Preberi več . Če ste pripravljeni plačati za premijsko rešitev, razmislite o OmniPage. Glej naše primerjava OneNote vs. OmniPage za OCR Prosti vs. Plačana programska oprema OCR: Microsoft OneNote in Nuance OmniPage PrimerjavaProgramska oprema za skeniranje OCR vam omogoča pretvorbo besedila v slikah ali PDF v urejene besedilne dokumente. Je brezplačno orodje OCR, kot je OneNote, dovolj dobro? Pa ugotovimo! Preberi več . Za mobilne dokumente jih boste želeli preveriti OCR aplikacije za naprave Android 6 najboljših aplikacij za Android OCR za črpanje besedila iz slikAli morate digitalizirati katero koli tiskano besedilo, da boste lahko ohranili mehko kopijo besedila? V tem primeru je vse, kar potrebujete, optično prepoznavanje znakov (OCR). Preberi več .

Kako uporabljate OCR? Ali imate katera priljubljena orodja OCR, ki jih nismo omenili? Sporočite nam v spodnjih komentarjih!

Joel Lee ima B.S. na področju računalništva in več kot šest let izkušenj s pisanjem. Je glavni urednik za MakeUseOf.