Objavljeno: 27.5.2014 | Avtor: Matjaž Klančar | Monitor Junij 2014

Ko računalniki berejo

V resnici še ni tako dolgo, kar je bilo »računalniško branje« oz. prepoznavanje besedila iz bitnih slik oz. fotografij za računalnik podobno težko opravilo, kot je (še) danes prepoznava govora. Danes znajo besedilo brati celo telefoni.

Ko računalniki berejo

»  Kaj smo ugotovili?

Branje besedil s programi OCR je danes dovolj dobro rešeno, da tudi šumniki ne povzročajo težav. Še več, programi se znajdejo tudi pri ohranjanju oblikovanja strani, kar pride velikokrat zelo prav.

Verjetno ste v spletu že zasledili, da Američani že kar nekaj časa zelo uspešno uporabljajo programe za narekovanje besedila, saj so programski paketi, ko je npr. Dragon NaturallySpeaking, v tej smeri že pred časom dovolj napredovali. Zdaj, ko so tudi računalniki dovolj hitri, je mogoče narekovati že kar v običajni hitrosti, brez nekoliko daljših presledkov med besedami in stavki, kot je bilo nujno še nedavno. In vendar podobnih programov za slovenščino (in še marsikateri svetovni jezik) še ni in jih najverjetneje še dolgo ne bo. Zaradi majhnosti trga, ki bi ga uporabljalo, in še posebej zaradi posebnosti in zapletenosti  našega jezika.

Že hiter pogled na Googlovo tržnico Play pokaže, da je programov, ki »znajo« OCR, res veliko.

Že hiter pogled na Googlovo tržnico Play pokaže, da je programov, ki »znajo« OCR, res veliko.

Zelo podobno je bilo stanje na trgu optičnega branja besedil pred, recimo, petnajstimi leti. Sistemi OCR, ki so bitne slike oz. fotografije spremenili v besedilo, ki ga je bilo mogoče računalniško urejati, so bili na voljo, a so res dobro delovali le v angleščini in nekaterih drugih večjih svetovnih jezikih. Razlog je bil podoben, kot je danes pri prepoznavanju govora – majhnost trga in naše posebnosti. K sreči so »naše posebnosti« tokrat manjše in se oklestijo na tri posebne črke, Č, Š in Ž. In ker ima nekaj takih posebnih črk še kar nekaj drugih narodov, so se sčasoma našla podjetja, ki so prepoznala tržno nišo in razvila izdelke za OCR, ki se odlično prodajajo (tudi) v vzhodni Evropi. Ne preseneča, da so tudi avtorji teh programov Vzhodnoevropejci, od Madžarov do Ukrajincev. Včasih smo zato vsi uporabljali zgolj in samo madžarski program Recognita, danes se navdušujemo nad ukrajinskim Abbyjem. Predvsem zato, ker si že sicer odlične rezultate branja še dodatno izboljša tudi z besedilnimi slovarji, ki so na voljo tudi za slovenščino. Pomoč slovarjev »matematiki« je namreč tisto, kar je v zadnjih letih programe OCR tako izpililo, da znajo običajno tiskano besedilo prebrati 100 %, brez napak. Napake se v resnici najdejo le pri slabših predlogah, kot so faksi in/ali s starejšimi pisalnimi stroji tipkana besedila. Da, tudi taki nam še vedno tu in tam pridejo pod roke.

Napredek OCR je danes v resnici tako očiten, da sistem obvladajo tudi že mobilne aplikacije, to pa naše mobilne telefone prelevi v že skorajda popolne optične bralnike. Naj omenimo samo Googlovo aplikacijo Goggles in celo Google Translate, ki obvladata (tudi) OCR, še več pa dobimo z (tudi zastonjskimi) aplikacijami, ki besedilo preberejo, spremenijo v PDF in nato še optično preberejo. O tem smo v Monitorju že pisali. 

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Google zapira zadnja vrata za blokiranje oglasov

    Google bo s prihajajočimi posodobitvami spletnega brskalnika Chrome dokončno onemogočil delovanje priljubljenih razširitev za blokiranje oglasov, kot je uBlock Origin.

    Objavljeno: 16.6.2026 10:00
  • Google nam bo zaklenil ekosistem Android

    Dolgo vrsto let je bila ena izmed glavnih prednosti ekosistema Android njegova odprtost, saj za razliko od konkurenčnega Applovega iOS-a ni imel omejitev za nameščanje aplikacij. Resda je Google preverjal aplikacije, ki jih je uvrstil na svojo tržnico Play Store, a vsakdo je lahko mimo te tržnice namestil karkoli, če je z interneta prenesel namestitveno datoteko. Postopek se imenuje sideloading in je na primer na iOS onemogočen. To se bo zdaj zgodilo tudi na Androidu.

    Objavljeno: 19.6.2026 05:00
  • Trumpov telefon je skoraj popolna kopija HTC-jevega

    Razstavljanje težko pričakovanega pametnega telefona Trump Mobile T1, ki so ga opravili strokovnjaki pri iFixit, je potrdilo prejšnje sume ocenjevalcev opreme, da je naprava skoraj popolna kopija obstoječega modela HTC U24 Pro.

    Objavljeno: 12.6.2026 09:00
  • Droni bodo po novem leteli brez GPS-a in zemljevidov

    Raziskovalci z nizozemske Tehnološke univerze v Delftu so po vzoru čebel razvili učinkovit navigacijski sistem za drone Bee-Nav.

    Objavljeno: 9.6.2026 10:00
  • Prihodnji teden bodo potekli certifikati za zagon računalnikov

    Bliža se datum, ki se je pred 15 leti zdel nedosegljivo daleč v prihodnosti. Potekli bodo certifikati iz leta 2011, s katerimi se varuje zagon osebnih računalnikov (Secure Boot), da se nanje ne ugnezdi škodljiva programska oprema že v UEFI/BIOS. Ne glede na operacijski sistem morajo posodobljene certifikate dobiti vsi starejši računalniki, najsi na njih teče Windows ali Linux. Prvi se večinoma posodobi sam.

    Objavljeno: 18.6.2026 05:00
  • Nova Philipsova svetilka je umetno sonce za sobe brez oken

    Podjetje Philips je predstavilo novo stropno svetilko Philips Skylight, ki s pomočjo napredne LED tehnologije in sistema NatureConnect uspešno posnema videz ter globino prave strešne linije in v prostore prinaša ritem naravne sončne svetlobe.

    Objavljeno: 11.6.2026 09:15
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji