Objavljeno: 27.5.2014 | Avtor: Matjaž Klančar | Monitor Junij 2014

Ko računalniki berejo

V resnici še ni tako dolgo, kar je bilo »računalniško branje« oz. prepoznavanje besedila iz bitnih slik oz. fotografij za računalnik podobno težko opravilo, kot je (še) danes prepoznava govora. Danes znajo besedilo brati celo telefoni.

»  Kaj smo ugotovili?

Branje besedil s programi OCR je danes dovolj dobro rešeno, da tudi šumniki ne povzročajo težav. Še več, programi se znajdejo tudi pri ohranjanju oblikovanja strani, kar pride velikokrat zelo prav.

Verjetno ste v spletu že zasledili, da Američani že kar nekaj časa zelo uspešno uporabljajo programe za narekovanje besedila, saj so programski paketi, ko je npr. Dragon NaturallySpeaking, v tej smeri že pred časom dovolj napredovali. Zdaj, ko so tudi računalniki dovolj hitri, je mogoče narekovati že kar v običajni hitrosti, brez nekoliko daljših presledkov med besedami in stavki, kot je bilo nujno še nedavno. In vendar podobnih programov za slovenščino (in še marsikateri svetovni jezik) še ni in jih najverjetneje še dolgo ne bo. Zaradi majhnosti trga, ki bi ga uporabljalo, in še posebej zaradi posebnosti in zapletenosti  našega jezika.

Že hiter pogled na Googlovo tržnico Play pokaže, da je programov, ki »znajo« OCR, res veliko.

Že hiter pogled na Googlovo tržnico Play pokaže, da je programov, ki »znajo« OCR, res veliko.

Zelo podobno je bilo stanje na trgu optičnega branja besedil pred, recimo, petnajstimi leti. Sistemi OCR, ki so bitne slike oz. fotografije spremenili v besedilo, ki ga je bilo mogoče računalniško urejati, so bili na voljo, a so res dobro delovali le v angleščini in nekaterih drugih večjih svetovnih jezikih. Razlog je bil podoben, kot je danes pri prepoznavanju govora – majhnost trga in naše posebnosti. K sreči so »naše posebnosti« tokrat manjše in se oklestijo na tri posebne črke, Č, Š in Ž. In ker ima nekaj takih posebnih črk še kar nekaj drugih narodov, so se sčasoma našla podjetja, ki so prepoznala tržno nišo in razvila izdelke za OCR, ki se odlično prodajajo (tudi) v vzhodni Evropi. Ne preseneča, da so tudi avtorji teh programov Vzhodnoevropejci, od Madžarov do Ukrajincev. Včasih smo zato vsi uporabljali zgolj in samo madžarski program Recognita, danes se navdušujemo nad ukrajinskim Abbyjem. Predvsem zato, ker si že sicer odlične rezultate branja še dodatno izboljša tudi z besedilnimi slovarji, ki so na voljo tudi za slovenščino. Pomoč slovarjev »matematiki« je namreč tisto, kar je v zadnjih letih programe OCR tako izpililo, da znajo običajno tiskano besedilo prebrati 100 %, brez napak. Napake se v resnici najdejo le pri slabših predlogah, kot so faksi in/ali s starejšimi pisalnimi stroji tipkana besedila. Da, tudi taki nam še vedno tu in tam pridejo pod roke.

Napredek OCR je danes v resnici tako očiten, da sistem obvladajo tudi že mobilne aplikacije, to pa naše mobilne telefone prelevi v že skorajda popolne optične bralnike. Naj omenimo samo Googlovo aplikacijo Goggles in celo Google Translate, ki obvladata (tudi) OCR, še več pa dobimo z (tudi zastonjskimi) aplikacijami, ki besedilo preberejo, spremenijo v PDF in nato še optično preberejo. O tem smo v Monitorju že pisali. 

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Severna Koreja s kriptovalutami in lažnimi zaposlenimi nakradla milijarde

    Za razliko od praktično vseh ostalih držav se Severna Koreja v veliki meri zanaša na internetni kriminal in kriptoprevare za financiranje delovanja države in izogibanje sankcijam. Tudi eden večjih letošnjih vdorov, ko so neznanci z borze Bybit ukradli za poldrugo milijardo dolarjev kriptovalute ether, je bil plod Severne Koreje.

    Objavljeno: 27.10.2025 07:00
  • Zakaj nihče ne mara Applovih in Samsungovih tankih telefonov?

    Applov najnovejši in najtanjši iPhone Air, ki v debelino meri le dobrih pet milimetrov in tehta 165 gramov, je čudo tehnike, a ga začuda ljudje niso radostno sprejeli. Medtem ko se iPhone 17 Pro in iPhone 17 Pro Max prodajata rekordno, klasični iPhone 17 pa prav tako žanje visoke številke, iPhone Air zapostaja.

    Objavljeno: 20.10.2025 05:00
  • Nvidia: Kitajska je za nas mrtva

    Nvidijin direktor Jensen Huang je dejal, da je tržni delež podjetja na Kitajskem hitro padel s 95 odstotkov na ničlo. To ni presenetljivo, saj izvoz na Kitajsko prepoveduje kar ameriška administracija. A to v resnici ni čisto res, saj po drugi strani več kot četrtino prodaje predstavlja izvoz v Singapur – od koder na Kitajsko vodijo neuradne poti.

    Objavljeno: 20.10.2025 07:00
  • Popolnoma drugačno električno kolo

    Rivianovo hčerinsko podjetje Also, specializirano za mikromobilnost, je predstavilo inovativno električno kolo TM-B (Transcendent Mobility - Bike), ki obljublja povsem novo izkušnjo vožnje. 

    Objavljeno: 23.10.2025 16:00
  • V Londonu vam bodo verjetno ukradli telefon

    Samo v lanskem letu so v Londonu ukradli 80.000 pametnih telefonov, kar je v milijonski metropoli sicer malo, a vseeno precej več kot v drugih podobno velikih mestih v Evropi. In približno tretjino več kot leto pred tem. Trend je torej zaskrbljujoč.

    Objavljeno: 23.10.2025 05:00
  • SD-kartica na dnu Atlantika preživela implozijo Titana

    Raziskovalci so na dnu Atlantskega ocena v bližini razbitine Titanika našli SanDiskovo spominsko kartico SD, s katere so lahko sneli 12 fotografij in devet videoposnetkov. Kartica je tja potonila pred dvema letoma, ko je implodirala podmornica Titan, s katero je podjetje OceanGate želelo obiskati razbitine slavnega parnika.

    Objavljeno: 22.10.2025 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji