Objavljeno: 28.2.2006 10:22 | Avtor: Krištof Oštir | Monitor Februar 2006

OmniPage in njegovi dodatki

Programi za prepoznavanje besedila so že povsem nadomestili "ročno" prepisovanje dokumentov. Boljši med njimi omogočajo ne le prepoznavanje skeniranih predlog, temveč se spopadejo tudi z datotekami Adobovega Acrobata, s fotografiranim besedilom in podobno. Najboljši ponujajo še kup dodatnih možnosti, kot je samodejno branje priponk elektronskih sporočil ali vsebine mape na disku.

OmniPage je že vrsto let eden najboljših programov za optično prepoznavanje znakov. Podjetje Nuance, ki se je še do nedavna imenovalo ScanSoft, z razvojem in izboljšavami, pa tudi z nakupi konkurence (recimo madžarske Recognite) ponuja enostaven, natančen in zelo zmogljiv izdelek. V svoji zadnji različici prinaša izboljšano prepoznavanje oblike, pretvarjanje tiskanih obrazcev v elektronske, glasovno branje prepoznanega besedila, ustvarjanje, branje in indeksiranje Acrobatovih dokumentov ... in seveda še natančnejše prepoznavanje - tudi slovenskih - besedil.

OmniPage ima enostaven uporabniški vmesnik in nas z nekaj kliki pripelje od branja do prepoznanega besedila.

Uporabniški vmesnik OmniPaga sledi svojim predhodnim različicam. Glavno delovno okno programa je razdeljeno na tri dele - pomanjšane slike prebranih strani so na levi, slikovna oblika trenutne strani je na sredini, na desni pa je okno za urejanje prepoznanega besedila. V zgornjem delu zaslona so ukazi za krmiljenje programa, skupaj z gumbi za samodejno obdelavo, v spodnjem pa okno s podrobnimi podatki o dokumentu, ki vsebuje podatke od imena datoteke do stanja prepoznave, skupaj s številom znakov na strani in (ocenjenim) številom napak.

Tudi stari znanci programa pa bodo opazili nekaj drobnih sprememb. Najočitnejša je orodje za vnos znakov (Character Map), mala orodjarna nad urejevalnikom besedila z znaki, ki jih je nekoliko teže vnesti s tipkovnico. Zanimiva je možnost zumiranja v korektorju (Proofreader), ki omogoča boljši pregled prebrane predloge in s tem lažje prepoznavanje napak. Še vedno pa korektor ne ponuja možnosti razveljavitve napačne odločitve. Med novostmi, ki neposredno vplivajo na kakovost prepoznave, je treba omeniti orodje za izboljšanje prebranih predlog (Image Enhancement). Program vključuje osnovne in bolj zapletene postopke digitalne obdelave podob, namenjene lažji prepoznavi besedila.

Avtomatizacija postopkov je ena izmed najimenitnejših strani programa.

Ena izmed najboljših strani novega OmniPaga je možnost avtomatizacije postopka. Že prejšnje različice so lahko spremljale izbrani imenik, različica 15 pa omogoča še več, recimo branje priponk, ki jih prejeme Microsoftov Outlook. Orodje "programiramo" prek čarovnika, kar je zelo nazorno in sila enostavno, a hkrati zelo zmogljivo. Sestavni del postopka je lahko pretvorba neposredno v zapis PDF. Ko govorimo o slednjem, moramo omeniti tudi dva dodatka k programu, in sicer PDF Create! in PDF Converter. Prvi je namenjen ustvarjanju Acrobatovih datotek iz kateregakoli programa in deluje kot običajen okenski tiskalnik. Precej bolj zanimiv pa je drugi, ki dokument v obliki PDF zapiše v Wordov zapis, pri tem pa bolj ali manj ohrani njegovo obliko. PDF Converter nima težav z besedilnimi datotekami, uspešno pa obvlada tudi predloge, ki v dokumentu vsebujejo bitne slike! Zelo zanimiv dodatek, ki ga ponuja Nunace, je tudi vtičnik za Google Desktop, s katerim slednjega pripravimo za iskanje vsebine vseh prebranih (pa tudi nekaterih drugih) dokumentov. OmniPage poskrbi za prepoznavanje besedila, Google pa za indeksiranje in iskanje.

Nova različica programa po trditvah razvijalcev omogoča do 25-odstotno izboljšanje natančnosti prepoznave - z drugimi besedami, za četrtino manj napak in potrebnih ročnih popravkov. OmniPage dokumente z "običajnim" besedilom (ena od standardnih pisav primerne velikosti) in enostavno obliko prepozna skoraj v celoti (natančnost je večja od 99 %). Pri zahtevnejši obliki, recimo zapletenih preglednicah ali straneh iz revij, se natančnost prepoznave zmanjša, večja pomanjkljivost pa je slabo ohranjanje oblike. Program pri slednji sicer kaže napredek, a smo še daleč od delovanja v načinu "poženi in pozabi".

OmniPage je, tudi po zaslugi vgrajenega slovenskega črkovalnika, odličen program za optično prepoznavanje znakov. Nova različica ponuja cel kup zanimivih dodatkov, ki pa precej obremenijo zmogljivosti računalnika (predvsem disk), pa tudi lastnikovo denarnico. Različica Professional je zato primerna predvsem za podjetja, za domačo rabo pa povsem zadošča okrnjena, a veliko cenejša običajna izvedba.

OmniPage Professional 15

Kaj: Natančen in zmogljiv program za optično prepoznavanje znakov.

Zahteve: Windows 98, Me, 2000, XP, Server 2003, 128 MB pomnilnika, približno 200 MB prostora na disku.

Izdeluje: Nuance, www.nuance.com.

Prodaja: Enajsta šola, (01) 426 74 32.

Cena: OmniPage Professional 162.883 tolarjev, OmniPage 39.578 tolarjev, nadgradnja Professional 67.843 tolarjev.

Za: Velika natančnost, odlična podpora zapisu PDF, slovenski črkovalnik, dodatek za Google Desktop.

Proti: Obsežnost programa, cena.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji