Objavljeno: 28.2.2006 10:22 | Avtor: Krištof Oštir | Monitor Februar 2006

OmniPage in njegovi dodatki

Programi za prepoznavanje besedila so že povsem nadomestili "ročno" prepisovanje dokumentov. Boljši med njimi omogočajo ne le prepoznavanje skeniranih predlog, temveč se spopadejo tudi z datotekami Adobovega Acrobata, s fotografiranim besedilom in podobno. Najboljši ponujajo še kup dodatnih možnosti, kot je samodejno branje priponk elektronskih sporočil ali vsebine mape na disku.

OmniPage je že vrsto let eden najboljših programov za optično prepoznavanje znakov. Podjetje Nuance, ki se je še do nedavna imenovalo ScanSoft, z razvojem in izboljšavami, pa tudi z nakupi konkurence (recimo madžarske Recognite) ponuja enostaven, natančen in zelo zmogljiv izdelek. V svoji zadnji različici prinaša izboljšano prepoznavanje oblike, pretvarjanje tiskanih obrazcev v elektronske, glasovno branje prepoznanega besedila, ustvarjanje, branje in indeksiranje Acrobatovih dokumentov ... in seveda še natančnejše prepoznavanje - tudi slovenskih - besedil.

OmniPage ima enostaven uporabniški vmesnik in nas z nekaj kliki pripelje od branja do prepoznanega besedila.

Uporabniški vmesnik OmniPaga sledi svojim predhodnim različicam. Glavno delovno okno programa je razdeljeno na tri dele - pomanjšane slike prebranih strani so na levi, slikovna oblika trenutne strani je na sredini, na desni pa je okno za urejanje prepoznanega besedila. V zgornjem delu zaslona so ukazi za krmiljenje programa, skupaj z gumbi za samodejno obdelavo, v spodnjem pa okno s podrobnimi podatki o dokumentu, ki vsebuje podatke od imena datoteke do stanja prepoznave, skupaj s številom znakov na strani in (ocenjenim) številom napak.

Tudi stari znanci programa pa bodo opazili nekaj drobnih sprememb. Najočitnejša je orodje za vnos znakov (Character Map), mala orodjarna nad urejevalnikom besedila z znaki, ki jih je nekoliko teže vnesti s tipkovnico. Zanimiva je možnost zumiranja v korektorju (Proofreader), ki omogoča boljši pregled prebrane predloge in s tem lažje prepoznavanje napak. Še vedno pa korektor ne ponuja možnosti razveljavitve napačne odločitve. Med novostmi, ki neposredno vplivajo na kakovost prepoznave, je treba omeniti orodje za izboljšanje prebranih predlog (Image Enhancement). Program vključuje osnovne in bolj zapletene postopke digitalne obdelave podob, namenjene lažji prepoznavi besedila.

Avtomatizacija postopkov je ena izmed najimenitnejših strani programa.

Ena izmed najboljših strani novega OmniPaga je možnost avtomatizacije postopka. Že prejšnje različice so lahko spremljale izbrani imenik, različica 15 pa omogoča še več, recimo branje priponk, ki jih prejeme Microsoftov Outlook. Orodje "programiramo" prek čarovnika, kar je zelo nazorno in sila enostavno, a hkrati zelo zmogljivo. Sestavni del postopka je lahko pretvorba neposredno v zapis PDF. Ko govorimo o slednjem, moramo omeniti tudi dva dodatka k programu, in sicer PDF Create! in PDF Converter. Prvi je namenjen ustvarjanju Acrobatovih datotek iz kateregakoli programa in deluje kot običajen okenski tiskalnik. Precej bolj zanimiv pa je drugi, ki dokument v obliki PDF zapiše v Wordov zapis, pri tem pa bolj ali manj ohrani njegovo obliko. PDF Converter nima težav z besedilnimi datotekami, uspešno pa obvlada tudi predloge, ki v dokumentu vsebujejo bitne slike! Zelo zanimiv dodatek, ki ga ponuja Nunace, je tudi vtičnik za Google Desktop, s katerim slednjega pripravimo za iskanje vsebine vseh prebranih (pa tudi nekaterih drugih) dokumentov. OmniPage poskrbi za prepoznavanje besedila, Google pa za indeksiranje in iskanje.

Nova različica programa po trditvah razvijalcev omogoča do 25-odstotno izboljšanje natančnosti prepoznave - z drugimi besedami, za četrtino manj napak in potrebnih ročnih popravkov. OmniPage dokumente z "običajnim" besedilom (ena od standardnih pisav primerne velikosti) in enostavno obliko prepozna skoraj v celoti (natančnost je večja od 99 %). Pri zahtevnejši obliki, recimo zapletenih preglednicah ali straneh iz revij, se natančnost prepoznave zmanjša, večja pomanjkljivost pa je slabo ohranjanje oblike. Program pri slednji sicer kaže napredek, a smo še daleč od delovanja v načinu "poženi in pozabi".

OmniPage je, tudi po zaslugi vgrajenega slovenskega črkovalnika, odličen program za optično prepoznavanje znakov. Nova različica ponuja cel kup zanimivih dodatkov, ki pa precej obremenijo zmogljivosti računalnika (predvsem disk), pa tudi lastnikovo denarnico. Različica Professional je zato primerna predvsem za podjetja, za domačo rabo pa povsem zadošča okrnjena, a veliko cenejša običajna izvedba.

OmniPage Professional 15

Kaj: Natančen in zmogljiv program za optično prepoznavanje znakov.

Zahteve: Windows 98, Me, 2000, XP, Server 2003, 128 MB pomnilnika, približno 200 MB prostora na disku.

Izdeluje: Nuance, www.nuance.com.

Prodaja: Enajsta šola, (01) 426 74 32.

Cena: OmniPage Professional 162.883 tolarjev, OmniPage 39.578 tolarjev, nadgradnja Professional 67.843 tolarjev.

Za: Velika natančnost, odlična podpora zapisu PDF, slovenski črkovalnik, dodatek za Google Desktop.

Proti: Obsežnost programa, cena.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Kaj se zgodi, če Samsungov Galaxy Z Fold prepognete 200.000-krat?

    Ustvarjalec vsebin tech-it je s prenosom v živo na YouTubu izvedel maratonski test, v katerem je ročno odprl in zaprl Samsung Galaxy Z Fold 7 kar 200.000-krat

    Objavljeno: 8.8.2025 10:00
  • Izobraževanje zaposlenih za prepoznavanje ribarjenja je neučinkovito

    Ker so zaposleni eden najučinkovitejših vektorjev za vdore v poslovne sisteme, so različne delavnice, tečaji in urjenja, kako prepoznati ribarjenje (phishing) zlasti v večjih podjetjih postala del rednega izobraževanja. A raziskovalci z Univerze v San Diegu so pokazali, da je uspeh tovrstnih izobraževanj sila pičel.

    Objavljeno: 18.8.2025 07:00
  • Nove vrste dron

    Podjetje Insta360 je predstavilo povsem nov koncept drona Antigravity A1, ki združuje 360-stopinjsko snemanje in FPV-letenje. 

    Objavljeno: 18.8.2025 10:00
  • Unreal Engine v avtomobilih Tesla

    Vse kaže, da Tesla pripravlja pomembno vizualno nadgradnjo sistemov, kot sta Autopilot in Full Self-Driving.

    Objavljeno: 15.8.2025 10:00
  • Linus Torvalds spet ponorel

    Linus Torvalds, izumitelj in še vedno glavni skrbnik Linuxa, je vedno slovel kot vzkipljiv človek, zato tudi njegov zadnji izbruh ni zelo presenetljiv. Ob pripravi nove verzije jedra 6.17 jih je pošteno napel Palmerju Dabbeltu, ki je predložil kopico popravkov za RISC-V. Torvalds je, milo rečeno, ponorel.

    Objavljeno: 14.8.2025 05:00
  • Perplexity bi kupil Chrome

    Umetno inteligentni iskalnik Perplexity je v odmevni in povsem nepričakovani potezi Googlu ponudil 34,5 milijarde ameriških dolarjev v gotovini za prevzem spletnega brskalnika Chrome.

    Objavljeno: 13.8.2025 10:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji