Objavljeno: 21.11.2004

Xeroxove napredne tehnologije za razpoznavo slik

Raziskovalni oddelek družbe Xerox, v katerem so v preteklosti nastali že številni znameniti računalniški izdelki, kot so miška, grafični vmesnik in laserski tiskalnik, je razkril podrobnosti o dveh novih tehnologijah, ki bi lahko močno koristile pri sistemih za razpoznavo slik. V okviru prvega projekta nastaja programska oprema, ki omogoča indeksiranje fotografij in razpoznavo elementov na njih, brez uporabe dodatnih meta podatkov, kot so naslovi in drugi meta podatki.

Xeroxov algoritem skuša elemente na fotografiji razpoznati na podlagi >>slikovnega slovarja<<, ki vsebuje številne temeljne elemente, s katerimi programska oprema primerja fotografije. Program sliko razgradi in razdeli njene elemente na posamezne gradnike, ki jih nato obdela (zavrti, poudari, počisti) in primerja s slovarjem. Vsakemu gradniku nato določi verjetnost zadetka, elemente pa nato primerja po kontekstu. Iz razpoznave avtomobilske gume in žarometa tako sklepa, da gre za avtomobil ali drugo prevozno sredstvo. Raziskovalci pa menijo, da je praktična uporaba še daleč, saj ima slikovni slovar doslej le okoli 1.000 normaliziranih elementov.

Drugi novost je rešitev, ki omogoča, da mobilne telefone z vgrajenimi digitalnimi fotoaparati uporabljamo tudi kot dokumente optične bralnike, s katerimi lahko kasneje celo opravljamo optično prepoznavo znakov. Pri Xeroxu menijo, da novi mobilni telefoni s fotoaparati višje ločljivosti (milijon pik in več), predstavljajo dovolj kvalitetno osnovo za zajem zapiskov in drugega gradiva, ki ga lahko kasneje na strežniku uporabimo za optično razpoznavo znakov. Xerox pripravlja celo rešitev, ki bo sliko prek brezžičnega omrežja prenesla na strežnik, ta pa bo telefonu vrnil besedilo v digitalni obliki.

http://www.xerox.com

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji