Objavljeno: 16.11.2012

Microsoft prevaja v (skoraj) realnem času

Microsoftov raziskovalni oddelek Microsoft Research je presenetil javnost, ko je nedavno na konferenci na Kitajskem javno demonstriral novo tehnologijo za strojno prevajanje govora v praktično realnem času (simultano prevajanje). Najsodobnejši razvojni dosežek omogoča razpoznavo govora, prevajanje in sintezo v realnem času. Pa ne samo to - ob tem celo ohrani zven govornikovega glasu. Zadevo je predstavil vodja raziskovalnega oddelka Rick Rashid, pri čemer je bil njegov govor v angleščini sproti preveden v kitajščino.

Velik skok naprej so uspeli narediti z razvojem nove tehnike imenovane Deep Neural Networks (DNN), ki simulira delovanje človeških možganov za boljšo razpoznavo govora in boljše oponašanje izgovorjenih izrazov. S tem so nadomestili dolga leta prevladujočo statistično metodo "hidden Markov modelling", ki temelji na učenju govora s pomočjo vzorcev različnih govorcev.

Microsoft trdi, da tehnika DNN sicer še ni popolna, je pa opazno boljša od dosedanjih poizkusov na področju razpoznave govora. Navajajo, da so s tem zmanjšali število napak za okoli 30%, kar v praksi pomeni eno napako v razpoznavi na vsakih sedem do osem besed. Doslej so najboljši algoritmi dosegali po eno napako na vsake štiri ali pet besed. Obetavno, a to je vnovič le korak do cilja, ki si ga vsi želimo, a še vedno ne vidimo luč na koncu tunela.

http://research.microsoft.com/en-us/

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji