Objavljeno: 31.3.2015 | Avtor: Jure Forstnerič | Monitor April 2015

Oblačni tolmač

Bojda postaja svet vse manjši. V Sloveniji, kjer velika večina prebivalcev razmeroma dobro razume angleščino, je to morda res, tam, kjer govorijo kak večji jezik, pa nekoliko manj. A računalniški velikani že dlje časa vztrajno rušijo tudi jezikovne meje.

Za naše okolje je bil z jezikovnega vidika izrednega pomena Microsoft, ki je že zelo kmalu ponudil tako prevedene različice operacijskega sistema Windows kot nadvse pomembnega in vplivnega pisarniškega paketa Office. Večina računalnikarjev, po vsej verjetnosti pa tudi bralcev Monitorja, je sicer raje ostala pri angleški različici tako prvega kot drugega, delno zaradi navajenosti na angleščino, delno pa zaradi lažjega reševanja težav, saj je bilo lažje poiskati pomoč v spletu. Kljub temu je ta Microsoftov korak pripomogel k hitrejši razširitvi računalnikov in računalništva pri nas – četudi je šlo bolj ali manj za komercialno odločitev.

Pri pogovoru vidimo tudi besedilo, kot ga razume program.

Pri pogovoru vidimo tudi besedilo, kot ga razume program.

Tudi danes je kljub majhnosti naše države oziroma kljub razmeroma majhnemu številu govorcev našega jezika stanje še kar dobro. Android je povsem poslovenjen, enako je tudi z zadnjo generacijo Windows Phone (ta sicer na začetku ni podpiral slovenščine). Tudi Okna (in Office) so še naprej na voljo v našem jeziku, videti je, da se bo to obdržalo tudi v prihajajoči različici Windows 10. Solidno se drži tudi odprtokodna skupnost, tam seveda zaradi požrtvovalnosti prevajalcev, ki za svoje delo načeloma ne morejo računati na zaslužek. Temna lisa je podjetje Apple, ki se za majhne trge načeloma ne zmeni preveč. Tako so uporabniki iPhona po osmih letih še vedno obsojeni na angleški vmesnik in hrvaško tipkovnico.

Stanje je še boljše v spletu, kjer je Google že pred leti ponudil lasten prevajalnik, ki med drugim podpira tudi slovenščino. To tehnologijo so vgradili tudi v brskalnik Chrome in z njim lahko hitro prevedemo praktično katerokoli spletno stran. Seveda je naš jezik razmeroma zapleten, zato prihaja do veliko napak, še posebej, ker prevajanje temelji na statističnih metodah. V Googlu imajo namreč zelo dobre razmere za strojno prevajanje – primerjajo jezikovne različice sicer ročno prevedenih strani. Če imamo torej slovensko in angleško spletno stran (ali, bolj verjetno, dokument), kjer je ena ročno prevedena, na obeh pa načeloma enaka vsebina, lahko v Googlu tako prevajajo tako posamezne besede kot besedne zveze in stavke. Teh zgledov je v spletu jasno zelo veliko, Google pa omogoča tudi vnašanje popravkov oziroma priporočil s strani uporabnikov.

Ko vstopi Microsoft

Podobno prevajanje je kmalu za Googlom predstavil tudi Microsoft, v sklopu svojega iskalnika Bing. Popolna novost pa je Skype Translator, ki smo ga preizkusili tokrat. Microsoft je leta 2011 kupil estonsko podjetje Skype (katerega lastnik je bil v preteklosti tudi Ebay) in podporo zanj razširil tudi v lastnih programih, na dogodku sredi decembra pa so predstavili novo tehnologijo, ki omogoča skoraj trenutno prevajanje govorjene besede.

Program je trenutno v globoki razvojni različici, odjemalec si sicer lahko namestimo, a bomo za njegovo rabo potrebovali preizkusni račun oz. povabilo. Za slednjega se sicer lahko prijavi vsakdo, v našem primeru smo nanj čakali nekaj mesecev. Tudi ko smo dobili elektronsko sporočilo, da je račun pripravljen, smo se morali obrniti na Microsoftovo tehnično pomoč, saj nam prijava v račun enostavno ni delovala.

Skype Translator je videti praktično enako kakor klasični Skype, lahko si tipkamo ali se pogovarjamo, podpira tudi spletne kamere. Že sprotno prevajanje natipkanega besedila je zanimivo (pri tem trenutno podpira okoli 40 jezikov), prava novost pa je prevajanje govorjene besede. Pri tem je trenutno omejen le na dva jezika, na angleščino in španščino. Ko izrečemo stavek (programu moramo po stavku pustiti premor), potrebuje trenutek ali dva, nato prijazen glas pove še prevedeni stavek – sogovornik sliši oboje, torej tako izvirni stavek kot (z manjšim zamikom) prevedenega.

Za vsakega sogovornika lahko določimo, v katerem jeziku tipka in v katerem govori. Trenutno sta pri govoru na voljo le španščina in angleščina.

Za vsakega sogovornika lahko določimo, v katerem jeziku tipka in v katerem govori. Trenutno sta pri govoru na voljo le španščina in angleščina.

Izkušnja je nadvse zanimiva. Sprva smo govorili prehitro, oziroma programu dali premalo časa, da bi lahko prevajal, a smo se hitro privadili ritmu govorjenja, predvsem dolžini premora med stavki. Seveda je velikega pomena tudi lepa in dovolj natančna izgovarjava, pri tem je zanimivo, da nam je šlo s španščino celo bolje, saj jo znamo slabše kot angleščino in smo zato razmeroma počasni, oziroma manj površni. Pogovor seveda ni tako tekoč, kot bi bil, če bi oba sogovornika govorila isti jezik, v praksi deluje, kot bi imela ob strani prevajalca, ki bi po izrečenem stavku povedano prevedel sogovorniku. Ta prevajalec seveda ni najhitrejši, velikokrat tudi ne razume najbolje – lahko si predstavljamo, da je že spil kakšno resno merico alkohola ali kaj podobnega. A vendarle – nekako kljub vsemu deluje.

Pri pogovoru vidimo tudi besedilo pogovora, kot ga je razumel program, oziroma ga shranimo v obliki besedila. Kot rečeno, je bilo med našim preizkusom veliko besed, ki jih program ni razumel ali jih je razumel napačno – recimo stavek: »So you're cooking Spanish to me«, ki je bil prvotno izrečen kot:  »So you're talking Spanish to me«. Veliko je odvisno od naglasa in od izgovarjave sodelujočih. Razvijalci pravijo, da se program tudi trudi prepoznati besede oziroma glasove, kot je »hmm«, to mu bolj ali manj tudi uspe. Se pa kljub temu zgodi tudi, da kako besedo presliši ali združi s sosednjo.

Program je še globoko v preizkusni fazi, zato nam razvijalci ponujajo ocenjevanje.

Program je še globoko v preizkusni fazi, zato nam razvijalci ponujajo ocenjevanje.

Resnična novost?

Če smo pošteni, v resnici niti ne gre za nekaj resnično novega, saj vso tehnologijo, vsaj po delih, že poznamo. Pred kratkim smo tako pisali o programu Dragon Natural Speaking, ki zapisuje narekovano besedilo. Strojno prevajanje smo opisali že zgoraj, programov, ki bi nam prebrali neko besedilo, pa je tudi kar nekaj. V Microsoftu so vse opisano lepo združili, tako da jim moramo čestitati, saj je izkušnja še kar dobra, predvsem pa kaže na velik potencial.

Program oziroma njegova osnova, ki deluje nekje v Microsoftovih strežnikih, se med rabo tudi uči. To pomeni, da bo s časom postal še natančnejši (in zato uporabnejši). V ozadju naj bi uporabljal tehnike, ki spominjajo na delovanje človeških možganov – t. i. »Deep Learning«. Računalniki najprej pretvorijo govorjeno besedo v besedilo, to pa se nato prevede s klasičnimi orodji.

Nad prevajalnim Skypom smo bili kar navdušeni. Predstavljamo si, da bomo v roku kakega leta ali dveh imeli to možnost že kar na telefonih. Pri tem je jasno, da se glavno naprezanje računalniških mišic dogaja v oblaku, torej bo zadeva brez težav delovala na praktično vseh napravah, ki so povezane v splet, jasno ob delujoči spletni povezavi. S tem programom pa bo komunikacija med različno govorečimi delovala podobno, kot je prikazano v znanstvenofantastičnih knjigah, filmih in serijah. Spomnimo se le ribice Babel v Štoparskem Vodniku.

Video

Video prispevek o Microsoftovem prevajalcu si lahko ogledate na naslovu: www.monitor.si/skype_translator

Danes program seveda še ni tako izpopolnjen, a obeta veliko. Brez težav si predstavljamo, da imajo (ali bodo v kratkem imeli) kakšen podoben projekt tudi v Googlu in še kje. Kljub temu pa nismo ravno optimistični, kar zadeva prevajanje oziroma prepoznavo našega jezika. Slovenščino je že tako ali tako presenetljivo težko razumeti oziroma govoriti, še večja težava pa je razmeroma majhno število govorcev. Samo v Indiji je več kot 25 jezikov z več govorci, kot jih ima slovenščina. Več obetata srbščina oziroma hrvaščina, ki imata skupaj približno desetkrat toliko govorcev, kot jih ima slovenščina. Morda pa se motimo – če slovanske jezike, ki imajo razmeroma podobno strukturo (in kar nekaj skupnih besed), razumejo kot relevanten trg, bomo morda nekoč le dočakali tudi glasovno prevajanje v našem jeziku.  

Skype Translator

Kaj: program za prevajanje govora.

Kje: www.skype.com/en/translator-preview

✓    Deluje, a le med angleščino in španščino ... In zaenkrat le v Windows 8.1.

✗    Še v razvoju, trenutno primerljiv z zaspanim, pijanim tolmačem.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji