RTV Slovenija svoje oddaje podnaslavlja že 20 let, v zadnjih dveh letih pa so uvedli še samodejno podnaslavljanje za praktično vso produkcijo. V začetku leta je samodejno podnaslavljanje oddaj slovenskih televizij omogočil tudi Telekom Slovenije, za zdaj le v načinu »ogled nazaj«. Podnapisi niso več redkost ali luksuz, temveč bodo kmalu na voljo za vse programe in oddaje – tudi tuje, ki se bodo sproti prevajale v slovenščino.
Ko smo tuje filme in oddaje nekoč gledali na nemških in italijanskih programih, smo se jezili nad njihovo predanostjo sinhronizaciji. Da niso podnaslavljali lastne produkcije, je bilo razumljivo, a tudi ameriške filme so vestno presneli z govorom v nemščini ali italijanščini. Podnapise smo zares videli le na slovenskih programih, kadar so vrteli tuje filme.
Podnaslavljanje v angleščini je prinesel šele internet, ko smo v začetku tisočletja iskali datoteke s podnapisi (.srt) za filme, ki smo jo pretočili z interneta (nekoč divx, kasneje tudi novejše formate). Podnapisi v istem jeziku kot avdio zapis pa so postali samoumevni šele s pretočnimi storitvami. Novi filmi in serije se že distribuirajo skupaj s podnapisi v originalnem jeziku in še številnih prevodih, ki so vnaprej pripravljeni in pregledani.
V povprečju traja podnaslavljanje minute slovenske vsebine sedem sekund, minute angleške vsebine s prevodom pa dvakrat toliko.
Kmalu pa niti to ne bo več potrebno, saj tehnologije za samodejno razpoznavanje govora že obstajajo in tudi strojno prevajanje je močno napredovalo. Youtube ima že lep čas samodejni prepis angleškega govora, ki deluje solidno. Dokler ne pretiravamo z lastnimi imeni in s prehitro/nerazumljivo govorico. Kot smo že tolikokrat ugotavljali pri analizi različnih jezikovnih orodij, slovenščina ter slovenska podjetja in ustanove prav nič ne zaostajajo za tujino – podnaslavljanje v slovenščini so dobili tudi slovenski programi. Razlogov je več, storitev pa še zdaleč ni namenjena le gluhim in naglušnim, temveč čisto vsem. Moderna produkcija je takšna, da so dialogi mestoma slabo razumljivi, zlasti če ne gledamo v čisti tišini.
NEO piše slovensko
Marca letos je Telekom Slovenije nadgradil svojo programsko opremo, ki omogoča spremljanje televizijskega »signala«. NEO je dobil možnost podnaslavljanja vsebin v maternem jeziku, torej v slovenščini. To funkcionalnost so uvedli za 20 programov, med katerimi so pretežno domači (nacionalni programi, POP TV, Kanal A, Planet idr.) ter trije angleški (Docubox, Fox News, Filmbox Arthouse) s prevodom v slovenščino, v prihodnosti pa obljubljajo razširitev nabora. Podnaslavljanje je mogoče vklopiti le pri »ogledu nazaj«, saj ne poteka v realnem času. Za kaj takega računska moč in dosegljiva tehnologija še nista na dovolj visoki ravni, dasiravno jima ne manjka dosti.
Pri Telekomu Slovenije so nam povedali, da so storitev razvili v sodelovanju s podjetjem Vitasis in z raziskovalci z ljubljanske fakultete za računalništvo in informatiko (UL FRI). Ista ekipa je razvila tudi glasovno upravljanje na platformi NEO, ki je dostopno že več let. Podnaslavljanje televizijskih vsebin je večji zalogaj, ki se rešuje v več korakih – kar je tudi razlog, da še ne poteka v realnem času.
Pojasnili so nam, da poteka v več stopnjah, za vsako opravilo pa se uporablja posebej prilagojen jezikovni model, ki so ga razvili pri Telekomu Slovenije in na UL FRI. Model teče na lastni strojni opremi, torej na strežnikih Telekoma Slovenije in ne v oblaku ali prek klicev API do tujih storitev.
Koraki so med drugim zaznavanje govora, pretvarjanje govora v besedilo, postavljanje ločil, zaznava različnih govorcev, prevod (če je potreben), ignoriranje medmetov, pretvarjanje slovnično nepravilnih oblik besed in stavkov v slovnično pravilne. Postopek steče, ko se neka oddaja sklene in je na voljo celoten zvočni zapis.
Obdelavi zvočnega zapisa in surovemu podnaslavljanju sledi uporaba več modelov, ki celotno besedilo pregledajo in analizirajo kontekst. Tak način daje precej boljše rezultate od sprotnega prepisovanja, kjer bi se mehanično zapisovala vsaka izrečena beseda posebej brez ozira na predhodno (in prihodnje) dogajanje. Cena, ki jo za takšno višjo kakovost plačamo, je zamik. Ta torej ni pogojen s hitrostjo obdelave, saj bi v tem primeru znašala nekaj sekund ali minut, temveč z dolžino oddaje.
Podnaslavljanje v televizorju
Televizorji z operacijskim sistemom Vidaa, med katerimi so najbolj znani Hisense (podjetje Vidaa je nekoč izšlo iz Hisensa), v prototipnih izdelkih zmorejo generirati podnapise v realnem času. Sistem za zdaj podpira šest svetovnih jezikov, med katerimi slovenščine še ni, jo pa lahko pričakujemo v prihodnosti, saj tehničnih ovir za njeno podporo ni.
V podjetju Hisense (pri nas Gorenje) so nam pojasnili, da gre za prototip, ki so ga pokazali na sejmu CES, a bo kmalu na voljo za vse naprave. Sistem deluje na več stopnjah. Najprej se prepozna govor, ki se iz glasovne oblike prepiše v besedilno. Ta se potem lahko tudi prevede stopenjsko na ravni besed, stavkov in povedi, za kar uporabljajo velike jezikovne modele. Ker sistem teče v oblaku, bo lahko deloval na vseh televizorjih ne glede na njihove strojne zmogljivosti.
Takšna storitev je uporabna le, če je zamik dovolj majhen, da gledalca ne moti, kar je največ 200 milisekund. Proizvajalec je dejal, da prvi testi kažejo, da potrebe po dodatnem zakasnjevanju slike ni, ali povedano drugače, podnaslavljanje poteka dovolj hitro, da sledi živi sliki. Tehnologija je še sorazmerno draga, zato je na trgu še ne ponujajo in je tudi nismo mogli preizkusiti. Ko pa bo na voljo, bo prispela tudi v Slovenijo, so zagotovili. Dobili jo bodo tako Hisensovi televizorji kakor druge (manj znane) znamke, ki uporabljajo operacijski sistem Vidaa.
V povprečju traja podnaslavljanje minute slovenske vsebine sedem sekund, minute angleške vsebine s prevodom pa dvakrat toliko. Kompromis med hitrostjo in natančnostjo so pomaknili v smer zadnje, ker pri ogledu z zamikom ni bistveno, ali se oddaja podnaslovi nekaj minut hitreje ali ne. Podnaslavljanje z nekajsekundnim zamikom, torej skoraj v živo, bi lahko izvajali že zdaj, a brez ozira na kontekst in s slabšimi rezultati. V prihodnosti bosta verjetno na voljo oba modela, so dodali. V živo bodo na voljo manj kakovostni podnapisi, po zaključku oddaje pa po sedanjem natančnejšem modelu. To načrtujejo še letos.
Podnapisi vsebin, ki jih sestavlja le en jezik – slovenščina ali angleščina –, so zelo natančni, saj se prepozna jezik in s tem izbere ustrezni model. Za zdaj se sistem nekoliko zmede, če se v oddaji prepleta več jezikov, saj bo izbrani model svojo nalogo dobro opravil le v »maternem« jeziku. Podobne težave imajo modeli, kadar govorci ne govorijo razumljivo. Rezultat so slabi podnapisi. Te težave kanijo odpraviti v prihodnjih inkarnacijah storitve.
Natančnih številk o številu uporabnikov, ki uporabljajo novo storitev, nam sicer niso posredovali, so pa odzivi zelo pozitivni. Poudarjajo, da je uporabnikov precej in da storitve še zdaleč ne uporabljajo le ljudje s težavami s sluhom, temveč tudi številni drugi. Razlogov je cel kup, od učenja slovenščine do okoliškega hrupa ali pa zgolj uvidevnosti. Ob tem dodajajo, da sproti prilagajajo podnapise glede na odzive in komentarje Hiše slovenskega znakovnega jezika ter Zveze društev gluhih in naglušnih Slovenije.
Nove programe dodajajo postopoma, za vključitev v shemo podnaslavljanja potrebujejo tudi soglasje izdajatelja televizijskega programa. V prihodnosti si torej lahko obetamo še bistveno več programov, saj tudi prevajanje iz angleščine v slovenščino ni težava, ki tudi že deluje (za tri programe, za katere imajo soglasje).

Samodejno podnaslavljanje Telekom Slovenije nudi že za 20 programov.
Podnaslavljanje pri viru
Medtem ko Telekom Slovenije poudarja, da je podnaslavljanje oddaj družbeno odgovorno dejanje in proaktiven pristop h kakovosti, ki presegata zgolj tehnično storitev, s čimer se lahko strinjamo, bi lahko postavili tudi provokativno vprašanje. Zakaj morajo podnaslavljanje zagotavljati operaterji, če pa bi lahko signal skupaj s podnapisi pošiljale kar televizijske postaje? Izkaže se, da nacionalni medij to v veliki meri že počne in da nudi kopico storitev, ki bi lahko bile širši javnosti bolje poznane.
RTV Slovenija izvaja pet storitev za dostopnost medijskih vsebin, kot so podnaslavljanje za gluhe in naglušne; znakovni jezik za gluhe; zvočni »podnapisi« za osebe z okvaro vida ali motnjami branja, razumevanja; zvočni opisi za osebe z okvaro vida ali drugimi motnjami; tehnika lahkega branja za osebe z motnjami v duševnem razvoju in drugimi intelektualnimi motnjami, denimo demenco.
V Sloveniji je približno 1.500 gluhih oseb, ki uporabljajo znakovni jezik, in okoli 200.000 oseb, ki imajo različne stopnje izgube sluha.
Podnaslavljanje izvajajo na dva načina: kot klasične vnaprej pripravljene podnapise in kot samodejno ustvarjene podnapise. Klasični podnapisi so mogoči za vnaprej posnete oddaje. Postopek se začne z orodji za samodejno prepoznavanje govora, ki uporabljajo umetno inteligenco. Tak prepis nato pregleda človek, ki popravi pravopisne napake in ga prilagodi jezikovnim ter tehničnim standardom za podnapise. Za to storitev imajo v oddelku podnaslavljanja za gluhe in naglušne v Multimedijskem centru zaposlene štiri ljudi, sodelujejo pa še štirje honorarni sodelavci.

Informativne oddaje imajo scenarij, zato jih lahko podnaslovijo vnaprej. Slika: RTV Slovenija
Tako podnaslovljene oddaje so s podnapisi dostopne tudi na internetnem portalu RTV365, ki je brezplačno na voljo vsem uporabnikom interneta v Sloveniji, v tujini pa nekaterih oddaj (zlasti tujih) in produkcij (npr. športne) zaradi avtorskih pravic ni, razen če se prijavimo s svojim profilom. Oddaje s tolmačem v znakovni jezik so istočasno dostopne na programu TV Maribor, kar je označeno z grafičnim simbolom v sporedu na spletni strani.
Zanimivo je, da RTV Slovenija še vedno nudi tudi tehnologijo, ki jo je že zdavnaj povozil čas, a ima še nekaj zvestih uporabnikov. Podnapisi so na voljo na teletekstu (771, 772, 773 za prvi, drugi in tretji televizijski program), seveda pa tudi na digitalnih platformah (portal in aplikacija). Naloga nacionalnega medija je tudi nudenje storitev, ki tržno niso smiselne, a majhni množici gledalcev izdatno koristijo.
Umetna inteligenca in VLC
Bržkone najpopularnejši program za predvajanje večpredstavnostnih datotek na računalnikih VLC bo prav tako podprl samodejno podnaslavljanje. VLC že od samega začetka podpira izpis priloženih podnapisov, ki so bodisi v ločenih datotekah bodisi v zbirniku .mkv, zdaj pa proučujejo lokalno generiranje podnapisov z umetno inteligenco.
Januarja letos so na sejmu CES prikazali prototip tega podnaslavljanja. Uporablja modele umetne inteligence, ki so dovolj oskubljeni, da tečejo lokalno, brez povezave z internetom, a hkrati dovolj sposobni, da podpirajo več kot sto jezikov. Vodja trženja Natacha Holtzhausser je ob tem dejala, da bo podnaslavljanje mogoče za vse vrste vsebin, od filmov do oddaj in predavanj ter celo pretakanja v živo.
Odtlej VLC ni razkril dodatnih informacij, zato lahko čakamo. Morda se bomo načakali, saj so že lani maja napovedali povsem novo različico VLC 4, ki je do danes še ni (so pa delujoče različice beta).

VLC je januarja pokazal samodejno podnaslavljanje in prevajanje.
Podnapisi tudi niso le prepis govora, temveč lahko posredujejo dodatne informacije, denimo o šumih in drugih zvokih v filmu ali oddaji. To gluhim in naglušnim omogoča lažje razumeti dogajanje. Uporabljajo se tudi barvni podnapisi, saj se z barvami lažje prepozna oseba, ki govori, saj morda sploh ni v kadru ali pa je težje prepoznavna.
Drugi način pa je samodejno podnaslavljanje, ki poteka v realnem času brez posredovanja človeka, zato je nekoliko nižje kakovosti. S temi podnapisi, ki jih lahko vidimo pri spremljanju oddaj prek digitalnih platform, so opremljene praktično vse oddaje v slovenščini z redkimi izjemami (denimo glasbene oddaje). V sporedu so vnaprej podnaslovljene oddaje označeno s simbolom [=], strojno oziroma samodejno podnaslovljene oddaje pa s simbolom [s=]. Podnapise v digitalnih okoljih (spletišče RTV365, mobilne in TV-aplikacije) prikličemo s klikom na prav ta simbola.
Vnaprej pripravljene oddaje in dnevnoinformativne oddaje v živo te tehnike samodejnega prepoznavanja govora ne uporabljajo, ker za to niti ni potrebe: podnaslavljajo se klasično. Po drugi strani pa si lahko podnaslavljanje v realnem času ogledamo pri oddaji Dobro jutro, ki to z uporabo razpoznavalnika govora v okviru poskusnega projekta počne že dve leti. Lanskega decembra so samodejno podnaslavljanje razširili še na številne druge oddaje, ki so pred tem imele le podnapise ob ponovitvah. Strojno podnaslavljanje dobivajo Tarča, Marcel, Dnevna soba in druge oddaje.
Sicer se ti samodejno generirani podnapisi v arhivu oddaj ne shranjujejo, saj to niti nima smisla. Projekt želijo nadgraditi tako, da bodo po človeškem pregledu in popravkih nato tudi samodejne podnapise skupaj z oddajami shranjevali v arhiv.

RTV je samodejno podnaslavljanje začel testirani pred dvema letoma z oddajo Dobro jutro. Slika: RTV Slovenija
Za primerjavo povejmo, da z vnaprej pripravljenimi (torej človeško pregledanimi podnapisi) letno opremijo več kot 14.000 oddaj na vseh treh programih. Za vse ostale oddaje, tudi za športne prenose, so na prvem in drugem programu na voljo SAMODEJNI strojni podnapisi. V prihodnosti bodo to omogočili tudi na tretjem programu, regionalnem centru in – radijskih programih. Sámo storitev pa nameravajo še izboljšati, dodati funkcionalnosti in zagotoviti sprotno jezikovno urejanje.
Konvergenca?
Tehnologija obstaja, pametni ljudje obstajajo, strojna moč obstaja. Pa bodo različni deležniki podnaslavljali vsak zase in mimo drug drugega? Nekoliko bolj taktno smo to vprašanje postavili tudi operaterjem in televizijam, a smo dobili le zelo diplomatske dogovore.
Seveda so operaterji samostojne gospodarske družbe, ki poslujejo v skladu s svojimi prioritetami in poslovnimi modeli. Podnaslavljanje več programov in kakovostni prevodi so zagotovo konkurenčna prednost, ki se je zavedajo. Ali jo predstavijo kot poslanstvo, družbeno odgovornost in prispevek k vključujoči družbi ali pa zgolj kot poslovni model, za končnega uporabnika niti ni pomembno. Storitev dobro deluje in uporabnikom omogoča boljšo izkušnjo, ob tem pa ne prinaša dodatnih stroškov. Na RTV so dejali, da sodelovanje z operaterji že poteka, podrobnosti pa niso razkrili.
Iz tujine kakor doma
Čeprav so vsebine RTV brezplačno dostopne vsem, nekatere omejitve obstajajo zaradi avtorskih pravic. Značilen primer so filmi in tuje serije, ki so na internetu običajno dostopni le omejen čas. Podobno velja za športne prenose in nekatere druge tuje produkcije, ki jih iz tujine (s tujega IP-naslova) ni mogoče spremljati.
Temu se lahko izognemo s prijavo. Če ustvarimo profil na MMC, nato pa pod osebne podatke vnesemo sklicno številko računa za RTV-prispevek in davčno številko zavezanca, bomo imeli v tujini v EU na voljo enake vsebine kakor doma. Z enim plačanim prispevkom lahko aktiviramo štiri profile družinskih članov.

Vnos davčne številke in sklica s položnice v celotni EU odklene zaklenjene vsebine RTV.
Sistema nista konkurenčna, temveč komplementarna. S testiranjem obeh lahko ocenimo, da so vnaprej pripravljeni podnapisi RTV najvišje mogoče kakovosti, saj jih pripravljajo usposobljeni profesionalci. A po drugi strani so na voljo le za lastno produkcijo, pa še to ne za vse oddaje. Smiselno bi bilo, da RTV omogoči dostop do te vsebine tudi operaterjem, ki prenašajo njen signal. Po drugi strani pa podnaslavljanje drugih programov lahko zagotavljajo le operaterji, ki so tu omejeni le z lastno iznajdljivostjo in vztrajnostjo (in s financami) pri pridobivanju soglasij. V idealnem svetu – ki morda sploh ni zelo daleč – bosta sistema neopazno prepletena, gledalec pa bo imel za ves program na voljo kakovostne podnapise za več okusov: dobesedni prepis, obdelani podnapis, podnapis z dodatnimi informacijami za gluhe in morda še kaj. V živo.
Najbolj nam bodo verjetno hvaležni sosedje ali družinski člani v sosednji sobi, dolgoročno pa lastna ušesa.