Objavljeno: 8.2.2021 07:00 | Teme: microsoft, oblak, govor

Microsoft ponuja razpoznavo in sintezo govora v slovenščini

Microsoft je posodobil spletno storitev Azure Speech Services, ki zdaj podpira razpoznavo in sintezo govora v večini jezikov Evropske unije, med katerimi tudi slovenščino. Azure Speech Services s pomočjo algoritmov umetne inteligence Neural TTS nudi tri različne storitve, ki utegnejo igrati pomembno vlogo pri razvoju nove generacije programov z interakcijo v naravnem (govorjenem) jeziku.

Prva storitev omogoča pretvorbo jezika v slovenski govorjeni jezik (Text-to-Speech). Trenutno so za slovenščino na voljo trije govorni vzorci (en ženski, dva moška), ki nudijo izredno kvalitetno branje besedila, kjer je skoraj nemogoče zaznati razliko med strojnim govorjenjem in človeškim govorom profesionalnega govorca. Delovanje je možno preizkusiti na tej povezavi.

Druga storitev je najbrž najbolj zanimiva in težko pričakovana: omogoča namreč pretvorbo govora v besedilo v slovenščini (Speech-to-Text). Storitev cilja na aplikacije s podporo za glasovno upravljanje, prepisovanje pogovorov in analizo klicev v centrih za podporo strankam. Na spletni strani Azure Speech Services demo program še ne podpira slovenščine, tako da na preizkus kakovosti razpoznave še čakamo.

Tretja storitev je prav tako zanimiva, saj omogoča neposredno prevajanje govora iz izvornega v enega izmed 70 podprtih jezikov. Tudi tu slovenščina še ni možna izbira za vir govora, je pa možno preizkusiti prevod iz poljubnega jezika v slovenščino, kjer so rezultati spodbudno dobri.

Storitve Azure Speech Services so na voljo predvsem razvijalcem programske opreme, ki lahko podporo za različne glasovne storitve vgradijo v svoje programe. Temu primerna je tudi cenovna politika Microsofta, ki storitev nudi kot plačljivo storitev v oblaku, cena pa je odvisna od količine besedila oziroma trajanja zvočnih posnetkov.

Za preizkus storitev Microsoft nudi celo brezplačni nivo storitev. Razpoznavo govora ne bomo plačali za posnetke dolžine do 5 ur na mesec. Enako velja za strojno prevajanje govora. Pri sintezi pa lahko računamo na brezplačno kvoto 5 milijonov znakov na mesec v standardnem načinu oziroma pol milijona, če uporabimo kvalitetnejši algoritem Neural TTS.

Od tu dalje je treba plačati 0,844€ na uro zvočnega zapisa oziroma 1,181€ na uro, če je razpoznava uporabljena na ciljni napravi (tipično za mobilne naprave). Strojno prevajanje govora stane 2,11€ na uro zvočnega zapisa. Pri sintezi govora sta na voljo dve kvaliteti: 3,374€ na milijon znakov v standardni kvaliteti in 13,493€ na milijon znakov pri uporabi algoritma Neural TTS.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • V ZDA bodo retroaktivno prepovedali DJI-jeve letalnike

    Ameriška Zvezna komisija za telekomunikacija (FCC) je sprejela sila nenavadno odločitev in za nazaj prepovedala uporabo naprav, ki jih je že odobrila in sprostila njihov uvoz v ZDA. Odločitev, da to smejo storiti, so sprejeli s tremi glasovi za in nobenim proti. Uperjena je proti kitajskemu proizvajalcu letalnikov DJI.

    Objavljeno: 3.11.2025 07:00
  • Konec poti za slovensko upravljanje z računi

    Storitev noprintZ, ki je uporabnikom omogočala prejemanje digitalnih računov in ročni vnos fizičnih računov, se bo ob koncu leta 2025 dokončno poslovila. 

    Objavljeno: 12.11.2025 06:00 | Teme: android, mobilna aplikacija, Slovenija
  • Microsoft pokazal Windows 11 26H1, ki na običajnih računalnikih ne bo deloval

    Verzija Windows 11, ki bo izšla prihodnje leto, se bo predvidljivo imenovala Windows 11 26H1, a je zelo verjetno ne bomo mogli uporabljati. Na kanalu Canary v programu Insider Preview se je predogledna izdaja (Build 28000) pojavila te dni, kar naznanja začetek nekoliko bolj javnega testiranja. Zdi pa se, da bo omejena na ARM-jeve procesorje.

    Objavljeno: 11.11.2025 05:00
  • Umetno inteligentni brskalniki prikažejo plačljive vsebine zastonj!

    Nekateri novi brskalniki, ki temeljijo na umetni inteligenci, lahko zaobidejo plačljive mehanizme medijskih vsebin. 

    Objavljeno: 4.11.2025 16:00
  • Kdo bo Python rešil pred smrtjo?

    Fundacija Python, ki skrbi za razvoj izjemno popularnega istoimenskega programskega jezika, je zavrnila 1,5 milijona dolarjev vredno finančno podporo Nacionalne znanstvene fundacije (NSF), ker jo je pogojevala z opustitvijo vseh programov raznolikosti, enakopravnosti in vključenosti (DEI). Namesto tega zato zbirajo donacije, kjer jim gre presenetljivo dobro.

    Objavljeno: 11.11.2025 07:00
  • Microsoft zakrpal hrošča: Windows 10 in 11 se končno znata ugasniti

    V najnovejši verziji popravkov za Windows 10 in 11 je Microsoft po več kot desetletju zakrpal hrošča, ki je marsikoga spravljal v dvome, ali njegov spomin še deluje. Če ste po uporabi Windows Update želeli računalnik ugasniti in ste izbrali Update and shut down, se je računalnik z Windows 10 ali 11 nemalokrat ponovno zagnal. Verjetno ste pomislili, da ste pomotoma kliknili Update and restart.

    Objavljeno: 4.11.2025 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji