Objavljeno: 8.2.2021 07:00 | Teme: microsoft, oblak, govor

Microsoft ponuja razpoznavo in sintezo govora v slovenščini

Microsoft je posodobil spletno storitev Azure Speech Services, ki zdaj podpira razpoznavo in sintezo govora v večini jezikov Evropske unije, med katerimi tudi slovenščino. Azure Speech Services s pomočjo algoritmov umetne inteligence Neural TTS nudi tri različne storitve, ki utegnejo igrati pomembno vlogo pri razvoju nove generacije programov z interakcijo v naravnem (govorjenem) jeziku.

Prva storitev omogoča pretvorbo jezika v slovenski govorjeni jezik (Text-to-Speech). Trenutno so za slovenščino na voljo trije govorni vzorci (en ženski, dva moška), ki nudijo izredno kvalitetno branje besedila, kjer je skoraj nemogoče zaznati razliko med strojnim govorjenjem in človeškim govorom profesionalnega govorca. Delovanje je možno preizkusiti na tej povezavi.

Druga storitev je najbrž najbolj zanimiva in težko pričakovana: omogoča namreč pretvorbo govora v besedilo v slovenščini (Speech-to-Text). Storitev cilja na aplikacije s podporo za glasovno upravljanje, prepisovanje pogovorov in analizo klicev v centrih za podporo strankam. Na spletni strani Azure Speech Services demo program še ne podpira slovenščine, tako da na preizkus kakovosti razpoznave še čakamo.

Tretja storitev je prav tako zanimiva, saj omogoča neposredno prevajanje govora iz izvornega v enega izmed 70 podprtih jezikov. Tudi tu slovenščina še ni možna izbira za vir govora, je pa možno preizkusiti prevod iz poljubnega jezika v slovenščino, kjer so rezultati spodbudno dobri.

Storitve Azure Speech Services so na voljo predvsem razvijalcem programske opreme, ki lahko podporo za različne glasovne storitve vgradijo v svoje programe. Temu primerna je tudi cenovna politika Microsofta, ki storitev nudi kot plačljivo storitev v oblaku, cena pa je odvisna od količine besedila oziroma trajanja zvočnih posnetkov.

Za preizkus storitev Microsoft nudi celo brezplačni nivo storitev. Razpoznavo govora ne bomo plačali za posnetke dolžine do 5 ur na mesec. Enako velja za strojno prevajanje govora. Pri sintezi pa lahko računamo na brezplačno kvoto 5 milijonov znakov na mesec v standardnem načinu oziroma pol milijona, če uporabimo kvalitetnejši algoritem Neural TTS.

Od tu dalje je treba plačati 0,844€ na uro zvočnega zapisa oziroma 1,181€ na uro, če je razpoznava uporabljena na ciljni napravi (tipično za mobilne naprave). Strojno prevajanje govora stane 2,11€ na uro zvočnega zapisa. Pri sintezi govora sta na voljo dve kvaliteti: 3,374€ na milijon znakov v standardni kvaliteti in 13,493€ na milijon znakov pri uporabi algoritma Neural TTS.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Najbolj brano

Android vam bo povedal, ali vam policija prisluškuje

Čedalje popularnejši način prisluškovanja in prestrezanja podatkov z mobilnih telefonov je uporaba lažnih baznih postaj (IMSI catcher), ki jih imajo organi pregona v nekaterih državah, lahko pa tudi drugi akterji. Na takšno napravo se povežejo vsi telefoni v okolici, saj njen signal preglasi legitimne bazne postaje, upravljavec pa potem zlahka prestreza komunikacijo. Uporabnik tega početja praktično ne more zaznati.

novice

Objavljeno: 1.7.2025 07:00

Tisoče severnokorejskih uslužbencev prikrito na daljavo delalo v ameriških podjetjih

Ameriško pravosodno ministrstvo je vložilo obtožnice zoper devet ljudi, ki so skrbeli za prikrito zaposlovanje računalnikarjev iz Severne Koreje za delo na daljavo v ameriških podjetjih. En Američan, šest Kitajcev in dva Tajvanca so obtoženi prevare, pranja denarja, kraje identitete, nepooblaščenega dostopa v računalniški sistem in kršenja mednarodnih sankcij.

novice

Objavljeno: 2.7.2025 07:00

Podjetja nočejo Copilota, ker zaposleni raje uporabljajo ChatGPT

Microsoft kljub velikim naporom (beri: finančnemu vložku) podjetjem težko proda storitve umetne inteligence Copilot.

novice

Objavljeno: 27.6.2025 09:00

Naprava, ki z laserji uničuje komarje

Čeprav še nimamo letečih avtomobilov ali robotov strežnikov, lahko zdaj naročimo nekaj, o čemer smo od nekdaj sanjali - lasersko napravo, ki zazna in ubije komarja v nekaj milisekundah.

novice

Objavljeno: 3.7.2025 11:00

Kitajski prenosniki so dve leti za zahodnimi

Čeprav se Kitajci močno trudijo in izdatno investirajo v domači razvoj in proizvodnjo čipov, so še vedno vsaj dve generaciji za zahodnimi izdelki. To izkazuje tudi najnovejši Huaweijev prenosnik MateBook Fold Ultimate, ki poganja lastni HarmonyOS in ima same kitajske komponente. A te v primerjavi z zahodnimi zaostajajo.

novice

Objavljeno: 25.6.2025 07:00