OpenAI: prihodnost generativne inteligence je zvok
V prihodnjih mesecih bo OpenAI več svoje pozornosti namenil razvoju modelov generativne umetne inteligence, ki ustvarjajo zvok. V minulih dveh mesecih so združili več skupin, ki so raziskovale in razvijale zvočne modele, saj želijo izboljšati tako razumevanje glasovnih ukazov kot tudi rezultate.
Prvi rezultati se že kažejo. Najnovejši modeli dajejo boljše in naravnejše odzive. Ena ključnih izboljšav, ki jo bodo prinesli novi modeli, bo sočasnost. Trenutno glasovni modeli počakajo, da uporabnik izreče ukaze, nato pa se odzovejo. Sočasna govorjenje modela in človeka, kakor pogosto komuniciramo z ljudmi v resničnem življenju, še ni mogoče. Novi model, ki bo izšel v prvem četrtletju, naj bi to omogočil.
OpenAI predvsem verjame, da želijo ljudje z umetno inteligenco interagirati glasovno, ne z gledanjem v zaslon in tipkanjem. Temu podrejajo številne odločitve, zgledujoč se po načinu, kako komuniciramo z drugimi ljudmi.
V prihodnosti želi OpenAI razviti tudi več novih naprav, med njimi tudi pametni zvočnik in pametna očala. Vse te naprave bodo brez zaslonov, zato je kakovostna glasovna umetna inteligenca nujna.


