Zvoki umetne inteligence, kot jih še nismo slišali

Nvidia je predstavila novo orodje za ustvarjanje zvokov, ki lahko ustvari nove zvoke. Orodje so poimenovali Fugatto in lahko ustvari glasbo, zvoke in govor na način, kot še niso nikoli obstajali. Trobenta, ki mijavka, ali saksofon, ki laja.

Orodje deluje kot ostali jezikovni modeli. Vnos opišemo s čim več besedami in čim natančneje, nato pa ga jezikovni model poustvari. V konkretnem primeru so rezultati zvočne oblike. Ob tem so izdali tudi znanstveni članek, ki opisuje dosežek.

Umetna inteligenca, ki ustvarja zvoke, že obstaja in ni nič novega. Stability AI, OpenAI, Google DeepMind in drugi so že vstopili na to področje. Nvidia pa kot prva pravi, da njihovo orodje ustvarja povsem nove, še nikoli slišane zvoke. Ostala orodja so bila na drugem delu spektra, saj so se soočala z očitki o plagiatorstvu.

Fugatto še ni javno dostopen, prav tako še ne vemo, kdaj bo.

Fugatto