Meta odprla kodo umetne inteligence za glasbo in zvoke

Meta je odprla kodo orodja za ustvarjanje zvočnih posnetkov z umetno inteligenco. AudioCraft omogoča pripravljanje glasbe in zvokov iz besedilnih opisov, podobno kot številna orodja počno s slikami. Sestavljajo ga tri komponente: AudioGen za zvočne učinke, MusicGen za glasbene kompozicije in EnCodec, ki je v resnici kodek za kompresiranje zvoka.

Poleg orodij, ki bodo odslej odprtokodna, je Meta ponudila še nekaj primerov. Ti kažejo, da je AudioCraft na zelo spodobnem nivoju, a da še ne more v celoti nadomestiti profesionalnih orodij in ljudi. Smo pa že blizu in odprtje AudioCrafta pod licenco MIT bo k temu prispevalo. Za zdaj je licenca raziskovalna, komercialna raba pa ni dovoljena.

Ob tem omenimo, da podobni izdelki že obstajajo: OpenAI-jev Jukebox, Googlov MusicLM in neodvisni Riffusion.

Github