Objavljeno: 19.4.2024 19:00

Microsoft deepfake: Zadostujeta ena fotografija in zvočni posnetek

Microsoft Research Asia je predstavil generativni model VASA-1, ki je izurjen za ustvarjanje video posnetkov ljudi in njihovega glasu. Pokazali so, da je za uporabo dovolj imeti eno dobro fotografijo, pa lahko na zvočni posnetek pripnemo karkoli. Rezultat je videoposnetek, na katerem oseba govori sinhronizirano z zvočnim posnetkom.

Novi model so predstavili tudi v znanstvenem članku VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time, njegovo ime VASA pa pomeni Visual Affective Skills Animator. Uporablja strojno učenje, s katerim analizira sliko in zvočni posnetek. Rezultat ni poljubno besedilo ali sinteza zvoka, temveč izdelani videoposnetek, na katerem oseba govori (z ustrezno obrazno mimiko), kar je zabeleženo v zvočnem posnetku. Gre torej za orodje, ki obstoječemu zvoku doda video.

Rezultat je še vedno impresiven – in konec koncev ga lahko kombiniramo z drugimi sintetizatorji zvoka, če bi to želeli. Microsoft trdi, da je VASA-1 najboljši doslej in pri realističnosti, ekspresivnosti in učinkovitosti boljši od obstoječih metod za animacijo. To kažejo tudi testi, kjer premaga EMO: Emote Portrait Alive iz Alibabe. Rezultat so videposnetki z ločljivostjo 512 x 512 in 40 sličicami na sekundo.

Prvi praktični preizkusi so sicer uporabili umetno generirane osebe, ki ne obstajajo (slike so naredili z DALL-E 3 ali StyleGAN2), a ni prav nobene ovire, da VASA-1 ne bi deloval na resničnih ljudeh.

VASA-1

Microsoft deepfake: Zadostujeta ena fotografija in zvočni posnetek

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Steam Machine razprodan, na eBayu tudi za 3200 USD!

    Žrebanje, ki naj bi preprečilo predprodajo nove konzole podjetja Valve, je končano.

    Objavljeno: 27.6.2026 13:00
  • Google nam bo zaklenil ekosistem Android

    Dolgo vrsto let je bila ena izmed glavnih prednosti ekosistema Android njegova odprtost, saj za razliko od konkurenčnega Applovega iOS-a ni imel omejitev za nameščanje aplikacij. Resda je Google preverjal aplikacije, ki jih je uvrstil na svojo tržnico Play Store, a vsakdo je lahko mimo te tržnice namestil karkoli, če je z interneta prenesel namestitveno datoteko. Postopek se imenuje sideloading in je na primer na iOS onemogočen. To se bo zdaj zgodilo tudi na Androidu.

    Objavljeno: 19.6.2026 05:00
  • Getty Images bo sodeloval z OpenAI, delnica se je čez noč podvojila!

    Podjetje Getty Images je v nedeljo sporočilo, da bodo sodelovali z OpenAI. Priljubljeno orodje umetne inteligence ChatGPT bo lahko brskalo po Gettyjevi knjižnici podob, se iz njih učilo in jih uporabnikom tudi streglo, kar seveda ne bo zastonj. Koliko bo Getty Images z dogovorom zaslužil, podjetji nista razkrili. Vlagatelji pa menijo, da ogromno.

    Objavljeno: 23.6.2026 05:00
  • Preboj, ki bo pospešil internet

    Kitajska telekomunikacijska in optična podjetja so z uspešnim preizkusom tehnologije optičnih vlaken z votlim jedrom postavila nov zgodovinski mejnik na področju globalnih komunikacij.

    Objavljeno: 29.6.2026 12:00
  • Microsoft odkril črva, ki krade kriptovalute

    Microsoft je opozoril na odkritje novega in naprednega črva, poimenovanega Crypto Clipper, ki se širi prek okuženih USB ključkov in je namenjen kraji kriptovalut.

    Objavljeno: 23.6.2026 10:00
  • Prihodnji teden bodo potekli certifikati za zagon računalnikov

    Bliža se datum, ki se je pred 15 leti zdel nedosegljivo daleč v prihodnosti. Potekli bodo certifikati iz leta 2011, s katerimi se varuje zagon osebnih računalnikov (Secure Boot), da se nanje ne ugnezdi škodljiva programska oprema že v UEFI/BIOS. Ne glede na operacijski sistem morajo posodobljene certifikate dobiti vsi starejši računalniki, najsi na njih teče Windows ali Linux. Prvi se večinoma posodobi sam.

    Objavljeno: 18.6.2026 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji