Objavljeno: 19.4.2024 19:00

Microsoft deepfake: Zadostujeta ena fotografija in zvočni posnetek

Microsoft Research Asia je predstavil generativni model VASA-1, ki je izurjen za ustvarjanje video posnetkov ljudi in njihovega glasu. Pokazali so, da je za uporabo dovolj imeti eno dobro fotografijo, pa lahko na zvočni posnetek pripnemo karkoli. Rezultat je videoposnetek, na katerem oseba govori sinhronizirano z zvočnim posnetkom.

Novi model so predstavili tudi v znanstvenem članku VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time, njegovo ime VASA pa pomeni Visual Affective Skills Animator. Uporablja strojno učenje, s katerim analizira sliko in zvočni posnetek. Rezultat ni poljubno besedilo ali sinteza zvoka, temveč izdelani videoposnetek, na katerem oseba govori (z ustrezno obrazno mimiko), kar je zabeleženo v zvočnem posnetku. Gre torej za orodje, ki obstoječemu zvoku doda video.

Rezultat je še vedno impresiven – in konec koncev ga lahko kombiniramo z drugimi sintetizatorji zvoka, če bi to želeli. Microsoft trdi, da je VASA-1 najboljši doslej in pri realističnosti, ekspresivnosti in učinkovitosti boljši od obstoječih metod za animacijo. To kažejo tudi testi, kjer premaga EMO: Emote Portrait Alive iz Alibabe. Rezultat so videposnetki z ločljivostjo 512 x 512 in 40 sličicami na sekundo.

Prvi praktični preizkusi so sicer uporabili umetno generirane osebe, ki ne obstajajo (slike so naredili z DALL-E 3 ali StyleGAN2), a ni prav nobene ovire, da VASA-1 ne bi deloval na resničnih ljudeh.

VASA-1

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Severna Koreja s kriptovalutami in lažnimi zaposlenimi nakradla milijarde

    Za razliko od praktično vseh ostalih držav se Severna Koreja v veliki meri zanaša na internetni kriminal in kriptoprevare za financiranje delovanja države in izogibanje sankcijam. Tudi eden večjih letošnjih vdorov, ko so neznanci z borze Bybit ukradli za poldrugo milijardo dolarjev kriptovalute ether, je bil plod Severne Koreje.

    Objavljeno: 27.10.2025 07:00
  • Popolnoma drugačno električno kolo

    Rivianovo hčerinsko podjetje Also, specializirano za mikromobilnost, je predstavilo inovativno električno kolo TM-B (Transcendent Mobility - Bike), ki obljublja povsem novo izkušnjo vožnje. 

    Objavljeno: 23.10.2025 16:00
  • V Londonu vam bodo verjetno ukradli telefon

    Samo v lanskem letu so v Londonu ukradli 80.000 pametnih telefonov, kar je v milijonski metropoli sicer malo, a vseeno precej več kot v drugih podobno velikih mestih v Evropi. In približno tretjino več kot leto pred tem. Trend je torej zaskrbljujoč.

    Objavljeno: 23.10.2025 05:00
  • SD-kartica na dnu Atlantika preživela implozijo Titana

    Raziskovalci so na dnu Atlantskega ocena v bližini razbitine Titanika našli SanDiskovo spominsko kartico SD, s katere so lahko sneli 12 fotografij in devet videoposnetkov. Kartica je tja potonila pred dvema letoma, ko je implodirala podmornica Titan, s katero je podjetje OceanGate želelo obiskati razbitine slavnega parnika.

    Objavljeno: 22.10.2025 05:00
  • Tri četrtine vseh satelitov je Starlinkovih!

    S precej manj pozornosti javnosti, kot bi si tako pomembne spremembe zaslužile, v Zemljino orbito izstreljujemo satelite hitreje kot kdajkoli doslej. Prednjačijo ponudniki satelitskega dostopa do interneta, med katerimi je najhitrejši Starlink. Ta je 19. oktobra z raketo Falcon 19 v vesolje poslal še 28 satelitov, s čimer je presegel magično mejo 10.000.

    Objavljeno: 22.10.2025 07:00
  • Uvodnik: Vedno je kriv DNS!

    Konec oktobra se je zgodilo nekaj, kar bi lahko imenovali že klasika digitalne dobe – Amazonov oblak AWS je spet odpovedal poslušnost. Tokrat je šlo za podatkovni center US-EAST-1, tisti najbolj obremenjeni in najstarejši del Amazonove infrastrukture, ki poganja velik del svetovnega spleta.

    Objavljeno: 28.10.2025 | Avtor: Matjaž Klančar | Monitor November 2025
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji