Novi algoritem Stable Diffusion lahko premaga JPG

Čeprav je standard za stiskanje fotografij z izgubo (lossy compression) postal JPG, to ni vedno najučinkovitejša rešitev. Včasih se izboljšave skrivajo na nenavadnih mestih, kar dokazuje odkritje, da lahko daje algoritem stabilne difuzije (stable diffusion) pri ekstremnem stiskanju boljše rezultate.

Stabilno difuzijo sicer uporabljajo zlasti kot pripomoček umetne inteligence za generiranje fotografij iz besedila. Srž predstavlja 4 GB velika datoteka s trenažnimi podatki, ki jo je algoritem preštudiral in mu omogoča, da nariše fotografijo glede na podane ključne besede. Naučil se je na milijonih fotografij s spleta, ki so bile ustrezno označene.

Matthias Bühlmann pa je ugotovil, da lahko ta pravi korak izpustimo. Namesto da bi v algoritem poslali ključno besedilo, lahko vanj pošljemo kar fotografijo samo. Pri visoki kompresiji, denimo s 768 kB na 5 kB, se odreže bolje kot JPEG. Fotografije zasedejo manj prostora, a so lepše.

To seveda ne pomeni, da bomo v vseh primerih jeli uporabljati Stable Diffusion 1.4. Prva pomanjkljivost je potreba po 4 GB veliki datoteki s podatki iz treninga. Druga težava pa je, da lahko v nekaterih primerih algoritem slikam doda podrobnosti, ki jih original ni imel. A bolj kot uporabnost odkritja je pomembna smer, v katero nas napotuje. Morda v prihodnosti dobimo še boljše algoritme za stiskanje, ki so se učili na obstoječih vsebinah in za katere nihče v resnici ne ve, kako delujejo.

Tehnične podrobnosti

Koda