Objavljeno: 23.8.2024 07:00

Kanibalizem modelov umetne inteligence vodi v katastrofo

Veliki jezikovni modeli potrebujejo velike količine besedila za učenje, kjer počasi trkamo ob povsem fizikalne meje. GPT-4 naj bi imel več kot bilijon parametrov, prebrati pa je moral še precej več besedila. Kakovostnih vsebin, ki so jih ustvarili ljudje, pa vseeno ni neomejeno mnogo, sploh pa dostopnih.

Zato ni presenetljivo, da so modeli najprej postrgali z interneta vse, kar se je dalo. Zaradi tega so si njihovi avtorji prislužili tudi številne tožbe, ki jih vlagajo zlasti založniki in drugi lastniki avtorskih pravic. Tožbe so vložili največji časniki v ZDA, Reddit pa je na primer prepovedal uporabo vsebin na njihovih straneh, razen če sklenejo dogovor in je uporaba plačljiva.

A nekoč bo vsebin zmanjkalo in že sedaj smo blizu. Raziskovalci so zato preverili, kaj bi se zgodilo, če bi se modeli učili od svojih mlajših bratov. Če bi na primer z GPT-n ustvarili velikanske količin besedila, ki bi ga potem pri učenju uporabil GPT-n+1, in tako naprej. Ideja ni tako zelo neverjetna, saj nekatere vrste strojnega učenja (unsupervised learning)  delujejo zelo podobno.

Rezultat je katastrofalen, so ugotovili raziskovalci. Zgodi se tako imenovani kolaps modelov, ki postanejo čedalje manj sposobni, njihovi rezultate pa nesmiselni. Kanibalizem predhodnih rezultatov začne uničevati modele, uporaba predhodnih rezultatov pa povzroči nastanek nepopravljivih defektov v novem modelu. Ni pa še jasno, kaj bi se zgodilo ob navzkrižnem učenju, kjer bi rezultati modela OpenAI nastopili kot vhod za Metin model itd.

V preizkusu, o katerem poročajo v reviji Nature, se je najbolj napreden model zataknil v stavku »black@tailed jackrabbits«. Nepopravljivo, nespremenljivo, neskončno.

Nature

Kanibalizem modelov umetne inteligence vodi v katastrofo

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Steam Machine razprodan, na eBayu tudi za 3200 USD!

    Žrebanje, ki naj bi preprečilo predprodajo nove konzole podjetja Valve, je končano.

    Objavljeno: 27.6.2026 13:00
  • Google zapira zadnja vrata za blokiranje oglasov

    Google bo s prihajajočimi posodobitvami spletnega brskalnika Chrome dokončno onemogočil delovanje priljubljenih razširitev za blokiranje oglasov, kot je uBlock Origin.

    Objavljeno: 16.6.2026 10:00
  • Google nam bo zaklenil ekosistem Android

    Dolgo vrsto let je bila ena izmed glavnih prednosti ekosistema Android njegova odprtost, saj za razliko od konkurenčnega Applovega iOS-a ni imel omejitev za nameščanje aplikacij. Resda je Google preverjal aplikacije, ki jih je uvrstil na svojo tržnico Play Store, a vsakdo je lahko mimo te tržnice namestil karkoli, če je z interneta prenesel namestitveno datoteko. Postopek se imenuje sideloading in je na primer na iOS onemogočen. To se bo zdaj zgodilo tudi na Androidu.

    Objavljeno: 19.6.2026 05:00
  • Getty Images bo sodeloval z OpenAI, delnica se je čez noč podvojila!

    Podjetje Getty Images je v nedeljo sporočilo, da bodo sodelovali z OpenAI. Priljubljeno orodje umetne inteligence ChatGPT bo lahko brskalo po Gettyjevi knjižnici podob, se iz njih učilo in jih uporabnikom tudi streglo, kar seveda ne bo zastonj. Koliko bo Getty Images z dogovorom zaslužil, podjetji nista razkrili. Vlagatelji pa menijo, da ogromno.

    Objavljeno: 23.6.2026 05:00
  • Microsoft odkril črva, ki krade kriptovalute

    Microsoft je opozoril na odkritje novega in naprednega črva, poimenovanega Crypto Clipper, ki se širi prek okuženih USB ključkov in je namenjen kraji kriptovalut.

    Objavljeno: 23.6.2026 10:00
  • Preboj, ki bo pospešil internet

    Kitajska telekomunikacijska in optična podjetja so z uspešnim preizkusom tehnologije optičnih vlaken z votlim jedrom postavila nov zgodovinski mejnik na področju globalnih komunikacij.

    Objavljeno: 29.6.2026 12:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji