Objavljeno: 23.8.2024 07:00

Kanibalizem modelov umetne inteligence vodi v katastrofo

Veliki jezikovni modeli potrebujejo velike količine besedila za učenje, kjer počasi trkamo ob povsem fizikalne meje. GPT-4 naj bi imel več kot bilijon parametrov, prebrati pa je moral še precej več besedila. Kakovostnih vsebin, ki so jih ustvarili ljudje, pa vseeno ni neomejeno mnogo, sploh pa dostopnih.

Zato ni presenetljivo, da so modeli najprej postrgali z interneta vse, kar se je dalo. Zaradi tega so si njihovi avtorji prislužili tudi številne tožbe, ki jih vlagajo zlasti založniki in drugi lastniki avtorskih pravic. Tožbe so vložili največji časniki v ZDA, Reddit pa je na primer prepovedal uporabo vsebin na njihovih straneh, razen če sklenejo dogovor in je uporaba plačljiva.

A nekoč bo vsebin zmanjkalo in že sedaj smo blizu. Raziskovalci so zato preverili, kaj bi se zgodilo, če bi se modeli učili od svojih mlajših bratov. Če bi na primer z GPT-n ustvarili velikanske količin besedila, ki bi ga potem pri učenju uporabil GPT-n+1, in tako naprej. Ideja ni tako zelo neverjetna, saj nekatere vrste strojnega učenja (unsupervised learning)  delujejo zelo podobno.

Rezultat je katastrofalen, so ugotovili raziskovalci. Zgodi se tako imenovani kolaps modelov, ki postanejo čedalje manj sposobni, njihovi rezultate pa nesmiselni. Kanibalizem predhodnih rezultatov začne uničevati modele, uporaba predhodnih rezultatov pa povzroči nastanek nepopravljivih defektov v novem modelu. Ni pa še jasno, kaj bi se zgodilo ob navzkrižnem učenju, kjer bi rezultati modela OpenAI nastopili kot vhod za Metin model itd.

V preizkusu, o katerem poročajo v reviji Nature, se je najbolj napreden model zataknil v stavku »black@tailed jackrabbits«. Nepopravljivo, nespremenljivo, neskončno.

Nature

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Xiaomi predstavil pametni pralni stroj prihodnosti

    Xiaomi je na kitajskem trgu predstavil pametni pralni stroj Mijia Three‑Zone Pro Drum 10 kg, ki prinaša nov pristop k pranju perila s tremi ločenimi bobni

    Objavljeno: 23.9.2025 09:00
  • Nvidia bo v OpenAI vložil 100 milijard dolarjev

    OpenAI in Nvidia sta napovedala tesno partnerstvo, ki ga bosta zapečatila z Nvidijino 100-milijardno investicijo v OpenAI. Po besedah poznavalcev gre za dvojni posel: Nvidia bo za OpenAI proizvajala čipe, ki jih bo slednji plačal z denarjem, obenem pa bo Nvidia vanj investirala 100 milijard dolarjev v zameno za prednostne delnice.

    Objavljeno: 23.9.2025 05:00
  • Windows 11 dobiva video ozadja za namizje

    V prihajajoči reviziji Windows 11 bomo lahko nastavili video ozadje na namizju, kažejo zgodnje preizkusne verzije. V trenutnih inačicah je možno uporabiti posnetke MP4 ali MKV kot ozadje. Predvajali se bodo vsakokrat, ko bomo prikazali namizje.

    Objavljeno: 23.9.2025 07:00
  • Umetna inteligenca bo nadomestila Excel

    Kljub milijonom, vloženim v sodobno programsko opremo, številne finančne ekipe še vedno za zaključevanje računov in usklajevanje številk, zlasti med pripravami na revizije, uporabljajo Excel. 

    Objavljeno: 29.9.2025 15:00
  • Xiaomi 17 z dodatnim zaslonom in veliko baterijo

    Xiaomi je na Kitajskem predstavil serijo telefonov Xiaomi 17, ki želi tekmovati za prestol na mobilnem trgu. 

    Objavljeno: 27.9.2025 13:00
  • Uvodnik - Telefon 'AI'

    Včasih me kdo vpraša: »Kaj je sploh ta umetna inteligenca na telefonih, ki jo menda vsi zdaj imajo, na kaj je treba paziti pri nakupu?« Naj poskusim odgovoriti.

    Objavljeno: 30.9.2025 | Avtor: Matjaž Klančar | Monitor Oktober 2025
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji