Objavljeno: 8.4.2025 05:00

Končno vidimo, kako veliki jezikovni modeli razmišljajo

Aktualna umetna inteligenca oziroma veliki jezikovni modeli veljajo za eno najmanj razumljenih komercialno dostopnih tehnologij, s čimer smo se nekako vsi sprijaznili. Pogled vanje so nam nekoliko odstrli pri Anthropicu, kjer so na svojem modelu Claude 3.5 Haiku uporabili tehnologijo sledenja po povezavah (circuit tracing). Rezultati so osupljivi.

Tehnika sledi jezikovnemu modelu, ko išče odgovore na vprašanja, in spremlja, kateri deli mreže se prožijo. Claudu so postavili deset vprašanj, pri čemer so bili trije načini razmišljanja posebej zanimivi. Na vprašanje, kaj je nasprotje od majhnega, je odgovarjal v angleščini, francoščini in kitajščini. Izkazalo se je, da se v prvi fazi odgovora v vseh primerih aktivira isti del mreže, ki poišče nasprotje kot pojem, šele nato pa ga prevede. Claude se torej ni na pamet naučil prevodov, ampak res razume koncept majhnosti in velikosti.

Še bolj zanimivo je vprašanje, koliko je 36 in 59. Claude ne uporabi klasičnega načina seštevanja, temveč razmišlja o seštevanju števil blizu 40 in 60. Nato ugotovi, da se mora rezultat končati s cifro 5, zato izpljune 95. Ko pa ga vprašamo, kako je prišel do odgovora, se zlaže in navede klasični osnovnošolski način seštevanja s prehodom desetic.

Ko pa so mu naročili, da spiše pesem, je celotni miselni proces še bolj bizaren. Osredotočil se je na rimo, nato pa okrog nje zgradil pesem. Rezultati torej kažejo, da Claude na nek način razmišlja. Ti testi so odstrli tančico skrivnosti v delovanju Clauda, a še vedno ne moremo reči, da ga popolnoma razumemo. Vemo pa, da ni trivialno orodje zgolj za iskanje najustreznejše naslednje besede.

 Technology Review

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Redka zmaga malega rudarja kriptovalut

    V času, ko rudarjenje bitcoina obvladujejo velika podjetja s specializirano opremo in ogromnimi viri, je neodvisnemu solo rudarju uspel izjemen podvig. 

    Objavljeno: 27.7.2025 13:00
  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • Internet umira, krivi smo sami

    Spletne strani in celotni internet se zanašajo na nepisano pravilo, ki se je v zadnjem letu začelo krhati in grozi, da bo pokopalo internet, kot ga poznamo. Zaradi agentov in modelov umetne inteligence čedalje manj klikamo na spletne strani, zaradi česar imajo te čedalje več težav s financiranjem. Zdi sem, da jim škoduje tudi Google, ki je doslej benevolentno zagotavljal promet s svojim iskalnikom.

    Objavljeno: 31.7.2025 05:00
  • Tehnologija je orodje za množično nadzorovanje

    Ko je minuli teden kamera na koncertu skupine Coldplay v Bostonu prikazala par, ki objet posluša Chrisa Martina, bi bil lahko to le še eden izmed množice povsem običajnih in dolgočasni prizor. A ker se je ženska na posnetku obrnila proč in obraz zakopal v roke, moški pa se je sklonil pod kader, je posnetek vzbudil veliko pozornosti. Pevec Chris Martin ga je na odru komentiral z besedami, da sta bodisi zelo sramežljiva bodisi razmerje skrivata – in ostalo je bilo zgodovina.

    Objavljeno: 21.7.2025 05:00
  • ChatGPT-5 bo na voljo avgusta

    Sam Altman, izvršni direktor OpenAI, je potrdil, da bo model GPT-5 izšel že v začetku avgusta. 

    Objavljeno: 25.7.2025 09:00
  • ChatGPT je slab v šahu

    Najboljši šahist sveta Magnus Carlsen je v spletnem dvoboju premagal umetno inteligenco ChatGPT v vsega 53-ih potezah, pri čemer sam ni izgubil niti ene same figure. 

    Objavljeno: 21.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji