Jezikovni modeli, ki učijo sami sebe
Univerza MIT razvija revolucionarno metodo SEAL (Self-Adapting Language Models), ki omogoča, da se veliki jezikovni modeli učijo sami. Klasični LLM-ji so namreč statični in pri posodobitvah mnogokrat potrebujejo zunanjo pomoč – kot so prilagoditve podatkov, ročno fino nastavljanje ali okrepljeno učenje. SEAL tu spreminja način dela, saj modelu omogoči, da sam ustvari lasten učni material in nadgradi svoje uteži, s čimer pridobi trajno novo znanje ter se prilagaja novim nalogam.
Glavna prednost metode SEAL-a je dvoslojen učni proces. V “notranji zanki” se model sam ustrezno prilagodi – spremeni uteži začasno. Nato v “zunanji zanki” sistem preveri, ali je prilagoditev pripomogla k boljšim rezultatom. Če je bila uspešna, se sprememba shrani s pozitivno nagrado in spodbuja nadaljnje samodejno učenje.
SEAL se je pokazal kot učinkovito orodje pri dveh ključnih izzivih: trajnem vključevanju novega znanja in sposobnosti učiti se iz le nekaj primerov. Pri testu na LLaMA‑3.2‑1 B modelu so s sintetičnim gradivom iz SEAL‑ovih navodil izboljšali natančnost odgovarjanja iz 0 (brez učenja) na 47 %, pri čemer so celo presegli rezultate GPT‑4. Pri reševanju kompleksnih abstraktnih nalog (ARC benchmark) je SEAL z 72,5 % uspel doseči daleč več od klasičnega kontekstualnega učenja (0 %) in brez okrepljenega učenja (RL) (20 %).
Za podjetja bo imel SEAL velik potencial. Omogočal bo, da AI agenti ne le posedujejo informacije, temveč jih trajno integrirajo v svoje delovanje, npr. lahko avtomatsko dopolnjevanje navodil, tehnološke okvire ali vedenjske vzorce strank. Tako se bodo modeli stalno prilagajali dinamičnim okoljem brez ročnega vnašanja novih podatkov
Kljub vsemu metoda ni brez omejitev. Pojavlja se tveganje pozabljanja predhodno pridobljenega znanja, zato raziskovalci predlagajo hibridne rešitve – primerno znanje trajno hraniti v utežeh, hitro spreminjajoče informacije pa preko zunanje baze (RAG). Prav tako se SEAL najbolje obnese pri večurnih ali dnevnih ciklih posodobitev, saj učenje v realnem času predstavlja prevelik sistemski in časovni zalogaj.