Objavljeno: 21.3.2022 08:00 | Teme: umetna inteligenca, strojno učenje

Cenejša metoda za učenje umetne inteligence

Uporaba algoritmov umetne inteligence je na vrhu seznamov tehnologij, ki jih nameravajo v bližnji prihodnosti uporabiti podjetja, pa čeprav na tem področju primanjkuje znanja, izkušenj, pogosto pa tudi oprijemljivih rezultatov. Težave so zlasti v fazi učenju algoritmov, kar je dolgotrajen, drag in težaven proces, prepogosto prepuščen zgolj intuiciji strokovnjakov.

Raziskovalci družb Microsoft in OpenAI so zato združili moči in razvili novo metodo, ki obeta precej hitrejše, enostavnejše, s tem pa seveda cenejše učenje algoritmov umetne inteligence. Nova metoda se imenuje μTransfer (mu-transfer) in omogoča lažejo nastavitev tako imenovanih hiperparametrov, s katerimi se upravlja algoritme v fazi učenja.

Pri razvoju algoritmov umetne inteligence strokovnjaki porabijo največ časa skrbnim nastavljalnem parametrov delovanja. Ti so tipično ločeni od samega podatkovnega modela, omogočajo pa natančno prilagoditev delovanja s ciljem, da je delovanje samega algoritma na koncu kar se da natančno.

Težava s hiperparametri izhaja iz dejstva, da jih je lahko v tipičnem algoritmu resnično ogromno in jih težko obvladovati. Nekateri algoritmi temeljijo že na več milijardah parametrov, ki jih je seveda izredno težko, dolgotrajno in s tem drago upravljati tudi največjim strokovnjakom.

Nova metoda μTransfer temelji na postopku, kjer se parametri najprej nastavljajo na razmeroma majhnem podatkovnem modelu, nato pa nastavitve analogno reproducirajo na večjem podatkovnem naboru. Raziskovalci so denimo algoritem na temelju GPT-3 najprej modelirali na manjšem modelu z okoli 40 milijoni parametrov in ga kasneje prenesli na model s 6,7 milijarde parametrov.

Rezultati so bili nadvse spodbudni, saj so z novo metodo porabili le okoli 7% časa in sredstev v primerjavi z dosedanjimi metodami, seveda ob približno enakih končnih rezultatih. Prihranki so menda celo večajo ob hkratnem povečevanju podatkovnega modela. μTransfer tako obeta znatne prihranke v velikih podatkovnih modelih, zato mu napovedujejo velik uspeh. Izvorna koda algoritma je na voljo kot odprta koda.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Najbolj brano

Aretacija hekerja razkrila, da nam Microsoft sledi

Ameriške oblasti so z aretacijo 19-letnega hekerja Petra Stokesa iz Evrope zadale močan udarec zloglasni kibernetski tolpi Scattered Spider, vendar je primer v javnosti sprožil preplah predvsem zaradi načina, kako so osumljenca izsledile.

novice

Objavljeno: 8.7.2026 09:00

Baterije električnih vozil zdržijo bistveno dlje, kot smo mislili

Najnovejša raziskava analitskega podjetja Recurrent je ovrgla zakoreninjene mite o hitrem propadanju baterij v električnih vozilih.

novice

Objavljeno: 8.7.2026 11:00

Vse prihranke je vložil v GTA 6, zdaj se mu vsi smejijo!

Na družbenem omrežju X je med igričarsko skupnostjo završalo ob objavi uporabnika z vzdevkom @AryanBundles.

novice

Objavljeno: 1.7.2026 10:00

Ljudje vrtajo v očala, da bi vas na skrivaj posneli

Pametna očala prinašajo vrsto tveganj in vprašanj glede zasebnosti, saj omogočajo skoraj prikrito snemanje kadarkoli in kjerkoli. Meta je zato svojim očalom dodala tako imenovano zasebnostno ledico (privacy LED), ki jasno in okolici vidno utripa, kadar uporabnik snema. A ljudje ne bi bili ljudje, če ne bi takoj začeli iskati načine, kako varovalko obiti.

novice

Objavljeno: 10.7.2026 05:00

Napaka na napako …

Uvedba umetne inteligence v poslovanje obeta večjo učinkovitost in nižje stroške, vendar praksa pogosto prinese nepredvidene ovire. Ko algoritem naleti na nepredvidljivost človeškega vedenja ali kompleksnost resničnega sveta, podjetja včasih ugotovijo, da je bil stari, analogni način pravzaprav boljši.

Fokus

Objavljeno: 30.6.2026 | Avtor: Boris Šavc | Monitor Julij-avgust 2026