Objavljeno: 21.3.2022 08:00 | Teme: umetna inteligenca, strojno učenje

Cenejša metoda za učenje umetne inteligence

Uporaba algoritmov umetne inteligence je na vrhu seznamov tehnologij, ki jih nameravajo v bližnji prihodnosti uporabiti podjetja, pa čeprav na tem področju primanjkuje znanja, izkušenj, pogosto pa tudi oprijemljivih rezultatov. Težave so zlasti v fazi učenju algoritmov, kar je dolgotrajen, drag in težaven proces, prepogosto prepuščen zgolj intuiciji strokovnjakov.

Raziskovalci družb Microsoft in OpenAI so zato združili moči in razvili novo metodo, ki obeta precej hitrejše, enostavnejše, s tem pa seveda cenejše učenje algoritmov umetne inteligence. Nova metoda se imenuje μTransfer (mu-transfer) in omogoča lažejo nastavitev tako imenovanih hiperparametrov, s katerimi se upravlja algoritme v fazi učenja.

Pri razvoju algoritmov umetne inteligence strokovnjaki porabijo največ časa skrbnim nastavljalnem parametrov delovanja. Ti so tipično ločeni od samega podatkovnega modela, omogočajo pa natančno prilagoditev delovanja s ciljem, da je delovanje samega algoritma na koncu kar se da natančno.

Težava s hiperparametri izhaja iz dejstva, da jih je lahko v tipičnem algoritmu resnično ogromno in jih težko obvladovati. Nekateri algoritmi temeljijo že na več milijardah parametrov, ki jih je seveda izredno težko, dolgotrajno in s tem drago upravljati tudi največjim strokovnjakom.

Nova metoda μTransfer temelji na postopku, kjer se parametri najprej nastavljajo na razmeroma majhnem podatkovnem modelu, nato pa nastavitve analogno reproducirajo na večjem podatkovnem naboru. Raziskovalci so denimo algoritem na temelju GPT-3 najprej modelirali na manjšem modelu z okoli 40 milijoni parametrov in ga kasneje prenesli na model s 6,7 milijarde parametrov.

Rezultati so bili nadvse spodbudni, saj so z novo metodo porabili le okoli 7% časa in sredstev v primerjavi z dosedanjimi metodami, seveda ob približno enakih končnih rezultatih. Prihranki so menda celo večajo ob hkratnem povečevanju podatkovnega modela. μTransfer tako obeta znatne prihranke v velikih podatkovnih modelih, zato mu napovedujejo velik uspeh. Izvorna koda algoritma je na voljo kot odprta koda.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Starlinkovi sateliti padajo na Zemljo

    Kot v obrabljeni frazi je Starlink tudi v resnici upokojil že več satelitov, kot so jih druga podjetja sploh izstrelila. Vsak dan na Zemljo pade kakšen, kar ni malo. Že marca letos smo poročali, da je Starlink deorbitiral 865 satelitov, še dobrih tristo pa jih je bilo na seznamu. Trend se nadaljuje.

    Objavljeno: 13.10.2025 05:00
  • Zakaj nihče ne mara Applovih in Samsungovih tankih telefonov?

    Applov najnovejši in najtanjši iPhone Air, ki v debelino meri le dobrih pet milimetrov in tehta 165 gramov, je čudo tehnike, a ga začuda ljudje niso radostno sprejeli. Medtem ko se iPhone 17 Pro in iPhone 17 Pro Max prodajata rekordno, klasični iPhone 17 pa prav tako žanje visoke številke, iPhone Air zapostaja.

    Objavljeno: 20.10.2025 05:00
  • Nvidia: Kitajska je za nas mrtva

    Nvidijin direktor Jensen Huang je dejal, da je tržni delež podjetja na Kitajskem hitro padel s 95 odstotkov na ničlo. To ni presenetljivo, saj izvoz na Kitajsko prepoveduje kar ameriška administracija. A to v resnici ni čisto res, saj po drugi strani več kot četrtino prodaje predstavlja izvoz v Singapur – od koder na Kitajsko vodijo neuradne poti.

    Objavljeno: 20.10.2025 07:00
  • Nizozemska prisilno prevzela kitajsko tovarno čipov

    Nizozemska je z izjemno kontroverzno in neobičajno potezo prevzela nadzor nad podjetjem Nexperia, ki je bilo v kitajski lasti. Ministrstvo za gospodarstvo je uporabilo zakon o dostopnosti izdelkov in ocenilo, da je vodenje podjetja resno zgrešeno, to pa ima posledice za dostopnost čipov, ki so ključna dobrina za državo in Evropo.

    Objavljeno: 14.10.2025 07:00
  • Windows bo umetni inteligenci dovolil dostop do lokalnih datotek

    Microsoft bo v operacijski sistem Windows 11 uvedel novo funkcionalnost umetne inteligence, imenovano Copilot Actions, ki omogoča izvajanje nalog na lokalno shranjenih datotekah. 

    Objavljeno: 17.10.2025 08:00
  • Apple z novim procesorjem in napravami

    Apple je presenetljivo tiho predstavil novo tablico iPad Pro, prenosnik MacBook Pro in očala Vision Pro.

    Objavljeno: 16.10.2025 08:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji