Objavljeno: 21.3.2022 08:00 | Teme: umetna inteligenca, strojno učenje

Cenejša metoda za učenje umetne inteligence

Uporaba algoritmov umetne inteligence je na vrhu seznamov tehnologij, ki jih nameravajo v bližnji prihodnosti uporabiti podjetja, pa čeprav na tem področju primanjkuje znanja, izkušenj, pogosto pa tudi oprijemljivih rezultatov. Težave so zlasti v fazi učenju algoritmov, kar je dolgotrajen, drag in težaven proces, prepogosto prepuščen zgolj intuiciji strokovnjakov.

Raziskovalci družb Microsoft in OpenAI so zato združili moči in razvili novo metodo, ki obeta precej hitrejše, enostavnejše, s tem pa seveda cenejše učenje algoritmov umetne inteligence. Nova metoda se imenuje μTransfer (mu-transfer) in omogoča lažejo nastavitev tako imenovanih hiperparametrov, s katerimi se upravlja algoritme v fazi učenja.

Pri razvoju algoritmov umetne inteligence strokovnjaki porabijo največ časa skrbnim nastavljalnem parametrov delovanja. Ti so tipično ločeni od samega podatkovnega modela, omogočajo pa natančno prilagoditev delovanja s ciljem, da je delovanje samega algoritma na koncu kar se da natančno.

Težava s hiperparametri izhaja iz dejstva, da jih je lahko v tipičnem algoritmu resnično ogromno in jih težko obvladovati. Nekateri algoritmi temeljijo že na več milijardah parametrov, ki jih je seveda izredno težko, dolgotrajno in s tem drago upravljati tudi največjim strokovnjakom.

Nova metoda μTransfer temelji na postopku, kjer se parametri najprej nastavljajo na razmeroma majhnem podatkovnem modelu, nato pa nastavitve analogno reproducirajo na večjem podatkovnem naboru. Raziskovalci so denimo algoritem na temelju GPT-3 najprej modelirali na manjšem modelu z okoli 40 milijoni parametrov in ga kasneje prenesli na model s 6,7 milijarde parametrov.

Rezultati so bili nadvse spodbudni, saj so z novo metodo porabili le okoli 7% časa in sredstev v primerjavi z dosedanjimi metodami, seveda ob približno enakih končnih rezultatih. Prihranki so menda celo večajo ob hkratnem povečevanju podatkovnega modela. μTransfer tako obeta znatne prihranke v velikih podatkovnih modelih, zato mu napovedujejo velik uspeh. Izvorna koda algoritma je na voljo kot odprta koda.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Kaj se zgodi, če Samsungov Galaxy Z Fold prepognete 200.000-krat?

    Ustvarjalec vsebin tech-it je s prenosom v živo na YouTubu izvedel maratonski test, v katerem je ročno odprl in zaprl Samsung Galaxy Z Fold 7 kar 200.000-krat

    Objavljeno: 8.8.2025 10:00
  • Programerska naloga, ki je ni rešil nihče

    Vsako leto se najboljši dijaki v programiranju na svetu merijo na olimpijadi iz informatike, kjer nastopa tudi slovenska ekipa. Tekmovalci v dveh tekmovalnih dneh rešujejo šest nalog, kodo pa pišejo v jeziku C++. Ene izmed nalog letos ni rešil nihče izmed 330 tekmovalci.

    Objavljeno: 6.8.2025 07:00
  • Linus Torvalds spet ponorel

    Linus Torvalds, izumitelj in še vedno glavni skrbnik Linuxa, je vedno slovel kot vzkipljiv človek, zato tudi njegov zadnji izbruh ni zelo presenetljiv. Ob pripravi nove verzije jedra 6.17 jih je pošteno napel Palmerju Dabbeltu, ki je predložil kopico popravkov za RISC-V. Torvalds je, milo rečeno, ponorel.

    Objavljeno: 14.8.2025 05:00
  • Xiaomi predstavil pametni ventilator

    Xiaomi je v poletni vročini za evropske trge predstavil Smart Desktop Air Circulation Fan, kompakten pametni ventilator, zasnovan za močan pretok zraka v manjših prostorih. 

    Objavljeno: 6.8.2025 11:00
  • Microsoft bo ukinil enoto GitHub

    Ko je Microsoft leta 2018 prevzel GitHub, se ni nič bistvenega spremenilo, saj je ostal samostojna enota z istim direktorjem. A Thomas Dohmke, ki je od leta 2021čas vodil GitHub, je napovedal odhod iz podjetja, saj ima druge podjetniške cilje. Microsoft zamenjave ne bo iskal.

    Objavljeno: 13.8.2025 05:00
  • Izobraževanje zaposlenih za prepoznavanje ribarjenja je neučinkovito

    Ker so zaposleni eden najučinkovitejših vektorjev za vdore v poslovne sisteme, so različne delavnice, tečaji in urjenja, kako prepoznati ribarjenje (phishing) zlasti v večjih podjetjih postala del rednega izobraževanja. A raziskovalci z Univerze v San Diegu so pokazali, da je uspeh tovrstnih izobraževanj sila pičel.

    Objavljeno: 18.8.2025 07:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji