Objavljeno: 9.11.2025 07:00 | Teme: umetna inteligenca

Nova metoda za učenje LLM-ov obljublja velike prihranke

Raziskovalci pri Nvidia so naredili pomemben korak na področju usposabljanja velikih jezikovnih modelov (LLM). Razvili so nov pristop po imenu NVFP4, ki omogoča usposabljanje modelov z 4-bitno kvantizacijo, pri čemer ohranja stabilnost in natančnost modelov, primerljivi z 8-bitnim formatom FP8.

Kvantizacija modelov pomeni pretvorbo njihovega števila parametrov iz visoko natančnih formatov, kot sta FP16 in FP32, v formate z manj podatki, kar zmanjša potrebo po (GPU) pomnilniku in računskih zmogljivostih. Tradicionalno je industrijski standard za takšno optimizacijo 8-bitni plavajoči format (FP8), ki že znatno zniža stroške brez velikega padca kakovosti. Uporaba kvantizacije NVFP4 te stroške še precej zmanjša.

Vendar prehod na 4-bitni format (FP4) prinaša izzive: omejen razpon vrednosti (le 16 možnih vrednosti) pomeni, da lahko ekstremne vrednosti popačijo rezultate in ogrozijo učno stabilnost. Testiranja pri ustvarjanju kode so pokazala rahlo zaostajanje v kasnejših fazah učenja, kar nakazuje, da 4-bitna preciznost še ni povsem optimalna za vse vrste nalog.

NVFP4 rešuje te izzive s kombinacijo pametnega skaliranja in mešane natančnosti. Večina plasti modela se kvantizira v 4-bitno obliko, medtem ko se numerično občutljivejše plasti ohranijo v višji preciznosti, na primer v BF16. Prav tako so prilagodili način izračuna gradientov v procesu vzvratne propagacije, da zmanjšajo pristranskosti, ki izhaja iz nizke preciznosti.

V praksi so raziskovalci s pomočjo pristopa NVFP4 usposobili model s približno 12 milijardami parametrov, ki je bil treniran na približno 10 bilijonih tokenov, in ga primerjali z modelom v FP8. Rezultati kažejo, da se učna izguba in natančnost pri nalogah uspešno približujeta FP8 verziji — tako na področju znanja, logičnega sklepanja in splošnih nalog kot tudi matematičnih izzivov.

Kar to odkritje naredi posebej zanimivo za industrijo, je možnost znatnega zmanjšanja stroškov zmogljivosti: manjša potreba po hitrosti pomnilnika in procesne moči pomeni, da tudi srednje velika podjetja ali start-upi lahko razmišljajo o lastnem usposabljanju zmogljivih jezikovnih modelov, namesto da le prilagajajo obstoječe.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Severna Koreja s kriptovalutami in lažnimi zaposlenimi nakradla milijarde

    Za razliko od praktično vseh ostalih držav se Severna Koreja v veliki meri zanaša na internetni kriminal in kriptoprevare za financiranje delovanja države in izogibanje sankcijam. Tudi eden večjih letošnjih vdorov, ko so neznanci z borze Bybit ukradli za poldrugo milijardo dolarjev kriptovalute ether, je bil plod Severne Koreje.

    Objavljeno: 27.10.2025 07:00
  • V ZDA bodo retroaktivno prepovedali DJI-jeve letalnike

    Ameriška Zvezna komisija za telekomunikacija (FCC) je sprejela sila nenavadno odločitev in za nazaj prepovedala uporabo naprav, ki jih je že odobrila in sprostila njihov uvoz v ZDA. Odločitev, da to smejo storiti, so sprejeli s tremi glasovi za in nobenim proti. Uperjena je proti kitajskemu proizvajalcu letalnikov DJI.

    Objavljeno: 3.11.2025 07:00
  • Uvodnik: Vedno je kriv DNS!

    Konec oktobra se je zgodilo nekaj, kar bi lahko imenovali že klasika digitalne dobe – Amazonov oblak AWS je spet odpovedal poslušnost. Tokrat je šlo za podatkovni center US-EAST-1, tisti najbolj obremenjeni in najstarejši del Amazonove infrastrukture, ki poganja velik del svetovnega spleta.

    Objavljeno: 28.10.2025 | Avtor: Matjaž Klančar | Monitor November 2025
  • Umetno inteligentni brskalniki prikažejo plačljive vsebine zastonj!

    Nekateri novi brskalniki, ki temeljijo na umetni inteligenci, lahko zaobidejo plačljive mehanizme medijskih vsebin. 

    Objavljeno: 4.11.2025 16:00
  • Microsoft zakrpal hrošča: Windows 10 in 11 se končno znata ugasniti

    V najnovejši verziji popravkov za Windows 10 in 11 je Microsoft po več kot desetletju zakrpal hrošča, ki je marsikoga spravljal v dvome, ali njegov spomin še deluje. Če ste po uporabi Windows Update želeli računalnik ugasniti in ste izbrali Update and shut down, se je računalnik z Windows 10 ali 11 nemalokrat ponovno zagnal. Verjetno ste pomislili, da ste pomotoma kliknili Update and restart.

    Objavljeno: 4.11.2025 05:00
  • Brezplačni »Photoshop«

    Zbirka grafičnih orodij Affinity, ki je doslej stala do 70 evrov na posamezno aplikacijo, je po novem zastonj.

    Objavljeno: 3.11.2025 15:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji