Objavljeno: 10.12.2024 10:00 | Teme: umetna inteligenca, odprta koda

Llama 3.3: zmogljivost velikih jezikovnih modelov v kompaktni obliki

Družba Meta je z izdajo velikega jezikovnega modela Llama 3.3 ponovno dokazal svojo zavezanost odprtokodni skupnosti in inovacijam na področju umetne inteligence. Najnovejši večjezični veliki jezikovni model (LLM) združuje izjemno zmogljivost z optimizacijo stroškov in porabe virov. V različici s 70 milijardami parametrov tako Llama 3.3 dosega primerljive rezultate kot v preteklem poletju predstavljeni model Llama 3.1 s 405 milijardami parametrov, sevedas z občutno nižjimi stroški in potrebami po strojni opremi.

Zahvaljujoč zmanjšani velikosti modela je potrebna količina pomnilnika GPU tudi do 24-krat manjša, kar pomeni znatne prihranke pri uporabi dragih procesorjev, kot je na primer Nvidia H100 in s tem manjši porabi energije. Če je strošek enega H100 GPU-ja ocenjen na 25.000 dolarjev, lahko prihranki pri infrastrukturi znašajo tudi do 600.000 dolarjev. Poleg tega so stroški generiranja žetonov optimizirani na le 0,01 dolarja na milijon žetonov, kar model Llama 3.3 postavlja kot stroškovno učinkovitejšo alternativo konkurentom, kot sta GPT-4 in Claude 3.5.

Model je bil usposobljen na 15 bilijonih žetonov iz javno dostopnih virov ter dodatno uglašen na 25 milijonih sintetičnih primerov. Za treniranje je bilo porabljenih 39,3 milijona ur na strežnikih opremljenih s procesorji H100 s pomnilniki velikosti 80GB.

Llama 3.3 se izkaže predvsem pri večjezičnih nalogah. Na testih, kot je MGSM, dosega kar 91,1-odstotno natančnost, pri čemer podpira jezike, kot so nemščina, francoščina, španščina, italijanščina, portugalščina, tajščina in hindijščina. Z novim kontekstnim oknom velikosti 128.000 žetonov je model idealen za generiranje dolgega besedila in obdelavo kompleksnih nalog.

Med tehničnimi izboljšavami je vključena tudi arhitektura Grouped Query Attention (GQA), ki povečuje učinkovitost med inferenčnimi postopki. Poleg tega so bili varnostni vidiki izboljšani z uporabo okrepitvenega učenja na podlagi povratnih informacij ljudi (RLHF) in nadzorovanega uglaševanja (SFT). Model se učinkovito upira neprimernim zahtevam, kar zagotavlja varno in etično uporabo.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Google poskrbel, da se telefonov ne bo več splačalo krasti

    Google bo okrepil zaščito pametnih telefonov Factory Reset Protection (FRP), tako da bo ukradene telefone v praksi nemogoče ponovno uporabiti. Že obstoječi Android 15 prinaša nekaj varovalk, novi FRP pa bomo dobili v Androidu 16.

    Objavljeno: 15.5.2025 05:00
  • Kitajci obrnili hrbet iPhonom

    Kitajski trg pametnih telefonov, ki tudi za zahodne znamke predstavlja izjemno pomemben delež, je letos doživel pravi pretres. Prodaja Applovih iPhonov je na primer padla za 50 odstotkov, podobno se godi tudi drugim tujim znamkam, ki nikoli niso imele zares opaznih deležev. Kitajski potrošniki so namreč začeli čedalje bolj kupovati domače izdelke.

    Objavljeno: 16.5.2025 05:00
  • Način, da vam umetna inteligenca ne bo lagala

    Vsi modeli umetne inteligence halucinirajo, včasih kakšen novejši celo bolj kot starejši, a obstajajo načini za zmanjšanje tega problema. Odpraviti ga za zdaj še ne moremo, lahko pa se mu v veliki meri izognemo, če pravilno sprašujemo. Najnovejša primerjava je pokazala, da je eden preprostejših načinov zahtevati daljše odgovore.

    Objavljeno: 14.5.2025 07:00
  • Windows dobil nov urejevalnik besedil v ukazni vrstici - Edit

    V ukazni vrstici v Windows vse od izida 64-bitnih inačic Windows nismo imeli pravega urejevalnika datotek. Starejše verzije so imele še stari MS DOS Edit, v novejših pa te funkcionalnosti ni bilo. Microsoft je zato napisal novi Edit, ki ga lahko obravnavamo kot ekvivalent za vim v Linuxu.

    Objavljeno: 20.5.2025 05:00
  • Papež svoje ime izbral zavoljo umetne inteligence

    Ko je Robert Prevost postal novi papež, si je izbral ime Leon XIV. Eden izmed razlogov za izbiro tega imena je tudi umetna inteligenca, je dejal v nagovoru kardinalskemu zboru. Leon XIII, eden izmed njegovih vzornikov, je bil papež v letih 1878-1903, torej na vrhuncu industrializacije.

    Objavljeno: 12.5.2025 05:00
  • Končno pravi internet na letalu

    Pri ameriški letalski družbi United Airlines so opravili prvi testni let z vgrajenim brezžičnim internetom Starlink. 

    Objavljeno: 12.5.2025 08:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji