Objavljeno: 10.12.2024 10:00 | Teme: umetna inteligenca, odprta koda

Llama 3.3: zmogljivost velikih jezikovnih modelov v kompaktni obliki

Družba Meta je z izdajo velikega jezikovnega modela Llama 3.3 ponovno dokazal svojo zavezanost odprtokodni skupnosti in inovacijam na področju umetne inteligence. Najnovejši večjezični veliki jezikovni model (LLM) združuje izjemno zmogljivost z optimizacijo stroškov in porabe virov. V različici s 70 milijardami parametrov tako Llama 3.3 dosega primerljive rezultate kot v preteklem poletju predstavljeni model Llama 3.1 s 405 milijardami parametrov, sevedas z občutno nižjimi stroški in potrebami po strojni opremi.

Zahvaljujoč zmanjšani velikosti modela je potrebna količina pomnilnika GPU tudi do 24-krat manjša, kar pomeni znatne prihranke pri uporabi dragih procesorjev, kot je na primer Nvidia H100 in s tem manjši porabi energije. Če je strošek enega H100 GPU-ja ocenjen na 25.000 dolarjev, lahko prihranki pri infrastrukturi znašajo tudi do 600.000 dolarjev. Poleg tega so stroški generiranja žetonov optimizirani na le 0,01 dolarja na milijon žetonov, kar model Llama 3.3 postavlja kot stroškovno učinkovitejšo alternativo konkurentom, kot sta GPT-4 in Claude 3.5.

Model je bil usposobljen na 15 bilijonih žetonov iz javno dostopnih virov ter dodatno uglašen na 25 milijonih sintetičnih primerov. Za treniranje je bilo porabljenih 39,3 milijona ur na strežnikih opremljenih s procesorji H100 s pomnilniki velikosti 80GB.

Llama 3.3 se izkaže predvsem pri večjezičnih nalogah. Na testih, kot je MGSM, dosega kar 91,1-odstotno natančnost, pri čemer podpira jezike, kot so nemščina, francoščina, španščina, italijanščina, portugalščina, tajščina in hindijščina. Z novim kontekstnim oknom velikosti 128.000 žetonov je model idealen za generiranje dolgega besedila in obdelavo kompleksnih nalog.

Med tehničnimi izboljšavami je vključena tudi arhitektura Grouped Query Attention (GQA), ki povečuje učinkovitost med inferenčnimi postopki. Poleg tega so bili varnostni vidiki izboljšani z uporabo okrepitvenega učenja na podlagi povratnih informacij ljudi (RLHF) in nadzorovanega uglaševanja (SFT). Model se učinkovito upira neprimernim zahtevam, kar zagotavlja varno in etično uporabo.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Starlinkovi sateliti padajo na Zemljo

    Kot v obrabljeni frazi je Starlink tudi v resnici upokojil že več satelitov, kot so jih druga podjetja sploh izstrelila. Vsak dan na Zemljo pade kakšen, kar ni malo. Že marca letos smo poročali, da je Starlink deorbitiral 865 satelitov, še dobrih tristo pa jih je bilo na seznamu. Trend se nadaljuje.

    Objavljeno: 13.10.2025 05:00
  • Telefone nam bodo prodajali še brez kablov

    ​​Sony je s svojim novim modelom pametnega telefona Xperia 10 VII dvignil precej prahu.

    Objavljeno: 9.10.2025 14:00
  • Uvodnik - Telefon 'AI'

    Včasih me kdo vpraša: »Kaj je sploh ta umetna inteligenca na telefonih, ki jo menda vsi zdaj imajo, na kaj je treba paziti pri nakupu?« Naj poskusim odgovoriti.

    Objavljeno: 30.9.2025 | Avtor: Matjaž Klančar | Monitor Oktober 2025
  • Miške so lahko tudi prisluškovalne naprave!

    Mikrofoni ne počno nič drugega kot zaznavajo potovanje zvočnih valov po mediju, ki je običajno zrak. A na enak način se zvok širi tudi po trdninah, kar ni le znanstvenofantastični način prisluškovanja. Raziskovalci s kalifornijske univerze v Irvinu so pokazali, da lahko tudi zmogljive igričarske miške delujejo kot prisluškovalna naprava.

    Objavljeno: 8.10.2025 05:00
  • Windows 11 ne bo možno namestiti brez interneta in spletnega profila

    Ni skrivnost, da Microsoft resnično motijo namestitve in uporaba Windows brez spletnih profilov. Že doslej so takšno, lokalno uporabo oteževali, sedaj pa so naredili še korak naprej. V novi testni verziji Windows 11 so onemogočili vse znane načine za izogibanje spletnemu profilu.

    Objavljeno: 8.10.2025 07:00
  • Kako onesposobiti mobilno omrežje milijonske metropole

    Mobilna omrežja, ki v današnjem svetu predstavljajo ključno infrastrukturo, je sorazmerno enostavno mogoče povsem onesposobiti, ne da bi se jih fizično dotaknili. Najpreprostejši napad je preobremenitev, za kar potrebujemo zgolj zadosti kartic SIM, ki jih uporabimo za zasutje omrežja s prometom. Takšno opremo so nedavno odkrili v New Yorku in okolici.

    Objavljeno: 6.10.2025 07:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji