Objavljeno: 10.12.2024 10:00 | Teme: umetna inteligenca, odprta koda

Llama 3.3: zmogljivost velikih jezikovnih modelov v kompaktni obliki

Družba Meta je z izdajo velikega jezikovnega modela Llama 3.3 ponovno dokazal svojo zavezanost odprtokodni skupnosti in inovacijam na področju umetne inteligence. Najnovejši večjezični veliki jezikovni model (LLM) združuje izjemno zmogljivost z optimizacijo stroškov in porabe virov. V različici s 70 milijardami parametrov tako Llama 3.3 dosega primerljive rezultate kot v preteklem poletju predstavljeni model Llama 3.1 s 405 milijardami parametrov, sevedas z občutno nižjimi stroški in potrebami po strojni opremi.

Zahvaljujoč zmanjšani velikosti modela je potrebna količina pomnilnika GPU tudi do 24-krat manjša, kar pomeni znatne prihranke pri uporabi dragih procesorjev, kot je na primer Nvidia H100 in s tem manjši porabi energije. Če je strošek enega H100 GPU-ja ocenjen na 25.000 dolarjev, lahko prihranki pri infrastrukturi znašajo tudi do 600.000 dolarjev. Poleg tega so stroški generiranja žetonov optimizirani na le 0,01 dolarja na milijon žetonov, kar model Llama 3.3 postavlja kot stroškovno učinkovitejšo alternativo konkurentom, kot sta GPT-4 in Claude 3.5.

Model je bil usposobljen na 15 bilijonih žetonov iz javno dostopnih virov ter dodatno uglašen na 25 milijonih sintetičnih primerov. Za treniranje je bilo porabljenih 39,3 milijona ur na strežnikih opremljenih s procesorji H100 s pomnilniki velikosti 80GB.

Llama 3.3 se izkaže predvsem pri večjezičnih nalogah. Na testih, kot je MGSM, dosega kar 91,1-odstotno natančnost, pri čemer podpira jezike, kot so nemščina, francoščina, španščina, italijanščina, portugalščina, tajščina in hindijščina. Z novim kontekstnim oknom velikosti 128.000 žetonov je model idealen za generiranje dolgega besedila in obdelavo kompleksnih nalog.

Med tehničnimi izboljšavami je vključena tudi arhitektura Grouped Query Attention (GQA), ki povečuje učinkovitost med inferenčnimi postopki. Poleg tega so bili varnostni vidiki izboljšani z uporabo okrepitvenega učenja na podlagi povratnih informacij ljudi (RLHF) in nadzorovanega uglaševanja (SFT). Model se učinkovito upira neprimernim zahtevam, kar zagotavlja varno in etično uporabo.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Podjetja nočejo Copilota, ker zaposleni raje uporabljajo ChatGPT

    Microsoft kljub velikim naporom (beri: finančnemu vložku) podjetjem težko proda storitve umetne inteligence Copilot.

    Objavljeno: 27.6.2025 09:00
  • Android vam bo povedal, ali vam policija prisluškuje

    Čedalje popularnejši način prisluškovanja in prestrezanja podatkov z mobilnih telefonov je uporaba lažnih baznih postaj (IMSI catcher), ki jih imajo organi pregona v nekaterih državah, lahko pa tudi drugi akterji. Na takšno napravo se povežejo vsi telefoni v okolici, saj njen signal preglasi legitimne bazne postaje, upravljavec pa potem zlahka prestreza komunikacijo. Uporabnik tega početja praktično ne more zaznati.

    Objavljeno: 1.7.2025 07:00
  • Kitajski prenosniki so dve leti za zahodnimi

    Čeprav se Kitajci močno trudijo in izdatno investirajo v domači razvoj in proizvodnjo čipov, so še vedno vsaj dve generaciji za zahodnimi izdelki. To izkazuje tudi najnovejši Huaweijev prenosnik MateBook Fold Ultimate, ki poganja lastni HarmonyOS in ima same kitajske komponente. A te v primerjavi z zahodnimi zaostajajo.

    Objavljeno: 25.6.2025 07:00
  • Pametna očala s samodejnim ostrenjem bi lahko nadomestila bifokalna stekla

    Finsko podjetje IXI razvija inovativna očala z lečami, ki se samodejno ostrijo glede na pogled uporabnika. 

    Objavljeno: 23.6.2025 10:00 | Teme: pametna očala
  • Teslini samovozeči taksiji ne znajo voziti

    Prvi dnevi Teslinih robotskih taksijev so polni napak, vožnje po napačni strani ceste, nenadnih zaviranj in nevarnih ustavljanj za odlaganje potnikov.

    Objavljeno: 26.6.2025 09:00
  • HDMI 2.2 je tu!

    Sicer na papirju, a vendarle. HDMI Forum je izdal končne specifikacije standarda HDMI 2.2, ki so ga izdatno opisovali in predstavljali že na januarskem sejmu CES. HDMI 2.2 ima že večjo prepustnost kot DisplayPort, a bo zanjo zahteval nove kable Ultra96.

    Objavljeno: 27.6.2025 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji