Objavljeno: 10.12.2024 10:00 | Teme: umetna inteligenca, odprta koda

Llama 3.3: zmogljivost velikih jezikovnih modelov v kompaktni obliki

Družba Meta je z izdajo velikega jezikovnega modela Llama 3.3 ponovno dokazal svojo zavezanost odprtokodni skupnosti in inovacijam na področju umetne inteligence. Najnovejši večjezični veliki jezikovni model (LLM) združuje izjemno zmogljivost z optimizacijo stroškov in porabe virov. V različici s 70 milijardami parametrov tako Llama 3.3 dosega primerljive rezultate kot v preteklem poletju predstavljeni model Llama 3.1 s 405 milijardami parametrov, sevedas z občutno nižjimi stroški in potrebami po strojni opremi.

Zahvaljujoč zmanjšani velikosti modela je potrebna količina pomnilnika GPU tudi do 24-krat manjša, kar pomeni znatne prihranke pri uporabi dragih procesorjev, kot je na primer Nvidia H100 in s tem manjši porabi energije. Če je strošek enega H100 GPU-ja ocenjen na 25.000 dolarjev, lahko prihranki pri infrastrukturi znašajo tudi do 600.000 dolarjev. Poleg tega so stroški generiranja žetonov optimizirani na le 0,01 dolarja na milijon žetonov, kar model Llama 3.3 postavlja kot stroškovno učinkovitejšo alternativo konkurentom, kot sta GPT-4 in Claude 3.5.

Model je bil usposobljen na 15 bilijonih žetonov iz javno dostopnih virov ter dodatno uglašen na 25 milijonih sintetičnih primerov. Za treniranje je bilo porabljenih 39,3 milijona ur na strežnikih opremljenih s procesorji H100 s pomnilniki velikosti 80GB.

Llama 3.3 se izkaže predvsem pri večjezičnih nalogah. Na testih, kot je MGSM, dosega kar 91,1-odstotno natančnost, pri čemer podpira jezike, kot so nemščina, francoščina, španščina, italijanščina, portugalščina, tajščina in hindijščina. Z novim kontekstnim oknom velikosti 128.000 žetonov je model idealen za generiranje dolgega besedila in obdelavo kompleksnih nalog.

Med tehničnimi izboljšavami je vključena tudi arhitektura Grouped Query Attention (GQA), ki povečuje učinkovitost med inferenčnimi postopki. Poleg tega so bili varnostni vidiki izboljšani z uporabo okrepitvenega učenja na podlagi povratnih informacij ljudi (RLHF) in nadzorovanega uglaševanja (SFT). Model se učinkovito upira neprimernim zahtevam, kar zagotavlja varno in etično uporabo.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Najbolj brano

Domačemu rudarju kriptovalut uspelo skoraj nemogoče

Domači rudar kriptovalut je z zastarelo opremo kljub statistični možnosti 1 proti 180 milijonov prejel 3,146 BTC.

novice

Objavljeno: 24.11.2025 09:05 | Teme: Bitcoin, kriptovalute

Google bo računalnike »napadel« z operacijskim sistemom Aluminium

Google združuje operacijska sistema Android in Chrome OS ter za računalnike razvija nov operacijski sistem.

novice

Objavljeno: 25.11.2025 15:00 | Teme: google, operacijski sistem, android, chrome

SSD-ji v predalih počasi izgubljajo podatke!

Redko pomislimo, da podatki na diskih, ki varno počivajo v klimatiziranih in suhih prostorih, niso varni, še posebej če niso aktivni. Vse komponente imajo življenjsko dobo, a SSD-ji so občutljivejši od klasičnih diskov z magnetnim zapisom. Po letu dni mirovanja so podatki že močno ogroženi.

novice

Objavljeno: 26.11.2025 05:00

Italijanski MediaWorld prodajal iPade po 15 evrov

Italijanska trgovska veriga je imetnikom svojih kartic zvestobe pomotoma ponudila 13-palčni iPad Air za le 15 evrov.

novice

Objavljeno: 25.11.2025 08:00 | Teme: apple, tablica, iPad

DeepMind razvil umetno inteligenco, ki izvaja matematične dokaze

Veliki jezikovni modeli, ki so najbolj vroča izvedba umetne inteligence v zadnjih letih, niso nikoli sloveli po dobri aritmetiki, a se tudi to popravlja. Še boljši pa so specializirani modeli, kakršen je AlphaProof, ki ga je DeepMind razvil za reševanje matematičnih zagonetk. O njem pišejo v najnovejši številki revije Nature.

novice

Objavljeno: 21.11.2025 05:00 | Teme: umetna inteligenca