Objavljeno: 8.4.2025 07:00

Meta pokazala novo družino modelov Llama 4

V Meti je kmalu po predstavitvi kitajskih modelov DeepSeek, ki so ga bistveno manj denarja pridelali zelo podobne rezultati od pregrešno dragih zahodnih modelov, začelo veljati obsedno stanje. Rezultat pospešenega razvoja so trije modeli iz družine Llama 4, ki jih je podjetje predstavilo te dni.

Imenujejo se Llama 4 Scout, Llama 4 Maverick in Llama 4 Behemoth. Naučeni so bili na ogromnih količinah neoznačenega besedila, slik in videoposnetkov, da bi čim bolje razumeli svet okoli sebe. Scout in Maverick sta že na voljo vsem, Behemoth pa je še v zadnjih faza učenja. Morda beseda vsem ni najprimernejša, saj licenca izrecno prepoveduje uporabo ljudem in podjetjem iz Evropske unije, kar je brez dvoma povezano z regulativo. Prav tako morajo posebno licenco dobiti podjetja, ki imajo več kot 700 milijonov uporabnikov mesečno.

Novi pomočniki bodo na voljo v WhatsAppu, Messengerju in Instagramu v več kot 40 državah, med katerimi evropskih še ni. Ena izmed prednosti novega modela je delitev dela, saj ga sestavlja več manjših modelov s svojimi specialnostmi, ki jim glavni model dodeli ustrezna opravila. Temu pravimo arhitektura MoE (mixture of experts). Tako ima Maverick 400 milijard parametrov, a vsak izmed 128 ekspertnih podmodelov jih hkrati uporablja le 17 milijard. Druga prednost je obseg, saj lahko prežveči do 10 milijonov žetonov dolge pozive.

Scout bo tekel na enem procesorju Nvidia H100, Maverick bo potreboval že H100 DGX, Behemoth pa precej več. Ima namreč 288 milijard aktivnih parametrov, s čimer je po lastnih navedbah boljši od GPT-4.5, Claude 3.7 Sonneta in Geminija 2.0 Pro.

 

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Redka zmaga malega rudarja kriptovalut

    V času, ko rudarjenje bitcoina obvladujejo velika podjetja s specializirano opremo in ogromnimi viri, je neodvisnemu solo rudarju uspel izjemen podvig. 

    Objavljeno: 27.7.2025 13:00
  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • Tehnologija je orodje za množično nadzorovanje

    Ko je minuli teden kamera na koncertu skupine Coldplay v Bostonu prikazala par, ki objet posluša Chrisa Martina, bi bil lahko to le še eden izmed množice povsem običajnih in dolgočasni prizor. A ker se je ženska na posnetku obrnila proč in obraz zakopal v roke, moški pa se je sklonil pod kader, je posnetek vzbudil veliko pozornosti. Pevec Chris Martin ga je na odru komentiral z besedami, da sta bodisi zelo sramežljiva bodisi razmerje skrivata – in ostalo je bilo zgodovina.

    Objavljeno: 21.7.2025 05:00
  • Internet umira, krivi smo sami

    Spletne strani in celotni internet se zanašajo na nepisano pravilo, ki se je v zadnjem letu začelo krhati in grozi, da bo pokopalo internet, kot ga poznamo. Zaradi agentov in modelov umetne inteligence čedalje manj klikamo na spletne strani, zaradi česar imajo te čedalje več težav s financiranjem. Zdi sem, da jim škoduje tudi Google, ki je doslej benevolentno zagotavljal promet s svojim iskalnikom.

    Objavljeno: 31.7.2025 05:00
  • ChatGPT-5 bo na voljo avgusta

    Sam Altman, izvršni direktor OpenAI, je potrdil, da bo model GPT-5 izšel že v začetku avgusta. 

    Objavljeno: 25.7.2025 09:00
  • ChatGPT je slab v šahu

    Najboljši šahist sveta Magnus Carlsen je v spletnem dvoboju premagal umetno inteligenco ChatGPT v vsega 53-ih potezah, pri čemer sam ni izgubil niti ene same figure. 

    Objavljeno: 21.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji