Meta predstavila model Llama 3.1 405B, ki ga lahko snamemo

Meta je včeraj predstavila nov veliki jezikovni model, kar v današnjem svetu s trenutnim tempom izhajanja ne bi bila več posebna novica, če ne bi bil odprt. Novi model Llama 3.1 405B je na voljo vsakomur, saj ga je moč sneti z interneta. To je torej prvi model, primerljiv z GPT-4, ki je odprt in dostopen.

Ali je Llama 3.1 boljša od GPT-4, Claude 3.5 Sonneta ali Geminija 1.5 Pro, je vprašanje brez jasnega odgovora. Vsak proizvajalec ob hvalil svoje modele, različni testi pa dajejo različne rezultate, med katerimi vsakdo izbere tistega, ki mu ustreza.

Llama 3.1 405B je natreniran na 15 bilijonih žetonov, za kar so uporabili več kot 16.000 kartic Nvidia H1000. Model sestavlja 405 milijard parametrov, torej numeričnih vrednosti v nevronski mreži, ki je njegovo srce. Načeloma so večji modeli boljši, a pri stotinah milijardah žetonov so nadaljnje izboljšave malenkostne.

Mark Zuckerberg je ob najavi modela objavil še daljši esej o pomembnosti odprtih modelov, s katerih se lahko načeloma strinjamo. Moti pa njegova oznaka modela kot odprtokodnega, kar ni res. Model lahko vsakdo sname in uporablja, se mora strinjati s pravili uporabe in sprejeti Metino licenco. To pa je manj odprtokodnosti, dasiravno bistveno več od tega, kar ponujata OpenAI ali Microsoft.

