Evropski odprtokodni jezikovni model Mixtral dohiteva GPT-4

Jezikovni model za umetno inteligenco GPT-4, ki velja za doslej najbolj zmogljivega po vseh neodvisnih testih, bo kot kaže kmalu dobil dostojnega tekmeca v odprtokodnem LLM modelu Miqu-1-70b, ki ga razvija francoska družba Mistral.

Mistral s sedežem družbe v Parizu, je dobro financirano odprtokodno AI podjetje, ki stoji za priljubljenim modelom Mixtral 8x7b. Tega strokovnjaki vidijo kot najuspešnejši odprtokodni LLM doslej, gre pa za prilagojeno in na novo natreniran model na temelju jezikovnega modela Meta Llama 2.

Novi model Miqu-170-b je sprva v javnost pricurljal prek skrivnostnega uporabnika, rezultati pa so pokazali, da gre za enega najboljših jezikovnih modelov doslej. Strokovnjaki poleg tega ugibajo, ali je novi model kvantiziran (Miqu bi lahko pomenilo Mistral Quantized), kar bi ga naredilo še bolj konkurenčnega. Kvantizacija se v umetni inteligenci nanaša na tehniko, ki se uporablja za izvajanje določenih modelov umetne inteligence na manj zmogljivih računalnikih in čipih z zamenjavo določenih dolgih numeričnih zaporedij v arhitekturi modela s krajšimi.

Nekaj dni kasneje je skrivnost pojasnil Arthur Mensch, sicer direktor družbe Mistral. Podatke o modelu je v javnost posredoval nekoliko preveč navdušen uslužbenec ene od strank družbe Mistral, ki je imel zgodnji dostop do kvantizirane (in z vodnim žigom podpisane) različico starega modela, ki pa so ga ponovno natrenirali in distribuirali povsem odprto, brez kakega pompa. Obenem je namignil, da je Mistral 7B napredoval in da lahko kmalu pričakujemo večje novosti.

Mnogi menijo, da gre za prelomni trenutek na področju umetne inteligence, saj je GPT-4 doslej veljal za absolutno najbolj zmogljiv jezikovni model, ki mu ne pride blizu niti Google Gemini, kljub velikim vložkom, ki jih v jezikovni model vlaga Google. Objava odprtokodnega jezikovnega modela, ki se lahko meri z GPT-4 bi lahko močno razmerje moči na tem mladem področju rabe umetne inteligence in sprožil uporabo jezikovnih modelov v zasebnih podatkovnih centrih.