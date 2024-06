Claude 3.5 Sonnet vsaj tako dober kot GPT-4o

Anthropic je ta teden izdal novo različico svoje umetne inteligence Claude 3.5 Sonnet, ki je njihov največji veliki jezikovni model in prvi v seriji 3.5. Ta številka je tudi ključna podrobnost v imenu, saj smo prejšnji Sonnet že dobili. Claude 3.5 Sonnet zna ustvarjati besedilo, analizirati podatke in pisati programsko kodo. Dostopen je na spletni strani ali prek API.

Kot vhod sprejme do 200.000 znakov, kar je dovolj tudi za analiziranje daljših besedil – povprečna stran v naši reviji ima okrog 5000 znakov. Analize kažejo, da je novi model najboljši Anthropicov model doslej, po kakovosti povsem primerljiv s ChatGPT-4o. To so osebna mnenja in občutki po uporabi, saj je objektivno primerjanje teh modelov težavno.

Obstajajo sicer številni testi in na MMLU (dodiplomsko poznavanje sveta), GSM8K (šolska matematika) in HumanEval (programiranje) je zares dosegel za odtenek boljše rezultate kot GPT-4o. V praksi so te številke sicer manj pomembne od obče uporabnosti.

Druga novost, ki jo je pripravil Anthropic, pa se imenuje Artifacts. Gre za nov uporabniški vmesnik, ki omogoča interakcijo z izdelki Clauda (besedilo, koda, dizajn) poleg običajnega okna za vnos pozivov. Claudu torej lahko naročimo, da napiše neko kodo, nato pa jo v Artifacts poženemo in preizkusimo.