Objavljeno: 7.2.2025 08:00 | Teme: umetna inteligenca

Lasten ChatGPT je s petdesetimi dolarji mogoče narediti v pol ure

Raziskovalci s Stanforda in Univerze v Washingtonu so v zelo kratkem času razvili cenovno ugoden model umetne inteligence za logično sklepanje, ki se lahko kosa z modeli podjetja OpenAI. 

Stanfordska raziskava razkriva, da je trening modela s1 trajal le 26 minut in stal manj kot 50 ameriških dolarjev. Raziskovalci so za razvoj modela uporabili metodo destilacije, pri kateri manjši modeli pridobijo znanje iz odgovorov večjih modelov. Konkretno je bil s1 izpopolnjen s pomočjo odgovorov Googlovega UI modela Gemini 2.0 Flash Thinking Experimental. Takšen razvoj je sicer pravno sporen, saj Google v svojih pogojih prepoveduje uporabo programskega vmesnika API storitve Gemini za razvoj konkurenčnih modelov.

Osnova za model s1 je odprtokodni model Qwen2.5, ki ga je razvilo podjetje Alibaba Cloud. Sprva so ga raziskovalci želeli trenirati na 59.000 vprašanjih, a so ugotovili, da že 1.000 vprašanj prinese enako dobre rezultate. Trening so izvedli na 16 grafičnih procesorjih Nvidia H100. Model uporablja tudi inovativno tehniko test-time scaling, ki mu omogoča, da si za razmislek pred odgovorom vzame več časa. 

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Starlinkovi sateliti padajo na Zemljo

    Kot v obrabljeni frazi je Starlink tudi v resnici upokojil že več satelitov, kot so jih druga podjetja sploh izstrelila. Vsak dan na Zemljo pade kakšen, kar ni malo. Že marca letos smo poročali, da je Starlink deorbitiral 865 satelitov, še dobrih tristo pa jih je bilo na seznamu. Trend se nadaljuje.

    Objavljeno: 13.10.2025 05:00
  • Telefone nam bodo prodajali še brez kablov

    ​​Sony je s svojim novim modelom pametnega telefona Xperia 10 VII dvignil precej prahu.

    Objavljeno: 9.10.2025 14:00
  • Miške so lahko tudi prisluškovalne naprave!

    Mikrofoni ne počno nič drugega kot zaznavajo potovanje zvočnih valov po mediju, ki je običajno zrak. A na enak način se zvok širi tudi po trdninah, kar ni le znanstvenofantastični način prisluškovanja. Raziskovalci s kalifornijske univerze v Irvinu so pokazali, da lahko tudi zmogljive igričarske miške delujejo kot prisluškovalna naprava.

    Objavljeno: 8.10.2025 05:00
  • Nizozemska prisilno prevzela kitajsko tovarno čipov

    Nizozemska je z izjemno kontroverzno in neobičajno potezo prevzela nadzor nad podjetjem Nexperia, ki je bilo v kitajski lasti. Ministrstvo za gospodarstvo je uporabilo zakon o dostopnosti izdelkov in ocenilo, da je vodenje podjetja resno zgrešeno, to pa ima posledice za dostopnost čipov, ki so ključna dobrina za državo in Evropo.

    Objavljeno: 14.10.2025 07:00
  • Windows 11 ne bo možno namestiti brez interneta in spletnega profila

    Ni skrivnost, da Microsoft resnično motijo namestitve in uporaba Windows brez spletnih profilov. Že doslej so takšno, lokalno uporabo oteževali, sedaj pa so naredili še korak naprej. V novi testni verziji Windows 11 so onemogočili vse znane načine za izogibanje spletnemu profilu.

    Objavljeno: 8.10.2025 07:00
  • AMD bo dobavljal čipe za OpenAI, slednji bo kupil desetino AMD-ja

    AMD in Open sta sklenila strateško partnerstvo, v katerem bo imel OpenAI možnost kupiti 10 odstotkov podjetja AMD. Na borzi so AMD-jeve delnice nemudoma pridobile 25 odstotkov vrednosti, s čimer se je tržna kapitalizacija podjetja povzpela 335 milijard dolarjev.

    Objavljeno: 7.10.2025 07:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji