Objavljeno: 7.2.2025 08:00 | Teme: umetna inteligenca

Lasten ChatGPT je s petdesetimi dolarji mogoče narediti v pol ure

Raziskovalci s Stanforda in Univerze v Washingtonu so v zelo kratkem času razvili cenovno ugoden model umetne inteligence za logično sklepanje, ki se lahko kosa z modeli podjetja OpenAI. 

Stanfordska raziskava razkriva, da je trening modela s1 trajal le 26 minut in stal manj kot 50 ameriških dolarjev. Raziskovalci so za razvoj modela uporabili metodo destilacije, pri kateri manjši modeli pridobijo znanje iz odgovorov večjih modelov. Konkretno je bil s1 izpopolnjen s pomočjo odgovorov Googlovega UI modela Gemini 2.0 Flash Thinking Experimental. Takšen razvoj je sicer pravno sporen, saj Google v svojih pogojih prepoveduje uporabo programskega vmesnika API storitve Gemini za razvoj konkurenčnih modelov.

Osnova za model s1 je odprtokodni model Qwen2.5, ki ga je razvilo podjetje Alibaba Cloud. Sprva so ga raziskovalci želeli trenirati na 59.000 vprašanjih, a so ugotovili, da že 1.000 vprašanj prinese enako dobre rezultate. Trening so izvedli na 16 grafičnih procesorjih Nvidia H100. Model uporablja tudi inovativno tehniko test-time scaling, ki mu omogoča, da si za razmislek pred odgovorom vzame več časa. 

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Android vam bo povedal, ali vam policija prisluškuje

    Čedalje popularnejši način prisluškovanja in prestrezanja podatkov z mobilnih telefonov je uporaba lažnih baznih postaj (IMSI catcher), ki jih imajo organi pregona v nekaterih državah, lahko pa tudi drugi akterji. Na takšno napravo se povežejo vsi telefoni v okolici, saj njen signal preglasi legitimne bazne postaje, upravljavec pa potem zlahka prestreza komunikacijo. Uporabnik tega početja praktično ne more zaznati.

    Objavljeno: 1.7.2025 07:00
  • Podjetja nočejo Copilota, ker zaposleni raje uporabljajo ChatGPT

    Microsoft kljub velikim naporom (beri: finančnemu vložku) podjetjem težko proda storitve umetne inteligence Copilot.

    Objavljeno: 27.6.2025 09:00
  • Kitajski prenosniki so dve leti za zahodnimi

    Čeprav se Kitajci močno trudijo in izdatno investirajo v domači razvoj in proizvodnjo čipov, so še vedno vsaj dve generaciji za zahodnimi izdelki. To izkazuje tudi najnovejši Huaweijev prenosnik MateBook Fold Ultimate, ki poganja lastni HarmonyOS in ima same kitajske komponente. A te v primerjavi z zahodnimi zaostajajo.

    Objavljeno: 25.6.2025 07:00
  • Pametna očala s samodejnim ostrenjem bi lahko nadomestila bifokalna stekla

    Finsko podjetje IXI razvija inovativna očala z lečami, ki se samodejno ostrijo glede na pogled uporabnika. 

    Objavljeno: 23.6.2025 10:00 | Teme: pametna očala
  • Teslini samovozeči taksiji ne znajo voziti

    Prvi dnevi Teslinih robotskih taksijev so polni napak, vožnje po napačni strani ceste, nenadnih zaviranj in nevarnih ustavljanj za odlaganje potnikov.

    Objavljeno: 26.6.2025 09:00
  • HDMI 2.2 je tu!

    Sicer na papirju, a vendarle. HDMI Forum je izdal končne specifikacije standarda HDMI 2.2, ki so ga izdatno opisovali in predstavljali že na januarskem sejmu CES. HDMI 2.2 ima že večjo prepustnost kot DisplayPort, a bo zanjo zahteval nove kable Ultra96.

    Objavljeno: 27.6.2025 05:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji