Objavljeno: 8.8.2025 07:00 | Teme: umetna inteligenca

Nova odprta modela umetne inteligence iz OpenAI

Imenu navkljub OpenAI že vse od prastarega modela GPT-2 ni izdal nobenega zares odprtega modela, ki bi mu lahko pogledali pod pokrov, ga spreminjali in seveda lokalno pognali. Zato smo toliko bolj presenečeni, da so te dni izdali gpt-oss-120b in gpt-oss-20b, oba z odprto licenco Apache 2.0.

Odprtost pomeni, da ju lahko poganjamo lokalno, ni pa to nujno. Kdor nima ustrezno zmogljive strojne opreme ali dovolj znanja, si bo lahko pomagal tudi s storitvami, kot so Hugging Face, Ollama, llamaa.cpp in vLLM. Modela sta različno zahtevna. Šibkejši model potrebuje 16 GB pomnilnika na grafični kartici, kar je dostopno tudi v domačih okoljih, medtem ko močnejši model zahteva vsaj 80 GB pomnilnika.

Nova modela uporabljata nov način "razmišljanja", ki ga je OpenAi predstavil v modelu o1 lani in se imenuje chain-of-thought reasoning. Poleg golega odgovora model zapiše tudi več korakov, kaj se je dogajalo v njegovem drobovju, ko je iskal odgovor. Nova modela sta zgolj besedilna, sta pa sposobna brskati po spletu, pisati kodo in rokovati s strojno opremo.

Ni težko ugotoviti, da je bila močna vzpodbuda za njun nastanek kitajski model DeepSeek, pa seveda tudi Qwen in Mistral, ki sta takisto dostopna pod Apache 2.0. Nova modela iz OpenAI bi bila morala iziti že pred meseci, a so ju raje še malce testirali in pilili. Ko model namreč odprejo, zaživi svoje življenje. Lepo je, da vsaj iz tovarne pride spodoben, dasiravno ga more kasneje vsakdo pokvariti.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Severna Koreja s kriptovalutami in lažnimi zaposlenimi nakradla milijarde

    Za razliko od praktično vseh ostalih držav se Severna Koreja v veliki meri zanaša na internetni kriminal in kriptoprevare za financiranje delovanja države in izogibanje sankcijam. Tudi eden večjih letošnjih vdorov, ko so neznanci z borze Bybit ukradli za poldrugo milijardo dolarjev kriptovalute ether, je bil plod Severne Koreje.

    Objavljeno: 27.10.2025 07:00
  • Popolnoma drugačno električno kolo

    Rivianovo hčerinsko podjetje Also, specializirano za mikromobilnost, je predstavilo inovativno električno kolo TM-B (Transcendent Mobility - Bike), ki obljublja povsem novo izkušnjo vožnje. 

    Objavljeno: 23.10.2025 16:00
  • V Londonu vam bodo verjetno ukradli telefon

    Samo v lanskem letu so v Londonu ukradli 80.000 pametnih telefonov, kar je v milijonski metropoli sicer malo, a vseeno precej več kot v drugih podobno velikih mestih v Evropi. In približno tretjino več kot leto pred tem. Trend je torej zaskrbljujoč.

    Objavljeno: 23.10.2025 05:00
  • SD-kartica na dnu Atlantika preživela implozijo Titana

    Raziskovalci so na dnu Atlantskega ocena v bližini razbitine Titanika našli SanDiskovo spominsko kartico SD, s katere so lahko sneli 12 fotografij in devet videoposnetkov. Kartica je tja potonila pred dvema letoma, ko je implodirala podmornica Titan, s katero je podjetje OceanGate želelo obiskati razbitine slavnega parnika.

    Objavljeno: 22.10.2025 05:00
  • Tri četrtine vseh satelitov je Starlinkovih!

    S precej manj pozornosti javnosti, kot bi si tako pomembne spremembe zaslužile, v Zemljino orbito izstreljujemo satelite hitreje kot kdajkoli doslej. Prednjačijo ponudniki satelitskega dostopa do interneta, med katerimi je najhitrejši Starlink. Ta je 19. oktobra z raketo Falcon 19 v vesolje poslal še 28 satelitov, s čimer je presegel magično mejo 10.000.

    Objavljeno: 22.10.2025 07:00
  • Uvodnik: Vedno je kriv DNS!

    Konec oktobra se je zgodilo nekaj, kar bi lahko imenovali že klasika digitalne dobe – Amazonov oblak AWS je spet odpovedal poslušnost. Tokrat je šlo za podatkovni center US-EAST-1, tisti najbolj obremenjeni in najstarejši del Amazonove infrastrukture, ki poganja velik del svetovnega spleta.

    Objavljeno: 28.10.2025 | Avtor: Matjaž Klančar | Monitor November 2025
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji