Objavljeno: 25.2.2025 | Avtor: Boris Šavc | Monitor Marec 2025

Pro et contra: Kitajski Deepseek ali zahodna umetna inteligenca?

Pro et contra: Kitajski Deepseek ali zahodna umetna inteligenca?

Umetnointeligenčnih klepetalnih robotov naenkrat ne izdelujejo le ameriška podjetja, ampak so jih začeli obvladati tudi Kitajci. Je to dobro ali slabo?

Boljši, in pika

Boris Šavc

Ob prihodu kitajskega umetnointeligenčnega modela Deepseek-R1 se je zahodni svet stresel. Nov, učinkovit in stroškovno ugoden model je sprožil razprodajo tveganih naložb, vključno s kriptovalutami in tehnološkimi delnicami. Investitorje je tako močno zaskrbel vpliv nove umetne inteligence na tehnološki sektor, da je na finančnih trgih zavel veter širšega pesimizma. Analitiki so v en glas poudarjali, da je kitajski preboj na področju umetne inteligence zaznan kot resen izziv za ameriška podjetja in da lahko znatno spremeni razmerje moči v tehnološki industriji. Sledile so številne novice o slabostih kitajske umetne inteligence in … mene je začela presneto zanimati.

Kitajska umetna inteligenca je namreč prijazna tako do naših žepov kot narave. Deepseek je odprtokoden in brezplačen za uporabo, obenem pa zahteva bistveno manj računalniških virov kot tekmeci. Deepseek-R1 naj bi tako za svoje delovanje potreboval le desetino računalniške moči v primerjavi z Metinim modelom Llama 3.1, kar dokazuje, da je mogoče razviti zmogljivo umetno inteligenco brez izjemno visokih stroškov in velike porabe električne energije. Varčnosti navkljub je kitajski model na testih presegel modele, kot so Grok, Gemini in Claude, pri čemer se po zmogljivosti uvršča ob bok modelom OpenAI. Model nudi odlično podporo za programerske naloge in je zelo prilagodljiv. Uporabniki ga lahko zaradi odprtokodne zasnove po želji spreminjamo in vključujemo v lastne aplikacije. Za njim je močna razvijalska skupnost, ki ga nenehno izboljšuje in širi njegove zmožnosti.

Deepseek-R1 odlično deluje pri logičnem razmišljanju, reševanju problemov in strukturiranem razmišljanju. Pri podajanju odgovora razmišlja na glas, kar pomeni, da plastično prikaže, kako pride do rešitve. Prav to se mi zdi največja prednost kitajske rešitve. V času, ko navdušenje nad generativnimi modeli zavira le strah pred nadvlado umetne inteligence, ni pomembnejše stvari, kot videti, kako umetna pamet razmišlja. Edino slabost Deepseeka predstavlja dejstvo, da je … kitajski. Njegova zaščita pred sovražnim govorom in drugimi prepovedanimi izrazi, ki smo ji nekdaj rekli cenzura, pač ni naravnana po zahodnih željah. Medtem ko se Amerika pripravlja, da bo spet velika, nas ves svet prepričuje o zlobnosti Kitajcev. Upam si staviti, da ravno v tem grmu tiči zajec. Če bi bil Deepseek ameriški, bi poleg hvale žel še milijardne finančne injekcije prav teh investitorjev, ki so ob prihodu modela R1 zagnali vik in krik. Z vidika uporabnika na sončni strani Alp pa je odločitev preprosta. Ko se enkrat sprijaznimo, da bodo do naših podatkov v vsakem primeru dostopali eni ali drugi, gre le še za to, katera storitev je boljša.

  

Milijoni ali milijarde?

Matej Šmid

Res je, kitajski preboj z imenom Deepseek je pretresel svetovne borze in še posebej zahodni svet informacijske tehnologije. Kar naenkrat je postalo očitno, da je mogoče vrhunske tehnološke izdelke narediti tudi s kitajskim znanjem, kitajskimi možgani, menda celo za malo denarja. Pa vendar se mi zdi, da je bil refleksni gib, ki smo ga doživeli ob predstavitvi jezikovnega modela V3 (in nato R1), preuranjen.

Za začetek – kitajskim raziskovalcem smo kar na prvo žogo verjeli, da so za svojega pogovornega robota porabili borih šest milijonov dolarjev procesorskega časa (v primerjavo s sto milijoni, ki so jih v to vložili zahodnjaki, na čelu z OpenAI in s ChatGPT oziroma z GPT-4). In da jim je uspelo zato, ker so zaradi pomanjkanja vrhunskih čipov NVidia morali ubrati bistre bližnjice in »se znajti«. Delnice NVidie so upadle, vendar so se že po tednu ali dveh skoraj do konca pobrale – izkazalo se namreč je, da so kitajski raziskovalci resnico malce oklestili.

Za začetek, podjetje Deepseek ima v svoji lasti 50.000 NVidijinih čipov serije Hopper. Resda niso najnovejši, ravno za v smeti pa vendarle niso. In stali so 1,6 milijarde dolarjev! Prvotna izjava o šestih milijonih stroškov je torej vsaj zavajajoča, če ne kaj več. Mimogrede, že plače ključnih inženirjev, ki v Deepseeku segajo do 1,3 milijona dolarjev letno, hitro presežejo prej omenjeno šestico. Če citiram meni osebno sicer ne najbolj priljubljenega Elon Muska: »Če želite biti konkurenčni na področju umetne inteligence, morate porabiti milijarde na leto.« Očitno to drži.

Pa vendar – od kod nižje številke od zahodnih rešitev? Kot kaže tudi tako, da so za trening modela Deepseek uporabljali – ChatGPT. Torej so ga 'destilirali', bi lahko rekli. Pustimo zdaj to, da so za OpenAI dejansko pokradli (brez navednic) celoten internet in da so pri Meti za svojo Llamo kar s službenih prenosnikov 'torrentali' terabajte avtorsko zaščitenih knjig …

Kaj pa druge prednosti Deepseekovega modela? Denimo to, da ga lahko namestimo lokalno in uporabljamo brez oblaka? Poskusil sem. In ugotovil, da nimam računalnika s 400 GB pomnilnika (!), ki je potreben za lokalno poganjanje polnokrvnega modela Deepseek-R1. Prav, namestil sem (močno) okrnjenega, ki teče v mojem mlinčku z 32 GB in grafično kartico NVidia RTX 3060. Deluje. Vendar tako neuporabno počasi, da se mi enostavno ni dalo čakati, da v celoti izpiše odgovor na moje vprašanje, kdo je Donald Trump.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Redka zmaga malega rudarja kriptovalut

    V času, ko rudarjenje bitcoina obvladujejo velika podjetja s specializirano opremo in ogromnimi viri, je neodvisnemu solo rudarju uspel izjemen podvig. 

    Objavljeno: 27.7.2025 13:00
  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • ChatGPT je bogatejši za pravega raziskovalnega agenta

    ChatGPT agent je nova generacija digitalnega pomočnika, ki združuje sposobnosti vizualnega in tekstovnega brskanja ter neposredne interakcije z zunanjimi platformami, kot so Google Drive, GitHub in SharePoint.

    Objavljeno: 18.7.2025 08:00
  • Tehnologija je orodje za množično nadzorovanje

    Ko je minuli teden kamera na koncertu skupine Coldplay v Bostonu prikazala par, ki objet posluša Chrisa Martina, bi bil lahko to le še eden izmed množice povsem običajnih in dolgočasni prizor. A ker se je ženska na posnetku obrnila proč in obraz zakopal v roke, moški pa se je sklonil pod kader, je posnetek vzbudil veliko pozornosti. Pevec Chris Martin ga je na odru komentiral z besedami, da sta bodisi zelo sramežljiva bodisi razmerje skrivata – in ostalo je bilo zgodovina.

    Objavljeno: 21.7.2025 05:00
  • ChatGPT je slab v šahu

    Najboljši šahist sveta Magnus Carlsen je v spletnem dvoboju premagal umetno inteligenco ChatGPT v vsega 53-ih potezah, pri čemer sam ni izgubil niti ene same figure. 

    Objavljeno: 21.7.2025 09:00
  • ChatGPT-5 bo na voljo avgusta

    Sam Altman, izvršni direktor OpenAI, je potrdil, da bo model GPT-5 izšel že v začetku avgusta. 

    Objavljeno: 25.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji