Objavljeno: 25.2.2025 | Avtor: Boris Šavc | Monitor Marec 2025

Pro et contra: Kitajski Deepseek ali zahodna umetna inteligenca?

Umetnointeligenčnih klepetalnih robotov naenkrat ne izdelujejo le ameriška podjetja, ampak so jih začeli obvladati tudi Kitajci. Je to dobro ali slabo?

Boljši, in pika

Boris Šavc

Ob prihodu kitajskega umetnointeligenčnega modela Deepseek-R1 se je zahodni svet stresel. Nov, učinkovit in stroškovno ugoden model je sprožil razprodajo tveganih naložb, vključno s kriptovalutami in tehnološkimi delnicami. Investitorje je tako močno zaskrbel vpliv nove umetne inteligence na tehnološki sektor, da je na finančnih trgih zavel veter širšega pesimizma. Analitiki so v en glas poudarjali, da je kitajski preboj na področju umetne inteligence zaznan kot resen izziv za ameriška podjetja in da lahko znatno spremeni razmerje moči v tehnološki industriji. Sledile so številne novice o slabostih kitajske umetne inteligence in … mene je začela presneto zanimati.

Kitajska umetna inteligenca je namreč prijazna tako do naših žepov kot narave. Deepseek je odprtokoden in brezplačen za uporabo, obenem pa zahteva bistveno manj računalniških virov kot tekmeci. Deepseek-R1 naj bi tako za svoje delovanje potreboval le desetino računalniške moči v primerjavi z Metinim modelom Llama 3.1, kar dokazuje, da je mogoče razviti zmogljivo umetno inteligenco brez izjemno visokih stroškov in velike porabe električne energije. Varčnosti navkljub je kitajski model na testih presegel modele, kot so Grok, Gemini in Claude, pri čemer se po zmogljivosti uvršča ob bok modelom OpenAI. Model nudi odlično podporo za programerske naloge in je zelo prilagodljiv. Uporabniki ga lahko zaradi odprtokodne zasnove po želji spreminjamo in vključujemo v lastne aplikacije. Za njim je močna razvijalska skupnost, ki ga nenehno izboljšuje in širi njegove zmožnosti.

Deepseek-R1 odlično deluje pri logičnem razmišljanju, reševanju problemov in strukturiranem razmišljanju. Pri podajanju odgovora razmišlja na glas, kar pomeni, da plastično prikaže, kako pride do rešitve. Prav to se mi zdi največja prednost kitajske rešitve. V času, ko navdušenje nad generativnimi modeli zavira le strah pred nadvlado umetne inteligence, ni pomembnejše stvari, kot videti, kako umetna pamet razmišlja. Edino slabost Deepseeka predstavlja dejstvo, da je … kitajski. Njegova zaščita pred sovražnim govorom in drugimi prepovedanimi izrazi, ki smo ji nekdaj rekli cenzura, pač ni naravnana po zahodnih željah. Medtem ko se Amerika pripravlja, da bo spet velika, nas ves svet prepričuje o zlobnosti Kitajcev. Upam si staviti, da ravno v tem grmu tiči zajec. Če bi bil Deepseek ameriški, bi poleg hvale žel še milijardne finančne injekcije prav teh investitorjev, ki so ob prihodu modela R1 zagnali vik in krik. Z vidika uporabnika na sončni strani Alp pa je odločitev preprosta. Ko se enkrat sprijaznimo, da bodo do naših podatkov v vsakem primeru dostopali eni ali drugi, gre le še za to, katera storitev je boljša.

Milijoni ali milijarde?

Matej Šmid

Res je, kitajski preboj z imenom Deepseek je pretresel svetovne borze in še posebej zahodni svet informacijske tehnologije. Kar naenkrat je postalo očitno, da je mogoče vrhunske tehnološke izdelke narediti tudi s kitajskim znanjem, kitajskimi možgani, menda celo za malo denarja. Pa vendar se mi zdi, da je bil refleksni gib, ki smo ga doživeli ob predstavitvi jezikovnega modela V3 (in nato R1), preuranjen.

Za začetek – kitajskim raziskovalcem smo kar na prvo žogo verjeli, da so za svojega pogovornega robota porabili borih šest milijonov dolarjev procesorskega časa (v primerjavo s sto milijoni, ki so jih v to vložili zahodnjaki, na čelu z OpenAI in s ChatGPT oziroma z GPT-4). In da jim je uspelo zato, ker so zaradi pomanjkanja vrhunskih čipov NVidia morali ubrati bistre bližnjice in »se znajti«. Delnice NVidie so upadle, vendar so se že po tednu ali dveh skoraj do konca pobrale – izkazalo se namreč je, da so kitajski raziskovalci resnico malce oklestili.

Za začetek, podjetje Deepseek ima v svoji lasti 50.000 NVidijinih čipov serije Hopper. Resda niso najnovejši, ravno za v smeti pa vendarle niso. In stali so 1,6 milijarde dolarjev! Prvotna izjava o šestih milijonih stroškov je torej vsaj zavajajoča, če ne kaj več. Mimogrede, že plače ključnih inženirjev, ki v Deepseeku segajo do 1,3 milijona dolarjev letno, hitro presežejo prej omenjeno šestico. Če citiram meni osebno sicer ne najbolj priljubljenega Elon Muska: »Če želite biti konkurenčni na področju umetne inteligence, morate porabiti milijarde na leto.« Očitno to drži.

Pa vendar – od kod nižje številke od zahodnih rešitev? Kot kaže tudi tako, da so za trening modela Deepseek uporabljali – ChatGPT. Torej so ga 'destilirali', bi lahko rekli. Pustimo zdaj to, da so za OpenAI dejansko pokradli (brez navednic) celoten internet in da so pri Meti za svojo Llamo kar s službenih prenosnikov 'torrentali' terabajte avtorsko zaščitenih knjig …

Kaj pa druge prednosti Deepseekovega modela? Denimo to, da ga lahko namestimo lokalno in uporabljamo brez oblaka? Poskusil sem. In ugotovil, da nimam računalnika s 400 GB pomnilnika (!), ki je potreben za lokalno poganjanje polnokrvnega modela Deepseek-R1. Prav, namestil sem (močno) okrnjenega, ki teče v mojem mlinčku z 32 GB in grafično kartico NVidia RTX 3060. Deluje. Vendar tako neuporabno počasi, da se mi enostavno ni dalo čakati, da v celoti izpiše odgovor na moje vprašanje, kdo je Donald Trump.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!