Objavljeno: 25.2.2025 | Avtor: Boris Šavc | Monitor Marec 2025

Pro et contra: Kitajski Deepseek ali zahodna umetna inteligenca?

Pro et contra: Kitajski Deepseek ali zahodna umetna inteligenca?

Umetnointeligenčnih klepetalnih robotov naenkrat ne izdelujejo le ameriška podjetja, ampak so jih začeli obvladati tudi Kitajci. Je to dobro ali slabo?

Boljši, in pika

Boris Šavc

Ob prihodu kitajskega umetnointeligenčnega modela Deepseek-R1 se je zahodni svet stresel. Nov, učinkovit in stroškovno ugoden model je sprožil razprodajo tveganih naložb, vključno s kriptovalutami in tehnološkimi delnicami. Investitorje je tako močno zaskrbel vpliv nove umetne inteligence na tehnološki sektor, da je na finančnih trgih zavel veter širšega pesimizma. Analitiki so v en glas poudarjali, da je kitajski preboj na področju umetne inteligence zaznan kot resen izziv za ameriška podjetja in da lahko znatno spremeni razmerje moči v tehnološki industriji. Sledile so številne novice o slabostih kitajske umetne inteligence in … mene je začela presneto zanimati.

Kitajska umetna inteligenca je namreč prijazna tako do naših žepov kot narave. Deepseek je odprtokoden in brezplačen za uporabo, obenem pa zahteva bistveno manj računalniških virov kot tekmeci. Deepseek-R1 naj bi tako za svoje delovanje potreboval le desetino računalniške moči v primerjavi z Metinim modelom Llama 3.1, kar dokazuje, da je mogoče razviti zmogljivo umetno inteligenco brez izjemno visokih stroškov in velike porabe električne energije. Varčnosti navkljub je kitajski model na testih presegel modele, kot so Grok, Gemini in Claude, pri čemer se po zmogljivosti uvršča ob bok modelom OpenAI. Model nudi odlično podporo za programerske naloge in je zelo prilagodljiv. Uporabniki ga lahko zaradi odprtokodne zasnove po želji spreminjamo in vključujemo v lastne aplikacije. Za njim je močna razvijalska skupnost, ki ga nenehno izboljšuje in širi njegove zmožnosti.

Deepseek-R1 odlično deluje pri logičnem razmišljanju, reševanju problemov in strukturiranem razmišljanju. Pri podajanju odgovora razmišlja na glas, kar pomeni, da plastično prikaže, kako pride do rešitve. Prav to se mi zdi največja prednost kitajske rešitve. V času, ko navdušenje nad generativnimi modeli zavira le strah pred nadvlado umetne inteligence, ni pomembnejše stvari, kot videti, kako umetna pamet razmišlja. Edino slabost Deepseeka predstavlja dejstvo, da je … kitajski. Njegova zaščita pred sovražnim govorom in drugimi prepovedanimi izrazi, ki smo ji nekdaj rekli cenzura, pač ni naravnana po zahodnih željah. Medtem ko se Amerika pripravlja, da bo spet velika, nas ves svet prepričuje o zlobnosti Kitajcev. Upam si staviti, da ravno v tem grmu tiči zajec. Če bi bil Deepseek ameriški, bi poleg hvale žel še milijardne finančne injekcije prav teh investitorjev, ki so ob prihodu modela R1 zagnali vik in krik. Z vidika uporabnika na sončni strani Alp pa je odločitev preprosta. Ko se enkrat sprijaznimo, da bodo do naših podatkov v vsakem primeru dostopali eni ali drugi, gre le še za to, katera storitev je boljša.

  

Milijoni ali milijarde?

Matej Šmid

Res je, kitajski preboj z imenom Deepseek je pretresel svetovne borze in še posebej zahodni svet informacijske tehnologije. Kar naenkrat je postalo očitno, da je mogoče vrhunske tehnološke izdelke narediti tudi s kitajskim znanjem, kitajskimi možgani, menda celo za malo denarja. Pa vendar se mi zdi, da je bil refleksni gib, ki smo ga doživeli ob predstavitvi jezikovnega modela V3 (in nato R1), preuranjen.

Za začetek – kitajskim raziskovalcem smo kar na prvo žogo verjeli, da so za svojega pogovornega robota porabili borih šest milijonov dolarjev procesorskega časa (v primerjavo s sto milijoni, ki so jih v to vložili zahodnjaki, na čelu z OpenAI in s ChatGPT oziroma z GPT-4). In da jim je uspelo zato, ker so zaradi pomanjkanja vrhunskih čipov NVidia morali ubrati bistre bližnjice in »se znajti«. Delnice NVidie so upadle, vendar so se že po tednu ali dveh skoraj do konca pobrale – izkazalo se namreč je, da so kitajski raziskovalci resnico malce oklestili.

Za začetek, podjetje Deepseek ima v svoji lasti 50.000 NVidijinih čipov serije Hopper. Resda niso najnovejši, ravno za v smeti pa vendarle niso. In stali so 1,6 milijarde dolarjev! Prvotna izjava o šestih milijonih stroškov je torej vsaj zavajajoča, če ne kaj več. Mimogrede, že plače ključnih inženirjev, ki v Deepseeku segajo do 1,3 milijona dolarjev letno, hitro presežejo prej omenjeno šestico. Če citiram meni osebno sicer ne najbolj priljubljenega Elon Muska: »Če želite biti konkurenčni na področju umetne inteligence, morate porabiti milijarde na leto.« Očitno to drži.

Pa vendar – od kod nižje številke od zahodnih rešitev? Kot kaže tudi tako, da so za trening modela Deepseek uporabljali – ChatGPT. Torej so ga 'destilirali', bi lahko rekli. Pustimo zdaj to, da so za OpenAI dejansko pokradli (brez navednic) celoten internet in da so pri Meti za svojo Llamo kar s službenih prenosnikov 'torrentali' terabajte avtorsko zaščitenih knjig …

Kaj pa druge prednosti Deepseekovega modela? Denimo to, da ga lahko namestimo lokalno in uporabljamo brez oblaka? Poskusil sem. In ugotovil, da nimam računalnika s 400 GB pomnilnika (!), ki je potreben za lokalno poganjanje polnokrvnega modela Deepseek-R1. Prav, namestil sem (močno) okrnjenega, ki teče v mojem mlinčku z 32 GB in grafično kartico NVidia RTX 3060. Deluje. Vendar tako neuporabno počasi, da se mi enostavno ni dalo čakati, da v celoti izpiše odgovor na moje vprašanje, kdo je Donald Trump.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Kaj se zgodi, če Samsungov Galaxy Z Fold prepognete 200.000-krat?

    Ustvarjalec vsebin tech-it je s prenosom v živo na YouTubu izvedel maratonski test, v katerem je ročno odprl in zaprl Samsung Galaxy Z Fold 7 kar 200.000-krat

    Objavljeno: 8.8.2025 10:00
  • Programerska naloga, ki je ni rešil nihče

    Vsako leto se najboljši dijaki v programiranju na svetu merijo na olimpijadi iz informatike, kjer nastopa tudi slovenska ekipa. Tekmovalci v dveh tekmovalnih dneh rešujejo šest nalog, kodo pa pišejo v jeziku C++. Ene izmed nalog letos ni rešil nihče izmed 330 tekmovalci.

    Objavljeno: 6.8.2025 07:00
  • Xiaomi predstavil pametni ventilator

    Xiaomi je v poletni vročini za evropske trge predstavil Smart Desktop Air Circulation Fan, kompakten pametni ventilator, zasnovan za močan pretok zraka v manjših prostorih. 

    Objavljeno: 6.8.2025 11:00
  • Avstralija mlajšim od 16 let prepovedala tudi profile na YouTubu

    Svet se je v zadnjih tednih začel odločneje premikati proti regulaciji spleta in preverjanju starosti uporabnikov, saj so podviga lotile EU, Velika Britanija in ZDA. A daleč pred vsemi je Avstralija, kjer je uporaba družbenih omrežij za otroke prepovedana, to pa se tudi preverja. Seznam družbenih omrežij so še razširili.

    Objavljeno: 1.8.2025 05:00
  • Superge s skritim predalom za AirTag

    Skechers je predstavil novo linijo otroških športnih čevljev Find My Skechers, ki staršem omogoča skrito namestitev sledilnika Apple AirTag pod peto čevlja. 

    Objavljeno: 1.8.2025 06:00
  • HBO Max bo še otežil deljenje gesel

    Warner Bros. Discovery bo od prihodnjega meseca začel strožje uveljavljati prepoved deljenja gesel na pretočni storitvi HBO Max. 

    Objavljeno: 8.8.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji