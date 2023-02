»Ljudje si želijo biti razočarani in tudi bodo«

Citat v naslovu je izrekel šef trenutno najbolj vročega podjetja OpenAI, ko je odgovarjal na govorice o menda prihajajoči četrti generaciji jezikovnega modela GPT. Toda ljudje s(m)o razočarani že zdaj, ko v svet počasi kapljajo kapljice Microsoftovega necenzuriranega 'Bing_GPT'. In Googlovega Barda, seveda.

Eden bolj priljubljenih mimov v zadnjem času je tisti o razvoju človekovih občutij, ko se sreča z velikimi 'umetnointeligenčnimi' jezikovnimi modeli, kot je ChatGPT: »Noro!«, »Ali bom ravnokar ob službo?«, »Ej, zlagal se je!« In na koncu: »Ah, saj to je le malce lepša digitalna pomočnica …« Da, tako hitro je mogoče ugotoviti, da veliki jezikovni modeli v resnici niso inteligentni in to tudi nikoli ne bodo. To je imel v mislih tudi zgoraj omenjeni Sam Altman, ko je napovedal razočaranje.

Toda razočaranje si je moč prihraniti, če omejimo pričakovanja. Pri Monitorju smo v prejšnji številki za test (in za hec) ChatGPT prepustili kar pisanje celotnega članka (rubrika Pro et contra na zadnjih straneh). Ni bil najboljši, pa vendar dovolj dober, da smo ga zaradi nazornosti v tisk spustili kar brez lekture. Podobno smo tokrat s Chatom testno spisali dve novici, ki ju najdete nekaj strani naprej. Dovolj je bil ukaz »Povzemi in v slovenščino prevedi to novico«. Ob kar nekaj uredniškega dela, preverjanja in prilagajanja, priznam. Toda test je bil uspešen, tudi tokrat. Podobno med pisanjem besedil za tokratno številko nekajkrat nisem hotel motiti lektorice in sem kar Chata povprašal: »Ali v tem stavku morda manjka kakšna vejica?« Res koristno orodje.

Ob uporabi novih iskalnikov se bomo morali zavedati, da odgovori ne bodo nujno pravi in resnični, saj bo iskalnik lahko haluciniral, pardon, lagal.

Po drugi strani mi je kaj hitro postalo jasno, da je (Chat)GPT le nekakšna stisnjena različica svetovnega spleta, kot nekakšen algoritem JPG, kot ga je v New Yorkerju odlično primerjal Ted Chiang. Množica besed, stavkov in sestavkov, iz katerih so algoritmi genialno izračunali statistično verjetnost pravilnega zaporedja besed, če skrajno poenostavim. Iz te stisnjene oblike ne bo nikoli mogoče nazaj sestaviti povsem enakega svetovnega spleta (če za trenutek zanemarimo dejstvo, da tudi sam splet seveda nikakor ni sveta resnica), ampak le bolj ali manj dober približek le-tega. Zelo podobno, kot to velja za fotografije JPG, če jih primerjamo s polnimi fotografijami, denimo PNG ali TIFF. Tako kot so JPG večinoma dovolj dobri, bodo tudi odgovori GPT, vendar ne vedno.

Če je nekaj na spletu slabo zastopano ali je zastopano narobe, bodo odgovori pač napačni. 'Halucinacije', se temu danes reče, čeprav bi jaz rekel kar 'laži'. Vprašanju o najboljših naravnih plezališčih na Slovenskem primorju mirno sledi naštevanje neobstoječih sten v Piranu, Sečovljah in Kopru. Če česa ne ve, se pač 'zlaže'. Tako kot se je že v svoji prvi javni predstavitvi zlagal Googlov jezikovni model Bard, pa tudi Microsoftov novi iskalnik Bing, ki je (oziroma bo, za zdaj je na voljo le izbrancem) oplemeniten s tehnologijo, ki temelji na ChatGPT.

Kako bodo videti ti spletni iskalniki nove dobe, bo še zanimivo opazovati. Microsoft nima česa izgubiti in bo na Bing očitno (za)stavil vse milijarde, ki jih vložil v podjetje OpenAI. Vsak odstotek tržnega deleža iskalnikov (trenutno jih ima okoli osem), ki bi ga pridobil v tekmi z Googlom, je menda vreden dve oglaševalski milijardi letno. Napad se bržkone obrestuje že zdaj, ko je ogromno ljudi sploh prvič slišalo, da ima Microsoft nekakšen iskalnik s smešnim imenom. Google je po drugi strani previdnejši, saj mu ni do tega, da bi kakorkoli ošibil kokoš, ki mu nese zlata jajca. Poleg tega, se strinjajo strokovnjaki, bodo GPT-iskalniki nove dobe vsaj desetkrat dražji, kot so sedanji. Iskanje po indeksirani podatkovni zbirki interneta je strojno veliko manj zahtevno kot generiranje odgovorov GPT, pri čemer bodo pogovori z njimi gotovo daljši, kot je čas, ki ga preživimo ob današnjih iskalnikih, ko odgovore običajno servirajo v manj kot sekundi.

Sploh pa bo treba nove iskalnike še nekako 'monetizirati'. Prikazovanje sponzoriranih objav in klikanje na najdene povezave, s čimer se prikazujejo dodatni oglasi, je danes tisto zlato, od katerega živi Google. Kako bo živel od natančnih odgovorov, brez povezav, verjetno ni jasno še nikomur. Microsoft z novim Bingom že poskuša s povezavami, ki so vstavljene v odgovore in celo z oglasi, ki se prikazujejo ob rezultatih, kot poroča Reuters. Ključno je seveda, kako in koliko vsiljivi bodo ti oglasi, koliko jih bodo ljudje opazili in koliko bodo zanje pripravljeni plačati oglaševalci.

Predvsem pa se bomo morali ob uporabi novih iskalnikov zavedati, da odgovori ne bodo nujno pravi in resnični, saj bo iskalnik lahko haluciniral, pardon, lagal. Toda tako je v resnici že danes – brez kančka previdnosti in natančnosti se po spletu ni varno sprehajati, to smo opazili že ob uvajanju omrežij 5G in ob zadnji korona epidemiji.