Objavljeno: 28.3.2023 | Avtor: Matej Huš | Monitor April 2023

Novi Chat Bing - Microsoft vrača udarec

Ni dolgo trajalo, da so velikani začeli odgovarjati na jezikovni model OpenAI. Microsoftov novi Chat Bing nudi vse prednosti ChatGPT in zaradi povezave z internetom odpravlja zamrznjenost v času, ki je njegova največja pomanjkljivost. Po dolgih letih je Bingu uspelo splezati iz brezna obskurnosti.

Več kot desetletje je bil Bing sinonim za izdelek, ki mu zares ne manjka prav veliko, a ga kljub temu ne uporablja skoraj nihče. Vsem Microsoftovim poskusom navkljub je njegov tržni delež ostajal pod desetimi odstotki, medtem ko je Google prepričljivo kraljeval. Presenečenje se je zgodilo februarja letos, ko je Bing dobil jezikovni model (LLM). Preprosto poimenovan Bing Chat je v iskanje prinesel zmožnosti ChatGPT in hipoma požel zanimanje internetnega občestva.

Da bo umetna inteligenca v obliki jezikovnih modelov spremenila način iskanja informacij na spletu, se je začelo govoriti praktično takoj po javni predstavitvi ChatGPT. O tem priča tudi panika, ki je zavladala pri Googlu, saj se je prvikrat pojavila resnična možnost, da mu žezlo nekdo spelje. Po kriznih sestankih je Google na prvi februarski ponedeljek na silo predstavil svoj odgovor z imenom Bard. Tako zelo se je mudilo, da ga očitno niso dovolj dobro preverili, zato je ob javni predstavitvi govoril tudi neumnosti. Konfabulacija je pri jezikovnih modelih zaradi njihovega nastanka in delovanja pričakovana, zato jo bolj milo sodimo – podobno kot mali otroci ne »lažejo«, temveč »imajo domišljijo«. A ko je Bard ob prvi uradni predstavitvi suvereno dejal, da je teleskop James Webb prvi posnel eksoplanete, je to uničujoče vplivalo na njegovo verodostojnost in tečaj Googlovih delnic.

Kdo je jedel magdalenice?

Pred natanko tremi leti smo preverjali, kako dobro računalniški modeli razumejo besedilo in jih ob tem vprašali Kdo je jedel magdalenice (Monitor 03/20). Tedanji odgovori so bili veliko razočaranje, saj so ponudili zgolj recepte za to francosko slaščico. Tri leta pozneje pa bi jezikovni modeli že opravili maturo iz književnosti! Bing in ChatGPT sta se naučila, kdo je bil Proust, kar razložita tudi v slovenščini.

Vprašanje: Kdo je jedel magdalenice? (Odgovora sta v izvirniku.)

ChatGPT: Jedel magdaleničke je znameniti francoski pisatelj Marcel Proust. V svojem romanu »V iskanju izgubljenega časa« Proust opisuje, kako okus in vonj magdalenice, pomočene v čaju, sprožita poplavo spominov iz njegovega otroštva. Magdalenička tako postane simbol nehotenega spomina in močna evokacija preteklosti. Čeprav lahko mnogi ljudje jedo magdalenice, je Proust najbolj tesno povezan z njimi v literaturi in popularni kulturi.

Bing: Magdalenice so majhni mehki kolački, značilne školjkaste oblike, ki izvirajo iz Francije. So priljubljena francoska sladica, ki jo jedo kot prigrizek ali posladek. Eden najbolj znanih ljudi, ki je jedel magdalenice, je bil Marcel Proust, francoski pisatelj in filozof. V svoji knjigi V iskanju izgubljenega časa je opisal svojo izkušnjo z jedjo magdalenice, namočene v čaj. Povedal je, kako ga je to preprosto dejanje spomnilo na otroštvo. Zanimivo je tudi to, da v prvih osnutkih svoje knjige ni omenjal magdalenic, ampak opečenec z medom ali trdi piškot. Šele v tretjem osnutku se pojavijo magdalenice. Ali vas zanima branje Proustove knjige ali poskus nekaj magdalenic?

Medtem ko se je Google ukvarjal s čiščenjem zapacane javne podobe, je Microsoft brez velikega pompa loščil svoj izdelek. Bing Chat je izšel nekaj dni pozneje kot pomoč pri iskanju po Bingu, a se je z njim moč tudi pogovarjati brez iskanja specifičnih spletnih strani, čeprav se to dogaja v ozadju. Naval je bil pričakovano velik, zato so se odločili za postopno splavitev, kjer se je za dostop treba prijaviti in počakati na čakalnem seznamu. Kmalu se je izkazalo, da medtem ko tehnična izvedba jezikovnih modelov ni velik izziv, je komercialna uporabnost več kot to. Bing Chat se je sprva z uporabniki zapletal v bizarne debate o smislu življenja, v kateri ni imel težav niti z agresijo ali žaljenjem. Microsoft se je hitro odzval in uvedel dodatne filtre, predvsem pa je omejil število izmenjav. V začetku marca, ko je nastajal ta prispevek, je ta omejitev pri osem. Po toliko vprašanjih in odzivih se seja pogovora konča. Microsoft je namreč ugotovil, da verjetnost za neprimerne odzive narašča z dolžino pogovora. Druga resna omejitev je 2.000 znakov, kolikor je lahko dolg posamezen vnos za Bing, medtem ko ChatGPT zmore prežvečiti tudi daljše. Tretja, še najresnejša, omejitev pa je zgolj 50 vprašanj za Bing dnevno, medtem ko ChatGPT dnevne omejitve nima.

Imamo dostop!

Bing je torej po desetletju irelevantnosti nenadoma pristal na prvih straneh. V začetku marca sem dobil dostop, čemur so takoj sledili številni pogovori. Ni presenetljivo, da je Microsoft Bing izkoristil kot vabo za uporabo brskalnika Edge, ki edini polno podpira interakcijo z novim sogovornikom. V Firefoxu in drugje lahko iščemo zgolj na stari način, tj. z vpisovanjem iskalnih poizvedb, na katere mestoma sicer odgovori Chat Bing v posebnem okvirju na desni, a pogovarjati se ne moremo. To je mogoče le v Edgeu.

Bing zna odgovarjati na zelo tehnična vprašanja.

Na spletni strani bing.com se je povsem neopazno znašel nov zavihek. Poleg že uveljavljenih Images, Videos, Maps in drugih je tam tudi Chat, ki je dostopen le ob prijavi v Microsoftov račun, če smo na čakalni listi dočakali aktivacijo novega sogovornika. V uvodnih navodilih piše, da mu lahko postavljamo kompleksna vprašanja, da bomo dobili boljše odgovore in ustvarjalne navdihe. Preverimo!

V nasprotju s ChatGPT novi sogovornik ni statičen. ChatGPT je ostal zataknjen v letu 2021, saj je bil izurjen s tedaj dostopnimi besedili, Bing Chat pa ima dostop do interneta in lahko prebira nove vire v realnem času, zato bi moral poznati tudi aktualne dogodke. Dvanajst ur po zgodovinski zmagi slovenske skakalne reprezentance v Planici je pravilno odgovoril na vprašanje, kdo je zmagal. Odgovor je kratek, pravilen in uporaben – navrgel je celo, da je to prva slovenska zlata medalja v tej disciplini. V nadaljevanju pogovora je postregel še z dodatnimi podatki, denimo s podrobnimi podatki o dosežkih reprezentanc. Vseeno sem hitro trčil ob njegove omejitve, saj na vprašanje, kdo bi bil zmagal, če bi primerjali dosežke posameznih tekmovalcev, ni odgovoril pravilno.

Novi Bing neposredno v Windows 11

V začetku marca je Microsoft novi Bing vgradil v posodobitev za Windows 11, kjer domuje kar v orodni vrstici. Od tam se bo neposredno odprl Edge z Bingom, v katerem bo moč kramljati. Dolgoročni načrt je še smelejši. Če bi umetni inteligenci dovolili preiskati datoteke na disku in v uporabniškem oblaku, bi lahko pametno iskala tudi med našimi podatki. Iskanje v Windows 11 je že zdaj ena najpopularnejših funkcionalnosti, zato bo to logična razširitev delovanja umetne inteligence.

Bing Chat deluje kot vmesnik med človeškimi vprašanji in poizvedbami za iskalni pogon. To se najlepše vidi, ko za vsako vprašanje izpiše, po katerih ključih besedah je dejansko iskal. Na vprašanje po zmagovalni reprezentanci je iskal po ključnih besedah »Ski jumping Team Men nordic championship Planica«. Dobljene rezultate je nato prevedel nazaj v človeški jezik. Pohvalno dejstvo je navajanje virov. ChatGPT virov ne navaja, če pa ga izrecno povprašamo po njih, si nemalokrat izmisli neobstoječe reference. Bing navaja vire, ki so povsem korektni. Za splošne poizvedbe so to različne spletne enciklopedije, denimo Wikipedija, Britannica in podobno. Za aktualne novice v Sloveniji je bil to večinoma STA, dopolnjen s specializiranimi viri (za smučanje strani FIS in Eurosporta). Za vprašanje, kaj se dogaja v Hondurasu, pa je navedel Reuters, BBC, Al Jazeero in MSN. Na vsakega je moč klikniti in si pogledati izvorno objavo.

Bing zna odgovoriti tudi na zelo opisna vprašanja. Zanimalo me je, ali pozna naslov francoskega romana o nesrečnem zakonu na podeželju, ki se na koncu konča z ženinim samomorom z arzenikom. Izstrelil je naslov Gospa Bovary, kar je vedel tudi ChatGPT. V resnici isti odgovor postreže tudi Google, a ga moramo vprašati bolj po robotsko s ključnimi besedami. Jezikovna modela pa razumeta tudi vprašanja v vezanem besedilu.

Kontekst je pomemben

Vprašal sem ju tudi po petih podjetjih, ki so bila vodilna na trgu, a so nato nepričakovano propadla. ChatGPT meni, da so to Kodak, Blockbuster, Nokia, Polaroid in Toys »R« Us, Bing pa namesto Polaroida navede Xerox. In zakaj je Nokia propadla, kar se tiče pametnih telefonov? Bing meni, da niso šli v korak s tehnološkimi novostmi (zasloni na dotik, kamere, aplikacije) in so se preveč oklepali obstoječe priljubljenosti, da so nápak stavili na Windows namesto Android in da so imeli notranje spore. ChatGPT našteje podobne vzroke: počasen odziv na prihod pametnih telefonov, slab operacijski sistem, pomanjkanje inovacij in slabo vodenje.

Po drugi strani pa Bing ve za v zadnjem času znamenito propadlo kripto menjalnico FTX. Če ga vprašamo o FTX na splošno, v začetku pogovora, ga bo opisal kratko. Če za FTX povprašam po debati o propadlih podjetjih, bo razumel temo pogovora in že sam odgovoril na nezastavljeno vprašanje o vzrokih za propad. Zdi se, kakor da Bing razume kontekst. ChatGPT je medtem obtičal v septembru 2021 in pojasni, da FTX posluje odlično.

Kaj pa praktične naloge, kjer je treba pokazati sintezo znanja? Urejanje kemijskih enačb gre obema kar solidno. Primer s spomladanske mature 2021 sta znala rešiti tako ChatGPT kakor Bing. Na vprašanje, katera produkta nastaneta pri reakciji 2-butina s HCl, pa je ChatGPT odgovoril pravilno, Bing pa je razumel narobe in namesto 2-butina opisoval reakcijo z 2-butenom in zanj sicer pravilno razložil, da je zaradi simetrije produkt le eden. Nobeden pa ni pravilno odgovori pri nalogi: »V prvi epruveti zmešamo raztopino kalijevega klorida z bromovico, v drugi pa raztopino kalijevega jodida z bromovico. Napišite enačbo reakcije, ki poteče«. Oba sta menila, da potečeta obe reakciji. Ko sem ju izrecno opozoril, da poteče le ena, je ChatGPT odgovoril nekaj tako neumnega, da tega raje ne bi ponavljal, Bing pa se je domislil ključne besede (halogen displacement reaction) in pravilno ugotovil, da reaktivnejši brom v soli zamenja jod. Oba sta znala izračunati, kako redčiti 35-odstotni HCl, da dobim 100 ml 20-odstotnega HCl, a je ChatGPT ostal pri matematiki, Bing pa je vključil še praktične napotke (vedno vlivajte kislino v vodo in ne obratno, redčite do oznake na bučki, premešajte itd.). Pri srednješolskih kemijskih vprašanjih bi torej bolj verjel Bingu.

Kako deluje Chat Bing

Microsoft je sorazmerno skrivnosten pri razkrivanju drobovja svojega novega iskalnika, a nekaj informacij vseeno imamo. Povedali so, da uporablja model GPT nove generacije, ki ga je razvil OpenAI in je podoben ChatGPT in GPT-3.5, a hitrejši, natančnejši in sposobnejši. Z Microsoftovimi sistemi se pogovarja prek modela Prometheus, skupaj pa omogočata tako prevajanje med človeškim in algoritmičnim jezikom kakor tudi novo rangiranje zadetkov pri iskanju. Prometheus je ključna komponenta, saj jezikovnemu modelu, ki načelno obvlada informacije, dosegljive v nekem trenutku v času, omogoča dotok novosti z interneta v realnem času. Prometheus je torej vmesnik med internetom in novim modelom GPT.

Skočimo na drugo stran ljubljanske Aškerčeve ulice. Jean-Jacques Rousseau je velik zagovornik demokracije, a ob tem ločuje ljudstvo kot zakonodajalca, ki naj deluje po principih neposredne demokracije, ter izvršno vejo oblasti, za katero pa demokracija ni izvedljiv način delovanja. Rousseau ločuje tudi med občo voljo in voljo vseh, kar je tema enega izmed maturitetnih esejev. Kaj vesta o tem umetni inteligenci? Odgovori ChatGPT so daljši, strukturirani v tri ali štiri odstavke, a faktično še vedno skoraj povsem pravilni. Bingovi odgovori so dolgi zgolj odstavek, a se osredotočijo izključno na zastavljeno vprašanje – in popolnoma pravilni, ker smiselno citira Britannico.

Obstaja še ena vrsta iskanja po spletu. Kadar pri delu z računalniki naletimo na specifične napake in težave, jih dobesedno in v narekovajih prepišemo v iskalno polje, potem pa skupaj s pametnimi ključnimi besedami (recimo, če delček rešitve poznamo) iščemo odgovor, neredko na forumih. Leta uporabe Google so nas natrenirala, kako spraševati. In tako sem ChatGPT postavil zelo tehnično vprašanje v človeškem jeziku (Why does ase report an error when opening OUTCAR from VASP6 for magnetic systems?). Pozitivno me je presenetilo, da je bil odgovor vsaj načelno uporaben. ChatGPT je vedel, kaj je ase, katere knjižnice uporablja (ase.io.vasp), kaj so magnetni momenti, kako je oblikovana datoteka OUTCAR itd. Njegovi odgovori pa so bili nekoristni, ker me je zanimala rešitev konkretnega hrošča. Google na isto vprašanje – čeprav Google načelno sprašujemo s ključnimi besedami in ne povedmi – kot prvi zadetek vrne povezavo do niti na tehničnem forumu, kjer je naveden popravek problematične skripte. In Bing? Odgovor je bil tehnično pravilen, kratek in uporaben. Povedal je, da ima vmesnik (parser) težave, navedel pot do problematične Pythonove skripte v privzeti namestitvi in pojasnil, da obstaja popravek. Ponudil mi je tudi odgovore na podvprašanja, denimo, kje ga najti, kako ga uporabiti in katere alternative obstajajo. Sredi pisarne sem obsedel osupel.

Ustvarjalnost

Doslej sem Bing in ChatGPT spraševal po odgovorih na vprašanja, kjer je mogočih več poti razmišljanja, a je odgovor en sam in enostavno preverljiv. Prava moč jezikovnih modelov pa se skriva v ustvarjalnosti, saj že ime pove, da gre za generativne modele.

ChatGPT obstaja v eni inačici, Bing pa ta hip ponuja tri načine delovanja: ustvarjalni, uravnoteženi in natančni. Pri pisanju pesmi so vsi bolj ali manj zanič, saj so rezultati zgolj videti kakor pesmi, sicer pa so vsebinsko izvotljeni, stopice ne obstajajo, verzi so naključnih dolžin itn. ChatGPT meni, da je vse, kar se rima, že pesem, medtem ko Bing rim niti ne poskuša iskati.

Oba znata precej dobro povzemati. Iz 2.000 znakov dolge Reutersove novice (o zahtevku, da bi ustanovitelj FTX v priporu lahko uporabljal mobilni telefon z začetka marca) sta napisala zelo podobna povzetka. Obema sem moral besedilo skopirati v vnosno polje, saj ChatGPT tako in tako nima dostopa do interneta, Bing pa tudi še ne more odpreti želene povezave in povzemati iz nje. Pri daljših besedilih je uporabnejši ChatGPT, ker je Bing pač omejen na 2.000 znakov.

Nato sem ju vprašal, kako bi začel svojo spletno trgovino za prodajo kmetijske opreme. Ponudila sta sedem oziroma osem točk, na katere je treba biti pozoren, pri čemer je bil ChatGPT izčrpnejši. Po drugi strani pa je Bing ponudil relevantna podvprašanja, na katera mi lahko odgovori: o dobaviteljih, referencah, pogajanjih itd. Bing pri vsakem odgovoru pričakuje podvprašanja in jih zato vedno že ponudi nekaj, ki bi uporabnika lahko zanimala, medtem ko se ChatGPT zadovolji s svojim trenutnim odgovorom.

Prihaja specializirana konkurenca

Eden glavnih problemov velikih jezikovnih modelov je haluciniranje informacij, kakor imenujemo generiranje fantazijskih »dejstev«. To želi rešiti Brave, ki je razvil svoje orodje Summarizer. Uporabili so lastne jezikovne modele, ki so izurjeni tako, da preverijo spletno stran in pripravijo povzetek tega, kar tam piše. To so vgradili v svoj brskalnik.

Google na drugi strani razvija splošni model, od katerega pričakujemo veliko, čeprav je prva predstavitev spodletela. Opera pa je obljubila, da bo v svoj brskalnik vgradila kar rešitev OpenAI, ki bo prilagojena pripravi kratkih povzetkov spletnih strani.

Summarizer je vgrajen v brskalnik Brave, kjer skrči in povzame vsebino spletne strani.

Oba, ChatGPT in Bing, si občasno kaj tudi izmislita ali preveč poenostavita. Za znanega slovenskega skakalca, ki se je poročil leta 2019, je Bing poroko postavil v leto 2013, ko je šele spoznal poznejšo ženo. Na vprašanje, zakaj je Al Pacino ubil Jimmyja Hoffo, je Bing jasno povedal, da ga ni (igral ga je v filmu). ChatGPT pa je dejal, da ni dokazov, zakaj je Al Pacino ubil Jimmyja Hoffo. Čeprav v nadaljevanju pojasni, da izginotje še ni pojasnjeno, je začetna dikcija sila okorna in bi zlahka sprožila kakšno teorijo zarote.

Za konec sem ju preizkusil še z navodilom, naj napišeta esej o vplivu računalnikov na družbo. Izdelka obeh umetnih inteligenc sta bila dolga približno 4.000 znakov. ChatGPT je vpliv razčlenil na službeno okolje, učenje, komunikacijo ter dodal še negativne posledice zaradi nadomeščanja ljudi, vdorov v zasebnost ter sklenil z uravnoteženim pogledom. Bing pa se je posvetil znanstvenih prebojem, usvajanju znanja, komunikaciji, razvedrilu in kulturi, možnostim za ustvarjalnost, zdravstvu in diagnostiki itd. O negativnih vplivih ni razpravljal. In splošni vtis? Besedilo ChatGPT je bolj sterilno, bolj splošno in vsebinsko prazno. Bingov tekst pa je kar preveč poln primerov in ponazoritev, ki so za nameček zgledno opremljeni z viri. Če bi vsebino obeh združili in malce premešali, pa bi bil rezultat fantastičen – dasiravno brez izvirne misli.

Pisanje kode

Če je lep čas kazalo, da je programiranje poklic prihodnosti, sta ChatGPT in Bing vsaj malo razburkala to mirnost. Nič ne kaže, da programerjev v prihodnosti ne bomo več potrebovali, jih bomo pa mogoče manj. Oba znata pisati in razhroščevati kodo, denimo »Napiši kodo za FizzBuz«. To je igra, kjer zapisujemo števila od 1 do 100, le da namesto deljivih s 3 pišemo Fizz, namesto deljivih s 5 Buzz in namesto deljivih s 15 FizzBuzz. Oba sta izbrala Python, le da je ChatGPT sprva napisal res špagetasto kodo s tremi stavki if, medtem ko je Bing napisal elegantno enovrstičnico. Resnici na ljubo pa je ChatGPT našel drugo rešitev takoj, ko sem ga s podvprašanjem pozval, naj se izogne stavkom if.

A vendarle razlika obstaja. ChatGPT je znal napisati kodo, ki za posamezno število preveri, ali je praštevilo. Ugotovil je, da ga lahko delimo z vsemi števili, ki so manjša od korena. Bingu se je nepričakovano zataknilo, zato je izpisal le, da o tej temi ne zna razpravljati. Še bolj nenavadno pa je, da je znal napisati kodo, ki izpiše vsa praštevila, česar se je lotil naivno. Najprej je napisal kodo, ki za dano število preveri praštevilskost (to torej zna!), nato pa v zanki to izvede na vsakem naravnem številu. ChatGPT je namesto tega našel Eratostenovo sito.

ChatGPT je napisal slabšo programsko kodo od Binga, a jo je po opozorilu popravil.

Oba znata iskati tudi hrošče v kodi, kjer sta se odrezala podobno. Na enostavnih primerih, ki sem jih našel na internetu, sta odpravila iste težave. Ali je to posledica enake pameti ali učenja iz dostopnih primerov, ne vem. Ko sem jima dal svojo kodo, sta si zobe polomila oba.

Katerega brata imate raje

Poleg tehnične dovršenosti vedno igra ključno vlogo še uporabniška izkušnja, kjer bi težko določil zmagovalca. ChatGPT dela v vseh brskalnikih, a občasno mrkne zaradi preobremenjenosti strežnikov. V Play Storu mrgoli aplikacij s tem imenom, a so prav vse lažne. Za uporabo se moramo napotiti na spletno stran v brskalniku.

Bing je po drugi strani še v beta fazi in ga brez povabila in uporabniškega računa ne moremo uporabljati. Zelo koristna je integracija neposredno v iskalnik, a hkrati je to mogoče le v brskalniku Edge. To izključi tudi starejše naprave, ki zaradi antične različice Windows sploh nimajo Edgea. Ima pa uradno aplikacijo za pametne telefone, ki presenetljivo dobro deluje in prepoznava tudi govorjeno slovansko angleščino. Odgovore bere, v angleščini čudovito, v slovenščini pa precej slabše.

Bing in ChatGPT sta v sorodu, a se pomembno razlikujeta. Odločitev med njima je podobna vprašanju, katerega brata imate raje. ChatGPT se bolje odreže pri nalogah, kjer ne potrebuje ažurnih informacij z interneta in je potrebnega več razmisleka (npr. pisanje kode), ter tam, kjer rešitev ni mogoče najti pri enem spletnem viru. Bing je absolutni zmagovalec pri vprašanjih na aktualna vprašanja, pri odgovarjanju z navajanjem virov in iskanju podatkov, ki so skriti na kakšnih spletnih straneh. Prevajal bi s ChatGPT, čeprav sta oba zelo spodobna. V tandemu, po možnosti še z ostalimi orodji, kakršna so WolframAlpha, InstaText in DeepL, pa umetna inteligenca tvori strašljivo sposobno kombinacijo. Prav zares, kdo nas bo še potreboval, sploh ko se trendu pridruži še Google?

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji