Objavljeno: 22.4.2011 | Avtor: Primož Gabrijelčič | Monitor April 2011

Osnove, dragi Watson

Osnove, dragi Watson

Od leta 2010 sta kandidatki Hrvaška in Makedonija, to pa je edina nekdanja jugoslovanska republika, ki je članica EU. - Kaj je Bosna?

Tako nekako bi se v prevodu glasilo vprašanje, na katerem so padle tri modre glave - največji zaslužkar kviza Jeopardy (in hkrati avtor zgornjega napačnega odgovora), njegov konkurent, ki je zmagal v 74 zaporednih šovih istega kviza, ter Watson.

Kaj ima ameriško nepoznavanje majhnih balkanskih državic z našo revijo in zakaj v računalniškem časopisu pišemo o tujih kvizih? Če ste v zadnjem mesecu spali na ušesih, naj vam povem, da se je konec februarja na ameriških televizijah odvrtel zanimiv tridnevni dogodek, v katerem je z omenjenima prvakoma Jeopardyja tekmoval Watson, računalnik podjetja IBM.

Jeopardy je kviz za ljudi z obsežnim znanjem, saj v njem nastopajo najrazličnejše teme - od umetnosti prek EU pa vse do računalniških tipkovnic in formule ena (kratek izbor tem iz tekmovanja, o katerem pišem). Zaradi tega je strašno primeren za računalniško podprto reševanje. Prebereš vprašanje (pravzaprav odgovor, kajti pri Jeopardyju je vprašanje v obliki trditve, odgovor pa v obliki vprašanja; o tem si več preberite na blog.monitor.si/2011/02/nam-bodo-racunalniki-zavladali) in ga vpišeš v Google, iz zadetkov pa hitro ugotoviš, kakšen je pravi odgovor. Če je tako enostavno, zakaj torej niso računalniki prehiteli ljudi že pred leti?

Težava je v razumevanju vprašanja. Če se v temi "Tudi na tipkovnici" znajde vprašanje "okrajšava za avtomobilski šport" vam Google ne bo dosti pomagal. (Pravzaprav vam februarja ne bi pomagal, dandanes pa na to kombinacijo besed - v angleščini, seveda - takoj najde kup člankov o Jeopardyju in Watsonu in med njimi tudi pravi odgovor.) Vprašanje je treba najprej razumeti, šele nato lahko iščeš.

Tudi če sta tema in vprašanje dovolj enostavna, da internetno iskanje izvrže pravo stran, delo za program ni lahko. Na strani mora najti iskane besede, nato razumeti sobesedilo, iz njega potegniti pravi odgovor in ga oblikovati v vprašanje. Ni več tako enostavno, kot se je zdelo na prvi pogled, kajneda? Kako je torej Watsonu uspelo premagati dva odlična tekmovalca?

Za začetek tako, da Watson niti ne poskuša razumeti vprašanja, temveč se problema reši s statistično analizo - približno tako, kot strani išče Google. Watson vzame temo in vprašanje, poseže v svojo velikansko zbirko podatkov (priklop v internet ni bil dovoljen, pa tudi prepočasen bi bil) in poišče čim več strani, na katerih nastopajo iskane besede. Nato te strani analizira in iz njih nekako (točnega postopka niso razkrili) potegne bistvo. To mu večinoma uspe, včasih, kot na primer v zgornjem primeru s tipkovnico in avtomobili (pravilni odgovor je "Kaj je F1?"), pa niti približno ne.

Kritiki so se seveda takoj oglasili, da Watson "goljufa", ker ne "razume" ne vprašanja ne podatkov, po katerih išče odgovore. (Narekovaje okoli "razume" sem postavil, ker pravzaprav nihče ne ve, kako ljudje izvajamo to "razumevanje".) Zagovorniki pa so odgovorili, da je to popolnoma nepomembna podrobnost. Bistveno je, da "umetna inteligenca" v Watsonu deluje bolje od vseh drugih sistemov za razumevanje splošnih besedil - in to precej bolje. Približno tako, kot statistična analiza v Googlovem prevajalniku deluje bolje od vseh sistemov za strojno prevajanje, ki se trudijo razumeti besedilo. Res pa je, da tako Watson kot Google občasno tako hudo usekata mimo, da sistem, ki besedilo analizira, take napake nikoli ne bi naredil.

Je torej prihodnost računalnikov v statistični analizi velikanskih količin besedil? Morda ne. Pred kratkim je Guardian objavil članek, v katerem je član Googlove ekipe za strojno prevajanje priznal, da so naleteli na omejitve te tehnologije in da potrebujejo podvojeno količino dokumentov, da izboljšajo prevod za borih 0,5 odstotka. Ker jim bo pri takšnem tempu prav hitro zmanjkalo gradiva, lahko računamo, da se strojno prevajanje v naslednjih letih ne bo kaj prida izboljšalo. Ugibam, da velja nekaj podobnega tudi za watsonovski pristop k iskanju odgovorov. Možno je, da bodo sistemi, ki se trudijo razumeti vsebino, z veliko truda kljub vsemu prišli do stopnje, kjer bodo prehiteli "statistično" konkurenco. Vemo pa tega seveda ne.

Kljub vsem omejitvam je Watson premagal človeška tekmeca, in to kar pošteno. Pozorni gledalci smo opazili, da je bila razlika majhna in merljiva v desetinkah. Watson je imel dve malenkostni prednosti, ki sta skupaj pripomogli k temu, da je lahko prvi pritisnil na stikalo in zato tudi prvi odgovarjal. Vprašanje je dobil v elektronski obliki, gumb pa je pritiskal z mehansko napravo, ki je imela hitrejši reakcijski čas, kot ga imamo ljudje.

Watson je torej zmagal in zdaj ga bodo predelali v sisteme za brskanje po obsežnih zbirkah podatkov za najrazličnejša področja. Za začetek se bo preizkusil v medicini. (Sistem bodo imenovali House. Ne, saj ne.) V dobro pacientov upamo, da tam ne bo kvasil takšnih neumnosti, kot jih je občasno na kvizu.

In kako je na vprašanje iz uvoda odgovoril Watson? "Kaj je Srbija?" Ah, Watson, pravilni odgovor je "Kaj je Slovenija?" Osnove, dragi Watson!

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Redka zmaga malega rudarja kriptovalut

    V času, ko rudarjenje bitcoina obvladujejo velika podjetja s specializirano opremo in ogromnimi viri, je neodvisnemu solo rudarju uspel izjemen podvig. 

    Objavljeno: 27.7.2025 13:00
  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • ChatGPT je bogatejši za pravega raziskovalnega agenta

    ChatGPT agent je nova generacija digitalnega pomočnika, ki združuje sposobnosti vizualnega in tekstovnega brskanja ter neposredne interakcije z zunanjimi platformami, kot so Google Drive, GitHub in SharePoint.

    Objavljeno: 18.7.2025 08:00
  • Tehnologija je orodje za množično nadzorovanje

    Ko je minuli teden kamera na koncertu skupine Coldplay v Bostonu prikazala par, ki objet posluša Chrisa Martina, bi bil lahko to le še eden izmed množice povsem običajnih in dolgočasni prizor. A ker se je ženska na posnetku obrnila proč in obraz zakopal v roke, moški pa se je sklonil pod kader, je posnetek vzbudil veliko pozornosti. Pevec Chris Martin ga je na odru komentiral z besedami, da sta bodisi zelo sramežljiva bodisi razmerje skrivata – in ostalo je bilo zgodovina.

    Objavljeno: 21.7.2025 05:00
  • ChatGPT je slab v šahu

    Najboljši šahist sveta Magnus Carlsen je v spletnem dvoboju premagal umetno inteligenco ChatGPT v vsega 53-ih potezah, pri čemer sam ni izgubil niti ene same figure. 

    Objavljeno: 21.7.2025 09:00
  • ChatGPT-5 bo na voljo avgusta

    Sam Altman, izvršni direktor OpenAI, je potrdil, da bo model GPT-5 izšel že v začetku avgusta. 

    Objavljeno: 25.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji