Objavljeno: 9.12.2018 05:00

AlphaZero blesti v šahu, šogiju in goju

Začelo se je z AlphaGojem, ki je pred dvema letoma in pol premagal aktualnega prvaka v antični kitajski igri go. AlphaGo je bil izdelek podjetja DeepMind, ki je danes že Googlova podružnica. Go velja za bistveno zahtevnejšo igro od šaha, kjer je človek primat izgubil že pred dvajsetimi leti, ko je Deep Blue premagal Garryja Kasparova. Ker imamo danes že v mobilnih telefonih več računske moči, kot jo je imel Deep Blue, ni presenetljivo, da so sčasoma padle tudi druge igre.

Naslednik AlphaGo je AlphaZero, ki se je naučil igrati šah, šogi in go. Novi program se je sposoben učiti sam, saj ne potrebuje človeškega mentorstva. Ko mu razložimo pravila igre, se izboljšuje in uči sam. To počne tako, da igra sam s seboj in v vsakih igri napreduje. V samo treh dneh se je AlphaZero naučil igrati go bolje od AlphaGo, čeprav pri tem ni imel nobene pomoči. Potreboval je 4,9 milijona partij, da je postal najboljši na svetu – ne pozabimo, da je AlphaGo boljši od kateregakoli človeka.

Temu postopku se pravi učenje z okrepitvijo (reinforcement learning). Konceptualna razlika je pomembna. AlphaGo se je izmojstril tako, da se je naučil vseh trikov in potez, ki so se jih v dolgi zgodovini igre naučili ljudje. AlphaZero je trike odkrival sam.

AlphaZero sedaj obvlada tri kompleksne igre, ki so bile še nedavno rezervirane za ljudi. Šah od leta 1997 računalniki igrajo bolje, go od leta 2016, šogi pa od pojava AlphaZero. Vseeno pa to ne pomeni, da bodo računalniki zavzeli svet. Omenjene igre predstavljajo svet, ki je zelo natančno določen, saj ima stroga in omejena pravila, zato jih algoritmi lahko izpilijo do obisti. Resničnost ima neprimerno več odtenkov.

Revija Science

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Kaj se zgodi, če Samsungov Galaxy Z Fold prepognete 200.000-krat?

    Ustvarjalec vsebin tech-it je s prenosom v živo na YouTubu izvedel maratonski test, v katerem je ročno odprl in zaprl Samsung Galaxy Z Fold 7 kar 200.000-krat

    Objavljeno: 8.8.2025 10:00
  • Programerska naloga, ki je ni rešil nihče

    Vsako leto se najboljši dijaki v programiranju na svetu merijo na olimpijadi iz informatike, kjer nastopa tudi slovenska ekipa. Tekmovalci v dveh tekmovalnih dneh rešujejo šest nalog, kodo pa pišejo v jeziku C++. Ene izmed nalog letos ni rešil nihče izmed 330 tekmovalci.

    Objavljeno: 6.8.2025 07:00
  • Xiaomi predstavil pametni ventilator

    Xiaomi je v poletni vročini za evropske trge predstavil Smart Desktop Air Circulation Fan, kompakten pametni ventilator, zasnovan za močan pretok zraka v manjših prostorih. 

    Objavljeno: 6.8.2025 11:00
  • Avstralija mlajšim od 16 let prepovedala tudi profile na YouTubu

    Svet se je v zadnjih tednih začel odločneje premikati proti regulaciji spleta in preverjanju starosti uporabnikov, saj so podviga lotile EU, Velika Britanija in ZDA. A daleč pred vsemi je Avstralija, kjer je uporaba družbenih omrežij za otroke prepovedana, to pa se tudi preverja. Seznam družbenih omrežij so še razširili.

    Objavljeno: 1.8.2025 05:00
  • Superge s skritim predalom za AirTag

    Skechers je predstavil novo linijo otroških športnih čevljev Find My Skechers, ki staršem omogoča skrito namestitev sledilnika Apple AirTag pod peto čevlja. 

    Objavljeno: 1.8.2025 06:00
  • HBO Max bo še otežil deljenje gesel

    Warner Bros. Discovery bo od prihodnjega meseca začel strožje uveljavljati prepoved deljenja gesel na pretočni storitvi HBO Max. 

    Objavljeno: 8.8.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji