Objavljeno: 9.12.2018 05:00

AlphaZero blesti v šahu, šogiju in goju

Začelo se je z AlphaGojem, ki je pred dvema letoma in pol premagal aktualnega prvaka v antični kitajski igri go. AlphaGo je bil izdelek podjetja DeepMind, ki je danes že Googlova podružnica. Go velja za bistveno zahtevnejšo igro od šaha, kjer je človek primat izgubil že pred dvajsetimi leti, ko je Deep Blue premagal Garryja Kasparova. Ker imamo danes že v mobilnih telefonih več računske moči, kot jo je imel Deep Blue, ni presenetljivo, da so sčasoma padle tudi druge igre.

Naslednik AlphaGo je AlphaZero, ki se je naučil igrati šah, šogi in go. Novi program se je sposoben učiti sam, saj ne potrebuje človeškega mentorstva. Ko mu razložimo pravila igre, se izboljšuje in uči sam. To počne tako, da igra sam s seboj in v vsakih igri napreduje. V samo treh dneh se je AlphaZero naučil igrati go bolje od AlphaGo, čeprav pri tem ni imel nobene pomoči. Potreboval je 4,9 milijona partij, da je postal najboljši na svetu – ne pozabimo, da je AlphaGo boljši od kateregakoli človeka.

Temu postopku se pravi učenje z okrepitvijo (reinforcement learning). Konceptualna razlika je pomembna. AlphaGo se je izmojstril tako, da se je naučil vseh trikov in potez, ki so se jih v dolgi zgodovini igre naučili ljudje. AlphaZero je trike odkrival sam.

AlphaZero sedaj obvlada tri kompleksne igre, ki so bile še nedavno rezervirane za ljudi. Šah od leta 1997 računalniki igrajo bolje, go od leta 2016, šogi pa od pojava AlphaZero. Vseeno pa to ne pomeni, da bodo računalniki zavzeli svet. Omenjene igre predstavljajo svet, ki je zelo natančno določen, saj ima stroga in omejena pravila, zato jih algoritmi lahko izpilijo do obisti. Resničnost ima neprimerno več odtenkov.

Revija Science

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Najbolj brano

Kitajci so ameriške sankcije obšli s kovčki diskov

Ker za kitajska podjetja veljajo stroge omejitve pri nakupih najzmogljivejših čipov, ki so uporabni za trening umetne inteligence, so se tamkajšnja podjetja znašla na zelo staromodni način. Umetno inteligenco trenirajo v Maleziji, kjer so čipi na voljo, le podatke je treba prinesti do tja. In spet se je izkazalo, da je v starem vicu o samokolnici diskov kot najhitrejšem načinu prenosa podatkov nemalo resnice. Temu pravimo tudi sneakernet.

novice

Objavljeno: 17.6.2025 10:00

Podjetja nočejo Copilota, ker zaposleni raje uporabljajo ChatGPT

Microsoft kljub velikim naporom (beri: finančnemu vložku) podjetjem težko proda storitve umetne inteligence Copilot.

novice

Objavljeno: 27.6.2025 09:00

Kitajski prenosniki so dve leti za zahodnimi

Čeprav se Kitajci močno trudijo in izdatno investirajo v domači razvoj in proizvodnjo čipov, so še vedno vsaj dve generaciji za zahodnimi izdelki. To izkazuje tudi najnovejši Huaweijev prenosnik MateBook Fold Ultimate, ki poganja lastni HarmonyOS in ima same kitajske komponente. A te v primerjavi z zahodnimi zaostajajo.

novice

Objavljeno: 25.6.2025 07:00

Pametna očala s samodejnim ostrenjem bi lahko nadomestila bifokalna stekla

Finsko podjetje IXI razvija inovativna očala z lečami, ki se samodejno ostrijo glede na pogled uporabnika.

novice

Objavljeno: 23.6.2025 10:00 | Teme: pametna očala

Teslini samovozeči taksiji ne znajo voziti

Prvi dnevi Teslinih robotskih taksijev so polni napak, vožnje po napačni strani ceste, nenadnih zaviranj in nevarnih ustavljanj za odlaganje potnikov.

novice

Objavljeno: 26.6.2025 09:00