Objavljeno: 27.12.2020 20:00 | Teme: umetna inteligenca

DeepMind po šahu, goju in šogiju obvlada tudi igre za Atari

Morda se ne zdi tako, a igrati šah je bistveno laže od igranja še tako primitivne videoigre, kot je na primer Pac-Man. Zato ni presenetljivo, da je umetna inteligenca šah obvladala že leta 1997, igro go leta 2016, videoigre pa – DeepMind pravi, da sedaj.

Razlika je predvsem v togosti okolja, v številu možnih potez, v možnih izidih. Pri šahu in goju so dovoljene poteze zelo dobro znane, njihovo število pa obvladljivo. Go je seveda bistveno kompleksnejši od šaha, a osnovni koncept ostaja enak. Iz zelo jasno določenih pravil se da hitro ugotoviti, katere poteze so dovoljene, od tod pa ostane le premislek, katera bo vodila do najboljšega izida.

Googlova podružnica DeepMind je že leta 2016 predstavila AlphaGo, ki je v goju zmlel človeškega prvaka. AlphaGo Zero je bil naslednja inačica, ki se ni učila iz tisočerih dobro odigranih partij ljudi, temveč je igrala sama s seboj in se izboljševala. AlphaZero je to kasneje še razširil na druge probleme.

Naslednji korak pa so predstavljale manj definirane igre, kot že omenjeni Pac-Man. Novi algoritem so predstavili te dni in ga poimenovali MuZero. V Nature so znanstveni članek objavili 23. decembra, kar seveda pomeni, da je bil algoritem nared že pred meseci, sedaj pa je še boljši.

MuZero uporablja kombinacijo metod, ki so jih izmojstrili njegovi predhodniki, in dodaja nove. Igranja se uči podobno kot otroci, torej najprej brez pravil, kasneje pa sproti osvaja pravila, dokler ne pozna vseh. Sproti se uči čim boljše strategije. Ko je odigral milijon partij, je bil podobno dober kot AlphaZero v šahu, goju in šogiju.

Ključna novost pa je, da se je naučil tudi 42 iger za Atari. To so bistveno bolj odprti problemi, kjer so pravila ohlapnejša, konfiguracijski prostor dopustnih potez širši, končni cilj pa bolj oddaljen. Končni cilj seveda ni izdelati algoritma, ki bo igral igre za Atari, temveč reševanje realnih problemov. Zvijanje proteinov, optimizacija problema trgovskega potnika, stiskanje podatkov itd. To so problemi, kjer pravil v igri ni, le končni rezultat mora biti v skladu z začetnimi predpostavkami in potrebami. Kompleksne probleme iz realnega sveta je lažje reševati, če pravil ne poznamo, saj nas pravila lahko vkalupijo in usmerijo na suboptimalne poti ali celo v slepe ulice.

 Nature

DeepMind

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Xiaomi predstavil pametni pralni stroj prihodnosti

    Xiaomi je na kitajskem trgu predstavil pametni pralni stroj Mijia Three‑Zone Pro Drum 10 kg, ki prinaša nov pristop k pranju perila s tremi ločenimi bobni

    Objavljeno: 23.9.2025 09:00
  • ChatGPT za kriminalce

    SpamGPT je nova platforma, ki jo uporabljajo spletni kriminalci za pošiljanje neželene pošte in izvajanje napadov z ribarjenjem.

    Objavljeno: 22.9.2025 19:30
  • Steam bo nehal delovati na 32-bitnem Windows 10

    Valve je sporočil, da bo z novim letom ukinil podporo za 32-bitne različice Windows v svoji priljubljeni platformi za digitalno distribucijo iger Steam. Uporabnikov 32-bitnega Windows 10 imajo le 0,01 odstotka, so zatrdili, zato ne pričakujejo večjega odpora.

    Objavljeno: 22.9.2025 05:00
  • Nvidia bo v OpenAI vložil 100 milijard dolarjev

    OpenAI in Nvidia sta napovedala tesno partnerstvo, ki ga bosta zapečatila z Nvidijino 100-milijardno investicijo v OpenAI. Po besedah poznavalcev gre za dvojni posel: Nvidia bo za OpenAI proizvajala čipe, ki jih bo slednji plačal z denarjem, obenem pa bo Nvidia vanj investirala 100 milijard dolarjev v zameno za prednostne delnice.

    Objavljeno: 23.9.2025 05:00
  • Windows 11 dobiva video ozadja za namizje

    V prihajajoči reviziji Windows 11 bomo lahko nastavili video ozadje na namizju, kažejo zgodnje preizkusne verzije. V trenutnih inačicah je možno uporabiti posnetke MP4 ali MKV kot ozadje. Predvajali se bodo vsakokrat, ko bomo prikazali namizje.

    Objavljeno: 23.9.2025 07:00
  • Chrome dobiva umetno inteligenco

    V prihodnjih tednih bo Chrome dobil paleto novih funkcionalnosti, ki jih bo omogočal Gemini. Prvi jih bodo deležni uporabniki, ki imajo jezik nastavljen na ameriško angleščino, kasneje pa tudi preostanek sveta. Novosti bodo na voljo tako na namiznih sistemih Windows in Mac kakor tudi v Androidu. Kasneje bo sledil še Chrome za Applov iOS.

    Objavljeno: 22.9.2025 07:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji