Objavljeno: 19.10.2017 09:00

AlphaGo: umetna inteligenca, ki se uči sama

DeepMindov računalnik z nevronsko mrežo AlphaGo, ki je že večkrat prepričljivo pokazal, da je v znameniti starodavni kitajski igri go boljši od človeka, je v novi verziji AlphaGo Zero postal še neprimerno boljši. Tokrat se je od nepopisanega lista do najboljšega igralca na svetu razvil v pičlih 40 dneh, ne da bi mu kdorkoli pri tem pomagal. Kaj sploh še ostane človeštvu?

AlphaGo je že pred poldrugim letom premagal najboljšega južnokorejskega igralca goja Lee Se-dola, letos pa je zlomil še svetovnega prvaka Ke Jieja. AlphaGo se je tedaj goja učil podobno kot ljudje: poznal je pravila, potem pa si je ogledal oziroma analiziral na tisoče že odigranih partij. To je prednost, če želi premagati človeka, a se s tem hkrati naleze človeških taktik pri igranju, ki niso nujno optimalne.

Čeprav ima človeštvo za seboj več tisoč let mojstrenja v goju, še vedno ne igramo popolno. AlphaGo Zero se je zato lotil učenja povsem drugače. Vanj so sprogramirali zgolj pravila, potem pa ga pustili, da se uči sam z igranjem proti sebi. Rezultati so impresivni. V samo treh dneh je AlphaGo Zero postal boljši od verzije, ki je premagala Lee Se-dola, v 21 dneh  je premagal verzijo, s katero je neuspešno igral Ke Jie, v štiridesetih dneh pa je postal boljši od dotlej najboljše verzije AlphaGo.

Rezultati so hkrati impresivni kakor tudi strašljivi. Pokazali so, da za učenje (reinforcement learning) niso ključni predhodni podatki, ki lahko v določenih primerih celo preprečujejo doseg optimuma, niti računska moč, temveč algoritmi. Kar strašljivo pa je videti, da se lahko računalnik v manj kot mesecu dni brez mentorja in uporabe predhodnega znanja, torej od začetka in brez tuje pomoči, nauči igrati več in bolje, kot se je človeštvu uspelo v tisočletjih.

DeepMind.

Članek v Nature.

Več novic

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

Najbolj brano

  • Redka zmaga malega rudarja kriptovalut

    V času, ko rudarjenje bitcoina obvladujejo velika podjetja s specializirano opremo in ogromnimi viri, je neodvisnemu solo rudarju uspel izjemen podvig. 

    Objavljeno: 27.7.2025 13:00
  • Šibko geslo in hekerski vdor pogubila 158 let staro podjetje

    Britansko podjetje KNP iz Northamptonshira, ki se je ukvarjalo s prevozi, je po 158 letih obratovanja zaprlo vrata, zaradi česar je brez dela ostalo 700 ljudi. Razlog ni slabo poslovanje, težke tržne razmere, izgube ali celo poneverbe, temveč precej bolj banalen. Podjetje je opustošil hekerski napad, v katerem so napadalci odnesli podatke o vseh strankah.

    Objavljeno: 23.7.2025 05:00
  • ChatGPT je bogatejši za pravega raziskovalnega agenta

    ChatGPT agent je nova generacija digitalnega pomočnika, ki združuje sposobnosti vizualnega in tekstovnega brskanja ter neposredne interakcije z zunanjimi platformami, kot so Google Drive, GitHub in SharePoint.

    Objavljeno: 18.7.2025 08:00
  • Tehnologija je orodje za množično nadzorovanje

    Ko je minuli teden kamera na koncertu skupine Coldplay v Bostonu prikazala par, ki objet posluša Chrisa Martina, bi bil lahko to le še eden izmed množice povsem običajnih in dolgočasni prizor. A ker se je ženska na posnetku obrnila proč in obraz zakopal v roke, moški pa se je sklonil pod kader, je posnetek vzbudil veliko pozornosti. Pevec Chris Martin ga je na odru komentiral z besedami, da sta bodisi zelo sramežljiva bodisi razmerje skrivata – in ostalo je bilo zgodovina.

    Objavljeno: 21.7.2025 05:00
  • ChatGPT je slab v šahu

    Najboljši šahist sveta Magnus Carlsen je v spletnem dvoboju premagal umetno inteligenco ChatGPT v vsega 53-ih potezah, pri čemer sam ni izgubil niti ene same figure. 

    Objavljeno: 21.7.2025 09:00
  • ChatGPT-5 bo na voljo avgusta

    Sam Altman, izvršni direktor OpenAI, je potrdil, da bo model GPT-5 izšel že v začetku avgusta. 

    Objavljeno: 25.7.2025 09:00
 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji