Umělá inteligence se učila hrát šachy jen 4 hodiny. Pak rozdrtila nejlepšího hráče světa

Umělá inteligence AlphaZero, kterou vyvinuli experti z Google, před několika měsíci ukázala svou naprostou nadřazenost ve hře Go: trvalo jí jen tři dny, aby se ji naučila, pak porazila nejlepšího hráče na světě. Nyní se jí povedl podobně husarský kousek, ale tentokrát v šachu a její úspěch je snad ještě působivější.

Tato umělá inteligence jménem AlphaZero je upravenou verzí programu AlphaGo Zero, který porazil dříve nejlepší program na hraní go AlphaGo 100:0. Lidé, a to ani ti nejlepší, už proti tomuto programu nemají vůbec šanci – když to naposledy zkusil světový velmistr v go, Korejec Lee-Sedol, drtivě prohrál.

Přestože je AlphaZero program specializovaný na hru Go, chtěli jeho autoři vyzkoušet, jak si povede v úplně jiném odvětví. Nechali ho tedy, aby se sám seznámil s šachy – hrou, která je stará nejméně 1500 let. Počítač měl na seznámení s hrou, jejími pravidly, strategií a taktikou pouhé čtyři hodiny. Během nich ho nikdo netrénoval, stroj se hru naučil zcela sám a zlepšoval se tím, že hrál sám proti sobě.

Nahrávám video

Pak ho jeho autoři nechali hrát proti zřejmě nejlepšímu současnému hráči šachu, což také není člověk, ale program jménem Stockfish8. AlphaZero proti němu sehrál 100 partií. Ani jednu neprohrál, všechny skončily buď jeho výhrou, nebo remízou. Lidé, kteří partii dvou strojů sledovali, byli zaskočení až šokovaní.

Šachy se změnily

Mike Klein pro web Chess.com uvedl: „Šachy se dnes jednou provždy změnily. A možná s tím i zbytek světa. Ani ne rok poté, co Alpha Go senzačně vyhrál proti nejlepšímu lidskému hráči go, zničil v šachu nejlepšího konkurenta.“

Na úspěchu stroje je pozoruhodné zejména to, že ho dosáhl zcela bez lidské pomoci. Starší generace umělých inteligencí byly zásobované obrovským množstvím již odehraných partií nebo těch nejlepších a nejslavnějších her – z nich se učily nejúčinnější postupy. AlphaZero nic takového k dispozici neměl, vycházel jen z toho, že mu programátoři vložili do paměti pravidla šachů.

  • 1997: Program Deep Blue porazil velmistra Garryho Kasparova v šachu.
  • 2011: Program IBM Watson porazil světové šampiony ve hře Jeopardy (česká verze se jmenovala Risk).
  • 2016: Umělá inteligence AlphaGo porazila velmistra Lee-Sedola ve hře go.
  • 2016: Umělá inteligence Libratus z Carnegie Meloon University porazila čtyři přední hráče pokeru.
  • 2017: Program DeepStack, na němž pracovali i čeští vědci, rozdrtil 33 hráčů v pokeru – a to i pomocí intuice.

Začínal s nulovou znalostí, ale během těch čtyř hodin, které měl na trénink povolené, hrál proti sobě velké množství partií, z nichž se dokázal poučit. Přitom proti svému konkurentovi je mnohem pomalejší. Zatímco AlphaZero umí za sekundu spočítat jen 800 000 pozicí, Stockfish 8 zvládne spočítat 70 milionů tahů. Ani tak ale proti googlovské umělé inteligenci neměl šanci.

Drtivá porážka

Když hrál AlphaZero bílými figurami, zvítězil v 25 případech a remizoval také ve 25 hrách, když hrál za černé, dařilo se mu už méně – vyhrál tři hry, remizoval 72krát. Podle šachových teoretiků to jen zdůrazňuje, jak velkou výhodou je hra za bílou stranu. Pro fanoušky šachu: nejoblíbenějšími zahájeními byly u něj Anglická hra (pěšec na c4), Dámský gambit a obecně jakékoliv otevření dámským pěšcem.

AlphaZero po tomto fenomenálním vítězství změřil síly ještě se svým starším sourozencem AlphGo, který byl modifikován pro hru šachu. Po dalších osmi hodinách tréninku ho porazil 60:0.

„Poté, co jsem si četl zprávu a pak jsem viděl samotné hry, vzpomněl jsem si, jak jsem si vždycky představoval, že na Zemi přistane nějaký naprosto nadřazený druh a ukáže nám, jak hrát šachy,“ uvedl pro server Chess.com šachový velmistr Peter Heine Nielsen. „Tak teď jsem to viděl.“ 

V šachové komunitě se nyní rozproudila živá debata, jestli jsou opravdu klasické šachové počítače, jako je třeba Stockfish8 nebo Elmo, zastaralé, nebo se dokáží z porážek poučit. Lidé, zdá se, jsou už z těchto odvětví založených na konkrétní sadě jednoduchých pravidel definitivně ze hry. Od doby, kdy počítač Deep Blue od IBM porazil Garryho Kasparova, uplynulo letos už dvacet let – a zatímco lidští hráči zůstávají stále stejně omezení svou biologickou kapacitou, stroje se zlepšují raketovou rychlostí.

Pro oblast umělých inteligencí je to také obrovský pokrok. AlphaGo (a jeho vylepšení AlphaZero) byly kritizovány jako příliš specializované, tudíž by to vlastně ani neměly být umělé inteligence. Nyní se ukazuje, že jde o mnohem variabilnější a univerzálnější programy, které by už brzy mohly promluvit také do praktických stránek života, třeba pátrání po rakovinových nádorech na rentgenových snímcích nebo do vědeckého výzkumu.

Výběr redakce

Aktuálně z rubriky Věda

První týdny otcovství mění mužům zásadně mozek, popsali experti

Když žena přivede na svět dítě, změní ji to duševně i tělesně. Týká se to i změn v mozku, které už vědci opakovaně a docela detailně popsali. Ale oč lépe známé byly dopady rodičovství na ženy, o to méně se vědělo o tom, co dělá otcovství s mozkem mužů. Teď to popsali němečtí psychologové, kteří čerstvé otce prozkoumali celou řadou těch nejmodernějších přístrojů.
před 6 hhodinami

Ebola se v Kongu šíří stovky kilometrů od dosavadního ohniska

V provincii Jižní Kivu na východě Konga byl potvrzen případ eboly, nemoc se tak objevila stovky kilometrů od dosavadního epicentra nákazy. Uvedla to ve čtvrtek povstalecká aliance, která oblast kontroluje, informovala agentura Reuters. Případ podle ní vyvolává obavy z dalšího šíření epidemie.
14:30Aktualizovánopřed 6 hhodinami

Španělsko prošlo nejhorší sezonou lesních požárů od roku 1995. Roli sehrálo i žhářství

Španělsko zažilo loni nejhorší sezonu lesních požárů od roku 1995. Oheň zničil 354 793 hektarů lesní půdy. Dokument Anatomie požáru se zaměřuje na požár u obce Molezuelas de la Carballeda v provincii Zamora, který byl loni v létě jedním z nejničivějších.
před 6 hhodinami

Turečtí vědci vypustili robotického archeologa, umí se potopit 300 metrů hluboko

Kam člověk nemůže, tam ho zastoupí robot. Tato praxe se začíná využívat v čím dál větším množství oborů – a nově také v podvodní archeologii. Stroj se totiž ponoří hlouběji než člověk a déle vydrží v podmínkách vysokého tlaku, nedostatku světla i vzduchu.
před 9 hhodinami

SpaceX míří na burzu a chce výrazně překonat saúdské těžaře

Americká firma SpaceX předložila americké Komisi pro cenné papíry a burzy (SEC) potřebný dokument pro vstup na burzu. V něm například uvádí, že v budoucnosti chce rozvíjet měsíční ekonomiku, infrastrukturu pro umělou inteligenci na oběžné dráze či osobní a nákladní přepravu na Měsíc a Mars. Firma podle dokumentu v prvním čtvrtletí letošního roku hospodařila s čistou ztrátou 4,28 miliardy dolarů (90 miliard korun). Meziročně ztrátu výrazně prohloubila z 528 milionů dolarů. Obrat společnost navýšila meziročně z necelých 4,1 na téměř 4,7 miliardy dolarů.
před 10 hhodinami

Nanoplasty mohou narušovat ochrannou vrstvu plic, ukazuje výzkum Akademie věd

Malé částečky umělých hmot, konkrétně takzvané ultrajemné polystyrenové nanoplasty, se mohou „zabudovávat“ do ochranné vrstvy plic, měnit její strukturu a oslabovat ochrannou funkci, popsali vědci z Ústavu fyzikální chemie J. Heyrovského Akademie věd ČR ve spolupráci s kolegy z Polska a Slovinska.
před 10 hhodinami

Přepracované AI se v experimentu obracely k marxismu

Pokud výzkumníci vystavili umělé inteligence (AI) náročné práci, neustále jim zhoršovali podmínky a ještě jim vyhrožovali, že je nahradí pokročilejšími modely, začaly AI komunikovat podobně jako marxisté.
před 15 hhodinami

Ebola v Evropě není velkou hrozbou, ukazují zkušenosti

Pacient, který může mít ebolu a bude hospitalizovaný v Česku, může vyvolávat obavy. Ale zkušenosti naznačují, že kvalitní přijatá opatření i samotné vlastnosti viru dokáží šíření nemoci účinně zabránit.
včera v 12:27
Načítání...