Umělá inteligence se učila hrát šachy jen 4 hodiny. Pak rozdrtila nejlepšího hráče světa

Umělá inteligence AlphaZero, kterou vyvinuli experti z Google, před několika měsíci ukázala svou naprostou nadřazenost ve hře Go: trvalo jí jen tři dny, aby se ji naučila, pak porazila nejlepšího hráče na světě. Nyní se jí povedl podobně husarský kousek, ale tentokrát v šachu a její úspěch je snad ještě působivější.

Tato umělá inteligence jménem AlphaZero je upravenou verzí programu AlphaGo Zero, který porazil dříve nejlepší program na hraní go AlphaGo 100:0. Lidé, a to ani ti nejlepší, už proti tomuto programu nemají vůbec šanci – když to naposledy zkusil světový velmistr v go, Korejec Lee-Sedol, drtivě prohrál.

Přestože je AlphaZero program specializovaný na hru Go, chtěli jeho autoři vyzkoušet, jak si povede v úplně jiném odvětví. Nechali ho tedy, aby se sám seznámil s šachy – hrou, která je stará nejméně 1500 let. Počítač měl na seznámení s hrou, jejími pravidly, strategií a taktikou pouhé čtyři hodiny. Během nich ho nikdo netrénoval, stroj se hru naučil zcela sám a zlepšoval se tím, že hrál sám proti sobě.

11 minut
Umělé inteligence v roce 2016
Zdroj: ČT24

Pak ho jeho autoři nechali hrát proti zřejmě nejlepšímu současnému hráči šachu, což také není člověk, ale program jménem Stockfish8. AlphaZero proti němu sehrál 100 partií. Ani jednu neprohrál, všechny skončily buď jeho výhrou, nebo remízou. Lidé, kteří partii dvou strojů sledovali, byli zaskočení až šokovaní.

Šachy se změnily

Mike Klein pro web Chess.com uvedl: „Šachy se dnes jednou provždy změnily. A možná s tím i zbytek světa. Ani ne rok poté, co Alpha Go senzačně vyhrál proti nejlepšímu lidskému hráči go, zničil v šachu nejlepšího konkurenta.“

Na úspěchu stroje je pozoruhodné zejména to, že ho dosáhl zcela bez lidské pomoci. Starší generace umělých inteligencí byly zásobované obrovským množstvím již odehraných partií nebo těch nejlepších a nejslavnějších her – z nich se učily nejúčinnější postupy. AlphaZero nic takového k dispozici neměl, vycházel jen z toho, že mu programátoři vložili do paměti pravidla šachů.

  • 1997: Program Deep Blue porazil velmistra Garryho Kasparova v šachu.
  • 2011: Program IBM Watson porazil světové šampiony ve hře Jeopardy (česká verze se jmenovala Risk).
  • 2016: Umělá inteligence AlphaGo porazila velmistra Lee-Sedola ve hře go.
  • 2016: Umělá inteligence Libratus z Carnegie Meloon University porazila čtyři přední hráče pokeru.
  • 2017: Program DeepStack, na němž pracovali i čeští vědci, rozdrtil 33 hráčů v pokeru – a to i pomocí intuice.

Začínal s nulovou znalostí, ale během těch čtyř hodin, které měl na trénink povolené, hrál proti sobě velké množství partií, z nichž se dokázal poučit. Přitom proti svému konkurentovi je mnohem pomalejší. Zatímco AlphaZero umí za sekundu spočítat jen 800 000 pozicí, Stockfish 8 zvládne spočítat 70 milionů tahů. Ani tak ale proti googlovské umělé inteligenci neměl šanci.

Drtivá porážka

Když hrál AlphaZero bílými figurami, zvítězil v 25 případech a remizoval také ve 25 hrách, když hrál za černé, dařilo se mu už méně – vyhrál tři hry, remizoval 72krát. Podle šachových teoretiků to jen zdůrazňuje, jak velkou výhodou je hra za bílou stranu. Pro fanoušky šachu: nejoblíbenějšími zahájeními byly u něj Anglická hra (pěšec na c4), Dámský gambit a obecně jakékoliv otevření dámským pěšcem.

AlphaZero po tomto fenomenálním vítězství změřil síly ještě se svým starším sourozencem AlphGo, který byl modifikován pro hru šachu. Po dalších osmi hodinách tréninku ho porazil 60:0.

„Poté, co jsem si četl zprávu a pak jsem viděl samotné hry, vzpomněl jsem si, jak jsem si vždycky představoval, že na Zemi přistane nějaký naprosto nadřazený druh a ukáže nám, jak hrát šachy,“ uvedl pro server Chess.com šachový velmistr Peter Heine Nielsen. „Tak teď jsem to viděl.“ 

V šachové komunitě se nyní rozproudila živá debata, jestli jsou opravdu klasické šachové počítače, jako je třeba Stockfish8 nebo Elmo, zastaralé, nebo se dokáží z porážek poučit. Lidé, zdá se, jsou už z těchto odvětví založených na konkrétní sadě jednoduchých pravidel definitivně ze hry. Od doby, kdy počítač Deep Blue od IBM porazil Garryho Kasparova, uplynulo letos už dvacet let – a zatímco lidští hráči zůstávají stále stejně omezení svou biologickou kapacitou, stroje se zlepšují raketovou rychlostí.

Pro oblast umělých inteligencí je to také obrovský pokrok. AlphaGo (a jeho vylepšení AlphaZero) byly kritizovány jako příliš specializované, tudíž by to vlastně ani neměly být umělé inteligence. Nyní se ukazuje, že jde o mnohem variabilnější a univerzálnější programy, které by už brzy mohly promluvit také do praktických stránek života, třeba pátrání po rakovinových nádorech na rentgenových snímcích nebo do vědeckého výzkumu.

Výběr redakce

Aktuálně z rubriky Věda

Nadměrný čas u videoher může podle studie vytlačovat zdravé návyky

Dlouhé hraní videoher není zdravé, tvrdí článek, který vyšel v odborném časopise Nutrition. A nejde jen o tvrzení – studie přináší důkazy o tom, co konkrétně je rizikové a od jakého času tráveného touto aktivitou to začíná být hrozbou pro zdraví.
před 13 hhodinami

Kráva používá nástroje. Vědci se diví, že si toho dosud nevšimli

Veronika žije v Rakousku na horách a jako každou jinou krávu ji trápí hmyz. Bodavý hmyz dobytek otravuje odnepaměti, ale až Veronika našla řešení. Ze země zvedá klacky nebo třeba i odhozené koště, to uchopí do tlamy a pohybuje jím tak, aby dosáhla na jinak nedosažitelná místa, která ji svědí. Její majitel toto chování nafilmoval a záběry se pak dostaly do rukou expertů z Veterinární univerzity ve Vídni. Ti byli v šoku.
20. 1. 2026

Evropu čekají silnější zemědělská sucha, i kdyby víc pršelo, varuje výzkum

Klimatické změny, které v současné době probíhají, musí nutně ovlivňovat nejen teploty, ale také všechno, na co teplo působí. Tedy včetně půdy a rostlin, které v ní rostou. Vědci z Univerzity v Readingu studovali, jak klimatické změny ovlivňují vlhkost půdy během vegetačního období, tedy v období roku, kdy zemědělské plodiny potřebují vodu nejvíce.
20. 1. 2026

Šest příspěvků za 23 sekund. Donald Trump se umí na Truth Social rozvášnit

Sociální síť Truth Social je výkladní skříní toho, o co se americký prezident dělí s veřejností. Analýza příspěvků, které tam vydal od roku 2022 do současnosti, naznačuje, jak s ní pracuje.
20. 1. 2026
Načítání...