Česká umělá inteligence má dokonce intuici. Porazila špičkové světové hráče v pokeru

Vědci z Univerzity Karlovy, Českého vysokého učení technického v Praze a Albertské univerzity v Kanadě dosáhli zásadního úspěchu na poli umělé inteligence. Mezinárodní tým vyvinul počítačový program DeepStack, který v prosinci 2016 poprvé v historii porazil profesionální hráče v jedné z nejpopulárnějších karetních her na světě – dvouhráčovém no-limit Texas hold'em pokeru. Vědecké objevy, jež vedly k tomuto výsledku, publikuje Science, jeden z nejprestižnějších vědeckých časopisů.

DeepStack vytvořil další historický milník, kdy lidé v populárních hrách podlehli počítačům. Po backgammonu, dámě, šachu a go je tedy dalším v pořadí no-limit poker. Oproti předchozím hrám je tu však jeden zásadní rozdíl. „Poker byl dlouholetou výzvou pro umělou inteligenci,“ říká Michael Bowling, profesor z Albertské univerzity, který výzkumný tým vedl. „Je to typická hra s neúplnou informací, ve které hráči během hry nemají stejnou informaci a pohled na hru.“

  • Čeští vědci měli s tímto výzkumem trošku smůlu. Byli sice první, kdo takový program vytvořil, a také ho úspěšně otestovali. Časopis Science má však velmi přísná redakční pravidla: než článek vyjde, uplyne často i půl roku nebo i delší doba. Než tedy informace o jejich objevu mohla být zveřejněna, povedlo se porazit lidské hráče i programu Libratus vyrobenému experty z Carnegie Mellon University. Češi byli první, ale americký úspěch měl větší publicitu – přestože česká práce byla zveřejněna ve slavném časopise Science. Zatímco Libratus musí běžet na obřím superpočítači, české umělé inteligenci stačí jen výkon běžného stolního počítače. 

Fakt, že hráč nevidí karty oponenta a oponent nevidí jeho karty, dělá problém výrazně složitějším z teoretického hlediska. Na druhou stranu je však tato neurčitost informace v reálném světě běžná. Matematické modely her umožňují popsat situace z ekonomie, aukcí, síťové bezpečnosti, ochrany důležitých cílů nebo kontroly jízdného. „V těchto reálných situacích se jednotlivé strany jen velmi zřídka rozhodují na základě úplných a totožných informací. Proto je pokrok v řešení her s neúplnou informací zásadní pro praktické aplikace,“ vysvětluje Michael Bowling.

Náhodou k úspěchu

  • Texas hold 'em je varianta pokeru. Stala se nejhranější karetní hrou nejen v evropských a amerických kasinech, ale také v hernách na internetu. Hráči se obvykle během hry snaží odhadnout své šance na výhru s ohledem na své karty, dosud vyložené karty a sázky soupeřů. Protože ve většině her nedojde k ukazování karet, je významné odhadnout jednak své šance na výhru při případném ukazování, ale také šanci, že ostatní soupeři položí karty po sázce hráče. (wiki)

První dva autoři DeepStacku, Martin Schmid a Matej Moravčík z Katedry aplikované matematiky Matematicko-fyzikální fakulty UK, popisují začátky projektu: „Jak už to tak v pokeru bývá, velkou roli sehrála náhoda. Při přátelském rozhovoru s profesorem Bowlingem na konferenci v Montrealu slovo dalo slovo a na stole bylo pozvání odjet na rok do Kanady a stát se členy Mikova týmu s odvážným cílem, který se nakonec více než povedl.“ Náročnost projektu podtrhuje také fakt, že desetičlenný tým pracoval na projektu téměř rok. „Celý Mikův tým je plný skvělých a šikovných lidí, těšíme se na další projekty v rámci tohoto týmu,“ shrnuli Martin a Matej.

Další z českých vědců, Viliam Lisý z Centra umělé inteligence na katedře počítačů Fakulty elektrotechnické ČVUT, v té době na Albertské univerzitě již působil v rámci své post-doktorské stáže: „Albertská univerzita má jednu z nejvlivnějších výzkumných skupin v oblasti výpočetní teorie her. Když mi Michael Bowling po doktorátu v této oblasti nabídl možnost absolvovat u něj post-doktorskou stáž, rozhodování bylo jednoduché.“

Jednoduchý, elegantní, chytrý

„Algoritmus DeepStacku je přelomový, protože se nám podařilo přenést myšlenky, které byly klíčové v hrách s úplnou informací, do světa her s neúplnou informací. Doposud nebylo jasné, zda je podobný přístup vůbec možný,“ říká Schmid. DeepStack umožňuje vypočítat vhodnou strategii pro situaci v pokeru až v momentě, kdy situace nastane, tedy bez nutnosti uvažovat o úplně celé hře předem naráz, což byl doteď převládající přístup.

Tato zásadní změna principů řešení byla umožněna mimo jiné rozvojem strojového učení pomocí hlubokých neuronových sítí. Tato neuronová síť v případě DeepStacku vyhodnocuje jednotlivé pokerové situace, a jde tedy o jistou formu intuice, kterou algoritmus využívá pro správná rozhodnutí. „Podobně jako v případě člověka, musí i DeepStack svoji intuici trénovat hraním mnoha pokerových partií. Naše síť v průběhu učení viděla miliony pokerových situací,“ dodává Moravčík.

Nahrávám video
Horizont: Umělá inteligence jako zkáza lidstva?
Zdroj: ČT24

„Schopnost uvažovat o jednotlivých pokerových situacích až v momentě, kdy nastanou, je klíčová pro složité hry, jako je no-limit Texas Hold'em, ve kterých může nastat mnohem víc různých situací, než je počet atomů ve vesmíru,“ vysvětluje Lisý. I takto složitou hru hraje DeepStack rychleji než lidi. V průměru potřebuje jen tři sekundy „myšlení“ na každé rozhodnutí a funguje i na běžném laptopu s výkonnější grafickou kartou od Nvidie, kterou používá pro své výpočty.

DeepStack hrál proti skupině profesionálních hráčů pokeru v prosinci 2016. Třicet tři hráčů vybraných Mezinárodní federací pokeru pocházelo ze sedmnácti států. Každý hráč měl možnost hrát 3000 her během čtyř týdnů. DeepStack tyto hráče v průměru porazil s obrovskou převahou. Každého z jedenácti hráčů, kteří dohráli všech 3000 her, porazil i individuálně a pouze v jednom případě výhra nebyla statisticky signifikantní. DeepStack je tedy první počítačový program, který porazil profesionální hráče v dvouhráčovém no-limit Texas hold'em pokeru.

Výběr redakce

Aktuálně z rubriky Věda

Čeští vědci jako první popsali na Marsu masivní výboj připomínající blesk

Čeští vědci ukázali, že v atmosféře Marsu dochází k elektrickým výbojům podobným bleskům. Čtyřčlennému výzkumnému týmu z Matematicko-fyzikální fakulty Univerzity Karlovy a Ústavu fyziky atmosféry Akademie věd ČR se to povedlo zjistit na základě měření americké sondy Maven.
před 2 hhodinami

Mise Artemis III na Měsíci nepřistane, oznámil šéf NASA

Na páteční tiskové konferenci oznámil ředitel americké vesmírné agentury NASA Jared Isaacman, že se odkládá pokus o přistání lidské posádky na Měsíci. Původně ji měla mít za úkol mise Artemis III, podle Isaacmana to ale má teď provést až Artemis IV.
před 6 hhodinami

Anthropic odmítl ultimátum Pentagonu

Společnost Anthropic odmítla požadavky Pentagonu, který chtěl využívat její technologii umělé inteligence (AI) bez omezení pro běžné uživatele. Americké ministerstvo obrany přitom sdělilo, že pokud firma nepřistoupí na jeho žádost, tak bude považována za „riziko pro dodavatelský řetězec“ a riskuje ztrátu státní zakázky v hodnotě 200 milionů dolarů (4,1 miliardy korun). Společnost dostala čas na rozhodnutí do pátku 17:01 amerického času (23:01 středoevropského času).
12:38Aktualizovánopřed 6 hhodinami

Poznamenat to může i výstražné služby, říká k hrozbě propouštění v ČHMÚ ředitel Rieder

Český hydrometeorologický ústav (ČHMÚ) má v rámci plánovaných vládních úspor podle informací Českého rozhlasu propustit 37 zaměstnanců. V rozhovoru pro Českou televizi varoval jeho ředitel Mark Rieder před následky, které by se projevily i v tak důležitých oblastech, jako jsou výstrahy na jevy, které způsobují stomiliardové škody.
před 8 hhodinami

Rudý příliv zabíjí v Jižní Africe korýše

Přemnožené mikroskopické mořské řasy zaplavily oceán u západního pobřeží Jihoafrické republiky. Jev známý jako rudý příliv způsobuje hromadný úhyn korýšů a dalších mořských živočichů, informovala agentura AP.
před 10 hhodinami

Snímek rypouších mláďat vyhrál soutěž podvodních fotografií

Porota britské fotografické soutěže Underwater Photographer of the Year, která se koná od roku 1965, vyhlásila letošní vítěze. Je specializovaná na hledání nejlepších snímků, které vznikly pod vodní hladinou. Celkovým vítězem se stal snímek dvojice rypouších mláďat od Mattyho Smithe.
před 12 hhodinami

Ptačí chřipka zabíjí stovky čápů ve Španělsku. Teď začíná jejich migrace do Česka

Ptačí chřipka trápí nejen velkochovy drůbeže a zvířata v zoologických zahradách, ale zejména divoce žijící ptáky. Španělští ornitologové v minulých týdnech zaznamenali obrovské úhyny u čápů – a to právě v době, kdy nastává pravidelná migrace tohoto druhu do střední Evropy, včetně České republiky.
před 15 hhodinami

Obětí komunistických procesů se stal i americký novinář. Byl cennou trofejí

Píka, Horáková, Slánský – oběti vykonstruovaných politických procesů z 50. let. Češi, politici, odbojáři. Před zmanipulovaný soud se tehdy v Praze dostal ale i americký občan – novinář William Nathan Oatis. Snažil se zjistit pravdu o nepohodlných politicích i duchovních, kteří začali záhadně „mizet“ a objevovali se pak právě ve vykonstruovaných procesech. Soud s Oatisem a jeho spolupracovníky se v pátek rozhodli rekonstruovat studenti v rámci festivalu Mene Tekel.
před 16 hhodinami
Načítání...