Česká umělá inteligence má dokonce intuici. Porazila špičkové světové hráče v pokeru

Vědci z Univerzity Karlovy, Českého vysokého učení technického v Praze a Albertské univerzity v Kanadě dosáhli zásadního úspěchu na poli umělé inteligence. Mezinárodní tým vyvinul počítačový program DeepStack, který v prosinci 2016 poprvé v historii porazil profesionální hráče v jedné z nejpopulárnějších karetních her na světě – dvouhráčovém no-limit Texas hold'em pokeru. Vědecké objevy, jež vedly k tomuto výsledku, publikuje Science, jeden z nejprestižnějších vědeckých časopisů.

DeepStack vytvořil další historický milník, kdy lidé v populárních hrách podlehli počítačům. Po backgammonu, dámě, šachu a go je tedy dalším v pořadí no-limit poker. Oproti předchozím hrám je tu však jeden zásadní rozdíl. „Poker byl dlouholetou výzvou pro umělou inteligenci,“ říká Michael Bowling, profesor z Albertské univerzity, který výzkumný tým vedl. „Je to typická hra s neúplnou informací, ve které hráči během hry nemají stejnou informaci a pohled na hru.“

  • Čeští vědci měli s tímto výzkumem trošku smůlu. Byli sice první, kdo takový program vytvořil, a také ho úspěšně otestovali. Časopis Science má však velmi přísná redakční pravidla: než článek vyjde, uplyne často i půl roku nebo i delší doba. Než tedy informace o jejich objevu mohla být zveřejněna, povedlo se porazit lidské hráče i programu Libratus vyrobenému experty z Carnegie Mellon University. Češi byli první, ale americký úspěch měl větší publicitu – přestože česká práce byla zveřejněna ve slavném časopise Science. Zatímco Libratus musí běžet na obřím superpočítači, české umělé inteligenci stačí jen výkon běžného stolního počítače. 

Fakt, že hráč nevidí karty oponenta a oponent nevidí jeho karty, dělá problém výrazně složitějším z teoretického hlediska. Na druhou stranu je však tato neurčitost informace v reálném světě běžná. Matematické modely her umožňují popsat situace z ekonomie, aukcí, síťové bezpečnosti, ochrany důležitých cílů nebo kontroly jízdného. „V těchto reálných situacích se jednotlivé strany jen velmi zřídka rozhodují na základě úplných a totožných informací. Proto je pokrok v řešení her s neúplnou informací zásadní pro praktické aplikace,“ vysvětluje Michael Bowling.

Náhodou k úspěchu

  • Texas hold 'em je varianta pokeru. Stala se nejhranější karetní hrou nejen v evropských a amerických kasinech, ale také v hernách na internetu. Hráči se obvykle během hry snaží odhadnout své šance na výhru s ohledem na své karty, dosud vyložené karty a sázky soupeřů. Protože ve většině her nedojde k ukazování karet, je významné odhadnout jednak své šance na výhru při případném ukazování, ale také šanci, že ostatní soupeři položí karty po sázce hráče. (wiki)

První dva autoři DeepStacku, Martin Schmid a Matej Moravčík z Katedry aplikované matematiky Matematicko-fyzikální fakulty UK, popisují začátky projektu: „Jak už to tak v pokeru bývá, velkou roli sehrála náhoda. Při přátelském rozhovoru s profesorem Bowlingem na konferenci v Montrealu slovo dalo slovo a na stole bylo pozvání odjet na rok do Kanady a stát se členy Mikova týmu s odvážným cílem, který se nakonec více než povedl.“ Náročnost projektu podtrhuje také fakt, že desetičlenný tým pracoval na projektu téměř rok. „Celý Mikův tým je plný skvělých a šikovných lidí, těšíme se na další projekty v rámci tohoto týmu,“ shrnuli Martin a Matej.

Další z českých vědců, Viliam Lisý z Centra umělé inteligence na katedře počítačů Fakulty elektrotechnické ČVUT, v té době na Albertské univerzitě již působil v rámci své post-doktorské stáže: „Albertská univerzita má jednu z nejvlivnějších výzkumných skupin v oblasti výpočetní teorie her. Když mi Michael Bowling po doktorátu v této oblasti nabídl možnost absolvovat u něj post-doktorskou stáž, rozhodování bylo jednoduché.“

Jednoduchý, elegantní, chytrý

„Algoritmus DeepStacku je přelomový, protože se nám podařilo přenést myšlenky, které byly klíčové v hrách s úplnou informací, do světa her s neúplnou informací. Doposud nebylo jasné, zda je podobný přístup vůbec možný,“ říká Schmid. DeepStack umožňuje vypočítat vhodnou strategii pro situaci v pokeru až v momentě, kdy situace nastane, tedy bez nutnosti uvažovat o úplně celé hře předem naráz, což byl doteď převládající přístup.

Tato zásadní změna principů řešení byla umožněna mimo jiné rozvojem strojového učení pomocí hlubokých neuronových sítí. Tato neuronová síť v případě DeepStacku vyhodnocuje jednotlivé pokerové situace, a jde tedy o jistou formu intuice, kterou algoritmus využívá pro správná rozhodnutí. „Podobně jako v případě člověka, musí i DeepStack svoji intuici trénovat hraním mnoha pokerových partií. Naše síť v průběhu učení viděla miliony pokerových situací,“ dodává Moravčík.

Nahrávám video

„Schopnost uvažovat o jednotlivých pokerových situacích až v momentě, kdy nastanou, je klíčová pro složité hry, jako je no-limit Texas Hold'em, ve kterých může nastat mnohem víc různých situací, než je počet atomů ve vesmíru,“ vysvětluje Lisý. I takto složitou hru hraje DeepStack rychleji než lidi. V průměru potřebuje jen tři sekundy „myšlení“ na každé rozhodnutí a funguje i na běžném laptopu s výkonnější grafickou kartou od Nvidie, kterou používá pro své výpočty.

DeepStack hrál proti skupině profesionálních hráčů pokeru v prosinci 2016. Třicet tři hráčů vybraných Mezinárodní federací pokeru pocházelo ze sedmnácti států. Každý hráč měl možnost hrát 3000 her během čtyř týdnů. DeepStack tyto hráče v průměru porazil s obrovskou převahou. Každého z jedenácti hráčů, kteří dohráli všech 3000 her, porazil i individuálně a pouze v jednom případě výhra nebyla statisticky signifikantní. DeepStack je tedy první počítačový program, který porazil profesionální hráče v dvouhráčovém no-limit Texas hold'em pokeru.

Výběr redakce

Aktuálně z rubriky Věda

Ebola v Evropě není velkou hrozbou, ukazují zkušenosti

Pacient, který může mít ebolu a bude hospitalizovaný v Česku, může vyvolávat obavy. Ale zkušenosti naznačují, že kvalitní přijatá opatření i samotné vlastnosti viru dokáží šíření nemoci účinně zabránit.
před 39 mminutami

Příznaky Alzheimera odhalí rychlý test. Zkuste si ho

První příznaky demence může odhalit nový test kognitivních funkcí, jako je paměť nebo porozumění. Ve věku 65 až 80 let je teď součástí preventivní prohlídky u praktického lékaře, dostupný je i na internetu. Trvá jen několik minut, informovala Společnost všeobecného lékařství České lékařské společnosti Jana Evangelisty Purkyně (ČLS JEP).
před 2 hhodinami

WHO zkoumá možnosti vakcín a léčby proti epidemii eboly v Kongu

Světová zdravotnická organizace (WHO) zkoumá, zda by některé kandidátské vakcíny, tedy očkovací látky ve fázi výzkumu, nebo léčebné postupy, mohly být použity k potlačení epidemie eboly v Kongu (Demokratické republice Kongo). Informovala o tom v úterý agentura AFP. Organizace již dříve vyhlásila nárůst počtu případů vysoce nakažlivé hemoragické horečky za mezinárodní zdravotní stav nouze.
včeraAktualizovánopřed 18 hhodinami

Kde leží hranice medicíny? Odpovědi hledal nový pořad Daniela Stacha Na dosah

Česká televize spouští nový diskusní pořad Na dosah. Bude se snažit přiblížit zásadní společenská témata, která mají potenciál rozdělovat společnost tak, aby odborníci i obyčejní lidé mohli hledali shodu. První díl se v úterý 19. května od 20:07 na ČT24 věnuje medicíně, která občas může vypadat jako všemocná – ale zatím taková rozhodně není.
před 23 hhodinami

Svět je dle expertů k pandemiím náchylnější než před covidem

Ani po epidemii eboly v západní Africe před necelými deseti lety, pandemii covidu-19 a nouzové situaci kolem infekčního onemocnění mpox (dříve opičí neštovice) není svět bezpečnějším místem před propuknutím nových pandemií. Uvedlo to mezinárodní expertní grémium na úvod výročního zasedání Světového zdravotnického shromáždění, které je orgánem Světové zdravotnické organizace (WHO). Šéf WHO Tedros Adhanom Ghebreyesus prohlásil, že svět nyní zažívá nebezpečné časy.
včera v 13:00

Po týdnu tréninku se lidský mozek naučí přijmout nemožné. Včetně létání

Člověk neumí vlastní silou létat. Nikdy to neuměl, a pokud se genetika nestane opravdu neskutečně pokročilou, nebude to umět nikdy. Lidský mozek je na tento fakt naprogramovaný miliony let evoluce našeho druhu. A přesto – náš mozek je tak neuvěřitelně přizpůsobivý a současně učenlivý, že se dá přesvědčit k tomu, že jeho nositel létat umí. A dokonce pak podle toho mění své další funkce. Prokázal to pozoruhodný experiment čínských vědců.
včera v 10:19

Historička: „Bílí“ migranti z Ruska nakopli československou vědu i techniku

Když do Československa přišli po první světové válce ruští emigranti, nabídla jim nově vzniklá republika vzdělání, pomoc i zázemí. A oni se jí za to odvděčili špičkovými výkony v technických oborech, popisuje v rozhovoru pro ČT24 historička Dana Hašková.
včera v 08:20

Klíšťata ve městech jsou infikovanější než v lesích, upozorňují vědci

Klíšťata ve městech jsou prokazatelně až dvakrát infikovanější než ta ze 150 lesních lokalit po celém Česku, kde pracovníci Státního zdravotního ústavu sbírají a testují vzorky. Vědci je hledají pozemním sběrem, informace získávají i přímo od lidí prostřednictvím aplikace Klíšťapka nebo webu Klíšťata ve městě. Za tři roky nasbírali více než dvanáct tisíc klíšťat. Některou z bakterií bylo infikováno 44 procent z nich, čtvrtina pak boreliózou.
včera v 06:30
Načítání...