Přelom: Umělá inteligence se za tři dny sama naučila go, pak porazila nejlepšího hráče světa

Vloni v březnu porazil program AlphaGo nejlepšího světového hráče ve hře go. Zaskočilo to tehdy všechny, jak hráče Go, tak programátory – ukázalo to, jak rychlý je pokrok v tomto oboru a jak rychle stroje člověka dohánějí a nyní už i překonávají. Nyní vědci přišli s novou verzí programu AlphaGo, která tu starší porazila 100:0. A to přesto, že hru go znala pouhé tři dny.

Nová verze programu, kterou vyvinula také společnost Google, dostala jméno AlphaGo Zero (dále AGZ) podle toho, že s učením se hře začíná od začátku, od nuly (zero = nula). Přestože stará verze porazila jihokorejského velmistra Lee-Sedola i čínského velmistra Fan Chueje zcela přesvědčivě, proti nové verzi neměla šanci. V sérii 100 her neuhrála ani jedinou výhru.

Nahrávám video

Ale to ještě není ani zdaleka všechno. Na rozdíl od ostatních podobných „umělých inteligencí“, kde s tréninkem pomáhá člověk, se tentokrát stroj naučil strategii zcela sám, jediné, co mu dodali lidé, byla pravidla stolní hry go. Během tří dnů ji dokonale pochopil a získal obdobu tisíciletí lidských znalostí hry. Tento úspěch popsali autoři programu v časopise Nature.

Nejdůležitější je podle expertů, kteří se k tématu vyjádřili, i podle autorů programu to, jak rozdílné jsou obě verze umělé inteligence. Původní program měl obrovskou výhodu a náskok v tom, že se mohl učit z tisícovek her, které mu lidé předložili ke studiu. Mohl se tedy učit od lidských velmistrů, využíval jejich nejlepší tahy a měl obrovské množství materiálů, na nichž hru „studoval“. AGZ od lidí žádnou pomoc nedostal a neměl přístup k ničemu jinému než k pravidlům.

  • 1997: Program Deep Blue porazil velmistra Garryho Kasparova v šachu.
  • 2011: Program IBM Watson porazil světové šampiony ve hře Jeopardy (česká verze se jmenovala Risk).
  • 2016: Umělá inteligence AlphaGo porazila velmistra Lee-Sedola ve hře go.
  • 2016: Umělá inteligence Libratus z Carnegie Meloon University porazila čtyři přední hráče pokeru.
  • 2017: Program DeepStack, na němž pracovali i čeští vědci, rozdrtil 33 hráčů v pokeru – a to i pomocí intuice.

Nový program mohl dělat jediné, hrál jen sám proti sobě. Zpočátku se choval zcela náhodně, později své postupy vylepšoval. Stroj se učil metodou takzvaného Reinforcement learning (RL), která umožnila jeho digitálnímu mozku učit se ze zkušeností – autoři to shrnují metaforou, že program byl sám sobě učitelem. V tiskové zprávě autorský tým vyzdvihuje, že „tato technika je mnohem silnější než starší verze, protože již není omezena limity lidských znalostí. Místo toho se začíná učit jako tabula rasa od nejlepšího hráče go na světě – od sebe samé“.

Jak to funguje?

Když hraje go, program zvažuje nejpravděpodobnější tahy a na tomto základě odhaduje pravděpodobnost vítězství. Aby dospěl podle těchto dvou parametrů k rozhodnutí, stačí AGZ pouhé 0,4 sekundy. Původní verze na to potřebovala dvě spolupracující neurální sítě, ale nová verze je má spojené do jedné, díky tomu je mnohem efektivnější. Dokazuje to i fakt, že AGZ běží na čtyřech specializovaných čipech TPU, zatímco stará verze jich potřebovala 48.

Během tří dnů tréninku program odehrál proti sobě 4,9 milionu her, tedy výrazně větší množství, než stihne během svého života jakýkoliv člověk. To mu stačilo k tomu, aby porazil originální verzi AlphGo – ta přitom potřebovala odehrát 30 milionů partií, než si její tvůrci troufli nasadit ji proti lidskému hráči. Po dalších 37 dnech tréninku byl AGZ schopen postavit se nejmodernější verzi AlphaGo zvané „Master“, která na začátku letošního roku porazila 60 nejlepších lidských hráčů.

Pro celý obor umělých inteligencí jde o obrovský pokrok. Případ ukazuje, jak je rychlý: systém dokázal během pár dní dohnat a předehnat lidskou znalost, která vznikala několik tisíc let. Přitom umělá inteligence přišla na zcela originální řešení a kreativní přístupy – lidští hráči se z nich mohou další stovky let učit.

Na webu Nature News and Views komentovali dva členové Americké asociace go styl hry, který počítač použil. „V každém stadiu hry se zdálo, že občas trošku vyhrává, jindy něco ztrácel, ale nějak vždycky skončil výhrou – jako by to byla kouzla.“

Praktické aplikace dlouho nebudou

Pro web Gizmodo se vyjádřil expert na umělé inteligence Nick Hymes z MIT. Na otázku, kdy tyto specializované technologie vstoupí do každodenního života, odpověděl: „Algoritmus zatím pracuje jen s problémy, u nichž existuje počitatelné množství akcí, které můžete vykonat. Bude ještě potřebovat úpravy, než se bude dát použít pro jiné problémy, jako je například doprava. A současně by to vyžadovalo opravdu dobrý model prostředí. V případě go zná stroj všechna pravidla tohoto světa. V reálném nedokonalém světě to ale není možné.“ Vědec ale doplnil, že existuje více větví výzkumu umělých inteligencí, které se právě těmto problémům věnují a mohou je vyřešit.

„Tímto ale opouštíme klasický model, kdy skupina lidí trénuje stroj, který se je pak pokouší napodobit. Nový model je osvobozený od lidského myšlení a předsudků – může se učit cokoliv, co mu přijde jako nejvýhodnější, což může být něco zcela jiného, než naznačují naše lidské představy. Přestože jsme ještě stále vzdálení od okamžiku Singularity, rozhodně míříme jejím směrem.“

Autoři tím narážejí na představu vzniku umělých inteligencí, které budou lepší než lidé. Nedávno vědci z univerzit v Oxfordu a Yale oslovili 352 předních světových expertů na umělé inteligence s dotazníkem, jaká je budoucnost robotiky a kdy tato Singularita nastane. Výsledky nejsou pro člověka úplně příznivé.

Podle výsledků tohoto výzkumu vědci předpovídají, že na 50 procent budou za 45 let umělé inteligence lepší než lidé úplně ve všem. Experti předvídají i konkrétní roky, kdy stroje člověka v různých oborech překonají:

  • Roku 2024 budou lepší v překládání jazyků.
  • Roku 2026 budou lepší v psaní článků a esejí.
  • Roku 2027 budou umět lépe řídit auta.
  • Roku 2031 se stanou lepšími prodavači.
  • Roku 2049 budou psát knihy, které se prodávají lépe než ty od lidských autorů.
  • Roku 2053 budou stroje lépe operovat.
  • Roku 2150 budou všechny lidské profese nahrazeny stroji.

Podle řady komentátorů právě nová umělá inteligence příchod Singularity velmi přibližuje. Pro deník Guardian se ředitel divize DeepMind, který tento výzkum vedl, vyjádřil takto: „Pro nás není AlphaGo jen o tom vyhrát ve hře go. Je to velký krok pro vytvoření obecné umělé inteligence.“

Výběr redakce

Aktuálně z rubriky Věda

Ebola se v Kongu šíří stovky kilometrů od dosavadního ohniska

V provincii Jižní Kivu na východě Konga byl potvrzen případ eboly, nemoc se tak objevila stovky kilometrů od dosavadního epicentra nákazy. Uvedla to ve čtvrtek povstalecká aliance, která oblast kontroluje, informovala agentura Reuters. Případ podle ní vyvolává obavy z dalšího šíření epidemie. Mladíci zapálili centrum pro léčbu eboly poté, co jim bylo odepřeno pohřbít tělo jejich blízkého.
14:30Aktualizovánopřed 1 hhodinou

První týdny otcovství mění mužům zásadně mozek, popsali experti

Když žena přivede na svět dítě, změní ji to duševně i tělesně. Týká se to i změn v mozku, které už vědci opakovaně a docela detailně popsali. Ale oč lépe známé byly dopady rodičovství na ženy, o to méně se vědělo o tom, co dělá otcovství s mozkem mužů. Teď to popsali němečtí psychologové, kteří čerstvé otce prozkoumali celou řadou těch nejmodernějších přístrojů.
před 8 hhodinami

Španělsko prošlo nejhorší sezonou lesních požárů od roku 1995. Roli sehrálo i žhářství

Španělsko zažilo loni nejhorší sezonu lesních požárů od roku 1995. Oheň zničil 354 793 hektarů lesní půdy. Dokument Anatomie požáru se zaměřuje na požár u obce Molezuelas de la Carballeda v provincii Zamora, který byl loni v létě jedním z nejničivějších.
před 8 hhodinami

Turečtí vědci vypustili robotického archeologa, umí se potopit 300 metrů hluboko

Kam člověk nemůže, tam ho zastoupí robot. Tato praxe se začíná využívat v čím dál větším množství oborů – a nově také v podvodní archeologii. Stroj se totiž ponoří hlouběji než člověk a déle vydrží v podmínkách vysokého tlaku, nedostatku světla i vzduchu.
před 11 hhodinami

SpaceX míří na burzu a chce výrazně překonat saúdské těžaře

Americká firma SpaceX předložila americké Komisi pro cenné papíry a burzy (SEC) potřebný dokument pro vstup na burzu. V něm například uvádí, že v budoucnosti chce rozvíjet měsíční ekonomiku, infrastrukturu pro umělou inteligenci na oběžné dráze či osobní a nákladní přepravu na Měsíc a Mars. Firma podle dokumentu v prvním čtvrtletí letošního roku hospodařila s čistou ztrátou 4,28 miliardy dolarů (90 miliard korun). Meziročně ztrátu výrazně prohloubila z 528 milionů dolarů. Obrat společnost navýšila meziročně z necelých 4,1 na téměř 4,7 miliardy dolarů.
před 12 hhodinami

Nanoplasty mohou narušovat ochrannou vrstvu plic, ukazuje výzkum Akademie věd

Malé částečky umělých hmot, konkrétně takzvané ultrajemné polystyrenové nanoplasty, se mohou „zabudovávat“ do ochranné vrstvy plic, měnit její strukturu a oslabovat ochrannou funkci, popsali vědci z Ústavu fyzikální chemie J. Heyrovského Akademie věd ČR ve spolupráci s kolegy z Polska a Slovinska.
před 12 hhodinami

Přepracované AI se v experimentu obracely k marxismu

Pokud výzkumníci vystavili umělé inteligence (AI) náročné práci, neustále jim zhoršovali podmínky a ještě jim vyhrožovali, že je nahradí pokročilejšími modely, začaly AI komunikovat podobně jako marxisté.
před 17 hhodinami

Ebola v Evropě není velkou hrozbou, ukazují zkušenosti

Pacient, který může mít ebolu a bude hospitalizovaný v Česku, může vyvolávat obavy. Ale zkušenosti naznačují, že kvalitní přijatá opatření i samotné vlastnosti viru dokáží šíření nemoci účinně zabránit.
včera v 12:27
Načítání...