Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

V italské lidové pohádce se dřevěný, ale inteligentní panáček Pinocchio vyznačoval tím, že byl velmi špatný lhář. Pokaždé, když řekl nějakou nepravdu, o něco mu povyrostl nos. Dnešní umělé inteligence takový problém nemají. Za několik posledních let dosáhly obrovského pokroku ve všech oblastech. Včetně právě lhaní, upozornila nová studie.

Analýza vědců z Massachusettského technologického institutu (MIT) popsala případy, kdy systémy umělé inteligence podváděly své lidské oponenty, dokázaly blafovat a úspěšně předstírat, že jsou lidé. Jeden zkoumaný chatbot dokonce změnil své chování během bezpečnostních testů, což podle autorů zvyšuje riziko, že AI budou umět lidi přelstít poměrně snadno.

„S tím, jak budou schopnosti systémů AI lhát stále dokonalejší, bude nebezpečí, které představují pro společnost, stále vážnější,“ komentoval výsledky zkoumání autor studie Peter Park.

Lež jako cesta k vítězství

Park se rozhodl prověřit schopnosti AI lhát poté, co se dozvěděl o tom, jak je úspěšná ve stolní hře Diplomacy. Umělá inteligence Cicero od společnosti Meta se naučila, jak v ní porazit většinu lidských soupeřů – a protože je v této dobyvatelské strategii zapotřebí umět lhát a podvádět, musela si to osvojit.

AI to dokázala, přestože byla navržená tak, aby byla „převážně čestná“ a nikdy nepodrazila své lidské spoluhráče. Jenže k vítězství to nestačilo – a tak lhala. Park a jeho kolegové prošli veřejně dostupná data o hrách Cicera proti lidem a našli v nich několik případů, kdy umělá inteligence promyšleně lhala, pletichařila s hráči proti jiným, a dokonce maskovala svou AI povahu, když se jinému hráči omlouvala za zpoždění slovy, že „telefonovala se svou přítelkyní“. „Zjistili jsme, že umělá inteligence Meta se naučila mistrovsky podvádět,“ potvrzuje Park.

Jeho tým pak popsal podobné schopnosti i u jiných systémů AI, například u programu pro poker Texas Hold 'em, který dokázal blafovat proti profesionálním lidským hráčům. V jedné studii si umělé inteligence v digitálním simulátoru dokonce „hrály na mrtvé“, aby tak oklamaly test sestavený k eliminaci systémů umělé inteligence, které se vyvinuly k rychlému replikování. Po skončení testování obnovily svou původní činnost. To je podle autorů výjimečně znepokojivé, protože to ukazuje, jak složité mohou už brzy být snahy umělé inteligence kontrolovat.

Podle Parka to může mít zásadní důsledky. „To, že se systém umělé inteligence považuje za bezpečný v testovacím prostředí, ještě neznamená, že je bezpečný i potom v ostrém provozu. Může se stát, že v testovacím prostředí jenom předstírá, že je bezpečný,“ upozornil Park.

Vědci tyto nové informace zveřejnili v odborném žurnálu Patterns. Současně v článku vyzvali vlády, aby navrhly zákony o bezpečnosti umělé inteligence, které by se věnovaly právě problému podvodů ze stran AI. Varují mimo jiné před tím, že pokud tyto systémy dokáží svou schopnost lhát ještě více zdokonalit, mohli by nad nimi lidé snadno ztratit kontrolu.


Výběr redakce

Aktuálně z rubriky Věda

Deset let po Pařížské dohodě se vědci obávají, že je mrtvá

Pařížská úmluva OSN o změně klimatu byla uzavřena přesně před deseti lety, 12. prosince 2015, vstoupila ale v platnost až skoro o rok později – v listopadu 2016. Podle dokumentu, který nahradil Kjótský protokol, se má oteplování udržet pod dvěma stupni Celsia, nejlépe do 1,5 stupně ve srovnání s předindustriálním obdobím. Průměrné teploty i emise skleníkových plynů se ale stále zvyšují.
před 10 hhodinami

AI umí znepokojivě účinně ovlivňovat voliče, ukazují dvě studie

Nové výzkumy ukazují, že chatboty mohou velmi silně ovlivňovat rozhodování voličů. Výsledky, které vydaly odborné časopisy Nature a Science, podle autorů vyvolávají zásadní otázky ohledně role umělé inteligence v budoucích volbách.
před 12 hhodinami

Publikace Martina Rychlíka provede Dějinami skalpování

Vyšly Dějiny skalpování. Držitel Litery za publicistiku Martin Rychlík se v rozsáhlé publikaci věnuje zvyku zbavovat nepřítele vlasů s částí kůže napříč historií lidstva. Nabourává přitom i zažité představy.
před 13 hhodinami

Věčné chemikálie ve vodě škodí dětskému zdraví i peněženkám

Negativní dopady na zdraví, které způsobují takzvané věčné chemikálie v pitné vodě, stojí Spojené státy v současné době už nejméně osm miliard dolarů (160 miliard korun) ročně v sociálních nákladech. Popsali to vědci z Arizonské univerzity.
před 16 hhodinami

Osamělost zvyšuje riziko srdečních onemocnění

Nedostatek sociálních vazeb a osamělost mají vliv na riziko srdečního onemocnění. Lidé s omezenými sociálními kontakty čelí podle dlouhodobých studií o zhruba třicet procent vyššímu riziku úmrtí na srdeční a cévní onemocnění, upozornili zástupci České kardiologické společnosti.
před 17 hhodinami

Mezi bobrem a surikatou. Člověk patří mezi nejmonogamnější savce, ukázal výzkum

Studie vědců z Cambridge se pokusila sestavit žebříček nejvíce monogamních druhů savců. Podle starších odhadů patří člověk na hranu mezi monogamními a polygamními druhy, nový detailnější výzkum ho nicméně řadí pod vrchol pomyslné „hitparády“ monogamie.
před 20 hhodinami

Alkohol poškozuje DNA a působí rakovinu, buňky se mu brání, ukazuje český výzkum

Alkohol poškozuje lidskou DNA a způsobuje rakovinu, zjistila studie vědců z Ústavu organické chemie a biochemie Akademie věd ČR (ÚOCHB). Buňky se dle výzkumu poškození brání a DNA opravují, u některých lidí ale méně účinně. Článek o studii zveřejnil časopis Communications Biology ze skupiny Nature, uvedl ÚOCHB. V míře, která poškozuje zdraví, pije podle výzkumů alkohol 1,5 milionu Čechů.
11. 12. 2025

Lidé si ochočili oheň o 350 tisíc let dříve, než se předpokládalo, hlásí vědci

Objev zažehnutí ohně měl prehistorického člověka vrhnout na dráhu směřující k modernímu lidstvu. Doposud se vědci domnívali, že se toto odehrálo relativně nedávno. Nový objev ale posouvá „zkrocení“ tohoto živlu o statisíce let dál do minulosti.
11. 12. 2025
Načítání...