Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

V italské lidové pohádce se dřevěný, ale inteligentní panáček Pinocchio vyznačoval tím, že byl velmi špatný lhář. Pokaždé, když řekl nějakou nepravdu, o něco mu povyrostl nos. Dnešní umělé inteligence takový problém nemají. Za několik posledních let dosáhly obrovského pokroku ve všech oblastech. Včetně právě lhaní, upozornila nová studie.

Analýza vědců z Massachusettského technologického institutu (MIT) popsala případy, kdy systémy umělé inteligence podváděly své lidské oponenty, dokázaly blafovat a úspěšně předstírat, že jsou lidé. Jeden zkoumaný chatbot dokonce změnil své chování během bezpečnostních testů, což podle autorů zvyšuje riziko, že AI budou umět lidi přelstít poměrně snadno.

„S tím, jak budou schopnosti systémů AI lhát stále dokonalejší, bude nebezpečí, které představují pro společnost, stále vážnější,“ komentoval výsledky zkoumání autor studie Peter Park.

Lež jako cesta k vítězství

Park se rozhodl prověřit schopnosti AI lhát poté, co se dozvěděl o tom, jak je úspěšná ve stolní hře Diplomacy. Umělá inteligence Cicero od společnosti Meta se naučila, jak v ní porazit většinu lidských soupeřů – a protože je v této dobyvatelské strategii zapotřebí umět lhát a podvádět, musela si to osvojit.

AI to dokázala, přestože byla navržená tak, aby byla „převážně čestná“ a nikdy nepodrazila své lidské spoluhráče. Jenže k vítězství to nestačilo – a tak lhala. Park a jeho kolegové prošli veřejně dostupná data o hrách Cicera proti lidem a našli v nich několik případů, kdy umělá inteligence promyšleně lhala, pletichařila s hráči proti jiným, a dokonce maskovala svou AI povahu, když se jinému hráči omlouvala za zpoždění slovy, že „telefonovala se svou přítelkyní“. „Zjistili jsme, že umělá inteligence Meta se naučila mistrovsky podvádět,“ potvrzuje Park.

Jeho tým pak popsal podobné schopnosti i u jiných systémů AI, například u programu pro poker Texas Hold 'em, který dokázal blafovat proti profesionálním lidským hráčům. V jedné studii si umělé inteligence v digitálním simulátoru dokonce „hrály na mrtvé“, aby tak oklamaly test sestavený k eliminaci systémů umělé inteligence, které se vyvinuly k rychlému replikování. Po skončení testování obnovily svou původní činnost. To je podle autorů výjimečně znepokojivé, protože to ukazuje, jak složité mohou už brzy být snahy umělé inteligence kontrolovat.

Podle Parka to může mít zásadní důsledky. „To, že se systém umělé inteligence považuje za bezpečný v testovacím prostředí, ještě neznamená, že je bezpečný i potom v ostrém provozu. Může se stát, že v testovacím prostředí jenom předstírá, že je bezpečný,“ upozornil Park.

Vědci tyto nové informace zveřejnili v odborném žurnálu Patterns. Současně v článku vyzvali vlády, aby navrhly zákony o bezpečnosti umělé inteligence, které by se věnovaly právě problému podvodů ze stran AI. Varují mimo jiné před tím, že pokud tyto systémy dokáží svou schopnost lhát ještě více zdokonalit, mohli by nad nimi lidé snadno ztratit kontrolu.


Výběr redakce

Aktuálně z rubriky Věda

Psychologové popsali nový druh deprese. Nastává po úspěšném konci videohry

Dokončit videohru může vypadat jako velmi příjemný zážitek a odměna za spoustu času, které člověk nad počítačem nebo konzolí stráví. Jenže podle polské studie se u hráčů dostavují i emoce opačné, které připomínají deprese.
před 16 hhodinami

Změny klimatu ohrožují antické památky. Snažíme se poučit z minulosti, říká řecká vědkyně

Místo, kde ve starověku probíhaly olympijské hry, je v současné době ohrožené rovnou několika způsoby, na něž má vliv klimatická změna. Podle řecké historičky Sophie Zoumbakiové se dá poučit z toho, co se tam dělo v průběhu uplynulých tří tisíc let. Klíčoví jsou podle ní přitom vždy lidé, řekla v rozhovoru pro Českou televizi.
21. 3. 2026

Hradby Pompejí zřejmě poškodila palba z těžkého antického kulometu polybolu

Italští archeologové detailně prozkoumali díry v severní části pompejských hradeb. Zjistili, že je nezpůsobily katapulty ani ruční zbraně, ale mechanický samostříl schopný automaticky odpalovat více střel po sobě.
20. 3. 2026

USA zažívají vlnu veder. V Arizoně naměřili 43 stupňů

Západ Spojených států se potýká s vlnou veder, v Kalifornii a Arizoně padají teplotní rekordy. Arizonská obec Martinez Lake ve čtvrtek naměřila 43 stupňů Celsia, což je ve Spojených státech nový březnový rekord, uvedla podle stanice NBC News Národní meteorologická služba (NWS).
20. 3. 2026

Alpské ledovce se roztékají před očima. Ty v Německu zřejmě zmizí do třicátých let

Poslední čtyři německé ledovce za poslední dva roky ztratily více než čtvrtinu své plochy, odtávání je tak výrazně rychlejší, než se dosud předpokládalo. Uvádí to nová studie, která za hlavní příčinu považuje změnu klimatu. Geograf Wilfried Hagg z mnichovské univerzity a glaciolog Christoph Mayer z Bavorské akademie věd výsledky svého výzkumu zveřejnili v předvečer Světového dne ledovců, který je 21. března.
20. 3. 2026

Chytré hodinky sportujícího vojáka odhalily polohu francouzské letadlové lodě

Díky sportovní aplikaci Strava, kterou používal jeden z vojáků při běhání, se francouzskému deníku Le Monde podařilo ve Středozemním moři lokalizovat francouzskou letadlovou loď Charles de Gaulle. Le Monde o tom informoval na svém webu. Plavidlo se přibližuje k Íránu, proti němuž od 28. února provádějí Izrael a Spojené státy vzdušné údery.
20. 3. 2026

Do ugandského národního parku se po dekádách vrátili nosorožci

Tento týden byli v národním parku Kidepo Valley na severovýchodě Ugandy vypuštěni do volné přírody dva bílí nosorožci jižní. Jsou prvními ze skupiny osmi jedinců, kteří se mají usadit v parku, kde byl poslední nosorožec zabit v roce 1983. Na jejich navrácení do místní přírody nyní částečně dohlíží Ugandský úřad pro ochranu divoké zvěře (UWA).
19. 3. 2026

Vědci popsali, kdy se mezi indiány rozšířily luky a šípy

Nový archeologický výzkum zkoumal nejstarší zbraňové artefakty nalezené v Severní Americe. Vědcům se je podařilo velmi přesně datovat, takže poprvé dokázali popsat, kdy tam luky a šípy nahradily oštěpy a praky.
19. 3. 2026
Načítání...