Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

V italské lidové pohádce se dřevěný, ale inteligentní panáček Pinocchio vyznačoval tím, že byl velmi špatný lhář. Pokaždé, když řekl nějakou nepravdu, o něco mu povyrostl nos. Dnešní umělé inteligence takový problém nemají. Za několik posledních let dosáhly obrovského pokroku ve všech oblastech. Včetně právě lhaní, upozornila nová studie.

Analýza vědců z Massachusettského technologického institutu (MIT) popsala případy, kdy systémy umělé inteligence podváděly své lidské oponenty, dokázaly blafovat a úspěšně předstírat, že jsou lidé. Jeden zkoumaný chatbot dokonce změnil své chování během bezpečnostních testů, což podle autorů zvyšuje riziko, že AI budou umět lidi přelstít poměrně snadno.

„S tím, jak budou schopnosti systémů AI lhát stále dokonalejší, bude nebezpečí, které představují pro společnost, stále vážnější,“ komentoval výsledky zkoumání autor studie Peter Park.

Lež jako cesta k vítězství

Park se rozhodl prověřit schopnosti AI lhát poté, co se dozvěděl o tom, jak je úspěšná ve stolní hře Diplomacy. Umělá inteligence Cicero od společnosti Meta se naučila, jak v ní porazit většinu lidských soupeřů – a protože je v této dobyvatelské strategii zapotřebí umět lhát a podvádět, musela si to osvojit.

AI to dokázala, přestože byla navržená tak, aby byla „převážně čestná“ a nikdy nepodrazila své lidské spoluhráče. Jenže k vítězství to nestačilo – a tak lhala. Park a jeho kolegové prošli veřejně dostupná data o hrách Cicera proti lidem a našli v nich několik případů, kdy umělá inteligence promyšleně lhala, pletichařila s hráči proti jiným, a dokonce maskovala svou AI povahu, když se jinému hráči omlouvala za zpoždění slovy, že „telefonovala se svou přítelkyní“. „Zjistili jsme, že umělá inteligence Meta se naučila mistrovsky podvádět,“ potvrzuje Park.

Jeho tým pak popsal podobné schopnosti i u jiných systémů AI, například u programu pro poker Texas Hold 'em, který dokázal blafovat proti profesionálním lidským hráčům. V jedné studii si umělé inteligence v digitálním simulátoru dokonce „hrály na mrtvé“, aby tak oklamaly test sestavený k eliminaci systémů umělé inteligence, které se vyvinuly k rychlému replikování. Po skončení testování obnovily svou původní činnost. To je podle autorů výjimečně znepokojivé, protože to ukazuje, jak složité mohou už brzy být snahy umělé inteligence kontrolovat.

Podle Parka to může mít zásadní důsledky. „To, že se systém umělé inteligence považuje za bezpečný v testovacím prostředí, ještě neznamená, že je bezpečný i potom v ostrém provozu. Může se stát, že v testovacím prostředí jenom předstírá, že je bezpečný,“ upozornil Park.

Vědci tyto nové informace zveřejnili v odborném žurnálu Patterns. Současně v článku vyzvali vlády, aby navrhly zákony o bezpečnosti umělé inteligence, které by se věnovaly právě problému podvodů ze stran AI. Varují mimo jiné před tím, že pokud tyto systémy dokáží svou schopnost lhát ještě více zdokonalit, mohli by nad nimi lidé snadno ztratit kontrolu.


Výběr redakce

Aktuálně z rubriky Věda

VideoVirtuální výcvik vojáků i robotičtí hlídači. Experti z ČVUT představili novinky

Roboti jako hlídači míst důležitých pro fungování státu nebo virtuální realita jako cvičiště pro vojáky. Špičkové bezpečnostní technologie jsou klíčovou součástí moderní obrany. To nejnovější z tuzemské vědy představili experti z ČVUT. Roboty lze podle vedoucího laboratoře výpočetní robotiky Jana Faigla z ČVUT nasadit všude tam, kam nechceme vysílat lidi. Samotná fyzická schránka není to hlavní – vědci pracují na mozku, tedy softwaru, který stroje pohání. Podle Faigla je důležité, aby se robot dokázal venku pohybovat bez dostupnosti satelitní navigace. To mu může umožnit řada senzorů.
před 14 mminutami

Tohle je první mapa čichu. Vytvořili ji na Harvardu

Lidský čich je nejméně prozkoumaný smysl. Má sice pro poznávání světa nejmenší význam, ale přesto jeho poruchy mohou přinášet řadu zdravotních problémů. Pomoci by mohla první čichová mapa, která propojila nos a mozek.
před 2 hhodinami

Velartovi museli o Černobylu mlčet, doporučovali alespoň sprchu a sušené mléko

Čtrnáct řádků, šedesát šest slov – tolik věnovala československá média oznámení o jaderné katastrofě v Černobylu. Rudé právo vydalo první zmínku o havárii v úterý 29. dubna 1986, až tři dny po incidentu. Už od pondělí se nicméně díky zprávám ze zahraničí mezi lidmi objevovaly informace o uniklé radiaci a nebezpečí. V komplikované situaci byli čeští odborníci – tušili nebezpečí, mluvit o něm ale nesměli.
před 3 hhodinami

Američtí vojáci se už nemusí očkovat proti chřipce. Vojenští lékaři vidí rizika

Každoroční očkování proti chřipce již pro americké vojáky není povinné, uvedl minulý týden americký ministr obrany Pete Hegseth ve videu zveřejněném na sociálních sítích. Tento krok poté kritizovala řada odborníků.
včera v 08:00

Změny klimatu a extrémní počasí zdražují potraviny i pojištění, píše Bloomberg

Extrémní výkyvy počasí v důsledku změn klimatu, například v podobě vln veder a sucha, devastují produkci potravin, poškozují kritickou infrastrukturu a vedou k prudkému nárůstu cen pojistného, uvedla v analýze agentura Bloomberg. Ekonomové a centrální bankéři varují, že cenové šoky nemusejí být jen dočasné, ale že se stávají trvalou hrozbou pro stabilitu trhu.
30. 4. 2026

V Černobylu je nejhůř zamořený Červený les. Po invazi si tam ale Rusové udělali zákopy

O zkušenostech s Černobylem, kde před čtyřiceti lety došlo k jaderné havárii, vypráví muž, který má toto místo prochozené křížem krážem. Andrej Pastorek se dostal i do míst, která okupovali ruští vojáci při invazi na Ukrajinu.
30. 4. 2026

Česko zasáhlo sucho, situace se jen tak nezlepší. Na Slovensku je ještě hůř

Kvůli nedostatku srážek a stále vyšším teplotám se ve střední Evropě prohlubuje půdní sucho. Na některých místech už odborníci varují před závažnými dopady na zemědělství.
29. 4. 2026

Štíři mají klepeta vyztužená železem. Jako by je vyrobil špičkový kovář, říká studie

Organismy na Zemi umí využívat zdroje ze svého okolí, včetně prvků, jako je železo, mangan nebo zinek. Konkrétně štíři si z nich staví své zbraně. Vědci teď poprvé detailně popsali, jak to tito tvorové dělají.
29. 4. 2026
Načítání...