Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

V italské lidové pohádce se dřevěný, ale inteligentní panáček Pinocchio vyznačoval tím, že byl velmi špatný lhář. Pokaždé, když řekl nějakou nepravdu, o něco mu povyrostl nos. Dnešní umělé inteligence takový problém nemají. Za několik posledních let dosáhly obrovského pokroku ve všech oblastech. Včetně právě lhaní, upozornila nová studie.

Analýza vědců z Massachusettského technologického institutu (MIT) popsala případy, kdy systémy umělé inteligence podváděly své lidské oponenty, dokázaly blafovat a úspěšně předstírat, že jsou lidé. Jeden zkoumaný chatbot dokonce změnil své chování během bezpečnostních testů, což podle autorů zvyšuje riziko, že AI budou umět lidi přelstít poměrně snadno.

„S tím, jak budou schopnosti systémů AI lhát stále dokonalejší, bude nebezpečí, které představují pro společnost, stále vážnější,“ komentoval výsledky zkoumání autor studie Peter Park.

Lež jako cesta k vítězství

Park se rozhodl prověřit schopnosti AI lhát poté, co se dozvěděl o tom, jak je úspěšná ve stolní hře Diplomacy. Umělá inteligence Cicero od společnosti Meta se naučila, jak v ní porazit většinu lidských soupeřů – a protože je v této dobyvatelské strategii zapotřebí umět lhát a podvádět, musela si to osvojit.

AI to dokázala, přestože byla navržená tak, aby byla „převážně čestná“ a nikdy nepodrazila své lidské spoluhráče. Jenže k vítězství to nestačilo – a tak lhala. Park a jeho kolegové prošli veřejně dostupná data o hrách Cicera proti lidem a našli v nich několik případů, kdy umělá inteligence promyšleně lhala, pletichařila s hráči proti jiným, a dokonce maskovala svou AI povahu, když se jinému hráči omlouvala za zpoždění slovy, že „telefonovala se svou přítelkyní“. „Zjistili jsme, že umělá inteligence Meta se naučila mistrovsky podvádět,“ potvrzuje Park.

Jeho tým pak popsal podobné schopnosti i u jiných systémů AI, například u programu pro poker Texas Hold 'em, který dokázal blafovat proti profesionálním lidským hráčům. V jedné studii si umělé inteligence v digitálním simulátoru dokonce „hrály na mrtvé“, aby tak oklamaly test sestavený k eliminaci systémů umělé inteligence, které se vyvinuly k rychlému replikování. Po skončení testování obnovily svou původní činnost. To je podle autorů výjimečně znepokojivé, protože to ukazuje, jak složité mohou už brzy být snahy umělé inteligence kontrolovat.

Podle Parka to může mít zásadní důsledky. „To, že se systém umělé inteligence považuje za bezpečný v testovacím prostředí, ještě neznamená, že je bezpečný i potom v ostrém provozu. Může se stát, že v testovacím prostředí jenom předstírá, že je bezpečný,“ upozornil Park.

Vědci tyto nové informace zveřejnili v odborném žurnálu Patterns. Současně v článku vyzvali vlády, aby navrhly zákony o bezpečnosti umělé inteligence, které by se věnovaly právě problému podvodů ze stran AI. Varují mimo jiné před tím, že pokud tyto systémy dokáží svou schopnost lhát ještě více zdokonalit, mohli by nad nimi lidé snadno ztratit kontrolu.


Výběr redakce

Aktuálně z rubriky Věda

U zrodu morových ran v Evropě stály sopečné erupce, změnily klima, zjistili vědci

Ke vzniku morové epidemie, která ve 14. století během pouhých několika let připravila o život velkou část evropské populace, podle nové studie zřejmě přispěly sopečné erupce, o nichž tehdejší obyvatelé Evropy ani nevěděli. Ty totiž do atmosféry vychrlily velké množství prachu a dalšího materiálu, což mimo jiné vedlo k citelnému ochlazení.
před 34 mminutami

Paleodieta je pohádka, člověk se jen masem nikdy neživil, tvrdí výzkum

Rozsáhlá analýza zbytků lidské potravy z období pravěku přinesla silné argumenty pro vyvrácení hypotéz o tom, že se v době kamenné konzumovalo hlavně maso.
před 3 hhodinami

NASA mohla omylem kolonizovat Mars, naznačují vlastnosti „nesmrtelné“ bakterie

Americká vesmírná agentura NASA objevila před několika lety v opakovaně čištěné laboratoři bakterii, která přežila desítky pokusů o dezinfekci. Teď vědci popsali, jak to organismus dělá, a také potenciální dopady těchto schopností.
před 18 hhodinami

Vědci na Trutnovsku našli v trase D11 hromadné vojenské hroby z 18. a 19. století

Vědci v trase budoucí dálnice D11 v úseku mezi Jaroměří a Trutnovem objevili hromadné vojenské hroby z 18. a 19. století, které považují za mimořádný archeologický soubor doplňující poznání tehdejších válečných konfliktů. Kromě hrobu z druhé slezské války z roku 1745, o kterém již informovali, našli také tři z roku 1866.
před 20 hhodinami

Ničivé počasí v části Asie není náhoda, ale klimatické varování, tvrdí vědci

Jihovýchodní Asie letos čelí neobvykle silným bouřím. Počet obětí povodní a sesuvů půdy v Indonésii, na Srí Lance a v Thajsku dosud přesáhl 1400, přičemž více než tisícovka lidí se stále pohřešuje. V Indonésii zůstávají celé vesnice odříznuté od zbytku světa poté, co voda zničila mosty a silnice. Tisíce lidí na Srí Lance nemají přístup k pitné vodě, zatímco thajský premiér přiznal nedostatečnou reakci své vlády, píše agentura AP.
před 23 hhodinami

Stárnutí ženských vajíček se dá zvrátit, zjistili náhodou čeští vědci

Projevy stárnutí ženských vajíček, takzvaných oocytů, je možné zvrátit a jejich poškození opravit. To, co bylo dosud považováno za biologicky nemožné, dokázal mezinárodní tým vedený reprodukční bioložkou Helenou Fulkovou z Ústavu experimentální medicíny Akademie věd ČR, který o průlomu informoval v tiskové zprávě. Výsledky zveřejnil časopis Aging Cell. Podle vědců otevírají závěry práce nové otázky o biologii stárnutí a také prostor pro vývoj budoucích léčebných postupů.
včera v 10:47

Univerzitní spin-offy sílí. Pomáhají výzkumu a míří do světového byznysu

Univerzitní firmy, takzvané spin-offy, které vysokým školám přinášejí zisk, jsou v zahraničí běžné. V tuzemsku se tento model prosazuje pomaleji. Na konferenci v Ostravě, pořádané agenturou CzechInvest, zazněly příklady úspěšných firem, které dokážou z akademického výzkumu vytvořit mezinárodně konkurenceschopný produkt i finanční přínos pro vysoké školy.
včera v 09:24

Humanoidů v Číně vzniká spousta, kupuje je málokdo. Země se bojí bubliny

Čína vsadila na to, že se stane světovou velmocí v humanoidních robotech. Podle několika analýz ale možná přišla s touto technologií příliš brzy, protože reálně o ni není příliš zájem.
včera v 06:30
Načítání...