Když se AI bude učit od AI, povede to ke smyčce a kolapsu, popsal výzkum

Když se budou umělé inteligence (AI) učit z dat, které vytvořily umělé inteligence, může to vést ke značně nespolehlivým výsledkům. A pokud bude takový proces učení trvat několik generací, bude výsledkem změť nesouvisejících nesmyslů. Podle nového článku, který vyšel v odborném žurnálu Nature, stačí asi deset generací ke kolapsu modelu.

Nástroje umělé inteligence, jako jsou velké jazykové modely (LLM), jsou stále populárnější. Trénují se především pomocí vstupních dat, která vytvořili lidé. Jenže s tím, jak se tyto modely šíří po internetu, se může stále častěji stávat, že se začne pro trénink využívat i počítačem generovaný obsah. Výsledkem může být podle studie takzvaná rekurze neboli smyčka. V ní by se mohly opakovat a posilovat chyby, jež v každém vzorku dat téměř jistě jsou. A v každé další generaci budou tyto omyly růst.

Počítačoví vědci se pokusili v nových matematických modelech popsat, jestli se tyto smyčky nemohou úplně zacyklit. Výzkum vedl Ilia Shumailov z týmu DeepMind společnosti Google. Výsledky prokazují, že u AI modelů z těchto důvodů ke kolapsu dojít může.

Společně s kolegy v této studii doložil, že umělá inteligence může v trénovacích datech přehlédnout některé výstupy, například méně časté řádky textu, což způsobí, že se bude trénovat pouze na části souboru dat. Současně pak tedy zkoumali, jak modely AI reagují na tréninkovou sadu dat, která byla vytvořena převážně pomocí umělé inteligence. Zjistili, že podávání dat vytvořených umělou inteligencí modelu způsobuje, že se u následujících generací zhoršuje jejich schopnost učit se, což nakonec vede ke zhroucení modelu.

Téměř všechny rekurzivně natrénované jazykové modely, které testovali, měly tendenci zobrazovat opakující se fráze. Například, když byl test proveden s textem o středověké architektuře jako původním vstupem, v deváté generaci model skončil se seznamem zajíců. Vlastně je to docela podobné dětské hře na tichou poštu, kdy se zpráva zkresluje hráč od hráče.

Co s tím

Autoři konstatují, že kolaps modelu je nevyhnutelným důsledkem modelů umělé inteligence, které používají trénovací datové sady vytvořené předchozími generacemi AI. Podle vedoucího výzkumu je ale možné tyto nástrahy obejít – umělá inteligence by se dala dlouhodobě trénovat i na datech vytvořených AI, ale bylo by k tomu zapotřebí velmi vyspělé filtrování těchto dat.

Současně ale podle Shumailova technologické firmy, které se spoléhají na obsah generovaný lidmi, mohou být schopny trénovat modely umělé inteligence, které jsou oproti jejich konkurentům spoléhajícím se jen na data z umělých inteligencí efektivnější.

Výběr redakce

Aktuálně z rubriky Věda

U zrodu morových ran v Evropě stály sopečné erupce, změnily klima, zjistili vědci

Ke vzniku morové epidemie, která ve 14. století během pouhých několika let připravila o život velkou část evropské populace, podle nové studie zřejmě přispěly sopečné erupce, o nichž tehdejší obyvatelé Evropy ani nevěděli. Ty totiž do atmosféry vychrlily velké množství prachu a dalšího materiálu, což mimo jiné vedlo k citelnému ochlazení.
před 27 mminutami

Paleodieta je pohádka, člověk se jen masem nikdy neživil, tvrdí výzkum

Rozsáhlá analýza zbytků lidské potravy z období pravěku přinesla silné argumenty pro vyvrácení hypotéz o tom, že se v době kamenné konzumovalo hlavně maso.
před 3 hhodinami

NASA mohla omylem kolonizovat Mars, naznačují vlastnosti „nesmrtelné“ bakterie

Americká vesmírná agentura NASA objevila před několika lety v opakovaně čištěné laboratoři bakterii, která přežila desítky pokusů o dezinfekci. Teď vědci popsali, jak to organismus dělá, a také potenciální dopady těchto schopností.
před 17 hhodinami

Vědci na Trutnovsku našli v trase D11 hromadné vojenské hroby z 18. a 19. století

Vědci v trase budoucí dálnice D11 v úseku mezi Jaroměří a Trutnovem objevili hromadné vojenské hroby z 18. a 19. století, které považují za mimořádný archeologický soubor doplňující poznání tehdejších válečných konfliktů. Kromě hrobu z druhé slezské války z roku 1745, o kterém již informovali, našli také tři z roku 1866.
před 20 hhodinami

Ničivé počasí v části Asie není náhoda, ale klimatické varování, tvrdí vědci

Jihovýchodní Asie letos čelí neobvykle silným bouřím. Počet obětí povodní a sesuvů půdy v Indonésii, na Srí Lance a v Thajsku dosud přesáhl 1400, přičemž více než tisícovka lidí se stále pohřešuje. V Indonésii zůstávají celé vesnice odříznuté od zbytku světa poté, co voda zničila mosty a silnice. Tisíce lidí na Srí Lance nemají přístup k pitné vodě, zatímco thajský premiér přiznal nedostatečnou reakci své vlády, píše agentura AP.
před 22 hhodinami

Stárnutí ženských vajíček se dá zvrátit, zjistili náhodou čeští vědci

Projevy stárnutí ženských vajíček, takzvaných oocytů, je možné zvrátit a jejich poškození opravit. To, co bylo dosud považováno za biologicky nemožné, dokázal mezinárodní tým vedený reprodukční bioložkou Helenou Fulkovou z Ústavu experimentální medicíny Akademie věd ČR, který o průlomu informoval v tiskové zprávě. Výsledky zveřejnil časopis Aging Cell. Podle vědců otevírají závěry práce nové otázky o biologii stárnutí a také prostor pro vývoj budoucích léčebných postupů.
před 23 hhodinami

Univerzitní spin-offy sílí. Pomáhají výzkumu a míří do světového byznysu

Univerzitní firmy, takzvané spin-offy, které vysokým školám přinášejí zisk, jsou v zahraničí běžné. V tuzemsku se tento model prosazuje pomaleji. Na konferenci v Ostravě, pořádané agenturou CzechInvest, zazněly příklady úspěšných firem, které dokážou z akademického výzkumu vytvořit mezinárodně konkurenceschopný produkt i finanční přínos pro vysoké školy.
včera v 09:24

Humanoidů v Číně vzniká spousta, kupuje je málokdo. Země se bojí bubliny

Čína vsadila na to, že se stane světovou velmocí v humanoidních robotech. Podle několika analýz ale možná přišla s touto technologií příliš brzy, protože reálně o ni není příliš zájem.
včera v 06:30
Načítání...