Když se AI bude učit od AI, povede to ke smyčce a kolapsu, popsal výzkum

Když se budou umělé inteligence (AI) učit z dat, které vytvořily umělé inteligence, může to vést ke značně nespolehlivým výsledkům. A pokud bude takový proces učení trvat několik generací, bude výsledkem změť nesouvisejících nesmyslů. Podle nového článku, který vyšel v odborném žurnálu Nature, stačí asi deset generací ke kolapsu modelu.

Nástroje umělé inteligence, jako jsou velké jazykové modely (LLM), jsou stále populárnější. Trénují se především pomocí vstupních dat, která vytvořili lidé. Jenže s tím, jak se tyto modely šíří po internetu, se může stále častěji stávat, že se začne pro trénink využívat i počítačem generovaný obsah. Výsledkem může být podle studie takzvaná rekurze neboli smyčka. V ní by se mohly opakovat a posilovat chyby, jež v každém vzorku dat téměř jistě jsou. A v každé další generaci budou tyto omyly růst.

Počítačoví vědci se pokusili v nových matematických modelech popsat, jestli se tyto smyčky nemohou úplně zacyklit. Výzkum vedl Ilia Shumailov z týmu DeepMind společnosti Google. Výsledky prokazují, že u AI modelů z těchto důvodů ke kolapsu dojít může.

Společně s kolegy v této studii doložil, že umělá inteligence může v trénovacích datech přehlédnout některé výstupy, například méně časté řádky textu, což způsobí, že se bude trénovat pouze na části souboru dat. Současně pak tedy zkoumali, jak modely AI reagují na tréninkovou sadu dat, která byla vytvořena převážně pomocí umělé inteligence. Zjistili, že podávání dat vytvořených umělou inteligencí modelu způsobuje, že se u následujících generací zhoršuje jejich schopnost učit se, což nakonec vede ke zhroucení modelu.

Téměř všechny rekurzivně natrénované jazykové modely, které testovali, měly tendenci zobrazovat opakující se fráze. Například, když byl test proveden s textem o středověké architektuře jako původním vstupem, v deváté generaci model skončil se seznamem zajíců. Vlastně je to docela podobné dětské hře na tichou poštu, kdy se zpráva zkresluje hráč od hráče.

Co s tím

Autoři konstatují, že kolaps modelu je nevyhnutelným důsledkem modelů umělé inteligence, které používají trénovací datové sady vytvořené předchozími generacemi AI. Podle vedoucího výzkumu je ale možné tyto nástrahy obejít – umělá inteligence by se dala dlouhodobě trénovat i na datech vytvořených AI, ale bylo by k tomu zapotřebí velmi vyspělé filtrování těchto dat.

Současně ale podle Shumailova technologické firmy, které se spoléhají na obsah generovaný lidmi, mohou být schopny trénovat modely umělé inteligence, které jsou oproti jejich konkurentům spoléhajícím se jen na data z umělých inteligencí efektivnější.

Výběr redakce

Aktuálně z rubriky Věda

V USA jsou dostupná lidská embrya na zakázku. Vědci varují před eugenikou

Američtí rodiče se stále víc obracejí na soukromé firmy, které jim slibují dodat geneticky ideální embrya. Tyto děti by měly mít vyšší IQ, měly by se dožívat vyššího věku a měly by tedy mít v životě lepší šance než zbytek populace. Experti na etiku to považují za znepokojivé.
před 13 hhodinami

Před čtyřiceti lety došlo ke katastrofě v Černobylu

Katastrofa v jaderné elektrárně Černobyl v dubnu 1986 zničila rozsáhlé území v Sovětském svazu, vyvolala na desítky let strach z atomu a měla i mnoho dalších negativních dopadů na celou Evropu.
před 14 hhodinami

Fotbalové mistrovství vyprodukuje obří emise. Samo se potýká s nepřízní klimatu

Mistrovství světa ve fotbale (MS) v roce 2026 bude v mnoha ohledech přelomové. Poprvé se odehraje ve třech zemích současně – Spojených státech, Kanadě a Mexiku. Poprvé se ho zúčastní 48 týmů, které se utkají ve 104 zápasech, místo 32 týmů a 64 utkání. Tento „největší šampionát historie“ může být zároveň i klimaticky nejproblematičtější. Odhady naznačují, že celková uhlíková stopa turnaje přesáhne devět milionů tun emisí odpovídajících ekvivalentu oxidu uhličitého. To je výrazně více než u předchozích šampionátů, a to téměř o dvojnásobek.
včera v 09:00

„Krakeni“ z vrcholu potravní pyramidy mění představy o pravěkých mořích

Japonští vědci díky kombinaci několika moderních technologií popsali druh druhohorní chobotnice, která mohla svými rozměry přinejmenším soupeřit s největšími obratlovci své doby. Tento agresivní predátor navíc disponoval nečekaně vysokou inteligencí.
24. 4. 2026

Makakové žerou na Gibraltaru kvůli jídlu od turistů hlínu, zjistila nová studie

Zatímco ve volné přírodě jedí makakové téměř výhradně rostliny a občas si přilepší třeba drobným hmyzem, na Gibraltaru konzumují sušenky s čokoládou, zmrzlinové kornouty či brambůrky. A aby pomohli svému trávicímu traktu vypořádat se s cukry a tuky z lidských svačin, pojídají gibraltarští makakové hlínu. Zjistila to studie vědců převážně z Cambridgeské univerzity publikovaná v časopise Nature, o níž informoval španělský deník El País.
24. 4. 2026

Vědci studují, jak komunikují děti s kochleárním implantátem

Podpořit vývoj řeči u dětí s kochleárním implantátem. To je cíl českého výzkumu, který se zaměřil na předškoláky se sluchovou vadou. Právě tento věk je klíčový pro rozvoj komunikace kvůli nástupu do školy.
24. 4. 2026

V Číně odhalili naleziště bizarních tvorů z hlubin času

Čínsko-britský výzkum v jihozápadní Číně objevil rozlehlé naleziště fosilií, které pomáhá mnohem lépe pochopit, jak vypadal život na Zemi v době před více než půl miliardou let. Objev podle autorů posunuje do vzdálenější minulosti vznik složitějších forem života.
23. 4. 2026

Postižený papoušek se stal vládcem. Vymyslel totiž neporazitelný styl boje

Novozélandský papoušek, kterému dali vědci jméno Bruce, je takovou papouščí kombinací Stephena Hawkinga a Chucka Norrise. Přes vážné tělesné postižení dokáže díky své inteligenci v soubojích porazit jakéhokoliv nepřítele. Stal se tak dominantním samcem ve svém hejnu.
23. 4. 2026
Načítání...