Když se AI bude učit od AI, povede to ke smyčce a kolapsu, popsal výzkum

Když se budou umělé inteligence (AI) učit z dat, které vytvořily umělé inteligence, může to vést ke značně nespolehlivým výsledkům. A pokud bude takový proces učení trvat několik generací, bude výsledkem změť nesouvisejících nesmyslů. Podle nového článku, který vyšel v odborném žurnálu Nature, stačí asi deset generací ke kolapsu modelu.

Nástroje umělé inteligence, jako jsou velké jazykové modely (LLM), jsou stále populárnější. Trénují se především pomocí vstupních dat, která vytvořili lidé. Jenže s tím, jak se tyto modely šíří po internetu, se může stále častěji stávat, že se začne pro trénink využívat i počítačem generovaný obsah. Výsledkem může být podle studie takzvaná rekurze neboli smyčka. V ní by se mohly opakovat a posilovat chyby, jež v každém vzorku dat téměř jistě jsou. A v každé další generaci budou tyto omyly růst.

Počítačoví vědci se pokusili v nových matematických modelech popsat, jestli se tyto smyčky nemohou úplně zacyklit. Výzkum vedl Ilia Shumailov z týmu DeepMind společnosti Google. Výsledky prokazují, že u AI modelů z těchto důvodů ke kolapsu dojít může.

Společně s kolegy v této studii doložil, že umělá inteligence může v trénovacích datech přehlédnout některé výstupy, například méně časté řádky textu, což způsobí, že se bude trénovat pouze na části souboru dat. Současně pak tedy zkoumali, jak modely AI reagují na tréninkovou sadu dat, která byla vytvořena převážně pomocí umělé inteligence. Zjistili, že podávání dat vytvořených umělou inteligencí modelu způsobuje, že se u následujících generací zhoršuje jejich schopnost učit se, což nakonec vede ke zhroucení modelu.

Téměř všechny rekurzivně natrénované jazykové modely, které testovali, měly tendenci zobrazovat opakující se fráze. Například, když byl test proveden s textem o středověké architektuře jako původním vstupem, v deváté generaci model skončil se seznamem zajíců. Vlastně je to docela podobné dětské hře na tichou poštu, kdy se zpráva zkresluje hráč od hráče.

Co s tím

Autoři konstatují, že kolaps modelu je nevyhnutelným důsledkem modelů umělé inteligence, které používají trénovací datové sady vytvořené předchozími generacemi AI. Podle vedoucího výzkumu je ale možné tyto nástrahy obejít – umělá inteligence by se dala dlouhodobě trénovat i na datech vytvořených AI, ale bylo by k tomu zapotřebí velmi vyspělé filtrování těchto dat.

Současně ale podle Shumailova technologické firmy, které se spoléhají na obsah generovaný lidmi, mohou být schopny trénovat modely umělé inteligence, které jsou oproti jejich konkurentům spoléhajícím se jen na data z umělých inteligencí efektivnější.

Výběr redakce

Aktuálně z rubriky Věda

Virus HIV se učí odolávat jedinému léku. Tvrdě za to ale platí

Vědci z americké společnosti Gilead Sciences, která má jediný účinný lék na HIV, otestovali, jestli se tento virus této látce nedokáže přizpůsobit. Výsledky naznačují, že ano, ale současně ukazují, že to ve skutečnosti nemusí být příliš nebezpečné.
před 6 hhodinami

Stárnoucímu Česku dojdou mladí lidé, ukazují velká data

Během pouhých deseti let začne odcházet do důchodu silná generace Husákových dětí. Přinese to zásadní demografickou proměnu, která změní celou českou společnost. Nejenže bude méně lidí na to, aby vydělávali na penze stále rostoucí skupině, ale především bude potřeba mnohem více sociální péče pro seniory.
10. 1. 2026Aktualizováno12. 1. 2026

První lidé lovili pomocí jedu už před 60 tisíci lety

Lidé druhu Homo sapiens na jihu Afriky používali už před šedesáti tisíci lety otrávené šípy. Dokázali to švédští vědci na základě nálezu takových zbraní na území dnešní Jihoafrické republiky. O nejstarším nálezu svého druhu informovali v článku, který zveřejnil odborný časopis Science Advances.
12. 1. 2026

„Sedmé nebe“ je úplně nový druh vesmírného objektu

Galaxie, která selhala, respektive oblak temné hmoty z počátku vesmíru – tak astronomové popisují vzdálený kosmický objekt, který objevili. Dali mu název Cloud-9, což by se dalo do češtiny nejlépe přeložit jako „Sedmé nebe“.
11. 1. 2026

Čeští vědci navrhli řešení klimatické změny. Klíčem je kácení severských lesů

Vědci navrhli prozkoumat možnost ukládání uhlíku pomocí splavování masy vykácených stromů do Severního ledového oceánu z lesů, které rostou v povodí sibiřských veletoků Obu, Jeniseje a Leny a severoamerických řek Yukonu a Mackenzie. V této oblasti se nachází asi sto gigatun uhlíku, který je uložený ve dřevě stromů. Vykácením přibližně jednoho procenta těchto lesů a splavením kmenů do oceánu by bylo možné snížit množství emisí o jednu gigatunu, tedy desetinu emisí vypuštěných lidstvem za rok.
10. 1. 2026

Dvacet pod nulou, nebo jen pět? Předpovědi počasí na příští týden se silně liší

Úspěšnost předpovědí počasí se v posledních letech zásadně zlepšila. I tak se ale vyskytne situace, která představuje i pro nejmodernější předpovědní modely a zkušené meteorology značnou výzvu. Momentálně se týká příštího týdne.
9. 1. 2026

Genetická šifra mistra Leonarda. Vědci možná získali jeho DNA

Mezinárodní vědecký tým našel s pomocí velmi detailních analytických metod stopy DNA na kresbě připisované renesančnímu géniovi Leonardu da Vincimu. Mohly by patřit samotnému mistrovi a univerzálnímu učenci, k identifikaci jeho DNA ale ještě zbývá daleká cesta. O studii informoval časopis Science.
9. 1. 2026

NASA stahuje posádku Crew-11 zpět na Zemi kvůli zdravotnímu stavu astronauta

Americký Národní úřad pro letectví a vesmír (NASA) se rozhodl pro předčasný návrat čtyřčlenné posádky mise Crew-11 z Mezinárodní vesmírné stanice (ISS) na Zemi kvůli zdravotnímu problému astronauta. Napsala o tom agentura AP. Člena posádky, který je nyní ve vesmírné laboratoři na oběžné dráze ve stabilizovaném stavu, NASA kvůli ochraně soukromí pacienta nejmenovala a nesdělila podrobnosti o jeho zdravotním problému. Návrat americko-rusko-japonské posádky na Zemi se uskuteční v příštích dnech.
8. 1. 2026Aktualizováno9. 1. 2026
Načítání...