Když se AI bude učit od AI, povede to ke smyčce a kolapsu, popsal výzkum

Když se budou umělé inteligence (AI) učit z dat, které vytvořily umělé inteligence, může to vést ke značně nespolehlivým výsledkům. A pokud bude takový proces učení trvat několik generací, bude výsledkem změť nesouvisejících nesmyslů. Podle nového článku, který vyšel v odborném žurnálu Nature, stačí asi deset generací ke kolapsu modelu.

Nástroje umělé inteligence, jako jsou velké jazykové modely (LLM), jsou stále populárnější. Trénují se především pomocí vstupních dat, která vytvořili lidé. Jenže s tím, jak se tyto modely šíří po internetu, se může stále častěji stávat, že se začne pro trénink využívat i počítačem generovaný obsah. Výsledkem může být podle studie takzvaná rekurze neboli smyčka. V ní by se mohly opakovat a posilovat chyby, jež v každém vzorku dat téměř jistě jsou. A v každé další generaci budou tyto omyly růst.

Počítačoví vědci se pokusili v nových matematických modelech popsat, jestli se tyto smyčky nemohou úplně zacyklit. Výzkum vedl Ilia Shumailov z týmu DeepMind společnosti Google. Výsledky prokazují, že u AI modelů z těchto důvodů ke kolapsu dojít může.

Společně s kolegy v této studii doložil, že umělá inteligence může v trénovacích datech přehlédnout některé výstupy, například méně časté řádky textu, což způsobí, že se bude trénovat pouze na části souboru dat. Současně pak tedy zkoumali, jak modely AI reagují na tréninkovou sadu dat, která byla vytvořena převážně pomocí umělé inteligence. Zjistili, že podávání dat vytvořených umělou inteligencí modelu způsobuje, že se u následujících generací zhoršuje jejich schopnost učit se, což nakonec vede ke zhroucení modelu.

Téměř všechny rekurzivně natrénované jazykové modely, které testovali, měly tendenci zobrazovat opakující se fráze. Například, když byl test proveden s textem o středověké architektuře jako původním vstupem, v deváté generaci model skončil se seznamem zajíců. Vlastně je to docela podobné dětské hře na tichou poštu, kdy se zpráva zkresluje hráč od hráče.

Co s tím

Autoři konstatují, že kolaps modelu je nevyhnutelným důsledkem modelů umělé inteligence, které používají trénovací datové sady vytvořené předchozími generacemi AI. Podle vedoucího výzkumu je ale možné tyto nástrahy obejít – umělá inteligence by se dala dlouhodobě trénovat i na datech vytvořených AI, ale bylo by k tomu zapotřebí velmi vyspělé filtrování těchto dat.

Současně ale podle Shumailova technologické firmy, které se spoléhají na obsah generovaný lidmi, mohou být schopny trénovat modely umělé inteligence, které jsou oproti jejich konkurentům spoléhajícím se jen na data z umělých inteligencí efektivnější.

Výběr redakce

Aktuálně z rubriky Věda

NASA ukončila poplach na ISS. Posádka se vrátila z úkrytu

Americký Národní úřad pro letectví a vesmír (NASA) ukončil poplach a nařídil posádce Mezinárodní vesmírné stanice (ISS), aby se vrátila na palubu k dřívějšímu provozu. Dříve posádce nařídil ukrýt se do kosmických lodí a připravit se na možnou evakuaci kvůli zhoršujícím se únikům vzduchu z ruského segmentu, uvedla agentura Reuters. Ruští kosmonauté se únik vzduchu pokusili opravit, ruská kosmická agentura Roskosmos snahy ale následně pozastavila a sdělila, že neexistuje žádné ohrožení bezpečnosti posádky ani palubních systémů ISS.
včeraAktualizovánopřed 10 hhodinami

Vedro na konci května připomnělo Britům „černé léto“ 1976

Nejteplejší květen v dějinách měření vyvolal v Británii obavy z návratu černého léta roku 1976. Tehdy panovaly takové teploty, že vyschla celá řada vodních zdrojů, trpělo zemědělství i lesy a země poprvé zavedla funkci ministra pro sucho.
před 21 hhodinami

Začalo Archeologické léto. Vědci nabízejí veřejnosti nahlédnout do života předků

Vypravit se po stopách dávných Keltů, projít se po zaniklé středověké vesnici, nahlédnout do práce archeologů přímo v terénu nebo objevit pozůstatky nedávné historie skryté pod povrchem měst i krajiny. To vše nabídne sedmý ročník Archeologického léta, oblíbené prázdninové akce pro všechny milovníky historie, archeologie a poznávání neobvyklých míst.
včera v 06:30

Čína změnila způsob, jak počítá své emise

Čína splní své klimatické cíle, i kdyby se její emise oxidu uhličitého v dalších letech zvýšily. Podle analýzy nezávislého webu Carbon Brief si totiž pomohla změnou metodiky, jak tyto emise počítá. Vzorec sice nezveřejnila, ale zřejmě pravidla přenastavila tak, aby odpovídala aktuálnímu ekonomickému vývoji země.
4. 6. 2026

Ötziho mumie obsahuje stále živé mikroorganismy

Výzkumníci z institutu Eurac Research získali podrobný přehled o mikroorganismech spojených s Ötzim. Nová studie přináší poznatky o komplexním mikrobiomu, od střevní flóry člověka z doby měděné až po kvasinky přizpůsobené chladnému prostředí, které mohly mumii doprovázet po tisíciletí a dodnes zůstávají součástí aktivního ekosystému.
4. 6. 2026

Umělá inteligence ohrožuje přírodní zdroje pro mnoho lidí, varují experti OSN

Rostoucí emise, ubývající zásoby vody a mizející půda. To jsou tři hlavní problémy, které způsobuje dynamicky rostoucí sektor umělých inteligencí (AI). Nová studie Univerzity OSN varuje, že v roce 2030 budou datacentra spotřebovávat tolik vody jako 1,3 miliardy lidí. Spotřeba elektřiny pak má vzrůst na více než dvojnásobek oproti loňsku.
4. 6. 2026

VideoAI může pomáhat při řízení jaderné elektrárny do deseti let, míní Kochánek

Na konferenci o bezprostřední budoucnosti jaderné energie na francouzském velvyslanectví se mluví o aktuálních trendech v této oblasti – od malých modulárních reaktorů až po využití digitalizace a umělé inteligence (AI) k efektivnější správě a zajištění bezpečnosti. Právě AI může podle předsedy Státního úřadu pro jadernou bezpečnost Štěpána Kochánka nahradit některé lidské specialisty jak při projektování a výstavbě, tak i při samotném řízení provozu jaderného zařízení. „Tak daleko zatím v tuto chvíli nejsme,“ říká ale Kochánek a dodává, že by k tomu mohlo dojít v příští dekádě.
4. 6. 2026

Veletrh vědy láká na jaderné reaktory i astronomii Středozemě

Na výstavišti v pražských Letňanech ve čtvrtek začíná Veletrh vědy. Potrvá do soboty. Nabídne stovku interaktivních expozic a desítky přednášek s diskusemi. Podesáté ho pořádá Akademie věd ČR (AV ČR), která na něm představí novinky ze současného výzkumu. Do programu se zapojuje i řada univerzit.
4. 6. 2026
Načítání...