Když se AI bude učit od AI, povede to ke smyčce a kolapsu, popsal výzkum

Když se budou umělé inteligence (AI) učit z dat, které vytvořily umělé inteligence, může to vést ke značně nespolehlivým výsledkům. A pokud bude takový proces učení trvat několik generací, bude výsledkem změť nesouvisejících nesmyslů. Podle nového článku, který vyšel v odborném žurnálu Nature, stačí asi deset generací ke kolapsu modelu.

Nástroje umělé inteligence, jako jsou velké jazykové modely (LLM), jsou stále populárnější. Trénují se především pomocí vstupních dat, která vytvořili lidé. Jenže s tím, jak se tyto modely šíří po internetu, se může stále častěji stávat, že se začne pro trénink využívat i počítačem generovaný obsah. Výsledkem může být podle studie takzvaná rekurze neboli smyčka. V ní by se mohly opakovat a posilovat chyby, jež v každém vzorku dat téměř jistě jsou. A v každé další generaci budou tyto omyly růst.

Počítačoví vědci se pokusili v nových matematických modelech popsat, jestli se tyto smyčky nemohou úplně zacyklit. Výzkum vedl Ilia Shumailov z týmu DeepMind společnosti Google. Výsledky prokazují, že u AI modelů z těchto důvodů ke kolapsu dojít může.

Společně s kolegy v této studii doložil, že umělá inteligence může v trénovacích datech přehlédnout některé výstupy, například méně časté řádky textu, což způsobí, že se bude trénovat pouze na části souboru dat. Současně pak tedy zkoumali, jak modely AI reagují na tréninkovou sadu dat, která byla vytvořena převážně pomocí umělé inteligence. Zjistili, že podávání dat vytvořených umělou inteligencí modelu způsobuje, že se u následujících generací zhoršuje jejich schopnost učit se, což nakonec vede ke zhroucení modelu.

Téměř všechny rekurzivně natrénované jazykové modely, které testovali, měly tendenci zobrazovat opakující se fráze. Například, když byl test proveden s textem o středověké architektuře jako původním vstupem, v deváté generaci model skončil se seznamem zajíců. Vlastně je to docela podobné dětské hře na tichou poštu, kdy se zpráva zkresluje hráč od hráče.

Co s tím

Autoři konstatují, že kolaps modelu je nevyhnutelným důsledkem modelů umělé inteligence, které používají trénovací datové sady vytvořené předchozími generacemi AI. Podle vedoucího výzkumu je ale možné tyto nástrahy obejít – umělá inteligence by se dala dlouhodobě trénovat i na datech vytvořených AI, ale bylo by k tomu zapotřebí velmi vyspělé filtrování těchto dat.

Současně ale podle Shumailova technologické firmy, které se spoléhají na obsah generovaný lidmi, mohou být schopny trénovat modely umělé inteligence, které jsou oproti jejich konkurentům spoléhajícím se jen na data z umělých inteligencí efektivnější.

Výběr redakce

Aktuálně z rubriky Věda

Útroby Země jsou plné vodíku. Oxfordští vědci mluví o zdroji energie na tisíce let

Vodík je sice vydáván za bezemisní zdroj energie, ale při jeho zpracování skleníkové plyny vznikají. Britští vědci teď popsali, kde by lidstvo mohlo vzít obrovské množství tohoto plynu.
včera v 16:39

Kolektivní imunita už nedrží spalničky v šachu, varuje vědec

Předpokládá se, že očkování proti spalničkám zachránilo v letech 1974–2024 na celém světě více než 93 milionů životů a snížilo celkovou dětskou úmrtnost. Teď se ale tato nemoc vrací.
včera v 12:29

Arktida reaguje na změny klimatu velmi různorodě, ukázal čtyřicetiletý výzkum

Arktida zůstává podle nové studie i přes plošné oteplování, které tam probíhá, stále velmi různorodá. Reakce arktických rostlin na klimatickou změnu se v různých oblastech značně liší, ukazuje výzkum mezinárodního týmu vědců, mezi nimiž byl i zástupce českobudějovického biologického centra.
včera v 11:02

Pyl ve vzduchu trápí alergiky, může ale také přinášet déšť

Pylová sezona je aktuálně v plném proudu. Své o tom vědí hlavně alergici, nyní zejména ti, kteří jsou citliví na pyl trav. Množství pylu ve vzduchu je kromě vlastních fenofází rostlin významně ovlivněno také charakterem počasí. Zejména při slunečném, suchém a mírně větrném počasí může být ve vzduchu až mimořádné množství pylu. Nicméně pyl dokáže ovlivnit naopak samotné počasí. Účastní se procesu vzniku srážek.
14. 5. 2025
Načítání...