Když se AI bude učit od AI, povede to ke smyčce a kolapsu, popsal výzkum

Když se budou umělé inteligence (AI) učit z dat, které vytvořily umělé inteligence, může to vést ke značně nespolehlivým výsledkům. A pokud bude takový proces učení trvat několik generací, bude výsledkem změť nesouvisejících nesmyslů. Podle nového článku, který vyšel v odborném žurnálu Nature, stačí asi deset generací ke kolapsu modelu.

Nástroje umělé inteligence, jako jsou velké jazykové modely (LLM), jsou stále populárnější. Trénují se především pomocí vstupních dat, která vytvořili lidé. Jenže s tím, jak se tyto modely šíří po internetu, se může stále častěji stávat, že se začne pro trénink využívat i počítačem generovaný obsah. Výsledkem může být podle studie takzvaná rekurze neboli smyčka. V ní by se mohly opakovat a posilovat chyby, jež v každém vzorku dat téměř jistě jsou. A v každé další generaci budou tyto omyly růst.

Počítačoví vědci se pokusili v nových matematických modelech popsat, jestli se tyto smyčky nemohou úplně zacyklit. Výzkum vedl Ilia Shumailov z týmu DeepMind společnosti Google. Výsledky prokazují, že u AI modelů z těchto důvodů ke kolapsu dojít může.

Společně s kolegy v této studii doložil, že umělá inteligence může v trénovacích datech přehlédnout některé výstupy, například méně časté řádky textu, což způsobí, že se bude trénovat pouze na části souboru dat. Současně pak tedy zkoumali, jak modely AI reagují na tréninkovou sadu dat, která byla vytvořena převážně pomocí umělé inteligence. Zjistili, že podávání dat vytvořených umělou inteligencí modelu způsobuje, že se u následujících generací zhoršuje jejich schopnost učit se, což nakonec vede ke zhroucení modelu.

Téměř všechny rekurzivně natrénované jazykové modely, které testovali, měly tendenci zobrazovat opakující se fráze. Například, když byl test proveden s textem o středověké architektuře jako původním vstupem, v deváté generaci model skončil se seznamem zajíců. Vlastně je to docela podobné dětské hře na tichou poštu, kdy se zpráva zkresluje hráč od hráče.

Co s tím

Autoři konstatují, že kolaps modelu je nevyhnutelným důsledkem modelů umělé inteligence, které používají trénovací datové sady vytvořené předchozími generacemi AI. Podle vedoucího výzkumu je ale možné tyto nástrahy obejít – umělá inteligence by se dala dlouhodobě trénovat i na datech vytvořených AI, ale bylo by k tomu zapotřebí velmi vyspělé filtrování těchto dat.

Současně ale podle Shumailova technologické firmy, které se spoléhají na obsah generovaný lidmi, mohou být schopny trénovat modely umělé inteligence, které jsou oproti jejich konkurentům spoléhajícím se jen na data z umělých inteligencí efektivnější.

Výběr redakce

Aktuálně z rubriky Věda

Vědci se domnívají, že našli prastarého předchůdce písma

První písmo podle učebnic dějepisu vzniklo na Blízkém východě, někdy kolem roku 3400 před naším letopočtem. Němečtí vědci ze Saarlandské univerzity teď ale tvrdí, že našli důkazy o tom, že historie písma je mnohem, mnohem starší. Možná dokonce o desítky tisíc let.
před 4 hhodinami

USA se na Trumpův pokyn vrací ke glyfosátu. Ministr Kennedy otočil

Prezident Donald Trump minulý týden vydal exekutivní příkaz, kterým se rozhodl podpořit domácí produkci fosforu a herbicidu glyfosátu. Chemikálii řada organizací viní z negativních dopadů na lidské zdraví, i kvůli možnému riziku rakoviny. Aktivně proti ní v minulosti vystupoval i současný ministr zdravotnictví Robert F. Kennedy mladší. Ve vládním angažmá otočil s tím, že na glyfosátu je závislé americké zemědělství.
před 6 hhodinami

Bouba a kiki fungují i u kuřat. Vědci boří jeden z pilířů jazykovědy

Nový výzkum italských psychologů zjistil, že jedno z univerzálních pravidel v lidském jazyce zřejmě nemá nic společného s řečí. Funguje totiž také u kuřat, která od lidí dělí tři sta milionů let evoluce.
před 7 hhodinami

Před 70 lety padla Stalinova modla. Pomohl k tomu ze záhrobí i Lenin

Takzvaná „Fronta na maso“ – monumentální Stalinův pomník na pražské Letné – stál na místě necelý rok, když se nad jeho existencí už začaly stahovat mraky. Před 70 lety totiž začal XX. sjezd Komunistické strany Sovětského svazu. Tehdejší první tajemník Nikita Chruščov na něm poprvé veřejně odsoudil Stalinovy zločiny a vytváření jeho kultu osobnosti. Projev byl tajný, brzo se ale dostal do světa. A Stalinova sláva začala uvadat. Příslib společenského uvolnění ale Sověti následně rázně utnuli.
před 11 hhodinami

Porno, sítě, hry. Hyde Park Civilizace řešil digitální hrozby

Stále mladší děti tráví stále více času na sociálních sítích. Ty jim poskytují spoustu zábavy, poznání i sociálních vazeb, ale také skýtají mnoho nástrah. Pro rodiče může být složité tato rizika pochopit, protože v jejich mládí nebyla lidská identita natolik propojená s tou digitální a většina takových hrozeb nebyla tak rozšířená. Tématu se věnoval Hyde Park Civilizace.
před 12 hhodinami

Marihuana v dospívání zdvojnásobuje riziko duševních nemocí

Téměř půl milionu mladých lidí zkoumali američtí vědci v rozsáhlé studii, která se věnovala konzumaci marihuany. Výzkum ukázal, že existuje souvislost mezi kouřením konopí a vznikem psychických chorob. A s velkou pravděpodobností jde o souvislost příčinnou.
včera v 14:15

Zákaz mobilů ve školách dle výzkumu přímo nezlepšuje známky ani duševní pohodu

Zákaz mobilních telefonů ve školách nevede přímočaře ke zlepšení studijních výsledků. Žáci sice nejsou tak rozptylováni, ale na druhou stranu roste neklid a nekázeň ve třídách. Vyplývá to z dat z 21 zemí včetně Česka, která analyzovali vědci výzkumného týmu IRTIS Fakulty sociálních studií Masarykovy univerzity v Brně. Podle tohoto výzkumu plošné zákazy nefungují a nejsou tedy ani univerzálním řešením. Vhodnější je přizpůsobit pravidla místním podmínkám.
včera v 11:24

Při extrémních vedrech vznikají nad městy nanočástice schopné proniknout do plic

Světová velkoměsta se vlivem oteplování planety i toho, jak zastavěná jsou, stávají stále rozpálenějšími kotli. Má to v mnoha ohledech negativní dopady na lidské zdraví. Teď vědci popsali další možný: vznik atmosférických aerosolů složených z nanočástic, které mohou proniknout do plic. To se donedávna pokládalo za nepravděpodobné.
včera v 11:14
Načítání...