AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

Výběr redakce

Aktuálně z rubriky Věda

Pompejské lázně byly špinavé a znečištěné těžkými kovy, ukázala studie

Nové objevy z lázní v Pompejích ukazují, že se jejich hygienické poměry značně lišily od toho, co se pokládá za římskou kvalitu. Nálezy ale současně naznačují, že se vědci mohou už brzy dozvědět o zaniklém městě mnohem víc.
před 8 hhodinami

Rychle zjistili, že jsme profesionálové, vzpomíná účastník Pouštní bouře

Válka v přímém přenosu – tak se říkalo konfliktu v Perském zálivu, který na začátku roku 1991 sledovaly díky televizním kamerám miliony lidí po celém světě. Do operace Pouštní bouře, která měla za cíl osvobodit okupovaný Kuvajt, se zapojili i českoslovenští vojáci z protichemické jednotky. Poprvé od druhé světové války se tak stali spojenci Američanů, Britů a Francouzů. Ti se na ně přesto – jako na své někdejší komunistické nepřátele – dívali nejdřív s opatrností.
před 12 hhodinami

Rytina koně stará 15 tisíc let. Moravští archeologové ukázali unikátní nález

Vědci objevili v jeskyni Švédův stůl v Moravském krasu rytinu starou zhruba 15 tisíc let, tedy z konce poslední doby ledové. Nález dle nich představuje mimořádný doklad takzvaného magdalénského umění a je důkazem dosud nenalezeného jeskynního umění v Česku. Naznačuje také, že tento druh jeskynního umění nebyl výsadou jen západní Evropy.
před 13 hhodinami

Ceny Neuron dostali Kubala Havrdová, Jiří Grygar a mladé talenty

Během slavnostního galavečera v Planetáriu Praha ocenila nadace Neuron sedm nadějných vědkyň a vědců působících v Česku, předala cenu za propojení vědy s byznysem, cenu za rozvíjení lásky k vědě, kterou obdržel astrofyzik Jiří Grygar, a hlavní Cenu Neuron pro lékařku a vědkyni Evu Kubala Havrdovou za záchranu lidských životů a také poprvé udělila ocenění Rising Star pro zcela výjimečný talent.
18. 1. 2026

Grónsko je klíčové pro Trumpovu kolosální Zlatou kopuli

Americký prezident Donald Trump a další představitelé jeho administrativy tvrdí, že získání Grónska je zásadní pro úspěšné dokončení projektu Golden Dome (Zlatá kopule). Tento vesmírný protiraketový štít nové generace má ochránit Spojené státy před stále vyspělejšími protivníky, píše server BBC News.
18. 1. 2026

Dánští archeologové objevili obří středověkou loď-hrad. Uvezla stovky tun nákladu

Objev masivní obchodní lodi u kodaňského pobřeží pomáhá vyprávět nejenom její příběh, ale také vrhá nové světlo na středověký obchod, život námořníků a také na to, jak se tyto lodi stavěly.
18. 1. 2026

Obavy z budoucnosti mladí Číňané rozptylují pomocí AI věštců

Mladí Číňané se zamilovali do věštění. Pohled do budoucna jim už ale nenabízí kartářky, prognostici nebo tvůrci horoskopů, ale stále častěji umělé inteligence, především domácího původu.
17. 1. 2026

Studie: Nejsou důkazy o spojitosti paracetamolu v těhotenství s autismem u dětí

Nová rozsáhlá studie nenašla žádné důkazy o tom, že by užívání paracetamolu v těhotenství zvyšovalo riziko autismu, ADHD a vývojové poruchy intelektu. Studii zveřejnil odborný časopis The Lancet. Těhotné ženy od užívání paracetamolu v loňském roce zrazoval americký prezident Donald Trump, který lék proti horečce a bolesti spojil s rizikem autismu u dětí.
17. 1. 2026
Načítání...