AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

Výběr redakce

Aktuálně z rubriky Věda

Írán odpojil internet v panice, Starlink rušit nedokáže

Teherán odpojil internet během protestů v panice a o přístup k síti přišlo dočasně i ministerstvo zahraničí. Píše to list Financial Times s odkazem na experty. Odříznutí Íránci se navzdory hrozbě represí pokoušejí komunikovat se světem přes Starlink. Íránské úřady se marně snaží rušit signál, a tak zabavují lidem antény.
před 9 mminutami

Cítí se opuštěni elitami, sjednoceni hněvem. Co lidi spojuje v krizích, ukázal český výzkum

Co mají společného spory o roušky během covidu a hádky o pomoc Ukrajině v diskuzích na facebooku? Výzkum českých vědkyň ukazuje, že lidé v časech krize sdílejí opakující se příběhy na základě modelu „my dole“ proti „těm nahoře“. Může to na sociálních sítích posílit sounáležitost mezi lidmi, ale současně takové chování rozděluje společnost ještě víc a vytváří pocity nedůvěry vůči elitám, hlavně těm politickým a mediálním.
před 1 hhodinou

Jaký bude rok 2026? Velká předpověď naznačuje vysoké teploty

Letošní rok by se mohl zařadit k těm dosud nejteplejším. Naznačují to predikce na základě analýzy historických dat a sledování dlouhodobého vývoje. Důležitou roli mají mít jevy El Niňo a La Niňa. Dosud nejteplejší byl rok 2024, ten loňský se stal třetím nejteplejším od počátku pozorování.
před 4 hhodinami

Mikroplastů je tolik, že kontaminují výzkumy o množství mikroplastů

Mikroplastů je už na Zemi tolik, že se nedá pořádně říct, jak moc jich je – tak se dají shrnout výsledky několika studií, které vyšly v poslední době. Na základě důkladných analýz jejich autoři zpochybňují předchozí výzkumy, které popisovaly, kolik mikroplastů (a nanoplastů) se nachází v lidských tkáních.
před 6 hhodinami

Komunisté před 55 lety normalizovali poměry. Pomocí lží i vražd

Zpátky k normálu – to byl cíl komunistů po srpnové okupaci v roce 1968. Rozjitřená společnost, která doufala ve změnu, se měla vrátit do doby před obrodným procesem (pražským jarem), takzvaně se normalizovat. Komunisté ale potřebovali vysvětlit a před lidmi obhájit vojenskou invazi z 21. srpna 1968. Posloužit k tomu měl oficiální dokument, který vyšel před 55 lety, byl plný lží a invazi nazýval „bratrskou pomocí“. Vtloukat do hlavy si ho měly i děti ve školách.
před 9 hhodinami

Umělá inteligence zabíjí tu dětskou, varuje výzkum

V této fázi vývoje převažují rizika využívání generativní umělé inteligence (AI) ve vzdělávání nad výhodami, říkají američtí autoři studie Centra pro univerzální vzdělávání Brookings Institution. Takzvaní chatboti dětem pomáhají s referáty, úkoly a učením, současně jim toho ale podle průzkumu až příliš mnoho berou.
před 23 hhodinami

Švýcarská nemocnice vyrábí metry umělé kůže pro popálené při požáru

Po požáru ve švýcarském zimním středisku Crans-Montana, kde při silvestrovských oslavách zahynulo čtyřicet lidí, 116 utrpělo zranění a desítky jsou stále hospitalizovány, pracuje laboratoř na výrobu kůže v centru buněčné produkce Univerzitní nemocnice kantonu Vaud na plné obrátky. Pokouší se pomoci zachránit pacienty s rozsáhlými popáleninami. Speciální zařízení v obci Epalinges nedaleko Lausanne je totiž jediné svého druhu v Evropě.
včera v 14:49

Pouštní národy lovily žraloky už v době kamenné, ukázal český výzkum

Pravěcí obyvatelé jihu Arábie se už před zhruba sedmi tisíci lety ve velké míře živili mořskými zdroji a troufli si i na tak velkou kořist, jako byli žraloci, vyplývá z výzkumu týmu Archeologického ústavu Akademie věd ČR (AV ČR). Ten v Ománu objevil nejstarší megalitický kolektivní hrob v jižní Arábii.
včera v 10:24
Načítání...