AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Tomáš Karlík

19. 12. 2024‌‌|Zdroj: BMJ

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Svět se místy o tři stupně ohřeje rychleji, než se čekalo, předpovídá AI

Horko letos vyvolalo rekordní sucha v Amazonii

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Lidé jsou palivo, v hudební branži je AI připraví o čtvrtinu příjmu, tvrdí studie

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

AI našla na planině Nazca kosatku s nožem a stovky dalších obrazců

Obrazec kosatky s nožem na planině Nazca

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Pokles schopností

Vítězové a poražení

Rozdíly mezi mozkem a jazykovým modelem

Výběr redakce

Ruský útok na Kyjev si vyžádal dvě oběti, terčem úderů se stal i Charkov

První z letounů Embraer bude slavnostně předán do výzbroje české armády

Kuvajt odrážel drony z Íránu, ten hlásil útoky i zásah základny v Jordánsku

Katar měl tajně finančně i vojensky pomáhat Íránu, pohár teď přetekl

Přes Brno prošla menší supercela

Čína nedávno zadržela českého občana

Íránské ministerstvo tvrdí, že série nových útoků USA zabila nejméně 35 civilistů

EU a Ukrajina uzavřely dohodu o společné výrobě dronů

Aktuálně z rubriky Věda

Inženýři z MIT vyrobili obojživelného robota. Inspirovali se papuchalkem

Zklidňování dětí mobilem se často může rodičům vymstít, popsali vědci

Dřív byli všude, teď vymírají. Vědci se pokoušejí zachránit piskoře a slunky

Tajfuny koktejlizují oceány, popsala studie

Nadbytek oxidu uhličitého hlavonožcům zmenšuje mozky

Liška běloprsá žil před 1200 lety. Experti odhalili jméno dávného mayského vědce

Vědci odhalili slabá místa viru klíšťové encefalitidy

Noční sovy mají horší metabolismus než ranní skřivani, ukázal výzkum

Evropský pohled

Irské misionářské organizace loni pomohly více než milionu lidí

Tbilisi po dvaceti letech obnoví tramvajovou dopravu

„Abychom přežili, spali jsme v lese.“ Ruské nálety vyhánějí ukrajinské rodiny z domovů

Rusko cvičilo na Čudsko-pskovském jezeře s ostrou střelbou. Neinformovalo o tom sousední Estonsko

Nové plavidlo estonské státní flotily pohání biometan z kravského hnoje

Kurýři jako zaměstnanci? Rozvoz jídla může zdražit

Systém na ověřování původu jahod stál Estonsko 220 tisíc eur, úřady ho ale nepoužívají

„Internet není hřiště.“ Bulharsko zvažuje, že zakáže dětem sociální sítě

Ženy v EU kvůli odkladu pravidel pro transparentnost odměňování přicházejí o miliardy eur

Počet vojáků USA v Polsku se má vrátit na deset tisíc, uvedl náměstek ministra obrany

Společné vyšetřování evropských médií odhalilo manipulace v komentářích. Nejvíc se týkaly Íránu

V Evropě vznikne servisní centrum pro střely systému Patriot

Přeměna vzdušné mise NATO zpřehlední velení a zrychlí reakci, míní exšéf estonského letectva

Budoucnost litevských trhů je nejistá. Prodejce odrazují nízké výdělky i obavy z nových pravidel

Čtyři Lotyši jsou obviněni ze špionáže pro Rusko

Klienti finančních institucí v Irsku získávají právo hovořit s člověkem místo chatbota

Při ruském útoku v noci na čtvrtek se v kyjevském metru ukrylo rekordních 52 tisíc lidí

Alijev tvrdí, že deset států EU již dováží ázerbájdžánský plyn a další mohou následovat

V Polsku obvinili dva lidi podezřelé ze špionáže ve prospěch Běloruska

Německo zvažuje zvýšení důchodového věku až na 70 let

Estonsko se chystá umožnit občanům zemí NATO zastávat funkce v oblasti národní obrany

Estonsko chce přenést část odpovědnosti za odpad na výrobce

V oteplujícím se Baltském moři sílí pobřežní vlny chladu, uvádí studie

V Irsku podle podniků gangy prohledávají koše kvůli vratným obalům