AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

Výběr redakce

Aktuálně z rubriky Věda

Botox vyřadil velbloudy ze soutěže krásy. Z kulturního dědictví je byznys

Porotci soutěže krásy velbloudů v Ománu diskvalifikovali dvacet zvířat, protože majitelé jim upravili vzhled. Kolem velbloudů se točí miliony dolarů a z klání, které má být především připomínkou beduínského kulturního dědictví, se tak stal především byznys.
před 13 mminutami

Pompejské zdi odhalují dosud nerozluštitelné vzkazy

Krátká zeď u pompejského divadla sloužila jako obdoba současných sociálních sítí. Vědci teď pomocí nových technologií rekonstruují vzkazy, které tam zanechali lidé před dvěma tisíci lety.
před 1 hhodinou

Velké bahnotoky a mury mohou vznikat i v Česku, varují výzkumníci

Vědci Ostravské univerzity (OU) potvrdili, že i středně vysoká pohoří v Česku mohou být při extrémním počasí vážně ohrožena sesuvy, erozí i ničivými proudy bahna a kamení. Opírají se o terénní výzkum a analýzu dat z Hrubého Jeseníku po povodních v předloňském roce. Podle vědců by bylo vhodné se systematičtěji zaměřit na preventivní opatření, která by dokázala těmto ničivým událostem předcházet.
před 7 hhodinami

Testosteron jako byznys? Influenceři zneužívají mužské nejistoty

S myšlenkou, že testosteron je klíč k tomu být opravdový muž, doporučují někteří influenceři na sociálních sítích hlavně mladým mužům, aby si nechali otestovat hladinu tohoto hormonu. A případně pak kupovali přípravky, které ho mají zvýšit. Podle nové studie bývají takové výzvy nepodložené a jediným cílem je finanční prospěch. Výzkumníci i lékaři varují, že nekontrolované užívání testosteronu je spojeno s vážnými zdravotními riziky.
před 11 hhodinami

Problémem útoku na Írán je nejasný cíl, řekl pro ČT generál Hodges

Zásadním problémem současné americko-izraelské operace proti Íránu je podle generála Bena Hodgese, který dříve velel americkým jednotkám v Evropě, fakt, že nikdo jasně nepopsal její cíle.
před 18 hhodinami

Rok plný selhání. Odborný žurnál zkritizoval ministra zdravotnictví Kennedyho

Jeden z nejprestižnějších zdravotních odborných časopisů světa, Lancet, vydal rozsáhlou kritiku amerického ministra zdravotnictví Roberta F. Kennedyho mladšího. List popsal změny, které Kennedy zavedl a které podle Lancetu poškodily americké zdravotnictví. Hovoří o roku plném selhání. Náprava prý bude trvat celé desítky let.
včera v 14:00

Mladé Evropanky kouří víc než jejich vrstevnice ve světě, varuje WHO

Evropské dívky ve věku 13 až 15 let mají nejvyšší míru užívání tabáku ve své věkové skupině na celém světě, informovala Světová zdravotnická organizace (WHO). Mladí Evropané vynikají také v konzumaci elektronických cigaret: užívá je nejméně každý sedmý mladistvý Evropan.
včera v 12:14

Vegetariáni méně trpí na časté rakoviny, prokázal rozsáhlý výzkum

Vegetariáni mají podstatně nižší riziko vzniku pěti typů rakoviny než lidé, kteří běžně konzumují maso, popsala nová studie, která se věnovala vlivu stravy na pravděpodobnost rozvoje rakovinného bujení. Opačnou situaci ale vědci zjistili u nejčastějšího druhu rakoviny jícnu.
včera v 10:54
Načítání...