AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

Výběr redakce

Aktuálně z rubriky Věda

Tak intenzivní otřesy nezasáhly oblast Venezuely sto let

Otřesy, které postihly Venezuelu, jsou podle seismologů silnější, než je v této oblasti obvyklé. Doposud není zcela jasné, proč přesáhly magnitudo 7. Možná šlo o část nějakého doposud neznámého cyklu.
před 9 mminutami

Nové plasty by mohly vznikat z oxidu uhličitého. Pracuje na tom česko-francouzský tým

Proměnit problém na řešení je cílem rozsáhlé česko-francouzské spolupráce, která chce změnit nadbytek oxidu uhličitého na umělé hmoty. Jeho molekuly by měly nahradit při vzniku polymerů dnes používanou ropu.
před 2 hhodinami

VideoHůře rozpoznáváme emoce, snadněji vybuchneme, popisuje psycholog dopady vedra

„Množství krve, které má mozek k dispozici pro svoje fungování, je nižší, což se projevuje na sníženém kognitivním výkonu,“ popsal ve Studiu 6 Filip Děchtěrenko z Psychologického ústavu AV ČR dopady horka na lidský organismus. Kvůli tomu je podle něj práce ve vysokých teplotách méně produktivní. Doplňuje, že lidem klesá hladina serotoninu a dopaminu, které jsou zodpovědné za dobrou náladu, a také hůře rozpoznávají emoce. „Neutrální výraz interpretujeme jako známku agrese,“ vysvětluje. Navíc podle něj „snadněji vybuchneme, snadněji jsme konfliktní“. Doporučuje pokud možno nechat jakoukoli mentální práci na chladnější části dne a nezanedbávat hydrataci. S moderátorkou Izabelou Šroubkovou probral i nepříznivé dopady spaní v horku a doporučení, jak spánek v teplé části roku vylepšit.
před 2 hhodinami

Za současnou vlnou veder stojí omega blokování, roli může hrát i hrouda chladné vody v Atlantiku

Takovou vlnu veder, jaká panuje tento týden, ještě Evropa v dějinách měření nezažila. Proč tak intenzivní a dlouhotrvající horko přišlo, má více příčin.
před 2 hhodinami

Bez kobaltu, ale s 3D katodami. Vědci hledají bezpečnější baterie

Moderní svět by nemohl fungovat bez baterií, které dokáží akumulovat energii. Jenže také občas chytnou, vyrábí se z prvků, které těží v nelidských podmínkách malé děti, a navíc jsou zdroje na ně velmi drahé. Všechny tyto problémy by mohla vyřešit nová technologie.
před 4 hhodinami

Vědci popsali působivý řád obřích muších spermií

Spermie octomilek jsou obří, ty největší mohou mít až šest centimetrů. Kdyby měly v poměru k velikosti těla tak dlouhé spermie lidé, měřily by o deset metrů víc než plejtvák obrovský. A navíc, podle nové studie, se chovají pozoruhodně koordinovaně – na to, že pro takové chování nemají žádné smysly.
před 21 hhodinami

Hnědí trpaslíci, psychometrie i výzkum covidu. Mladí čeští vědci dostali Prémii Otto Wichterleho

Mimořádný talent na počátku vědecké dráhy – tak označila Akademie věd České republiky 23 mladých vědců a vědkyň, kterým ve středu udělila ocenění Prémie Otto Wichterleho.
před 22 hhodinami

Absolutní český teplotní rekord může padnout v neděli

Český hydrometeorologický ústav (ČHMÚ) na svých sociálních sítích uvedl, že v neděli může padnout rekord pro vůbec nejteplejší den v dějinách tuzemského měření – dosavadní zaznamenané maximum je 40,4 stupně Celsia. „Na základě aktuálních dat lze říct, že nás čeká extrémně teplý víkend bez ohledu na to, zda bude rekord překonán, nebo ne,“ napsal ČHMÚ. V dalších dnech bude předpověď dále zpřesňovat a reagovat výstrahami.
včera v 11:34
Načítání...