AI si o vědě vymýšlí jako bulvár, varuje studie

Většina chatbotů nedokáže shrnout vědecké studie, aniž by zkreslovala výsledky. Nejčastěji přehání a jen těžko se jí toto chování dá vymluvit. Problém je podle autorů nové studie složitější, než se zdá. Zejména proto, že čím novější verze AI, tím hůř si vedly. A navíc, když se vědci pokoušeli ovlivňovat chatboty k větší přesnosti, dosáhli tím pravého opaku.

Podle studie mezinárodního vědeckého týmu Uweho Peterse poskytují velké jazykové modely, jako je například ChatGPT a DeepSeek, při shrnutí vědeckých studií nepřesné závěry až v 73 procentech případů.

Studie hodnotila, jak přesně deset předních velkých jazykových modelů – včetně ChatGPT, DeepSeek, Claude a LLaMA – shrnuje abstrakty a plné texty článků z nejlepších vědeckých a lékařských časopisů, jako jsou například Nature, Science a The Lancet. Vědci testovali tyto AI po dobu jednoho roku a shromáždili celkem 4900 souhrnů vytvořených pomocí modelů, které se běžně označují za umělou inteligenci (AI).

Bulvární a neoblomné

Šest z deseti modelů systematicky zveličovalo tvrzení obsažená v původních textech. Podle autorů často nenápadným, ale o to působivějším způsobem: například měnilo opatrná tvrzení v minulém čase na rozsáhlejší verzi v přítomném čase. Kupříkladu poznámku „léčba byla v této studii účinná“ si AI vyložila jako „léčba je účinná“. Tyto změny mohou čtenáře uvést v omyl, že zjištění platí mnohem šířeji, než je tomu ve skutečnosti.

Podobné chování je často spojené s bulvárním tiskem, který výsledky výzkumů přehání, ale mnohdy se mu nevyhne ani seriózní komunikace vědy v mainstreamových médiích. Vědci mají se zjednodušujícími vyjádřeními dlouhodobě problém. Zveličování nemusí být u novinářů snahou šokovat nebo přehánět, někdy jde o vedlejší produkt snahy předat složitou informaci laické veřejnosti v co možná nejpochopitelnější formě.

Pozoruhodné podle autorů studie je, že vědci nebyli schopní přimět jazykové modely k tomu, aby své postoje korigovaly. Když chatboty výslovně vyzvali, aby se vyhnuly výše popsaným nepřesnostem, nastal pravý opak: modely vytvářely příliš zobecněné závěry dvakrát častěji, než když dostaly jednoduchou žádost o shrnutí.

„Tento efekt je znepokojivý,“ řekl Peters. „Studenti, vědci i politici se mohou domnívat, že pokud požádají ChatGPT, aby se vyhnul nepřesnostem, získají spolehlivější shrnutí. Naše výsledky ale dokazují opak,“ dodal autor výzkumu.

Čím novější, tím horší

Studie také přímo porovnala shrnutí stejných článků generované chatbotem a napsané člověkem. Chatboti téměř pětkrát častěji než jejich lidské protějšky vytvářeli rozsáhlá zobecnění. „Znepokojující také je,“ řekl Peters, „že novější modely umělé inteligence, jako ChatGPT-4o a DeepSeek, si vedly hůře než starší modely.“

Jedním z možných vysvětlení je, že se AI modely učí na nevhodných datech. Tedy právě například na přehánění bulvárního nebo nekvalitního popularizačního tisku, který má potenciál značného šíření na internetu a snadno se tak dostane i do tréninkových dat AI.

Nejpřesnější byl mezi testovanými modely Claude. Pro lepší výsledky autoři práce doporučují také nastavit chatbotům nižší „teplotu“, což je parametr určující kreativitu.

„Pokud chceme, aby umělá inteligence podporovala vědeckou gramotnost, a ne ji podkopávala,“ dodal Peters, „potřebujeme větší ostražitost a testování těchto systémů v kontextu vědecké komunikace.“

Výběr redakce

Aktuálně z rubriky Věda

Španělské úřady prověřují, zda africký mor prasat neunikl z tamní laboratoře

Španělská policie od čtvrtka prověřuje laboratoř v Katalánsku. Cílem vyšetřování je objasnit, jestli za vznikem ohnisek afrického moru prasat, který v regionu zabil přinejmenším 26 divočáků, nestojí právě toto pracoviště nebo jiná z pěti laboratoří v této oblasti, které s virem pracují.
19. 12. 2025

Lyžování na ledovci se stane vzpomínkou. V Alpách jich mohou zbýt tři procenta

Horské ledovce hrají mimořádně důležitou roli. Ovlivňují lokální i globální klimatické systémy, zásobují řeky vodou, formují krajinu a mají i kulturní a estetický význam pro místní komunity. V neposlední řadě je důležitý také jejich turistický potenciál. Nová vědecká studie však ukazuje, že jejich zánik se zrychluje a většina z nich zmizí už během tohoto století.
19. 12. 2025

Bez pravdy, gulagů a naděje. Nový ruský slovník je nástrojem politické moci

Nový výkladový slovník státního jazyka, který letos vydalo Rusko, využívá jazyk jako politický nástroj moci. Zcela v něm například chybí pojmy jako pravda, gulag nebo stalinismus. Podle Jany Kockové ze Slovanského ústavu Akademie věd je dokument závazný pro státní orgány, úředníky i učitele a může mít konkrétní společenské i právní důsledky.
18. 12. 2025

Do Evropy se vrátila lepra, případy hlásí Rumunsko a Chorvatsko

V polovině prosince oznámil rumunský ministr zdravotnictví Alexandru Rogobete, že se v zemi dva lidé nakazili leprou. Jde o první potvrzené případy lepry v Rumunsku za více než čtyřicet let. Obě nakažené ženy pracovaly v lázních ve městě Kluž jako masérky. Další dva lidé čekají na výsledky testů. Úřady lázně, kde se nemoc objevila, uzavřely. Jeden případ zaznamenalo i Chorvatsko. Lepra není výrazně nakažlivá a valná většina lidí je proti ní imunní.
18. 12. 2025

Novým šéfem NASA se stal Jared Isaacman

Americký Senát ve středu potvrdil miliardáře a soukromého astronauta Jareda Isaacmana jako nového šéfa Národního úřadu pro letectví a vesmír (NASA), píše agentura Reuters. Isaacman se tak stal patnáctým šéfem úřadu. V republikány ovládaném Senátu pro něj hlasovalo 67 senátorů, proti jich bylo 30.
17. 12. 2025

Podvodníci okradli děti s rakovinou o desítky milionů, které na ně vybrali

Mezinárodní skupina podvodníků roky okrádala rodiny s dětmi, které trpí rakovinou. Pomocí emotivních videí na YouTube poptávala peníze, které si pak ale nechala. Zneužívání dětí a rodin odhalilo rozsáhlé dvouleté vyšetřování stanice BBC. Riziko, že člověk přispěje na podvodné sbírky, lze snížit následováním jednoduchých zásad.
17. 12. 2025
Doporučujeme

Glumův efekt poškozuje vědu a hlavně doktorandy, naznačila studie

Vědci si příliš hromadí znalosti i výzkumná témata pro sebe, tvrdí nový výzkum, který fenomén nazval Glumův efekt, podle postavy z knihy Pán prstenů J. R. R. Tolkiena. Glum si žárlivě střežil Prsten podobně, jako si dnes významná část vědců sobecky hlídá „svoje témata“. Poškozuje to zejména doktorandy, ale také celou vědu, protože tak v laboratořích a výzkumných ústavech vzniká toxická atmosféra, naznačuje studie, která ale má metodologické nedostatky.
17. 12. 2025

Británie se vrací k programu Erasmus

Británie a Evropská unie se ve středu dohodly, že britským studentům umožní opětovné zapojení do oblíbeného studentského výměnného programu Erasmus+. Jde o malý, ale symbolický signál zlepšení vztahů mezi Spojeným královstvím a EU po brexitu, napsala agentura Reuters.
17. 12. 2025
Načítání...