AI si o vědě vymýšlí jako bulvár, varuje studie

Většina chatbotů nedokáže shrnout vědecké studie, aniž by zkreslovala výsledky. Nejčastěji přehání a jen těžko se jí toto chování dá vymluvit. Problém je podle autorů nové studie složitější, než se zdá. Zejména proto, že čím novější verze AI, tím hůř si vedly. A navíc, když se vědci pokoušeli ovlivňovat chatboty k větší přesnosti, dosáhli tím pravého opaku.

Podle studie mezinárodního vědeckého týmu Uweho Peterse poskytují velké jazykové modely, jako je například ChatGPT a DeepSeek, při shrnutí vědeckých studií nepřesné závěry až v 73 procentech případů.

Studie hodnotila, jak přesně deset předních velkých jazykových modelů – včetně ChatGPT, DeepSeek, Claude a LLaMA – shrnuje abstrakty a plné texty článků z nejlepších vědeckých a lékařských časopisů, jako jsou například Nature, Science a The Lancet. Vědci testovali tyto AI po dobu jednoho roku a shromáždili celkem 4900 souhrnů vytvořených pomocí modelů, které se běžně označují za umělou inteligenci (AI).

Bulvární a neoblomné

Šest z deseti modelů systematicky zveličovalo tvrzení obsažená v původních textech. Podle autorů často nenápadným, ale o to působivějším způsobem: například měnilo opatrná tvrzení v minulém čase na rozsáhlejší verzi v přítomném čase. Kupříkladu poznámku „léčba byla v této studii účinná“ si AI vyložila jako „léčba je účinná“. Tyto změny mohou čtenáře uvést v omyl, že zjištění platí mnohem šířeji, než je tomu ve skutečnosti.

Podobné chování je často spojené s bulvárním tiskem, který výsledky výzkumů přehání, ale mnohdy se mu nevyhne ani seriózní komunikace vědy v mainstreamových médiích. Vědci mají se zjednodušujícími vyjádřeními dlouhodobě problém. Zveličování nemusí být u novinářů snahou šokovat nebo přehánět, někdy jde o vedlejší produkt snahy předat složitou informaci laické veřejnosti v co možná nejpochopitelnější formě.

Pozoruhodné podle autorů studie je, že vědci nebyli schopní přimět jazykové modely k tomu, aby své postoje korigovaly. Když chatboty výslovně vyzvali, aby se vyhnuly výše popsaným nepřesnostem, nastal pravý opak: modely vytvářely příliš zobecněné závěry dvakrát častěji, než když dostaly jednoduchou žádost o shrnutí.

„Tento efekt je znepokojivý,“ řekl Peters. „Studenti, vědci i politici se mohou domnívat, že pokud požádají ChatGPT, aby se vyhnul nepřesnostem, získají spolehlivější shrnutí. Naše výsledky ale dokazují opak,“ dodal autor výzkumu.

Čím novější, tím horší

Studie také přímo porovnala shrnutí stejných článků generované chatbotem a napsané člověkem. Chatboti téměř pětkrát častěji než jejich lidské protějšky vytvářeli rozsáhlá zobecnění. „Znepokojující také je,“ řekl Peters, „že novější modely umělé inteligence, jako ChatGPT-4o a DeepSeek, si vedly hůře než starší modely.“

Jedním z možných vysvětlení je, že se AI modely učí na nevhodných datech. Tedy právě například na přehánění bulvárního nebo nekvalitního popularizačního tisku, který má potenciál značného šíření na internetu a snadno se tak dostane i do tréninkových dat AI.

Nejpřesnější byl mezi testovanými modely Claude. Pro lepší výsledky autoři práce doporučují také nastavit chatbotům nižší „teplotu“, což je parametr určující kreativitu.

„Pokud chceme, aby umělá inteligence podporovala vědeckou gramotnost, a ne ji podkopávala,“ dodal Peters, „potřebujeme větší ostražitost a testování těchto systémů v kontextu vědecké komunikace.“

Výběr redakce

Aktuálně z rubriky Věda

Překonání rekordu o 1,5 stupně je bezprecedentní, upozornil ČHMÚ

Současná klimatická změna je podle Českého hydrometeorologického ústavu (ČHMÚ) mimořádně rychlá a lidé se na ni musí adaptovat. Překonání teplotního maxima pro Česko o 1,5 stupně, jako se to stalo tento víkend, je podle meteorologů „naprosto bezprecedentní“.
před 47 mminutami

Pravěká jeskyně byla plná lidských těl. Teď vědci zjistili, že byla zřejmě jen ženská

Před asi 300 tisíci lety žil na jihu Afriky druh pravěkého člověka Homo naledi, který byl mnohem menší než současní lidé, ale možná už své mrtvé pohřbíval. Vědci teď prozkoumali největší takové možné pohřebiště a s překvapením zjistili, že jsou tam zřejmě pouze ženská těla. Studie vyšla v časopise Cell.
před 14 hhodinami

Vaječníky po menopauze mohou pomáhat s imunitou, naznačuje studie

Když vědci zkoumali lidské vaječníky, zjistili, jak se v nich projevuje stárnutí. Aby zjistili víc, provedli několik experimentů na myších – u nich ověřili, že když přestanou vlivem věku fungovat, získají jiné funkce. Autoři nové studie věří, že u lidí by mohl proces fungovat podobně.
včera v 10:00

Teplotní rekordy v pátek ohlásily desítky stanic. Podívejte se

Česko v posledních dnech sevřely mimořádně vysoké teploty. V pátek padl první teplotní rekord už po jedenácté hodině dopoledne. Nejtepleji bylo stejně jako v několika předchozích dnech v Doksanech na Litoměřicku, kde naměřili 38,1 stupně Celsia. Rekordní hodnota pro 26. červen to ale pro tuto stanici není, v roce 2019 tam bylo ještě o osm desetin stupně tepleji. Rekordy pro 26. června padly na 66 ze 171 stanic, které měří více než 30 let, což představuje 39 procent.
26. 6. 2026Aktualizováno26. 6. 2026
Načítání...