AI si o vědě vymýšlí jako bulvár, varuje studie

Většina chatbotů nedokáže shrnout vědecké studie, aniž by zkreslovala výsledky. Nejčastěji přehání a jen těžko se jí toto chování dá vymluvit. Problém je podle autorů nové studie složitější, než se zdá. Zejména proto, že čím novější verze AI, tím hůř si vedly. A navíc, když se vědci pokoušeli ovlivňovat chatboty k větší přesnosti, dosáhli tím pravého opaku.

Podle studie mezinárodního vědeckého týmu Uweho Peterse poskytují velké jazykové modely, jako je například ChatGPT a DeepSeek, při shrnutí vědeckých studií nepřesné závěry až v 73 procentech případů.

Studie hodnotila, jak přesně deset předních velkých jazykových modelů – včetně ChatGPT, DeepSeek, Claude a LLaMA – shrnuje abstrakty a plné texty článků z nejlepších vědeckých a lékařských časopisů, jako jsou například Nature, Science a The Lancet. Vědci testovali tyto AI po dobu jednoho roku a shromáždili celkem 4900 souhrnů vytvořených pomocí modelů, které se běžně označují za umělou inteligenci (AI).

Bulvární a neoblomné

Šest z deseti modelů systematicky zveličovalo tvrzení obsažená v původních textech. Podle autorů často nenápadným, ale o to působivějším způsobem: například měnilo opatrná tvrzení v minulém čase na rozsáhlejší verzi v přítomném čase. Kupříkladu poznámku „léčba byla v této studii účinná“ si AI vyložila jako „léčba je účinná“. Tyto změny mohou čtenáře uvést v omyl, že zjištění platí mnohem šířeji, než je tomu ve skutečnosti.

Podobné chování je často spojené s bulvárním tiskem, který výsledky výzkumů přehání, ale mnohdy se mu nevyhne ani seriózní komunikace vědy v mainstreamových médiích. Vědci mají se zjednodušujícími vyjádřeními dlouhodobě problém. Zveličování nemusí být u novinářů snahou šokovat nebo přehánět, někdy jde o vedlejší produkt snahy předat složitou informaci laické veřejnosti v co možná nejpochopitelnější formě.

Pozoruhodné podle autorů studie je, že vědci nebyli schopní přimět jazykové modely k tomu, aby své postoje korigovaly. Když chatboty výslovně vyzvali, aby se vyhnuly výše popsaným nepřesnostem, nastal pravý opak: modely vytvářely příliš zobecněné závěry dvakrát častěji, než když dostaly jednoduchou žádost o shrnutí.

„Tento efekt je znepokojivý,“ řekl Peters. „Studenti, vědci i politici se mohou domnívat, že pokud požádají ChatGPT, aby se vyhnul nepřesnostem, získají spolehlivější shrnutí. Naše výsledky ale dokazují opak,“ dodal autor výzkumu.

Čím novější, tím horší

Studie také přímo porovnala shrnutí stejných článků generované chatbotem a napsané člověkem. Chatboti téměř pětkrát častěji než jejich lidské protějšky vytvářeli rozsáhlá zobecnění. „Znepokojující také je,“ řekl Peters, „že novější modely umělé inteligence, jako ChatGPT-4o a DeepSeek, si vedly hůře než starší modely.“

Jedním z možných vysvětlení je, že se AI modely učí na nevhodných datech. Tedy právě například na přehánění bulvárního nebo nekvalitního popularizačního tisku, který má potenciál značného šíření na internetu a snadno se tak dostane i do tréninkových dat AI.

Nejpřesnější byl mezi testovanými modely Claude. Pro lepší výsledky autoři práce doporučují také nastavit chatbotům nižší „teplotu“, což je parametr určující kreativitu.

„Pokud chceme, aby umělá inteligence podporovala vědeckou gramotnost, a ne ji podkopávala,“ dodal Peters, „potřebujeme větší ostražitost a testování těchto systémů v kontextu vědecké komunikace.“

Výběr redakce

Aktuálně z rubriky Věda

Auta jsou dál největšími znečišťovateli měst. Problémem jsou filtry pevných částic

Automobilová doprava zůstává hlavním znečišťovatelem ovzduší v tuzemských městech. Přesto se situace i díky přísnějším zákonům v posledních letech výrazně zlepšuje. Hlavním problémem ale stále zůstávají nefunkční, nebo dokonce chybějící filtry pevných částic, a to u naftových i benzinových aut. Poukázala na to měření vědců z ČVUT a z Akademie věd.
před 8 hhodinami

Ve stockholmské kavárně člověk slouží umělé inteligenci

Kávu sice nalévá lidská ruka, ale za pultem v experimentální kavárně ve Stockholmu tahá za nitky něco mnohem méně tradičního. Začínající firma Andon Labs se sídlem v San Franciscu svěřila vedení kavárny Andon Café ve švédském hlavním městě zástupkyni umělé inteligence (AI), které říkají Mona, napsala agentura AP.
před 15 hhodinami

Archeologové nově přiblížili příběh lékaře, který zahynul v Pompejích

Stále existuje mnoho příběhů, které čekají na to, až budou vyprávěny, a které se vynořují z obrovského množství nálezů, jež pod vrstvami sopečných vyvrženin zůstaly v Pompejích. A řadu příběhů rozvíjí a zpřesňují opakovaná prostudování. Teď se to podařilo v jednom z nejlépe prozkoumaných míst – slavné Zahradě utečenců. Výpočetní tomografie pomohla vědcům přiblížit příběh lékaře.
před 18 hhodinami

Kamenný vrták, nemocný neandertálec a párátko. Experti popsali první operaci zubu

První známý zubařský zákrok se odehrál asi před šedesáti tisíci lety. Provedl ho neandertálec na jiném neandertálci – podle nové studie britských a ruských vědců „určitě úspěšně“.
před 21 hhodinami

NASA: Části mexického hlavního města se propadají o dva centimetry měsíčně

Některé části mexického hlavního města Mexico City se propadají o více než dva centimetry měsíčně, uvedl americký Národní úřad pro letectví a vesmír (NASA) s odkazem na nové měření z vesmíru.
17. 5. 2026

Vědci popsali nejdelšího dinosaura jihovýchodní Asie. Je větší než tyrannosaurus

Výzkumníci v Thajsku identifikovali dosud neznámý druh dinosaura. Byl největší v jihovýchodní Asii a vážil přibližně tolik jako čtyři sloni afričtí. O poznatcích publikovaných ve vědeckém časopisu Scientific Reports informovala americká veřejnoprávní rozhlasová stanice NPR.
17. 5. 2026

Před dvaceti lety varoval Al Gore svět před klimatickou krizí

Před dvaceti lety vstoupil do kin dokument, který zásadně proměnil veřejnou debatu o změně klimatu. Snímek An Inconvenient Truth („Nepříjemná pravda“) s bývalým americkým viceprezidentem Alem Gorem v hlavní roli se v roce 2006 stal globálním fenoménem. Pro miliony lidí šlo o první setkání s představou, že klimatická změna není vzdáleným problémem budoucnosti, ale procesem probíhajícím právě teď. O dvě dekády později se ale nabízí otázka: Jak dobře film obstál ve světle aktuálních poznatků?
16. 5. 2026

V prvním kole přijímacích zkoušek na střední školy uspělo více zájemců než vloni

V prvním kole přijímacích zkoušek na střední školy uspělo 93,3 procenta žáků, kteří se hlásili z devátých tříd základních škol. Je to podobně jako loni, kdy jich podle aktualizovaných dat bylo 92,9 procenta, informovala v pátek v tiskové zprávě státní organizace Cermat. Do čtyřletých a kratších oborů letos školy přijaly 89,8 procenta uchazečů. Je to více než v roce 2025, kdy bylo podle aktualizovaných dat Cermatu přijato 87,9 procenta uchazečů.
15. 5. 2026Aktualizováno15. 5. 2026
Načítání...