AI si o vědě vymýšlí jako bulvár, varuje studie

Většina chatbotů nedokáže shrnout vědecké studie, aniž by zkreslovala výsledky. Nejčastěji přehání a jen těžko se jí toto chování dá vymluvit. Problém je podle autorů nové studie složitější, než se zdá. Zejména proto, že čím novější verze AI, tím hůř si vedly. A navíc, když se vědci pokoušeli ovlivňovat chatboty k větší přesnosti, dosáhli tím pravého opaku.

Podle studie mezinárodního vědeckého týmu Uweho Peterse poskytují velké jazykové modely, jako je například ChatGPT a DeepSeek, při shrnutí vědeckých studií nepřesné závěry až v 73 procentech případů.

Studie hodnotila, jak přesně deset předních velkých jazykových modelů – včetně ChatGPT, DeepSeek, Claude a LLaMA – shrnuje abstrakty a plné texty článků z nejlepších vědeckých a lékařských časopisů, jako jsou například Nature, Science a The Lancet. Vědci testovali tyto AI po dobu jednoho roku a shromáždili celkem 4900 souhrnů vytvořených pomocí modelů, které se běžně označují za umělou inteligenci (AI).

Bulvární a neoblomné

Šest z deseti modelů systematicky zveličovalo tvrzení obsažená v původních textech. Podle autorů často nenápadným, ale o to působivějším způsobem: například měnilo opatrná tvrzení v minulém čase na rozsáhlejší verzi v přítomném čase. Kupříkladu poznámku „léčba byla v této studii účinná“ si AI vyložila jako „léčba je účinná“. Tyto změny mohou čtenáře uvést v omyl, že zjištění platí mnohem šířeji, než je tomu ve skutečnosti.

Podobné chování je často spojené s bulvárním tiskem, který výsledky výzkumů přehání, ale mnohdy se mu nevyhne ani seriózní komunikace vědy v mainstreamových médiích. Vědci mají se zjednodušujícími vyjádřeními dlouhodobě problém. Zveličování nemusí být u novinářů snahou šokovat nebo přehánět, někdy jde o vedlejší produkt snahy předat složitou informaci laické veřejnosti v co možná nejpochopitelnější formě.

Pozoruhodné podle autorů studie je, že vědci nebyli schopní přimět jazykové modely k tomu, aby své postoje korigovaly. Když chatboty výslovně vyzvali, aby se vyhnuly výše popsaným nepřesnostem, nastal pravý opak: modely vytvářely příliš zobecněné závěry dvakrát častěji, než když dostaly jednoduchou žádost o shrnutí.

„Tento efekt je znepokojivý,“ řekl Peters. „Studenti, vědci i politici se mohou domnívat, že pokud požádají ChatGPT, aby se vyhnul nepřesnostem, získají spolehlivější shrnutí. Naše výsledky ale dokazují opak,“ dodal autor výzkumu.

Čím novější, tím horší

Studie také přímo porovnala shrnutí stejných článků generované chatbotem a napsané člověkem. Chatboti téměř pětkrát častěji než jejich lidské protějšky vytvářeli rozsáhlá zobecnění. „Znepokojující také je,“ řekl Peters, „že novější modely umělé inteligence, jako ChatGPT-4o a DeepSeek, si vedly hůře než starší modely.“

Jedním z možných vysvětlení je, že se AI modely učí na nevhodných datech. Tedy právě například na přehánění bulvárního nebo nekvalitního popularizačního tisku, který má potenciál značného šíření na internetu a snadno se tak dostane i do tréninkových dat AI.

Nejpřesnější byl mezi testovanými modely Claude. Pro lepší výsledky autoři práce doporučují také nastavit chatbotům nižší „teplotu“, což je parametr určující kreativitu.

„Pokud chceme, aby umělá inteligence podporovala vědeckou gramotnost, a ne ji podkopávala,“ dodal Peters, „potřebujeme větší ostražitost a testování těchto systémů v kontextu vědecké komunikace.“

Výběr redakce

Aktuálně z rubriky Věda

Do ugandského národního parku se po dekádách vrátili nosorožci

Tento týden byli v národním parku Kidepo Valley na severovýchodě Ugandy vypuštěni do volné přírody dva bílí nosorožci jižní. Jsou prvními ze skupiny osmi jedinců, kteří se mají usadit v parku, kde byl poslední nosorožec zabit v roce 1983. Na jejich navrácení do místní přírody nyní částečně dohlíží Ugandský úřad pro ochranu divoké zvěře (UWA).
před 6 hhodinami

Vědci popsali, kdy se mezi indiány rozšířily luky a šípy

Nový archeologický výzkum zkoumal nejstarší zbraňové artefakty nalezené v Severní Americe. Vědcům se je podařilo velmi přesně datovat, takže poprvé dokázali popsat, kdy tam luky a šípy nahradily oštěpy a praky.
před 7 hhodinami

Archeologové našli ve Velkém Meziříčí středověkou studnu a asi i základ pranýře

Ve středu Velkého Meziříčí letos archeologové odkryli zasypanou středověkou studnu a kruhový podstavec, který zřejmě sloužil jako pranýř. Našli také základy středověké pece. Oznámil to Šimon Kochan ze zapsaného ústavu Archaia Brno, který na místě pracuje. Záchranný archeologický výzkum doprovází postupnou obnovu náměstí a přilehlých ulic, která začala loni zjara. Stavební práce budou podle radnice dokončené příští rok.
před 7 hhodinami

VideoUnikátním ekosystémem Pražského hradu se zabývali přírodovědci

Pražský hrad byl sídlem králů, císařů i prezidentů. Ale také více než sedmi stovek druhů rostlin, 220 druhů hmyzu a více než čtyřiceti druhů ptáků. Teď tam přírodovědci popsali dokonce několik druhů, které až doposud z tuzemské přírody vůbec neznali – včetně unikátního roztoče pancířníka. Nejzajímavějším místem v areálu je podle biologů Jelení příkop, který obsahuje neporušenou „krajinu“, jež sahá až do dob mamutích stepí z doby ledové.
před 10 hhodinami

„Panna Maria ze Szopienic“ zachraňovala olověné děti. O hrdinství čtyřicet let mlčela

Panna Maria ze Szopienic nebo slezská Erin Brokovich - to jsou dvě přirovnání, která se používají v souvislosti s polskou pediatričkou Jolantou Wadowskou-Król. Hrdinka nového seriálu platformy Netflix Olověné děti zachránila v podstatě tajně až skoro ilegálně stovky dětí před vážnými zdravotními problémy. Ty jim způsobovala otrava olovem z hutí v polských Szopienicích. To se ovšem nelíbilo komunistům, a tak Wadowská za své hrdinství tvrdě zaplatila. A svůj příběh držela v utajení - až dokud ho neobjevila její vnučka a o několik let později i filmaři.
před 11 hhodinami

Víc než polovina kojenců tráví čas u mobilu nebo televize, vyplývá z průzkumu

Celkem padesát pět procent dětí mladších než dvanáct měsíců pravidelně tráví čas u mobilu, tabletu či televize. Více než hodinu denně tato zařízení sleduje čtyřicet jedna procent batolat od jednoho do dvou let. Mezi předškoláky je to šedesát osm procent dětí. Vyplývá to z průzkumu agentury STEM, který představil spolek Zvedni hlavu a Nadace O2. Podle předsedkyně Asociace klinických logopedů Barbory Richtrové jsou čísla výrazně vyšší, než jaká jsou v tomto ohledu doporučení odborníků.
včera v 17:26

Virus chikungunya se šíří do Evropy, kvůli oteplování asi pronikne i do Česka

Až donedávna byl virus chikungunya spojený jen s tropickými zeměmi. Vloni už ale způsobil stovky nákaz i ve Francii a Itálii. Britští vědci teď detailně popsali, jak moc na sever může proniknout. V rozhovoru pro Českou televizi upozornili, že mezi ohroženými zeměmi je i Česko.
včera v 12:51

VideoAI a válka s Íránem zdražují elektroniku. Na víc vyjdou počítače či mobily

Situace kolem války na Blízkém východě se kromě cen energií a komodit negativně dotýká i elektroniky. Znamená to například dražší počítače nebo mobilní telefony, řekl pro ČT Vladimír Janíček z elektrotechnické fakulty ČVUT. Už před několika měsíci kvůli vysoké poptávce ze strany datových center pro umělou inteligenci přitom vystřelily nahoru ceny hlavně některých základních počítačových komponent – zejména pamětí. Nyní se může do cen čipů propsat ztížená logistika i dražší výroba způsobená nedostatkem energetických surovin, jakými jsou plyn a ropa.
včera v 11:07
Načítání...