AI si o vědě vymýšlí jako bulvár, varuje studie

Většina chatbotů nedokáže shrnout vědecké studie, aniž by zkreslovala výsledky. Nejčastěji přehání a jen těžko se jí toto chování dá vymluvit. Problém je podle autorů nové studie složitější, než se zdá. Zejména proto, že čím novější verze AI, tím hůř si vedly. A navíc, když se vědci pokoušeli ovlivňovat chatboty k větší přesnosti, dosáhli tím pravého opaku.

Podle studie mezinárodního vědeckého týmu Uweho Peterse poskytují velké jazykové modely, jako je například ChatGPT a DeepSeek, při shrnutí vědeckých studií nepřesné závěry až v 73 procentech případů.

Studie hodnotila, jak přesně deset předních velkých jazykových modelů – včetně ChatGPT, DeepSeek, Claude a LLaMA – shrnuje abstrakty a plné texty článků z nejlepších vědeckých a lékařských časopisů, jako jsou například Nature, Science a The Lancet. Vědci testovali tyto AI po dobu jednoho roku a shromáždili celkem 4900 souhrnů vytvořených pomocí modelů, které se běžně označují za umělou inteligenci (AI).

Bulvární a neoblomné

Šest z deseti modelů systematicky zveličovalo tvrzení obsažená v původních textech. Podle autorů často nenápadným, ale o to působivějším způsobem: například měnilo opatrná tvrzení v minulém čase na rozsáhlejší verzi v přítomném čase. Kupříkladu poznámku „léčba byla v této studii účinná“ si AI vyložila jako „léčba je účinná“. Tyto změny mohou čtenáře uvést v omyl, že zjištění platí mnohem šířeji, než je tomu ve skutečnosti.

Podobné chování je často spojené s bulvárním tiskem, který výsledky výzkumů přehání, ale mnohdy se mu nevyhne ani seriózní komunikace vědy v mainstreamových médiích. Vědci mají se zjednodušujícími vyjádřeními dlouhodobě problém. Zveličování nemusí být u novinářů snahou šokovat nebo přehánět, někdy jde o vedlejší produkt snahy předat složitou informaci laické veřejnosti v co možná nejpochopitelnější formě.

Pozoruhodné podle autorů studie je, že vědci nebyli schopní přimět jazykové modely k tomu, aby své postoje korigovaly. Když chatboty výslovně vyzvali, aby se vyhnuly výše popsaným nepřesnostem, nastal pravý opak: modely vytvářely příliš zobecněné závěry dvakrát častěji, než když dostaly jednoduchou žádost o shrnutí.

„Tento efekt je znepokojivý,“ řekl Peters. „Studenti, vědci i politici se mohou domnívat, že pokud požádají ChatGPT, aby se vyhnul nepřesnostem, získají spolehlivější shrnutí. Naše výsledky ale dokazují opak,“ dodal autor výzkumu.

Čím novější, tím horší

Studie také přímo porovnala shrnutí stejných článků generované chatbotem a napsané člověkem. Chatboti téměř pětkrát častěji než jejich lidské protějšky vytvářeli rozsáhlá zobecnění. „Znepokojující také je,“ řekl Peters, „že novější modely umělé inteligence, jako ChatGPT-4o a DeepSeek, si vedly hůře než starší modely.“

Jedním z možných vysvětlení je, že se AI modely učí na nevhodných datech. Tedy právě například na přehánění bulvárního nebo nekvalitního popularizačního tisku, který má potenciál značného šíření na internetu a snadno se tak dostane i do tréninkových dat AI.

Nejpřesnější byl mezi testovanými modely Claude. Pro lepší výsledky autoři práce doporučují také nastavit chatbotům nižší „teplotu“, což je parametr určující kreativitu.

„Pokud chceme, aby umělá inteligence podporovala vědeckou gramotnost, a ne ji podkopávala,“ dodal Peters, „potřebujeme větší ostražitost a testování těchto systémů v kontextu vědecké komunikace.“

Výběr redakce

Aktuálně z rubriky Věda

Umělá inteligence zabíjí tu dětskou, varuje výzkum

V této fázi vývoje převažují rizika využívání generativní umělé inteligence (AI) ve vzdělávání nad výhodami, říkají američtí autoři studie Centra pro univerzální vzdělávání Brookings Institution. Takzvaní chatboti dětem pomáhají s referáty, úkoly a učením, současně jim toho ale podle průzkumu až příliš mnoho berou.
před 6 hhodinami

Švýcarská nemocnice vyrábí metry umělé kůže pro popálené při požáru

Po požáru ve švýcarském zimním středisku Crans-Montana, kde při silvestrovských oslavách zahynulo čtyřicet lidí, 116 utrpělo zranění a desítky jsou stále hospitalizovány, pracuje laboratoř na výrobu kůže v centru buněčné produkce Univerzitní nemocnice kantonu Vaud na plné obrátky. Pokouší se pomoci zachránit pacienty s rozsáhlými popáleninami. Speciální zařízení v obci Epalinges nedaleko Lausanne je totiž jediné svého druhu v Evropě.
před 8 hhodinami

Pouštní národy lovily žraloky už v době kamenné, ukázal český výzkum

Pravěcí obyvatelé jihu Arábie se už před zhruba sedmi tisíci lety ve velké míře živili mořskými zdroji a troufli si i na tak velkou kořist, jako byli žraloci, vyplývá z výzkumu týmu Archeologického ústavu Akademie věd ČR (AV ČR). Ten v Ománu objevil nejstarší megalitický kolektivní hrob v jižní Arábii.
před 12 hhodinami

Posádka mise Crew-11 se vrátila z ISS kvůli zdraví jednoho z astronautů

V Tichém oceánu dopoledne středoevropského času přistála kosmická loď s čtyřčlennou posádkou NASA. Z Mezinárodní vesmírné stanice (ISS) se vrátila o čtyři měsíce dřív, než bylo v plánu, kvůli zdravotnímu stavu jednoho z astronautů.
08:18Aktualizovánopřed 13 hhodinami

Od ISS se na Zemi předčasně vrací loď Dragon kvůli zdravotnímu stavu astronauta

Od Mezinárodní vesmírné stanice (ISS) se ve středu odpoutala kosmická loď Dragon se čtyřmi astronauty, které americký Národní úřad pro letectví a vesmír (NASA) stahuje předčasně z mise kvůli zdravotnímu stavu jednoho z nich. Přistání lodě na Zemi se očekává ve čtvrtek okolo 9:40 SEČ. Podle zdravotního ředitele NASA Jamese Polka nejde o nouzovou evakuaci.
před 23 hhodinami

Rok 2025 byl po předchozích dvou letech nejteplejším v historii měření

Rok 2025 byl třetím nejteplejším rokem v historii měření. Průměrná globální teplota dosáhla 14,97 stupně Celsia. Byl tedy jen nepatrně (o 0,01 stupně Celsia) chladnějším než rok 2023 a o 0,13 stupně Celsia chladnějším než rok 2024, který byl vůbec nejteplejším rokem v historii měření. Uvedla to meteorologická služba Evropské unie Copernicus. Posledních jedenáct let bylo zároveň nejteplejších v historii měření.
včeraAktualizovánovčera v 16:19

Vědci naznačili, proč jsou někteří primáti homosexuální

Homosexualita je u savců natolik rozšířená, že to podle vědců nemůže být ani náhoda, ani omyl. Hledají proto evoluční příčiny a nový výzkum přinesl rovnou několik zajímavých poznatků.
včera v 14:48

Riziko jo-jo efektu je u léků na hubnutí zásadní, zjistili vědci

Nová studie vědců z Oxfordu odhalila velkou hrozbu toho, že po vysazení nejmodernějších a velmi účinných léků proti obezitě se hmotnost opět velmi rychle vrací.
včera v 12:35
Načítání...