Umělá inteligence uspěla v testu pro lékařské oprávnění. Odpovídala smysluplně a inovativně

Umělá inteligence ChatGPT dosáhla dalšího milníku. Poté, co zaujala schopností smysluplně odpovídat na otázky, plnit nejrůznější kreativní úkoly a třeba i psát eseje nebo básně, nyní uspěla v testu, který se skládá pro získání lékařské licence ve Spojených státech.

Konverzační umělá inteligence ChatGPT dosáhla průměrného skóre přibližně 60 procent v testu, který je nutný pro složení lékařské licenční zkoušky v americké licenční zkoušce USMLE. Podle vědců, kteří ji tomuto úkolu vystavili, její odpovědi dávají ucelený vnitřní smysl a obsahují inovativní postřehy.

USMLE, kterou skládají studenti medicíny a lékaři, hodnotí znalosti z většiny lékařských oborů od biochemie přes diagnostické uvažování až po bioetiku. Vědecký tým vedený Victorem Tsengem z testu vyřadil několik otázek založených na obrázcích. Umělá inteligence je totiž navržená „jen“ jako jazykové rozhraní, obrazy zatím nerozeznává. Výzkumníci tedy otestovali program na 350 z 376 veřejných otázek z USMLE z června 2022.

Po odstranění neurčitých odpovědí dosáhl ChatGPT ve všech třech zkouškách USMLE skóre mezi 52,4 a 75 procenty. Hranice úspěšnosti je přitom každý rok přibližně šedesát procent. ChatGPT také u 88,9 procenta odpovědí přinesl alespoň jeden významný poznatek, tedy něco, co bylo nové a klinicky užitečné.

Autory testu překvapilo, že ChatGPT překonal výkon PubMedGPT, což je obdobný model umělé inteligence, ale specializovaný jen na lékařská témata. Ten dosáhl skóre jen 50,8 procenta ve stejném typu testu.

I když relativně malý rozsah vstupních dat omezil hloubku a rozsah analýz, autoři poznamenávají, že jejich zjištění poskytují náhled na potenciál ChatGPT pro zlepšení lékařského vzdělávání a případně i klinické praxe. Sami ho přitom už v praxi používají: sami vystaví lékařskou zprávu a umělá inteligence ji z nesrozumitelného lékařského žargonu přepíše do obyčejného, lidem srozumitelného jazyka.

„To, že program dosáhl úspěšného výsledku u této obtížné odborné zkoušky, a to bez jakéhokoli lidského posílení, představuje pozoruhodný milník ve vyspělosti klinické umělé inteligence,“ dodávají autoři.

ChatGPT je nový systém umělé inteligence (AI), který pracuje na principu velkého jazykového modelu. Jde o to, že umí předpovídat následující slovní sekvence tak, aby výsledné odpovědi dávaly lidem smysl. Tento program nabral spoustu znalostí při procesu učení, takže má všechny uložené ve své paměti a už nemusí pro správné odpovědi prohledávat internet. 

Výběr redakce

Aktuálně z rubriky Věda

Ceny Neuron dostali Kubala Havrdová, Jiří Grygar a mladé talenty

Během slavnostního galavečera v Planetáriu Praha ocenila nadace Neuron sedm nadějných vědkyň a vědců působících v Česku, předala cenu za propojení vědy s byznysem, cenu za rozvíjení lásky k vědě, kterou obdržel astrofyzik Jiří Grygar, a hlavní Cenu Neuron pro lékařku a vědkyni Evu Kubala Havrdovou za záchranu lidských životů a také poprvé udělila ocenění Rising Star pro zcela výjimečný talent.
před 10 hhodinami

Grónsko je klíčové pro Trumpovu kolosální Zlatou kopuli

Americký prezident Donald Trump a další představitelé jeho administrativy tvrdí, že získání Grónska je zásadní pro úspěšné dokončení projektu Golden Dome (Zlatá kopule). Tento vesmírný protiraketový štít nové generace má ochránit Spojené státy před stále vyspělejšími protivníky, píše server BBC News.
před 19 hhodinami

Dánští archeologové objevili obří středověkou loď-hrad. Uvezla stovky tun nákladu

Objev masivní obchodní lodi u kodaňského pobřeží pomáhá vyprávět nejenom její příběh, ale také vrhá nové světlo na středověký obchod, život námořníků a také na to, jak se tyto lodi stavěly.
před 22 hhodinami

Obavy z budoucnosti mladí Číňané rozptylují pomocí AI věštců

Mladí Číňané se zamilovali do věštění. Pohled do budoucna jim už ale nenabízí kartářky, prognostici nebo tvůrci horoskopů, ale stále častěji umělé inteligence, především domácího původu.
17. 1. 2026

Studie: Nejsou důkazy o spojitosti paracetamolu v těhotenství s autismem u dětí

Nová rozsáhlá studie nenašla žádné důkazy o tom, že by užívání paracetamolu v těhotenství zvyšovalo riziko autismu, ADHD a vývojové poruchy intelektu. Studii zveřejnil odborný časopis The Lancet. Těhotné ženy od užívání paracetamolu v loňském roce zrazoval americký prezident Donald Trump, který lék proti horečce a bolesti spojil s rizikem autismu u dětí.
17. 1. 2026

Írán odpojil internet v panice, Starlink rušit nedokáže

Teherán odpojil internet během protestů v panice a o přístup k síti přišlo dočasně i ministerstvo zahraničí. Píše to list Financial Times s odkazem na experty. Odříznutí Íránci se navzdory hrozbě represí pokoušejí komunikovat se světem přes Starlink. Íránské úřady se marně snaží rušit signál, a tak zabavují lidem antény.
16. 1. 2026

Cítí se opuštěni elitami, sjednoceni hněvem. Co lidi spojuje v krizích, ukázal český výzkum

Co mají společného spory o roušky během covidu a hádky o pomoc Ukrajině v diskuzích na facebooku? Výzkum českých vědkyň ukazuje, že lidé v časech krize sdílejí opakující se příběhy na základě modelu „my dole“ proti „těm nahoře“. Může to na sociálních sítích posílit sounáležitost mezi lidmi, ale současně takové chování rozděluje společnost ještě víc a vytváří pocity nedůvěry vůči elitám, hlavně těm politickým a mediálním.
16. 1. 2026

Jaký bude rok 2026? Velká předpověď naznačuje vysoké teploty

Letošní rok by se mohl zařadit k těm dosud nejteplejším. Naznačují to predikce na základě analýzy historických dat a sledování dlouhodobého vývoje. Důležitou roli mají mít jevy El Niňo a La Niňa. Dosud nejteplejší byl rok 2024, ten loňský se stal třetím nejteplejším od počátku pozorování.
16. 1. 2026
Načítání...