Umělá inteligence uspěla v testu pro lékařské oprávnění. Odpovídala smysluplně a inovativně

Umělá inteligence ChatGPT dosáhla dalšího milníku. Poté, co zaujala schopností smysluplně odpovídat na otázky, plnit nejrůznější kreativní úkoly a třeba i psát eseje nebo básně, nyní uspěla v testu, který se skládá pro získání lékařské licence ve Spojených státech.

Konverzační umělá inteligence ChatGPT dosáhla průměrného skóre přibližně 60 procent v testu, který je nutný pro složení lékařské licenční zkoušky v americké licenční zkoušce USMLE. Podle vědců, kteří ji tomuto úkolu vystavili, její odpovědi dávají ucelený vnitřní smysl a obsahují inovativní postřehy.

USMLE, kterou skládají studenti medicíny a lékaři, hodnotí znalosti z většiny lékařských oborů od biochemie přes diagnostické uvažování až po bioetiku. Vědecký tým vedený Victorem Tsengem z testu vyřadil několik otázek založených na obrázcích. Umělá inteligence je totiž navržená „jen“ jako jazykové rozhraní, obrazy zatím nerozeznává. Výzkumníci tedy otestovali program na 350 z 376 veřejných otázek z USMLE z června 2022.

Po odstranění neurčitých odpovědí dosáhl ChatGPT ve všech třech zkouškách USMLE skóre mezi 52,4 a 75 procenty. Hranice úspěšnosti je přitom každý rok přibližně šedesát procent. ChatGPT také u 88,9 procenta odpovědí přinesl alespoň jeden významný poznatek, tedy něco, co bylo nové a klinicky užitečné.

Autory testu překvapilo, že ChatGPT překonal výkon PubMedGPT, což je obdobný model umělé inteligence, ale specializovaný jen na lékařská témata. Ten dosáhl skóre jen 50,8 procenta ve stejném typu testu.

I když relativně malý rozsah vstupních dat omezil hloubku a rozsah analýz, autoři poznamenávají, že jejich zjištění poskytují náhled na potenciál ChatGPT pro zlepšení lékařského vzdělávání a případně i klinické praxe. Sami ho přitom už v praxi používají: sami vystaví lékařskou zprávu a umělá inteligence ji z nesrozumitelného lékařského žargonu přepíše do obyčejného, lidem srozumitelného jazyka.

„To, že program dosáhl úspěšného výsledku u této obtížné odborné zkoušky, a to bez jakéhokoli lidského posílení, představuje pozoruhodný milník ve vyspělosti klinické umělé inteligence,“ dodávají autoři.

ChatGPT je nový systém umělé inteligence (AI), který pracuje na principu velkého jazykového modelu. Jde o to, že umí předpovídat následující slovní sekvence tak, aby výsledné odpovědi dávaly lidem smysl. Tento program nabral spoustu znalostí při procesu učení, takže má všechny uložené ve své paměti a už nemusí pro správné odpovědi prohledávat internet. 

Výběr redakce

Aktuálně z rubriky Věda

Bez kobaltu, ale s 3D katodami. Vědci hledají bezpečnější baterie

Moderní svět by nemohl fungovat bez baterií, které dokáží akumulovat energii. Jenže také občas chytnou, vyrábí se z prvků, které těží v nelidských podmínkách malé děti, a navíc jsou zdroje na ně velmi drahé. Všechny tyto problémy by mohla vyřešit nová technologie.
před 1 hhodinou

Vědci popsali působivý řád obřích muších spermií

Spermie octomilek jsou obří, ty největší mohou mít až šest centimetrů. Kdyby měly v poměru k velikosti těla tak dlouhé spermie lidé, měřily by o deset metrů víc než plejtvák obrovský. A navíc, podle nové studie, se chovají pozoruhodně koordinovaně – na to, že pro takové chování nemají žádné smysly.
před 18 hhodinami

Hnědí trpaslíci, psychometrie i výzkum covidu. Mladí čeští vědci dostali Prémii Otto Wichterleho

Mimořádný talent na počátku vědecké dráhy – tak označila Akademie věd České republiky 23 mladých vědců a vědkyň, kterým ve středu udělila ocenění Prémie Otto Wichterleho.
před 19 hhodinami

Absolutní český teplotní rekord může padnout v neděli

Český hydrometeorologický ústav (ČHMÚ) na svých sociálních sítích uvedl, že v neděli může padnout rekord pro vůbec nejteplejší den v dějinách tuzemského měření – dosavadní zaznamenané maximum je 40,4 stupně Celsia. „Na základě aktuálních dat lze říct, že nás čeká extrémně teplý víkend bez ohledu na to, zda bude rekord překonán, nebo ne,“ napsal ČHMÚ. V dalších dnech bude předpověď dále zpřesňovat a reagovat výstrahami.
před 23 hhodinami

Čína technologicky pokořila USA. Nejrychlejší superpočítač mají v Šen-čenu

Nejvýkonnější, oficiálně známý počítač mají poprvé od roku 2017 v Číně. Nachází se v Národním superpočítačovém centru v Šen-čenu. Z prvního místa tak sesadil americký superpočítač El Capitan. Vyplývá to z žebříčku pěti set nejrychlejších počítačů na světě, který se zveřejňuje dvakrát do roka.
včera v 10:06

LSD se posunulo jako možný lék proti depresi do „nadějné“ fáze

Psychedelika se zmiňují v souvislosti s léčbou vážných duševních nemocí stále častěji – řada výsledků vypadá velmi nadějně, ale zatím chyběla kvalitnější potvrzení jejich účinnosti prostřednictvím velkých dlouhodobých studií. Teď jedna taková vyšla a naznačuje, že potenciál těchto substancí je nemalý.
23. 6. 2026

Do Česka přiteče přes sto milionů na špičkovou vědu. ERC granty mají dva projekty

ERC granty jsou způsob, jak Evropská unie podporuje vědu v členských zemích. Pečlivě vybrané projekty mohou takto získat financování, které posune výzkum dál. V úterý byly zveřejněny ERC granty v kategorii Advanced (Pokročilý). Získaly je rovnou dva tuzemské projekty – jeden z Olomouce, druhý z Prahy.
23. 6. 2026

Stromy vyhrály evoluční závod, protože se nejlépe přizpůsobily suchu

Na otázku, jak se stalo, že vznikly stromy a co jim umožnilo stát se jedněmi z největších a nejdéle žijících organismů na Zemi, se pokusil odpovědět velký mezinárodní výzkum, ve kterém hráli významnou roli i experti z Česka.
23. 6. 2026
Načítání...