Umělá inteligence uspěla v testu pro lékařské oprávnění. Odpovídala smysluplně a inovativně

Umělá inteligence ChatGPT dosáhla dalšího milníku. Poté, co zaujala schopností smysluplně odpovídat na otázky, plnit nejrůznější kreativní úkoly a třeba i psát eseje nebo básně, nyní uspěla v testu, který se skládá pro získání lékařské licence ve Spojených státech.

Konverzační umělá inteligence ChatGPT dosáhla průměrného skóre přibližně 60 procent v testu, který je nutný pro složení lékařské licenční zkoušky v americké licenční zkoušce USMLE. Podle vědců, kteří ji tomuto úkolu vystavili, její odpovědi dávají ucelený vnitřní smysl a obsahují inovativní postřehy.

USMLE, kterou skládají studenti medicíny a lékaři, hodnotí znalosti z většiny lékařských oborů od biochemie přes diagnostické uvažování až po bioetiku. Vědecký tým vedený Victorem Tsengem z testu vyřadil několik otázek založených na obrázcích. Umělá inteligence je totiž navržená „jen“ jako jazykové rozhraní, obrazy zatím nerozeznává. Výzkumníci tedy otestovali program na 350 z 376 veřejných otázek z USMLE z června 2022.

Po odstranění neurčitých odpovědí dosáhl ChatGPT ve všech třech zkouškách USMLE skóre mezi 52,4 a 75 procenty. Hranice úspěšnosti je přitom každý rok přibližně šedesát procent. ChatGPT také u 88,9 procenta odpovědí přinesl alespoň jeden významný poznatek, tedy něco, co bylo nové a klinicky užitečné.

Autory testu překvapilo, že ChatGPT překonal výkon PubMedGPT, což je obdobný model umělé inteligence, ale specializovaný jen na lékařská témata. Ten dosáhl skóre jen 50,8 procenta ve stejném typu testu.

I když relativně malý rozsah vstupních dat omezil hloubku a rozsah analýz, autoři poznamenávají, že jejich zjištění poskytují náhled na potenciál ChatGPT pro zlepšení lékařského vzdělávání a případně i klinické praxe. Sami ho přitom už v praxi používají: sami vystaví lékařskou zprávu a umělá inteligence ji z nesrozumitelného lékařského žargonu přepíše do obyčejného, lidem srozumitelného jazyka.

„To, že program dosáhl úspěšného výsledku u této obtížné odborné zkoušky, a to bez jakéhokoli lidského posílení, představuje pozoruhodný milník ve vyspělosti klinické umělé inteligence,“ dodávají autoři.

ChatGPT je nový systém umělé inteligence (AI), který pracuje na principu velkého jazykového modelu. Jde o to, že umí předpovídat následující slovní sekvence tak, aby výsledné odpovědi dávaly lidem smysl. Tento program nabral spoustu znalostí při procesu učení, takže má všechny uložené ve své paměti a už nemusí pro správné odpovědi prohledávat internet. 

Výběr redakce

Aktuálně z rubriky Věda

V Chorvatsku našli přes dva tisíce let starou terakotovou hlavu

Chorvatští archeologové a speleologové našli při průzkumu jeskyně Crno jezero na dalmatském poloostrově Pelješac terakotovou hlavu zobrazující starořeckou divadelní masku. Předmět, který lze datovat do 4. až 3. století před naším letopočtem, je uvnitř dutý a v horní části má otvor sloužící k zavěšení, pravděpodobně na zeď. Takové masky jsou často spojovány s divadelními představeními a kultem boha vína Dionýsa, který je považován za patrona divadla. O nálezu informovalo Archeologické muzeum v Dubrovníku.
23. 5. 2026

Klimatická změna ukusuje Evropě jaro. Nástup léta začíná být náhlý

Jaro bývá řadou lidí označováno jako jejich nejoblíbenější roční období. Jenže v kontextu prohlubující se změny klimatu pomalu přestává platit stav, kdy je přechod mezi jarem a létem ve střední Evropě příjemně pozvolný.
23. 5. 2026

Celosvětový výskyt duševních poruch se od roku 1990 téměř zdvojnásobil, ukazuje studie

Duševních poruch ve světě od roku 1990 téměř dvojnásobně přibylo a v současnosti jimi trpí zhruba 1,2 miliardy lidí. Vyplývá to ze studie Institutu pro měření a vyhodnocování zdravotního stavu (IHME) při Washingtonské univerzitě, kterou ve spolupráci s Queenslandskou univerzitou zveřejnil časopis The Lancet. Výzkum upozorňuje také na výrazný nárůst v Řecku.
22. 5. 2026

Vědci z Lille vyvíjejí mužské antikoncepční tělísko, na trhu by mohlo být do roku 2033

Vyvíjené mužské antikoncepční tělísko je „malou svorkou“, která se zavádí během patnácti minut v lokální anestezii. Její antikoncepční účinek je čistě mechanický a mohl by trvat až tři roky.
22. 5. 2026
Načítání...