Česká umělá inteligence překládá přesněji než lidé. Vyvinuli ji na Univerzitě Karlově

Prestižní vědecký časopis Nature Communications publikoval studii vědců z Matematicko-fyzikální fakulty Univerzity Karlovy, která představila anglicko-český překladač CUBBITT založený na neuronových sítích. Při překladu novinových zpráv dosahuje tento program kvality srovnatelné s výstupem profesionálních překladatelů. V zaslepeném testu byly automatické překlady hodnotiteli označeny jako v průměru o něco méně plynulé, ale obsahově mírně přesnější než překlady lidské.

Jednou z nejpopulárnějších aplikací metod umělé inteligence (AI) v oblasti zpracování přirozeného jazyka je automatický překlad z jednoho jazyka do jiného. Donedávna se předpokládalo, že pro kvalitní překlad je nutné velmi důkladné porozumění obsahu překládaného textu, a že automatizovaný překlad kvalitou srovnatelný s výsledkem lidského překladatele tedy ještě dlouho nebude na dohled. V automatizovaném překladu, stejně jako v jiných oblastech AI, nastala ale díky pokroku v takzvaném hlubokém učení v posledních letech doslova změna paradigmatu, která tuto dosavadní představu mění.

Jako významný úspěch se jeví výsledek experimentu, který pro překladový směr angličtina-čeština realizovali na Matematicko-fyzikální fakultě Univerzity Karlovy ve spolupráci s vědci z Univerzity v Oxfordu (oba též absolventi MFF UK) a z týmu Google Brain. Autoři natrénovali neuronovou síť na česko-anglickém paralelním korpusu, což je kolekce autentických anglických textů a jejich protějšků přeložených do češtiny o celkové velikosti 58 milionů párů vět.

Výsledný překladač nazvaný CUBBITT autoři použili k převedení vzorku anglických novinových textů. Tentýž vzorek byl nezávisle přeložen profesionálními překladateli z odborné agentury. Kvalita výsledných automatických i ručních překladů byla následně hodnocena 15 rodilými mluvčími češtiny, kteří měli posoudit přesnost a plynulost. Hodnocení bylo slepé, tedy hodnotitelé neměli informaci o tom, kdo věty z jednoho jazyka do druhého převáděl.

Přesnější, ale méně plynulý

„Výsledek srovnání můžeme považovat za průlomový. Automatický překladač sice nepatrně pokulhával za lidskými překladateli v hodnocení plynulosti, byl ale v průměru o něco přesnější, pokud jde o obsahovou správnost. Naměřený výsledek byl statisticky signifikantní,“ uvedl hlavní autor studie Martin Popel z MFF UK. Podobné pozorování autoři učinili už v roce 2018, ovšem tehdy byly hodnoceny jen izolované věty bez kontextu celého článku. 

Autoři studie upozorňují, že i přes představený pokrok se situace zatím výrazně liší od jiných oblastí, kde se umělá inteligence v posledních letech úspěšně utkává s člověkem. Zatímco například v šachu dnes AI poráží víceméně rutinně i nejlepší hráče světa, zde šlo o „soutěž“ s běžnými, byť profesionálními překladateli, kteří v danou chvíli ani nevěděli, že „soutěží“. Měření navíc proběhlo pouze na specifickém žánru novinových textů a výsledky rozhodně nelze zobecňovat na překladatelskou práci jako celek. 

Výběr redakce

Aktuálně z rubriky Věda

Grónsko je klíčové pro Trumpovu kolosální Zlatou kopuli

Americký prezident Donald Trump a další představitelé jeho administrativy tvrdí, že získání Grónska je zásadní pro úspěšné dokončení projektu Golden Dome (Zlatá kopule). Tento vesmírný protiraketový štít nové generace má ochránit Spojené státy před stále vyspělejšími protivníky, píše server BBC News.
před 6 hhodinami

Dánští archeologové objevili obří středověkou loď-hrad. Uvezla stovky tun nákladu

Objev masivní obchodní lodi u kodaňského pobřeží pomáhá vyprávět nejenom její příběh, ale také vrhá nové světlo na středověký obchod, život námořníků a také na to, jak se tyto lodi stavěly.
před 8 hhodinami

Obavy z budoucnosti mladí Číňané rozptylují pomocí AI věštců

Mladí Číňané se zamilovali do věštění. Pohled do budoucna jim už ale nenabízí kartářky, prognostici nebo tvůrci horoskopů, ale stále častěji umělé inteligence, především domácího původu.
včera v 09:00

Studie: Nejsou důkazy o spojitosti paracetamolu v těhotenství s autismem u dětí

Nová rozsáhlá studie nenašla žádné důkazy o tom, že by užívání paracetamolu v těhotenství zvyšovalo riziko autismu, ADHD a vývojové poruchy intelektu. Studii zveřejnil odborný časopis The Lancet. Těhotné ženy od užívání paracetamolu v loňském roce zrazoval americký prezident Donald Trump, který lék proti horečce a bolesti spojil s rizikem autismu u dětí.
včera v 08:44

Írán odpojil internet v panice, Starlink rušit nedokáže

Teherán odpojil internet během protestů v panice a o přístup k síti přišlo dočasně i ministerstvo zahraničí. Píše to list Financial Times s odkazem na experty. Odříznutí Íránci se navzdory hrozbě represí pokoušejí komunikovat se světem přes Starlink. Íránské úřady se marně snaží rušit signál, a tak zabavují lidem antény.
16. 1. 2026

Cítí se opuštěni elitami, sjednoceni hněvem. Co lidi spojuje v krizích, ukázal český výzkum

Co mají společného spory o roušky během covidu a hádky o pomoc Ukrajině v diskuzích na facebooku? Výzkum českých vědkyň ukazuje, že lidé v časech krize sdílejí opakující se příběhy na základě modelu „my dole“ proti „těm nahoře“. Může to na sociálních sítích posílit sounáležitost mezi lidmi, ale současně takové chování rozděluje společnost ještě víc a vytváří pocity nedůvěry vůči elitám, hlavně těm politickým a mediálním.
16. 1. 2026

Jaký bude rok 2026? Velká předpověď naznačuje vysoké teploty

Letošní rok by se mohl zařadit k těm dosud nejteplejším. Naznačují to predikce na základě analýzy historických dat a sledování dlouhodobého vývoje. Důležitou roli mají mít jevy El Niňo a La Niňa. Dosud nejteplejší byl rok 2024, ten loňský se stal třetím nejteplejším od počátku pozorování.
16. 1. 2026

Mikroplastů je tolik, že kontaminují výzkumy o množství mikroplastů

Mikroplastů je už na Zemi tolik, že se nedá pořádně říct, jak moc jich je – tak se dají shrnout výsledky několika studií, které vyšly v poslední době. Na základě důkladných analýz jejich autoři zpochybňují předchozí výzkumy, které popisovaly, kolik mikroplastů (a nanoplastů) se nachází v lidských tkáních.
16. 1. 2026
Načítání...