Česká umělá inteligence překládá přesněji než lidé. Vyvinuli ji na Univerzitě Karlově

Prestižní vědecký časopis Nature Communications publikoval studii vědců z Matematicko-fyzikální fakulty Univerzity Karlovy, která představila anglicko-český překladač CUBBITT založený na neuronových sítích. Při překladu novinových zpráv dosahuje tento program kvality srovnatelné s výstupem profesionálních překladatelů. V zaslepeném testu byly automatické překlady hodnotiteli označeny jako v průměru o něco méně plynulé, ale obsahově mírně přesnější než překlady lidské.

Jednou z nejpopulárnějších aplikací metod umělé inteligence (AI) v oblasti zpracování přirozeného jazyka je automatický překlad z jednoho jazyka do jiného. Donedávna se předpokládalo, že pro kvalitní překlad je nutné velmi důkladné porozumění obsahu překládaného textu, a že automatizovaný překlad kvalitou srovnatelný s výsledkem lidského překladatele tedy ještě dlouho nebude na dohled. V automatizovaném překladu, stejně jako v jiných oblastech AI, nastala ale díky pokroku v takzvaném hlubokém učení v posledních letech doslova změna paradigmatu, která tuto dosavadní představu mění.

Jako významný úspěch se jeví výsledek experimentu, který pro překladový směr angličtina-čeština realizovali na Matematicko-fyzikální fakultě Univerzity Karlovy ve spolupráci s vědci z Univerzity v Oxfordu (oba též absolventi MFF UK) a z týmu Google Brain. Autoři natrénovali neuronovou síť na česko-anglickém paralelním korpusu, což je kolekce autentických anglických textů a jejich protějšků přeložených do češtiny o celkové velikosti 58 milionů párů vět.

Výsledný překladač nazvaný CUBBITT autoři použili k převedení vzorku anglických novinových textů. Tentýž vzorek byl nezávisle přeložen profesionálními překladateli z odborné agentury. Kvalita výsledných automatických i ručních překladů byla následně hodnocena 15 rodilými mluvčími češtiny, kteří měli posoudit přesnost a plynulost. Hodnocení bylo slepé, tedy hodnotitelé neměli informaci o tom, kdo věty z jednoho jazyka do druhého převáděl.

Přesnější, ale méně plynulý

„Výsledek srovnání můžeme považovat za průlomový. Automatický překladač sice nepatrně pokulhával za lidskými překladateli v hodnocení plynulosti, byl ale v průměru o něco přesnější, pokud jde o obsahovou správnost. Naměřený výsledek byl statisticky signifikantní,“ uvedl hlavní autor studie Martin Popel z MFF UK. Podobné pozorování autoři učinili už v roce 2018, ovšem tehdy byly hodnoceny jen izolované věty bez kontextu celého článku. 

Autoři studie upozorňují, že i přes představený pokrok se situace zatím výrazně liší od jiných oblastí, kde se umělá inteligence v posledních letech úspěšně utkává s člověkem. Zatímco například v šachu dnes AI poráží víceméně rutinně i nejlepší hráče světa, zde šlo o „soutěž“ s běžnými, byť profesionálními překladateli, kteří v danou chvíli ani nevěděli, že „soutěží“. Měření navíc proběhlo pouze na specifickém žánru novinových textů a výsledky rozhodně nelze zobecňovat na překladatelskou práci jako celek. 

Výběr redakce

Aktuálně z rubriky Věda

Zvyšte daně na slazené nápoje, vyzývá státy WHO. Česku by to dle analýzy pomohlo

Světová zdravotnická organizace (WHO) doporučila členským zemím, aby zvýšily daně na slazené a alkoholické nápoje s cílem omezit jejich spotřebu a finančně podpořit zdravotnictví. Podle WHO fakt, že většina zemí má na tyto nápoje stále nízké daně, přispívá k nárůstu počtů nemocných obezitou, cukrovkou, chorobami srdce a rakovinou.
před 16 mminutami

Rok 2025 byl po předchozích dvou letech nejteplejším v historii měření

Rok 2025 byl třetím nejteplejším rokem v historii měření. Průměrná globální teplota dosáhla 14,97 stupně Celsia. Byl tedy jen nepatrně (o 0,01 stupně Celsia) chladnějším než rok 2023 a o 0,13 stupně Celsia chladnějším než rok 2024, který byl vůbec nejteplejším rokem v historii měření. Uvedla to meteorologická služba Evropské unie Copernicus. Posledních jedenáct let bylo zároveň nejteplejších v historii měření.
04:22Aktualizovánopřed 32 mminutami

Virus HIV se učí odolávat jedinému léku. Tvrdě za to ale platí

Vědci z americké společnosti Gilead Sciences, která má jediný účinný lék na HIV, otestovali, jestli se tento virus této látce nedokáže přizpůsobit. Výsledky naznačují, že ano, ale současně ukazují, že to ve skutečnosti nemusí být příliš nebezpečné.
před 16 hhodinami

Stárnoucímu Česku dojdou mladí lidé, ukazují velká data

Během pouhých deseti let začne odcházet do důchodu silná generace Husákových dětí. Přinese to zásadní demografickou proměnu, která změní celou českou společnost. Nejenže bude méně lidí na to, aby vydělávali na penze stále rostoucí skupině, ale především bude potřeba mnohem více sociální péče pro seniory.
10. 1. 2026Aktualizováno12. 1. 2026

První lidé lovili pomocí jedu už před 60 tisíci lety

Lidé druhu Homo sapiens na jihu Afriky používali už před šedesáti tisíci lety otrávené šípy. Dokázali to švédští vědci na základě nálezu takových zbraní na území dnešní Jihoafrické republiky. O nejstarším nálezu svého druhu informovali v článku, který zveřejnil odborný časopis Science Advances.
12. 1. 2026

„Sedmé nebe“ je úplně nový druh vesmírného objektu

Galaxie, která selhala, respektive oblak temné hmoty z počátku vesmíru – tak astronomové popisují vzdálený kosmický objekt, který objevili. Dali mu název Cloud-9, což by se dalo do češtiny nejlépe přeložit jako „Sedmé nebe“.
11. 1. 2026

Čeští vědci navrhli řešení klimatické změny. Klíčem je kácení severských lesů

Vědci navrhli prozkoumat možnost ukládání uhlíku pomocí splavování masy vykácených stromů do Severního ledového oceánu z lesů, které rostou v povodí sibiřských veletoků Obu, Jeniseje a Leny a severoamerických řek Yukonu a Mackenzie. V této oblasti se nachází asi sto gigatun uhlíku, který je uložený ve dřevě stromů. Vykácením přibližně jednoho procenta těchto lesů a splavením kmenů do oceánu by bylo možné snížit množství emisí o jednu gigatunu, tedy desetinu emisí vypuštěných lidstvem za rok.
10. 1. 2026

Dvacet pod nulou, nebo jen pět? Předpovědi počasí na příští týden se silně liší

Úspěšnost předpovědí počasí se v posledních letech zásadně zlepšila. I tak se ale vyskytne situace, která představuje i pro nejmodernější předpovědní modely a zkušené meteorology značnou výzvu. Momentálně se týká příštího týdne.
9. 1. 2026
Načítání...