Česká umělá inteligence překládá přesněji než lidé. Vyvinuli ji na Univerzitě Karlově

21. 9. 2020‌‌|Zdroj: ČT24, UK MFF

Prestižní vědecký časopis Nature Communications publikoval studii vědců z Matematicko-fyzikální fakulty Univerzity Karlovy, která představila anglicko-český překladač CUBBITT založený na neuronových sítích. Při překladu novinových zpráv dosahuje tento program kvality srovnatelné s výstupem profesionálních překladatelů. V zaslepeném testu byly automatické překlady hodnotiteli označeny jako v průměru o něco méně plynulé, ale obsahově mírně přesnější než překlady lidské.

Jednou z nejpopulárnějších aplikací metod umělé inteligence (AI) v oblasti zpracování přirozeného jazyka je automatický překlad z jednoho jazyka do jiného. Donedávna se předpokládalo, že pro kvalitní překlad je nutné velmi důkladné porozumění obsahu překládaného textu, a že automatizovaný překlad kvalitou srovnatelný s výsledkem lidského překladatele tedy ještě dlouho nebude na dohled. V automatizovaném překladu, stejně jako v jiných oblastech AI, nastala ale díky pokroku v takzvaném hlubokém učení v posledních letech doslova změna paradigmatu, která tuto dosavadní představu mění.

Jako významný úspěch se jeví výsledek experimentu, který pro překladový směr angličtina-čeština realizovali na Matematicko-fyzikální fakultě Univerzity Karlovy ve spolupráci s vědci z Univerzity v Oxfordu (oba též absolventi MFF UK) a z týmu Google Brain. Autoři natrénovali neuronovou síť na česko-anglickém paralelním korpusu, což je kolekce autentických anglických textů a jejich protějšků přeložených do češtiny o celkové velikosti 58 milionů párů vět.

Konec lží politiků? Umělá inteligence bude brzy umět ověřit jejich výroky v reálném čase

Výsledný překladač nazvaný CUBBITT autoři použili k převedení vzorku anglických novinových textů. Tentýž vzorek byl nezávisle přeložen profesionálními překladateli z odborné agentury. Kvalita výsledných automatických i ručních překladů byla následně hodnocena 15 rodilými mluvčími češtiny, kteří měli posoudit přesnost a plynulost. Hodnocení bylo slepé, tedy hodnotitelé neměli informaci o tom, kdo věty z jednoho jazyka do druhého převáděl.

Přesnější, ale méně plynulý

„Výsledek srovnání můžeme považovat za průlomový. Automatický překladač sice nepatrně pokulhával za lidskými překladateli v hodnocení plynulosti, byl ale v průměru o něco přesnější, pokud jde o obsahovou správnost. Naměřený výsledek byl statisticky signifikantní,“ uvedl hlavní autor studie Martin Popel z MFF UK. Podobné pozorování autoři učinili už v roce 2018, ovšem tehdy byly hodnoceny jen izolované věty bez kontextu celého článku.

Autoři studie upozorňují, že i přes představený pokrok se situace zatím výrazně liší od jiných oblastí, kde se umělá inteligence v posledních letech úspěšně utkává s člověkem. Zatímco například v šachu dnes AI poráží víceméně rutinně i nejlepší hráče světa, zde šlo o „soutěž“ s běžnými, byť profesionálními překladateli, kteří v danou chvíli ani nevěděli, že „soutěží“. Měření navíc proběhlo pouze na specifickém žánru novinových textů a výsledky rozhodně nelze zobecňovat na překladatelskou práci jako celek.