Česká umělá inteligence překládá přesněji než lidé. Vyvinuli ji na Univerzitě Karlově

Prestižní vědecký časopis Nature Communications publikoval studii vědců z Matematicko-fyzikální fakulty Univerzity Karlovy, která představila anglicko-český překladač CUBBITT založený na neuronových sítích. Při překladu novinových zpráv dosahuje tento program kvality srovnatelné s výstupem profesionálních překladatelů. V zaslepeném testu byly automatické překlady hodnotiteli označeny jako v průměru o něco méně plynulé, ale obsahově mírně přesnější než překlady lidské.

Jednou z nejpopulárnějších aplikací metod umělé inteligence (AI) v oblasti zpracování přirozeného jazyka je automatický překlad z jednoho jazyka do jiného. Donedávna se předpokládalo, že pro kvalitní překlad je nutné velmi důkladné porozumění obsahu překládaného textu, a že automatizovaný překlad kvalitou srovnatelný s výsledkem lidského překladatele tedy ještě dlouho nebude na dohled. V automatizovaném překladu, stejně jako v jiných oblastech AI, nastala ale díky pokroku v takzvaném hlubokém učení v posledních letech doslova změna paradigmatu, která tuto dosavadní představu mění.

Jako významný úspěch se jeví výsledek experimentu, který pro překladový směr angličtina-čeština realizovali na Matematicko-fyzikální fakultě Univerzity Karlovy ve spolupráci s vědci z Univerzity v Oxfordu (oba též absolventi MFF UK) a z týmu Google Brain. Autoři natrénovali neuronovou síť na česko-anglickém paralelním korpusu, což je kolekce autentických anglických textů a jejich protějšků přeložených do češtiny o celkové velikosti 58 milionů párů vět.

Výsledný překladač nazvaný CUBBITT autoři použili k převedení vzorku anglických novinových textů. Tentýž vzorek byl nezávisle přeložen profesionálními překladateli z odborné agentury. Kvalita výsledných automatických i ručních překladů byla následně hodnocena 15 rodilými mluvčími češtiny, kteří měli posoudit přesnost a plynulost. Hodnocení bylo slepé, tedy hodnotitelé neměli informaci o tom, kdo věty z jednoho jazyka do druhého převáděl.

Přesnější, ale méně plynulý

„Výsledek srovnání můžeme považovat za průlomový. Automatický překladač sice nepatrně pokulhával za lidskými překladateli v hodnocení plynulosti, byl ale v průměru o něco přesnější, pokud jde o obsahovou správnost. Naměřený výsledek byl statisticky signifikantní,“ uvedl hlavní autor studie Martin Popel z MFF UK. Podobné pozorování autoři učinili už v roce 2018, ovšem tehdy byly hodnoceny jen izolované věty bez kontextu celého článku. 

Autoři studie upozorňují, že i přes představený pokrok se situace zatím výrazně liší od jiných oblastí, kde se umělá inteligence v posledních letech úspěšně utkává s člověkem. Zatímco například v šachu dnes AI poráží víceméně rutinně i nejlepší hráče světa, zde šlo o „soutěž“ s běžnými, byť profesionálními překladateli, kteří v danou chvíli ani nevěděli, že „soutěží“. Měření navíc proběhlo pouze na specifickém žánru novinových textů a výsledky rozhodně nelze zobecňovat na překladatelskou práci jako celek. 

Výběr redakce

Aktuálně z rubriky Věda

Vědci na Trutnovsku našli v trase D11 hromadné vojenské hroby z 18. a 19. století

Vědci v trase budoucí dálnice D11 v úseku mezi Jaroměří a Trutnovem objevili hromadné vojenské hroby z 18. a 19. století, které považují za mimořádný archeologický soubor doplňující poznání tehdejších válečných konfliktů. Kromě hrobu z druhé slezské války z roku 1745, o kterém již informovali, našli také tři z roku 1866.
před 22 hhodinami

Ničivé počasí v části Asie není náhoda, ale klimatické varování, tvrdí vědci

Jihovýchodní Asie letos čelí neobvykle silným bouřím. Počet obětí povodní a sesuvů půdy v Indonésii, na Srí Lance a v Thajsku dosud přesáhl 1400, přičemž více než tisícovka lidí se stále pohřešuje. V Indonésii zůstávají celé vesnice odříznuté od zbytku světa poté, co voda zničila mosty a silnice. Tisíce lidí na Srí Lance nemají přístup k pitné vodě, zatímco thajský premiér přiznal nedostatečnou reakci své vlády, píše agentura AP.
včera v 11:44

Stárnutí ženských vajíček se dá zvrátit, zjistili náhodou čeští vědci

Projevy stárnutí ženských vajíček, takzvaných oocytů, je možné zvrátit a jejich poškození opravit. To, co bylo dosud považováno za biologicky nemožné, dokázal mezinárodní tým vedený reprodukční bioložkou Helenou Fulkovou z Ústavu experimentální medicíny Akademie věd ČR, který o průlomu informoval v tiskové zprávě. Výsledky zveřejnil časopis Aging Cell. Podle vědců otevírají závěry práce nové otázky o biologii stárnutí a také prostor pro vývoj budoucích léčebných postupů.
včera v 10:47

Univerzitní spin-offy sílí. Pomáhají výzkumu a míří do světového byznysu

Univerzitní firmy, takzvané spin-offy, které vysokým školám přinášejí zisk, jsou v zahraničí běžné. V tuzemsku se tento model prosazuje pomaleji. Na konferenci v Ostravě, pořádané agenturou CzechInvest, zazněly příklady úspěšných firem, které dokážou z akademického výzkumu vytvořit mezinárodně konkurenceschopný produkt i finanční přínos pro vysoké školy.
včera v 09:24
Načítání...