Vědci vytvořili první bilingvní programy. Naučily se překládat bez pomoci člověka

O automatickém překladu pomocí počítačů se dlouhá desetiletí mluvilo jako o pouhém snu. Ale díky neurálním sítím došlo v posledních několika letech k nebývalému pokroku v tomto oboru. Před ještě větším pokrokem ale zřejmě teprve stojíme.

Počítačové programy, které napodobují fungování lidského mozku, splnily sen mnoha generací jazykovědců i počítačových vědců – stroje dnes překládají jednoduché texty už téměř tak dobře jako lidé.

S neurálními sítěmi je ale také spojena celá řada problémů – musí se, podobně jako lidský mozek, nejprve vycvičit. A to zabere spoustu času: takovému počítačovému překladateli se musí větu po větě ukázat, jak se překládají miliony a miliony vět a slovních spojení. Jen tak se stroj naučí „chápat“, jak při tom lidský mozek postupuje.

Nyní ale možná přichází další přelom: dva vědecké týmy prakticky současně oznámily, že naučily počítač překládat, aniž by měl k dispozici druhý jazyk. Jde o výhodu, která by mohla vést k tomu, že bude možné překládat do cizích jazyků mnohem přesněji a rychleji – a která zřejmě povede k úpadku překladatelské profese.

Robot bez učitele

„Představte si, že někomu dáte hromadu čínských a hromadu arabských knih – ale žádná není stejná. A člověk by se podle toho měl být schopen naučit překládat z čínštiny do arabštiny. To vypadá nemožně, co?“ ptá se sugestivně autor první studie Mikel Artetxe. „Ale my dokázali, že počítač to dokáže!“ Jak?

Většina strojového učení, v němž se neurální sítě a další druhy počítačových algoritmů učí ze zkušenosti, je doprovázena dohledem, supervizí. Počítač se pokusí uhodnout správnou odpověď, splnit úkol, odpovědět – supervizor to vyhodnotí a počítač se pak podle toho chová dál. Je to trošku jako vztah učitele a žáka.

Při překladech u „velkých“ jazyků, jako je třeba z angličtiny do francouzštiny, to funguje velice dobře – existuje totiž množství stejných textů v obou řečech. Jenže u menších jazyků, které jsou si navíc třeba kulturně vzdálené, je problém: takový knižní materiál neexistuje a stroje se tedy nemají z čeho učit.

Stůl stojí u židle

Oba vědecké týmy, které výsledky svého výzkumu budou prezentovat na velké mezinárodní konferenci, se zaměřily na jiný postup: strojové učení bez dohlížitele. Stroje vytvářejí databáze podobností mezi jazyky zcela bez dohledu lidského elementu – vycházejí přitom z toho, že slova si jsou ve většině jazyků často velmi blízko.

Například slova „stůl“ a „židle“ jsou velmi často ve větě blízko sebe – a podobných blízkostí je jazyk plný. Programy jsou schopné vytvořit si z těchto vztahů jakousi mapu; téměř vždy jsou si takové mapy velmi podobné – jen jsou vždy obsazené slovy v odlišných jazycích. Počítače pak tyto mapy propojí a voilá, umí najednou oba jazyky a tedy i překlady mezi nimi. Podobně pak postupují i v jiných kategoriích, třeba ve skladbě a slovotvorbě.

Tam si navíc pomáhají metodou zpětného překladu, kdy se pokusí přeložit větu z jednoho jazyka do druhého. Potom ji přeloží zpět do původního jazyka – pokud není shodná s tou původní, příště to počítač udělá jinak a lépe. Učí se tak mapovat hlubší struktury jazyka.

Oba představené systémy se od sebe liší – ale jen v drobných detailech, globálně používají velmi podobné metody. Autoři obou prací navíc souhlasí s tím, že pokud se poučí z výhod druhého systému, mohou ten svůj výrazně vylepšit.

Nahrávám video
Umělé inteligence v roce 2016
Zdroj: ČT24

Tento překlad zatím není tak dobrý jako ten, který využívá Google, ale dokáže zase pracovat zcela bez lidského zásahu – to je hlavní přelom.

„Že se počítač dokáže naučit překládat i bez lidské supervize, je šokující,“ komentoval práce Di He, počítačový expert na umělé inteligence, který pracuje pro pekingskou pobočku Microsoftu. „Ale současně je to skvělé a dokazuje to, že jdeme správným směrem,“ dodává. Obě práce jsou dostupné ve webovém archivu arXiv ZDE a ZDE.

Výběr redakce

Aktuálně z rubriky Věda

Mise Artemis pro přistání na Měsíci může mít zásadní problémy, varuje inspektor

NASA nedávno změnila své plány ohledně mise na Měsíc. Stále ale doufá, že tam do roku 2028 její astronauti přistanou. Teď se objevila další překážka – podle zprávy kontrolního orgánu by let byl spojený s riziky pro bezpečnost posádky.
před 2 hhodinami

Vědci spočítali, kolik emisí způsobila válka v Gaze

Vědci poprvé spočítali, kolik emisí skleníkových plynů způsobil konflikt mezi Izraelem a teroristickým hnutím Hamás v Pásmu Gazy. Tvrdí, že v souvislosti s konfliktem se do atmosféry uvolnilo asi 33 milionů tun oxidu uhličitého, což odpovídá celoročním emisím Jordánska.
před 3 hhodinami

Češi umírají předčasně hlavně v severních regionech. Data ukazují, kde se žije nejdéle

Mapové výstupy ukazují, kde v České republice lidé nejčastěji umírají před 65. rokem života, kolik potenciálních let života se tím ztrácí a kde mají největší naději na dožití. Přehledná vizualizace velkých dat zobrazuje rozdíly na úrovni všech 206 správních obvodů obcí s rozšířenou působností.
před 8 hhodinami

Hromadné hroby odhalily míru černé smrti v Čechách

Kutnohorská kostnice je místem, které budí zájem turistů i spisovatelů. Ale také vědců; v jejím okolí je totiž pohřbeno asi 40 tisíc lidí. Nová analýza jejich kostí prokázala, jak dramaticky zasáhla české země v půlce čtrnáctého století morová epidemie.
včera v 12:25

Estonsko a Brno společně pracují na ochraně před kvantovým hackováním

Čeští a estonští vědci spojili síly, aby vybudovali přeshraniční centrum kybernetické bezpečnosti, které posílí digitální obranu Evropy tváří v tvář rostoucím hrozbám ve virtuálním prostoru.
včera v 10:55

Archeologové popsali unikátní masakr žen a dětí z doby železné

Před 2800 lety se odehrál masakr, při kterém neznámí útočníci pobili desítky žen a dětí. Archeologové teď pomocí forenzních metod zkoušejí popsat, co se tehdy vlastně stalo a proč je celá řada okolností spojených s touto masovou vraždou tak podivná.
včera v 06:30

Vědci vysvětlili „problém první noci“

Radost z cestování může mnohdy pokazit první noc na novém místě. Člověk se převaluje, má divoké sny, vzbudí ho každé šustnutí a ani druhý den si kvůli nevyspalosti moc neužije. Druhá noc už zpravidla bývá mnohem lepší. Tento fenomén se odborně označuje jeho „problém první noci“. Vědci teď exaktně popsali, v čem spočívá.
10. 3. 2026

Evropské lesy je třeba připravit na kůrovce i další požáry, varuje velký model

Podmínky pro vznik kůrovcových kalamit podobných té z let 2018 až 2022 se v budoucnosti budou opakovat, ukazuje nový model vytvořený s pomocí umělé inteligence. Podíleli se na něm i čeští vědci a předpovídá vývoj v Evropě, včetně Česka. I v nejoptimističtějším scénáři předpokládá výrazný nárůst zasažených lesů.
10. 3. 2026
Načítání...