Umělá inteligence Google se naučila odezírat slova ze rtů. Lépe než lidé

Projekt DeepMind společnosti Google dokáže stále nové věci. Nyní se ve spolupráci s univerzitou v Oxfordu naučil odezírat ze rtů, stačilo mu k tomu jen dost dlouho se dívat na televizi.

Vědci nabídli počítačovému programu 5000 hodin televizního vysílání ze šesti různých stanic. Celkem videa obsahovala 118 000 sekvencí. Oxfordský tým nejprve „trénoval“ program na záznamech z let 2010 až 2015. Potom ho otestoval na videích z letošního roku – umělá inteligence měla za úkol odezírat celé fráze a věty. Dokázala to velice úspěšně.

Když pak výzkumný tým srovnával výsledky počítače s lidským profesionálem, ukázalo se, že stroj byl v „překladu“ 200 náhodně vybraných klipů výrazně úspěšnější. Zatímco profesionální odezírač dokázal správně označit jen 12,4 procent slov, umělá inteligence byla úspěšná v 46,8 procentech případů. Navíc většina neúspěchů se týkala jen drobností, například písmene „s“ na konci slova. Tyto výsledky jsou mnohem lepší než jakýkoli jiný automatický program.

Program DeepMind už se učí i taktické a strategické dovednosti – na hře Starcraft:

„Jde o první velký krok k tomu získat plně automatické systémy pro odezírání,“ popsali vědci svůj úspěch. Aby si stroje dokázaly takovou dovednost osvojit, musí se učit na obrovském vzorku dat. Zdá se, že už brzy člověka v tomto oboru zcela nahradí. Shodou okolností před dvěma týdny další umělá inteligence jménem GRID (také z Oxfordu) výrazně překonala v odezírání člověka. Tento pokus byl ovšem založen jen na omezeném slovníku 51 slov, jež umí stroj dokonale rozeznávat.

DeepMind už umí rozeznávat víc než 17 500 slov, navíc dokáže rozlišovat mnohem komplikovanější gramatické kategorie. Oxford i Google už slíbili, že televizní data, která získali od BBC, zveřejní pro další podobné projekty jako volně dostupný zdroj informací.

Největším problémem při učení bylo to, že řada videoklipů od BBC měla asynchronní zvukovou a obrazovou stopu – počítač pak nebyl schopen správně přiřadit správné významy k pohybům úst. To celý proces učení výrazně zdrželo.

Co s tím teď?

Aplikací v reálném životě se nabízí víc než dost. Jednou z těch užitečných je například automatické vytváření titulků u videa, ale nabízejí se i mnohem rozporuplnější využití. Pokud by se podařilo spojit tento systém například se systémem bezpečnostních kamer, mohly by stroje monitorovat každé vyřčené slovo.

Nahrávám video

Pochopitelně by se našlo uplatnění na letištích, v tajných službách i bezpečnosti obecně. Samozřejmě s využitím rovnou přichází také obava ze zneužití – od špionážních služeb, až po příliš silné zasahování státu do soukromí občanů.

Možné je také to, že objev změní komunikaci s mobilními telefony – když vám bude přístroj odezírat slova přímo ze rtů, neměl by být problém s ním komunikovat zcela potichu. Obrovským způsobem mohou v budoucnosti pokročilé aplikace pomoci neslyšícím. Chytrý mobil odečte slova ze rtů mluvčího a převede je na text, řeč nebo znaky.

Výběr redakce

Aktuálně z rubriky Věda

VideoLetní obloha nabízí krásu i poučení. Astronom radí, co pozorovat

Začátek července přichází s kombinací teplých večerů, jasné oblohy a volného času. Astronom Pavel Suchan doporučuje, kam v této době na noční obloze hledět, aby se člověk něco dozvěděl o vesmíru a viděl to nejzajímavější, co letní obloha nabízí.
před 14 hhodinami

Robotický tahač letí zachránit teleskop NASA, který se rychle blíží k Zemi

Do vesmíru bylo v pátek vysláno trojramenné robotické vesmírné plavidlo, které má zachránit dalekohled amerického Národního úřadu pro letectví a vesmír (NASA) dříve, než by mohl shořet v zemské atmosféře. Napsala o tom agentura AP.
před 16 hhodinami

El Niño je tady. Ještě zesílí a přinese extrémní počasí, varuje WMO

Podle Světové meteorologické organizace (WMO) se v tropickém Pacifiku vyvinuly podmínky jevu El Niño. Vědci předpovídají, že v nadcházejících měsících rychle zesílí, čímž se v mnoha částech světa zvýší pravděpodobnost výskytu vln veder, sucha, silných srážek a dalších extrémních povětrnostních jevů.
před 20 hhodinami

Kanibalismus škodí lidskému zdraví, proto se neuchytil, tvrdí vědci

Kanibalismus má nepříznivé dopady na zdraví, což je hlavním důvodem, proč se v lidské společnosti neuchytil, tvrdí dvojice vědců z Polska a Česka. Pomocí matematického modelu dospěli k závěru, že dlouhodobé pojídání jiných lidí šíří v komunitě nemoci a vede k jejímu rozpadu, napsala agentura Reuters.
před 21 hhodinami

Vědci popsali, jak nebezpečný patogen plíživě získal imunitu vůči antibiotikům

Ukryté na nemocničních chodbách, šířící se v malých nenápadných vlnkách. Z hlediska lidského času pomalu a nenápadně, ale současně nezastavitelně a tak, aby co nejlépe odolávaly lidské medicíně. A podařilo se jim to – z obyčejných bakterií se staly „superbakterie“ odolné vůči většině antibiotik. Vědci teď popsali, jak tato cesta vypadala.
před 23 hhodinami

Americká vědkyně vytvořila umělé buňky, které se umí samy rozmnožovat

Dělí se, replikují svůj genom, vypadají jako živé. Ale tyto buňky vznikly pod rukama vědců v laboratoři. Od opravdového umělého života je sice dělí ještě propast, ale jsou prvním náznakem toho, jak by v budoucnosti mohl vypadat.
2. 7. 2026

Obři na jídelníčku. První obyvatelé Ameriky byli specialisté na lov megafauny

Nejstarší původní obyvatelé Ameriky se velmi úzce potravně specializovali.. Kamkoliv na tomto kontinentu vkročili – od Aljašky až po nejjižnější části Latinské Ameriky – tam lovili tu největší možnou kořist. Tedy zvířata, která se dnes označují za megafaunu.
2. 7. 2026

Tři mohyly, 150 generací pohřbívání. Čeští archeologové popsali unikátní místo

Více než čtyři a půl tisíce let se pravěké civilizace vracely na pohřebiště v polských Muszkowicích. Na dlouholetý význam tohoto posvátného místa přišli společně čeští a polští archeologové. Zatímco většinu podobných mohyl v tuzemsku zničilo intenzivní zemědělství, v Muszkowicích se pohřebiště dochovala včetně nadzemních částí.
2. 7. 2026

Evropský pohled