Umělá inteligence Google se naučila odezírat slova ze rtů. Lépe než lidé

Projekt DeepMind společnosti Google dokáže stále nové věci. Nyní se ve spolupráci s univerzitou v Oxfordu naučil odezírat ze rtů, stačilo mu k tomu jen dost dlouho se dívat na televizi.

Vědci nabídli počítačovému programu 5000 hodin televizního vysílání ze šesti různých stanic. Celkem videa obsahovala 118 000 sekvencí. Oxfordský tým nejprve „trénoval“ program na záznamech z let 2010 až 2015. Potom ho otestoval na videích z letošního roku – umělá inteligence měla za úkol odezírat celé fráze a věty. Dokázala to velice úspěšně.

Když pak výzkumný tým srovnával výsledky počítače s lidským profesionálem, ukázalo se, že stroj byl v „překladu“ 200 náhodně vybraných klipů výrazně úspěšnější. Zatímco profesionální odezírač dokázal správně označit jen 12,4 procent slov, umělá inteligence byla úspěšná v 46,8 procentech případů. Navíc většina neúspěchů se týkala jen drobností, například písmene „s“ na konci slova. Tyto výsledky jsou mnohem lepší než jakýkoli jiný automatický program.

Program DeepMind už se učí i taktické a strategické dovednosti – na hře Starcraft:

„Jde o první velký krok k tomu získat plně automatické systémy pro odezírání,“ popsali vědci svůj úspěch. Aby si stroje dokázaly takovou dovednost osvojit, musí se učit na obrovském vzorku dat. Zdá se, že už brzy člověka v tomto oboru zcela nahradí. Shodou okolností před dvěma týdny další umělá inteligence jménem GRID (také z Oxfordu) výrazně překonala v odezírání člověka. Tento pokus byl ovšem založen jen na omezeném slovníku 51 slov, jež umí stroj dokonale rozeznávat.

DeepMind už umí rozeznávat víc než 17 500 slov, navíc dokáže rozlišovat mnohem komplikovanější gramatické kategorie. Oxford i Google už slíbili, že televizní data, která získali od BBC, zveřejní pro další podobné projekty jako volně dostupný zdroj informací.

Největším problémem při učení bylo to, že řada videoklipů od BBC měla asynchronní zvukovou a obrazovou stopu – počítač pak nebyl schopen správně přiřadit správné významy k pohybům úst. To celý proces učení výrazně zdrželo.

Co s tím teď?

Aplikací v reálném životě se nabízí víc než dost. Jednou z těch užitečných je například automatické vytváření titulků u videa, ale nabízejí se i mnohem rozporuplnější využití. Pokud by se podařilo spojit tento systém například se systémem bezpečnostních kamer, mohly by stroje monitorovat každé vyřčené slovo.

3 minuty
Google shromažďuje kulturní dědictví světa
Zdroj: ČT24

Pochopitelně by se našlo uplatnění na letištích, v tajných službách i bezpečnosti obecně. Samozřejmě s využitím rovnou přichází také obava ze zneužití – od špionážních služeb, až po příliš silné zasahování státu do soukromí občanů.

Možné je také to, že objev změní komunikaci s mobilními telefony – když vám bude přístroj odezírat slova přímo ze rtů, neměl by být problém s ním komunikovat zcela potichu. Obrovským způsobem mohou v budoucnosti pokročilé aplikace pomoci neslyšícím. Chytrý mobil odečte slova ze rtů mluvčího a převede je na text, řeč nebo znaky.

Výběr redakce

Aktuálně z rubriky Věda

Africké kolonie tučňáků se za sotva dekádu zmenšily o 95 procent

Kde se ještě před dvěma dekádami rozléhalo kejhání desítek tisíc tučňáků, panuje dnes ticho. Ptáci většinou vyhladověli k smrti. Stalo se to poté, co u břehů Jižní Afriky, kde žili, zmizely sardinky.
před 8 hhodinami

Česko je na prahu chřipkové epidemie

Tuzemsko stojí podle hlavní hygieničky Barbory Mackové na prahu chřipkové epidemie. Podle dat za minulý týden přibylo v Česku od týdne předchozího nemocných asi o šestinu, roste zejména počet nemocných dětí ve školním věku. Mezi různými infekcemi dýchacích cest se zvýšil podíl chřipky, pacientů za týden přibylo skoro o třetinu, uvedl Státní zdravotní ústav (SZÚ).
včeraAktualizovánopřed 8 hhodinami

Británie a Španělsko kvůli nebývale silné chřipkové vlně doporučují roušky

Letos přišla do západní Evropy chřipková epidemie dříve a silněji než v minulých letech. Navíc ji tvoří kmen viru, který je spíše vzácnější, takže proti němu hůř chrání protilátky z očkování i prodělání nemoci v minulosti.
před 9 hhodinami

Večer ho přemalovali, ráno tam byl zas. Lennonova pomníku se komunisté báli

Místem jedněch z prvních protirežimních akcí v komunistickém Československu, které předznamenaly listopad 1989, byla i takzvaná Lennonova zeď. Ta v Praze na Velkopřevorském náměstí vznikla několik dnů poté, co se před 45 lety v New Yorku poblíž Central Parku ozvalo pět výstřelů. Duševně nemocný Mark Chapman tam 8. prosince 1980 před jedenáctou hodinou večer postřelil hudebníka Johna Lennona. Bývalý člen skupiny Beatles pak během několika minut zemřel. Po celém světě se následně zvedla mohutná vlna piety, která se přelila až do mírových happeningů.
před 13 hhodinami

Do Lužických hor se vrátily divoké kočky. Fotopasti ukázaly koťata

Vzácné kočky divoké už zase žijí v Lužických horách. Že se tam úspěšně usadily, prokazují nejen genetické analýzy z odebraných vzorků srsti a trusu, ale také fotopasti Hnutí Duha, které odhalily jejich mláďata.
před 13 hhodinami

Nanotyrannus nebyl jen mladý T. rex, definitivně potvrdili vědci

Vědci desetiletí debatovali o tom, zda masožravý dinosaurus Nanotyrannus nebyl ve skutečnosti jen mladým jedincem druhu Tyrannosaurus rex. Zdá se však, že během pěti týdnů byla tato záležitost definitivně vyřešena dvěma novými studiemi. Ty ukazují, že Nanotyrannus se od Tyranosaura rexe značně lišil.
před 15 hhodinami

Čeští vědci by si měli více věřit, zaznělo v Událostech, komentářích z ekonomiky

České start-upy i zavedené společnosti vyvíjejí špičkové technologie, se kterými jsou úspěšné v tuzemsku i na mezinárodním poli. Stát se je snaží motivovat přímo prostřednictvím různých dotací, ale i nepřímo skrze daňové odpočty na výzkum a vývoj. Navzdory tomu se česká ekonomika v takzvaném indexu inovativnosti spíše propadá. O příčinách poklesu a možnostech zlepšení v Událostech, komentářích z ekonomiky debatovali výzkumnice z Technické univerzity Liberec Markéta Hujerová, výkonná ředitelka Czechitas Senta Čermáková a hlavní ekonom ČSOB Jan Bureš. Debatou provázely Vanda Kofroňová a Tereza Gleichová.
7. 12. 2025

Vědci chtějí změnit jeden z nejnepříjemnějších zvuků na světě

Zvuk zubní vrtačky je tak nepříjemný, že může lidi od návštěvy dentisty odradit, upozorňují vědci. Hledají proto cestu, jak tento problém alespoň zmenšit.
7. 12. 2025
Načítání...