Umělá inteligence Google se naučila odezírat slova ze rtů. Lépe než lidé

Projekt DeepMind společnosti Google dokáže stále nové věci. Nyní se ve spolupráci s univerzitou v Oxfordu naučil odezírat ze rtů, stačilo mu k tomu jen dost dlouho se dívat na televizi.

Vědci nabídli počítačovému programu 5000 hodin televizního vysílání ze šesti různých stanic. Celkem videa obsahovala 118 000 sekvencí. Oxfordský tým nejprve „trénoval“ program na záznamech z let 2010 až 2015. Potom ho otestoval na videích z letošního roku – umělá inteligence měla za úkol odezírat celé fráze a věty. Dokázala to velice úspěšně.

Když pak výzkumný tým srovnával výsledky počítače s lidským profesionálem, ukázalo se, že stroj byl v „překladu“ 200 náhodně vybraných klipů výrazně úspěšnější. Zatímco profesionální odezírač dokázal správně označit jen 12,4 procent slov, umělá inteligence byla úspěšná v 46,8 procentech případů. Navíc většina neúspěchů se týkala jen drobností, například písmene „s“ na konci slova. Tyto výsledky jsou mnohem lepší než jakýkoli jiný automatický program.

Program DeepMind už se učí i taktické a strategické dovednosti – na hře Starcraft:

„Jde o první velký krok k tomu získat plně automatické systémy pro odezírání,“ popsali vědci svůj úspěch. Aby si stroje dokázaly takovou dovednost osvojit, musí se učit na obrovském vzorku dat. Zdá se, že už brzy člověka v tomto oboru zcela nahradí. Shodou okolností před dvěma týdny další umělá inteligence jménem GRID (také z Oxfordu) výrazně překonala v odezírání člověka. Tento pokus byl ovšem založen jen na omezeném slovníku 51 slov, jež umí stroj dokonale rozeznávat.

DeepMind už umí rozeznávat víc než 17 500 slov, navíc dokáže rozlišovat mnohem komplikovanější gramatické kategorie. Oxford i Google už slíbili, že televizní data, která získali od BBC, zveřejní pro další podobné projekty jako volně dostupný zdroj informací.

Největším problémem při učení bylo to, že řada videoklipů od BBC měla asynchronní zvukovou a obrazovou stopu – počítač pak nebyl schopen správně přiřadit správné významy k pohybům úst. To celý proces učení výrazně zdrželo.

Co s tím teď?

Aplikací v reálném životě se nabízí víc než dost. Jednou z těch užitečných je například automatické vytváření titulků u videa, ale nabízejí se i mnohem rozporuplnější využití. Pokud by se podařilo spojit tento systém například se systémem bezpečnostních kamer, mohly by stroje monitorovat každé vyřčené slovo.

3 minuty
Google shromažďuje kulturní dědictví světa
Zdroj: ČT24

Pochopitelně by se našlo uplatnění na letištích, v tajných službách i bezpečnosti obecně. Samozřejmě s využitím rovnou přichází také obava ze zneužití – od špionážních služeb, až po příliš silné zasahování státu do soukromí občanů.

Možné je také to, že objev změní komunikaci s mobilními telefony – když vám bude přístroj odezírat slova přímo ze rtů, neměl by být problém s ním komunikovat zcela potichu. Obrovským způsobem mohou v budoucnosti pokročilé aplikace pomoci neslyšícím. Chytrý mobil odečte slova ze rtů mluvčího a převede je na text, řeč nebo znaky.

Výběr redakce

Aktuálně z rubriky Věda

Od ISS se na Zemi předčasně vrací loď Dragon kvůli zdravotnímu stavu astronauta

Od Mezinárodní vesmírné stanice (ISS) se ve středu odpoutala kosmická loď Dragon se čtyřmi astronauty, které americký Národní úřad pro letectví a vesmír (NASA) stahuje předčasně z mise kvůli zdravotnímu stavu jednoho z nich. Přistání lodě na Zemi se očekává ve čtvrtek okolo 9:40 SEČ. Podle zdravotního ředitele NASA Jamese Polka nejde o nouzovou evakuaci.
před 4 hhodinami

Rok 2025 byl po předchozích dvou letech nejteplejším v historii měření

Rok 2025 byl třetím nejteplejším rokem v historii měření. Průměrná globální teplota dosáhla 14,97 stupně Celsia. Byl tedy jen nepatrně (o 0,01 stupně Celsia) chladnějším než rok 2023 a o 0,13 stupně Celsia chladnějším než rok 2024, který byl vůbec nejteplejším rokem v historii měření. Uvedla to meteorologická služba Evropské unie Copernicus. Posledních jedenáct let bylo zároveň nejteplejších v historii měření.
včeraAktualizovánopřed 11 hhodinami

Vědci naznačili, proč jsou někteří primáti homosexuální

Homosexualita je u savců natolik rozšířená, že to podle vědců nemůže být ani náhoda, ani omyl. Hledají proto evoluční příčiny a nový výzkum přinesl rovnou několik zajímavých poznatků.
před 13 hhodinami

Riziko jo-jo efektu je u léků na hubnutí zásadní, zjistili vědci

Nová studie vědců z Oxfordu odhalila velkou hrozbu toho, že po vysazení nejmodernějších a velmi účinných léků proti obezitě se hmotnost opět velmi rychle vrací.
před 15 hhodinami

Zvyšte daně na slazené nápoje, vyzývá státy WHO. Česku by to dle analýzy pomohlo

Světová zdravotnická organizace (WHO) doporučila členským zemím, aby zvýšily daně na slazené a alkoholické nápoje s cílem omezit jejich spotřebu a finančně podpořit zdravotnictví. Podle WHO fakt, že většina zemí má na tyto nápoje stále nízké daně, přispívá k nárůstu počtů nemocných obezitou, cukrovkou, chorobami srdce a rakovinou.
před 17 hhodinami

Virus HIV se učí odolávat jedinému léku. Tvrdě za to ale platí

Vědci z americké společnosti Gilead Sciences, která má jediný účinný lék na HIV, otestovali, jestli se tento virus této látce nedokáže přizpůsobit. Výsledky naznačují, že ano, ale současně ukazují, že to ve skutečnosti nemusí být příliš nebezpečné.
13. 1. 2026

Stárnoucímu Česku dojdou mladí lidé, ukazují velká data

Během pouhých deseti let začne odcházet do důchodu silná generace Husákových dětí. Přinese to zásadní demografickou proměnu, která změní celou českou společnost. Nejenže bude méně lidí na to, aby vydělávali na penze stále rostoucí skupině, ale především bude potřeba mnohem více sociální péče pro seniory.
10. 1. 2026Aktualizováno12. 1. 2026

První lidé lovili pomocí jedu už před 60 tisíci lety

Lidé druhu Homo sapiens na jihu Afriky používali už před šedesáti tisíci lety otrávené šípy. Dokázali to švédští vědci na základě nálezu takových zbraní na území dnešní Jihoafrické republiky. O nejstarším nálezu svého druhu informovali v článku, který zveřejnil odborný časopis Science Advances.
12. 1. 2026
Načítání...