Umělá inteligence Google se naučila odezírat slova ze rtů. Lépe než lidé

Projekt DeepMind společnosti Google dokáže stále nové věci. Nyní se ve spolupráci s univerzitou v Oxfordu naučil odezírat ze rtů, stačilo mu k tomu jen dost dlouho se dívat na televizi.

Vědci nabídli počítačovému programu 5000 hodin televizního vysílání ze šesti různých stanic. Celkem videa obsahovala 118 000 sekvencí. Oxfordský tým nejprve „trénoval“ program na záznamech z let 2010 až 2015. Potom ho otestoval na videích z letošního roku – umělá inteligence měla za úkol odezírat celé fráze a věty. Dokázala to velice úspěšně.

Když pak výzkumný tým srovnával výsledky počítače s lidským profesionálem, ukázalo se, že stroj byl v „překladu“ 200 náhodně vybraných klipů výrazně úspěšnější. Zatímco profesionální odezírač dokázal správně označit jen 12,4 procent slov, umělá inteligence byla úspěšná v 46,8 procentech případů. Navíc většina neúspěchů se týkala jen drobností, například písmene „s“ na konci slova. Tyto výsledky jsou mnohem lepší než jakýkoli jiný automatický program.

Program DeepMind už se učí i taktické a strategické dovednosti – na hře Starcraft:

„Jde o první velký krok k tomu získat plně automatické systémy pro odezírání,“ popsali vědci svůj úspěch. Aby si stroje dokázaly takovou dovednost osvojit, musí se učit na obrovském vzorku dat. Zdá se, že už brzy člověka v tomto oboru zcela nahradí. Shodou okolností před dvěma týdny další umělá inteligence jménem GRID (také z Oxfordu) výrazně překonala v odezírání člověka. Tento pokus byl ovšem založen jen na omezeném slovníku 51 slov, jež umí stroj dokonale rozeznávat.

DeepMind už umí rozeznávat víc než 17 500 slov, navíc dokáže rozlišovat mnohem komplikovanější gramatické kategorie. Oxford i Google už slíbili, že televizní data, která získali od BBC, zveřejní pro další podobné projekty jako volně dostupný zdroj informací.

Největším problémem při učení bylo to, že řada videoklipů od BBC měla asynchronní zvukovou a obrazovou stopu – počítač pak nebyl schopen správně přiřadit správné významy k pohybům úst. To celý proces učení výrazně zdrželo.

Co s tím teď?

Aplikací v reálném životě se nabízí víc než dost. Jednou z těch užitečných je například automatické vytváření titulků u videa, ale nabízejí se i mnohem rozporuplnější využití. Pokud by se podařilo spojit tento systém například se systémem bezpečnostních kamer, mohly by stroje monitorovat každé vyřčené slovo.

3 minuty
Google shromažďuje kulturní dědictví světa
Zdroj: ČT24

Pochopitelně by se našlo uplatnění na letištích, v tajných službách i bezpečnosti obecně. Samozřejmě s využitím rovnou přichází také obava ze zneužití – od špionážních služeb, až po příliš silné zasahování státu do soukromí občanů.

Možné je také to, že objev změní komunikaci s mobilními telefony – když vám bude přístroj odezírat slova přímo ze rtů, neměl by být problém s ním komunikovat zcela potichu. Obrovským způsobem mohou v budoucnosti pokročilé aplikace pomoci neslyšícím. Chytrý mobil odečte slova ze rtů mluvčího a převede je na text, řeč nebo znaky.

Výběr redakce

Aktuálně z rubriky Věda

Sucho na východě a povodně na západě. Vyšla zpráva o evropském klimatu

Loňský rok byl pro Evropu nejteplejším v historii s rekordními teplotami na téměř polovině kontinentu a s rozsáhlými záplavami zejména v jeho západní části. Ve zprávě o stavu klimatu v Evropě to v úterý uvedla meteorologická služba Evropské unie Copernicus.
05:50Aktualizovánopřed 3 hhodinami

První jaderná elektrárna v USA začala využívat umělou inteligenci

Jak jaderná energetika, tak i umělá inteligence jsou užitečné nástroje, které ale při nesprávném využití mohou způsobit obrovské škody. První americká atomová elektrárna teď nasadila umělou inteligenci pro zjednodušení práce lidských zaměstnanců.
před 19 hhodinami

„Do září zjistíme příčinu autismu,“ slibuje americký ministr zdravotnictví

Americký ministr zdravotnictví Robert F. Kennedy mladší se zavázal k „masivnímu testování a výzkumnému úsilí“, aby do pěti měsíců určil příčinu autismu, píše server BBC. Odborníci varují, že nalezení příčin poruchy autistického spektra – složitého syndromu, který lékaři zkoumají po desetiletí – nebude jednoduché a snahu označili za zcestnou a nerealistickou.
před 22 hhodinami

Sahara bývala bujnou zelenou savanou s neznámým obyvatelstvem

Saharská poušť je jedním z nejvyprahlejších a nejpustších míst na Zemi. Táhne se od východního pobřeží severní Afriky k jejím západním břehům a toto území, které lze svou velikostí přirovnat k Číně nebo Spojeným státům, pojme jedenáct zemí. V dávných dobách však nebývalo tak nehostinné jako dnes. Ukazuje to i analýza nalezených ostatků.
před 23 hhodinami

První slonovinové nástroje lidé vyráběli mnohem dřív, než se čekalo. Našly se na Ukrajině

První nástroje vyrobené lidmi ze slonoviny mohly sloužit jako dětské imitace práce dospělých. Naznačuje to rozsáhlá analýzu artefaktů nalezených na Ukrajině.
včera v 07:30

Umělá inteligence spotřebuje do roku 2030 stejně elektřiny jako Japonsko

Datová centra budou do roku 2030 potřebovat dvakrát více energie než v současné době. Celková poptávka po elektřině z datových center se zvýší na 945 terawatthodin (TWh), což je o něco více než spotřeba elektřiny v Japonsku. Hlavním pohonem růstu bude umělá inteligence (AI), poptávka po elektřině z datových center pro AI by se měla do roku 2030 zvýšit až čtyřnásobně.
13. 4. 2025

Vědci popsali temnou diverzitu české krajiny. Ukazuje, jak moc je poškozená

V oblastech silně ovlivněných lidskou činností chybí rostlinné druhy, které by se na podobných stanovištích jinak přirozeně vyskytovaly. Jev označovaný jako temná diverzita zkoumají dvě stovky botaniků z celého světa v projektu DarkDivNet. Čeští odborníci pomohli vytvořit metodickou koncepci a shromáždili data z několika území v Čechách a na Moravě.
12. 4. 2025

Na Tchaj-wanu se našla čelist denisovana, pravěkého bratrance neandertálců

Objev čelisti denisovana na asijském ostrově naznačuje, že se pravěcí příbuzní lidí rozšířili dál, než se předpokládalo. Současně jde o jeden z nejlépe dochovaných důkazů existence těchto prehistorických hominidů.
11. 4. 2025
Načítání...