Umělá inteligence Google se naučila odezírat slova ze rtů. Lépe než lidé

Projekt DeepMind společnosti Google dokáže stále nové věci. Nyní se ve spolupráci s univerzitou v Oxfordu naučil odezírat ze rtů, stačilo mu k tomu jen dost dlouho se dívat na televizi.

Vědci nabídli počítačovému programu 5000 hodin televizního vysílání ze šesti různých stanic. Celkem videa obsahovala 118 000 sekvencí. Oxfordský tým nejprve „trénoval“ program na záznamech z let 2010 až 2015. Potom ho otestoval na videích z letošního roku – umělá inteligence měla za úkol odezírat celé fráze a věty. Dokázala to velice úspěšně.

Když pak výzkumný tým srovnával výsledky počítače s lidským profesionálem, ukázalo se, že stroj byl v „překladu“ 200 náhodně vybraných klipů výrazně úspěšnější. Zatímco profesionální odezírač dokázal správně označit jen 12,4 procent slov, umělá inteligence byla úspěšná v 46,8 procentech případů. Navíc většina neúspěchů se týkala jen drobností, například písmene „s“ na konci slova. Tyto výsledky jsou mnohem lepší než jakýkoli jiný automatický program.

Program DeepMind už se učí i taktické a strategické dovednosti – na hře Starcraft:

„Jde o první velký krok k tomu získat plně automatické systémy pro odezírání,“ popsali vědci svůj úspěch. Aby si stroje dokázaly takovou dovednost osvojit, musí se učit na obrovském vzorku dat. Zdá se, že už brzy člověka v tomto oboru zcela nahradí. Shodou okolností před dvěma týdny další umělá inteligence jménem GRID (také z Oxfordu) výrazně překonala v odezírání člověka. Tento pokus byl ovšem založen jen na omezeném slovníku 51 slov, jež umí stroj dokonale rozeznávat.

DeepMind už umí rozeznávat víc než 17 500 slov, navíc dokáže rozlišovat mnohem komplikovanější gramatické kategorie. Oxford i Google už slíbili, že televizní data, která získali od BBC, zveřejní pro další podobné projekty jako volně dostupný zdroj informací.

Největším problémem při učení bylo to, že řada videoklipů od BBC měla asynchronní zvukovou a obrazovou stopu – počítač pak nebyl schopen správně přiřadit správné významy k pohybům úst. To celý proces učení výrazně zdrželo.

Co s tím teď?

Aplikací v reálném životě se nabízí víc než dost. Jednou z těch užitečných je například automatické vytváření titulků u videa, ale nabízejí se i mnohem rozporuplnější využití. Pokud by se podařilo spojit tento systém například se systémem bezpečnostních kamer, mohly by stroje monitorovat každé vyřčené slovo.

3 minuty
Google shromažďuje kulturní dědictví světa
Zdroj: ČT24

Pochopitelně by se našlo uplatnění na letištích, v tajných službách i bezpečnosti obecně. Samozřejmě s využitím rovnou přichází také obava ze zneužití – od špionážních služeb, až po příliš silné zasahování státu do soukromí občanů.

Možné je také to, že objev změní komunikaci s mobilními telefony – když vám bude přístroj odezírat slova přímo ze rtů, neměl by být problém s ním komunikovat zcela potichu. Obrovským způsobem mohou v budoucnosti pokročilé aplikace pomoci neslyšícím. Chytrý mobil odečte slova ze rtů mluvčího a převede je na text, řeč nebo znaky.

Výběr redakce

Aktuálně z rubriky Věda

Deset let po Pařížské dohodě se vědci obávají, že je mrtvá

Pařížská úmluva OSN o změně klimatu byla uzavřena přesně před deseti lety, 12. prosince 2015, vstoupila ale v platnost až skoro o rok později – v listopadu 2016. Podle dokumentu, který nahradil Kjótský protokol, se má oteplování udržet pod dvěma stupni Celsia, nejlépe do 1,5 stupně ve srovnání s předindustriálním obdobím. Průměrné teploty i emise skleníkových plynů se ale stále zvyšují.
před 5 hhodinami

AI umí znepokojivě účinně ovlivňovat voliče, ukazují dvě studie

Nové výzkumy ukazují, že chatboty mohou velmi silně ovlivňovat rozhodování voličů. Výsledky, které vydaly odborné časopisy Nature a Science, podle autorů vyvolávají zásadní otázky ohledně role umělé inteligence v budoucích volbách.
před 7 hhodinami

Publikace Martina Rychlíka provede Dějinami skalpování

Vyšly Dějiny skalpování. Držitel Litery za publicistiku Martin Rychlík se v rozsáhlé publikaci věnuje zvyku zbavovat nepřítele vlasů s částí kůže napříč historií lidstva. Nabourává přitom i zažité představy.
před 7 hhodinami

Věčné chemikálie ve vodě škodí dětskému zdraví i peněženkám

Negativní dopady na zdraví, které způsobují takzvané věčné chemikálie v pitné vodě, stojí Spojené státy v současné době už nejméně osm miliard dolarů (160 miliard korun) ročně v sociálních nákladech. Popsali to vědci z Arizonské univerzity.
před 10 hhodinami

Osamělost zvyšuje riziko srdečních onemocnění

Nedostatek sociálních vazeb a osamělost mají vliv na riziko srdečního onemocnění. Lidé s omezenými sociálními kontakty čelí podle dlouhodobých studií o zhruba třicet procent vyššímu riziku úmrtí na srdeční a cévní onemocnění, upozornili zástupci České kardiologické společnosti.
před 12 hhodinami

Mezi bobrem a surikatou. Člověk patří mezi nejmonogamnější savce, ukázal výzkum

Studie vědců z Cambridge se pokusila sestavit žebříček nejvíce monogamních druhů savců. Podle starších odhadů patří člověk na hranu mezi monogamními a polygamními druhy, nový detailnější výzkum ho nicméně řadí pod vrchol pomyslné „hitparády“ monogamie.
před 14 hhodinami

Alkohol poškozuje DNA a působí rakovinu, buňky se mu brání, ukazuje český výzkum

Alkohol poškozuje lidskou DNA a způsobuje rakovinu, zjistila studie vědců z Ústavu organické chemie a biochemie Akademie věd ČR (ÚOCHB). Buňky se dle výzkumu poškození brání a DNA opravují, u některých lidí ale méně účinně. Článek o studii zveřejnil časopis Communications Biology ze skupiny Nature, uvedl ÚOCHB. V míře, která poškozuje zdraví, pije podle výzkumů alkohol 1,5 milionu Čechů.
včera v 14:53

Lidé si ochočili oheň o 350 tisíc let dříve, než se předpokládalo, hlásí vědci

Objev zažehnutí ohně měl prehistorického člověka vrhnout na dráhu směřující k modernímu lidstvu. Doposud se vědci domnívali, že se toto odehrálo relativně nedávno. Nový objev ale posouvá „zkrocení“ tohoto živlu o statisíce let dál do minulosti.
včera v 12:42
Načítání...