Umělá inteligence Google se naučila odezírat slova ze rtů. Lépe než lidé

Projekt DeepMind společnosti Google dokáže stále nové věci. Nyní se ve spolupráci s univerzitou v Oxfordu naučil odezírat ze rtů, stačilo mu k tomu jen dost dlouho se dívat na televizi.

Vědci nabídli počítačovému programu 5000 hodin televizního vysílání ze šesti různých stanic. Celkem videa obsahovala 118 000 sekvencí. Oxfordský tým nejprve „trénoval“ program na záznamech z let 2010 až 2015. Potom ho otestoval na videích z letošního roku – umělá inteligence měla za úkol odezírat celé fráze a věty. Dokázala to velice úspěšně.

Když pak výzkumný tým srovnával výsledky počítače s lidským profesionálem, ukázalo se, že stroj byl v „překladu“ 200 náhodně vybraných klipů výrazně úspěšnější. Zatímco profesionální odezírač dokázal správně označit jen 12,4 procent slov, umělá inteligence byla úspěšná v 46,8 procentech případů. Navíc většina neúspěchů se týkala jen drobností, například písmene „s“ na konci slova. Tyto výsledky jsou mnohem lepší než jakýkoli jiný automatický program.

Program DeepMind už se učí i taktické a strategické dovednosti – na hře Starcraft:

„Jde o první velký krok k tomu získat plně automatické systémy pro odezírání,“ popsali vědci svůj úspěch. Aby si stroje dokázaly takovou dovednost osvojit, musí se učit na obrovském vzorku dat. Zdá se, že už brzy člověka v tomto oboru zcela nahradí. Shodou okolností před dvěma týdny další umělá inteligence jménem GRID (také z Oxfordu) výrazně překonala v odezírání člověka. Tento pokus byl ovšem založen jen na omezeném slovníku 51 slov, jež umí stroj dokonale rozeznávat.

DeepMind už umí rozeznávat víc než 17 500 slov, navíc dokáže rozlišovat mnohem komplikovanější gramatické kategorie. Oxford i Google už slíbili, že televizní data, která získali od BBC, zveřejní pro další podobné projekty jako volně dostupný zdroj informací.

Největším problémem při učení bylo to, že řada videoklipů od BBC měla asynchronní zvukovou a obrazovou stopu – počítač pak nebyl schopen správně přiřadit správné významy k pohybům úst. To celý proces učení výrazně zdrželo.

Co s tím teď?

Aplikací v reálném životě se nabízí víc než dost. Jednou z těch užitečných je například automatické vytváření titulků u videa, ale nabízejí se i mnohem rozporuplnější využití. Pokud by se podařilo spojit tento systém například se systémem bezpečnostních kamer, mohly by stroje monitorovat každé vyřčené slovo.

3 minuty
Google shromažďuje kulturní dědictví světa
Zdroj: ČT24

Pochopitelně by se našlo uplatnění na letištích, v tajných službách i bezpečnosti obecně. Samozřejmě s využitím rovnou přichází také obava ze zneužití – od špionážních služeb, až po příliš silné zasahování státu do soukromí občanů.

Možné je také to, že objev změní komunikaci s mobilními telefony – když vám bude přístroj odezírat slova přímo ze rtů, neměl by být problém s ním komunikovat zcela potichu. Obrovským způsobem mohou v budoucnosti pokročilé aplikace pomoci neslyšícím. Chytrý mobil odečte slova ze rtů mluvčího a převede je na text, řeč nebo znaky.

Výběr redakce

Aktuálně z rubriky Věda

Írán odpojil internet v panice, Starlink rušit nedokáže

Teherán odpojil internet během protestů v panice a o přístup k síti přišlo dočasně i ministerstvo zahraničí. Píše to list Financial Times s odkazem na experty. Odříznutí Íránci se navzdory hrozbě represí pokoušejí komunikovat se světem přes Starlink. Íránské úřady se marně snaží rušit signál, a tak zabavují lidem antény.
před 7 hhodinami

Cítí se opuštěni elitami, sjednoceni hněvem. Co lidi spojuje v krizích, ukázal český výzkum

Co mají společného spory o roušky během covidu a hádky o pomoc Ukrajině v diskuzích na facebooku? Výzkum českých vědkyň ukazuje, že lidé v časech krize sdílejí opakující se příběhy na základě modelu „my dole“ proti „těm nahoře“. Může to na sociálních sítích posílit sounáležitost mezi lidmi, ale současně takové chování rozděluje společnost ještě víc a vytváří pocity nedůvěry vůči elitám, hlavně těm politickým a mediálním.
před 8 hhodinami

Jaký bude rok 2026? Velká předpověď naznačuje vysoké teploty

Letošní rok by se mohl zařadit k těm dosud nejteplejším. Naznačují to predikce na základě analýzy historických dat a sledování dlouhodobého vývoje. Důležitou roli mají mít jevy El Niňo a La Niňa. Dosud nejteplejší byl rok 2024, ten loňský se stal třetím nejteplejším od počátku pozorování.
před 11 hhodinami

Mikroplastů je tolik, že kontaminují výzkumy o množství mikroplastů

Mikroplastů je už na Zemi tolik, že se nedá pořádně říct, jak moc jich je – tak se dají shrnout výsledky několika studií, které vyšly v poslední době. Na základě důkladných analýz jejich autoři zpochybňují předchozí výzkumy, které popisovaly, kolik mikroplastů (a nanoplastů) se nachází v lidských tkáních.
před 13 hhodinami

Komunisté před 55 lety normalizovali poměry. Pomocí lží i vražd

Zpátky k normálu – to byl cíl komunistů po srpnové okupaci v roce 1968. Rozjitřená společnost, která doufala ve změnu, se měla vrátit do doby před obrodným procesem (pražským jarem), takzvaně se normalizovat. Komunisté ale potřebovali vysvětlit a před lidmi obhájit vojenskou invazi z 21. srpna 1968. Posloužit k tomu měl oficiální dokument, který vyšel před 55 lety, byl plný lží a invazi nazýval „bratrskou pomocí“. Vtloukat do hlavy si ho měly i děti ve školách.
před 16 hhodinami

Umělá inteligence zabíjí tu dětskou, varuje výzkum

V této fázi vývoje převažují rizika využívání generativní umělé inteligence (AI) ve vzdělávání nad výhodami, říkají američtí autoři studie Centra pro univerzální vzdělávání Brookings Institution. Takzvaní chatboti dětem pomáhají s referáty, úkoly a učením, současně jim toho ale podle průzkumu až příliš mnoho berou.
včera v 16:55

Švýcarská nemocnice vyrábí metry umělé kůže pro popálené při požáru

Po požáru ve švýcarském zimním středisku Crans-Montana, kde při silvestrovských oslavách zahynulo čtyřicet lidí, 116 utrpělo zranění a desítky jsou stále hospitalizovány, pracuje laboratoř na výrobu kůže v centru buněčné produkce Univerzitní nemocnice kantonu Vaud na plné obrátky. Pokouší se pomoci zachránit pacienty s rozsáhlými popáleninami. Speciální zařízení v obci Epalinges nedaleko Lausanne je totiž jediné svého druhu v Evropě.
včera v 14:49

Pouštní národy lovily žraloky už v době kamenné, ukázal český výzkum

Pravěcí obyvatelé jihu Arábie se už před zhruba sedmi tisíci lety ve velké míře živili mořskými zdroji a troufli si i na tak velkou kořist, jako byli žraloci, vyplývá z výzkumu týmu Archeologického ústavu Akademie věd ČR (AV ČR). Ten v Ománu objevil nejstarší megalitický kolektivní hrob v jižní Arábii.
včera v 10:24
Načítání...