Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Satelitní projekt ESA povede Univerzita Karlova

Nový projekt pražských geoinformatiků by měl pomoci ke vzniku generace expertů schopných pracovat s komplikovanými družicovými daty a využívat je pro vědu i praktický život.
před 11 hhodinami

Další roky budou rekordně horké, předpovídají meteorologové

Nová zpráva Světové meteorologické organizace (WMO) upozorňuje, že klimatická změna oteplující planetu pokračuje. V novém výhledu na příštích pět let agentura varuje před celou řadu nebezpečných jevů.
před 12 hhodinami

Francie investovala do diskreditace výzkumu svých jaderných testů

Francouzská Komise pro atomovou energii (CEA) utratila desetitisíce eur ve snaze znevěrohodnit výzkum, který odhalil, že Paříž podceňuje zničující vliv svých jaderných testů ve Francouzské Polynésii v 60. a 70. letech minulého století. Podle deníků Le Monde a The Guardian to naznačují dokumenty získané investigativní platformou Disclose. Stalo se tak jen několik dní předtím, než má svoji zprávu o testech předložit parlamentní vyšetřovací komise.
před 15 hhodinami

Kosmická loď Starship předčasně explodovala, Musk let označuje za úspěch

Společnost SpaceX miliardáře Elona Muska v úterý vyslala na devátý zkušební let svou kosmickou loď Starship, informují světové agentury. Největší a nejsilnější raketa na světě, měřící 123 metrů, odstartovala z kosmodromu v jižním Texasu v úterý v 18:35 místního času (01:35 SELČ). Zhruba po půl hodině nad ní ale SpaceX ztratila kontrolu.
před 16 hhodinami

Obraz, zvuk i hudba naráz. Rozlišit realitu od výtvorů AI je stále těžší

Modely umělé inteligence na generování videí jsou zase o krok dál, a lidé tak mají o něco menší šanci rozlišit realitu od výtvorů AI. Modely tvořící videa jsou již schopné pracovat zároveň s obrazem, zvukem i hudbou. Odborníci proto varují před větším šířením takzvaných deepfaků a dalšího závadného obsahu nebo kyberšikanou. Problém rozeznat některé umělé výtvory od skutečných záběrů už mají i experti.
před 19 hhodinami

Úsvit atomového věku začal Einsteinovým dopisem o Československu

Když se židovští vědci, kteří museli uprchnout před nacismem z Maďarska, dozvěděli, že Německo může získat nejsilnější zbraň na světě, rozhodli se konat.
před 19 hhodinami

Mladí Tchajwanci a Číňané se s duševními problémy obracejí na AI

Na Tchaj-wanu a v Číně se mladí lidé obracejí s duševními problémy spíše na umělou inteligenci (AI) než na psychoterapeuta, napsal server The Guardian. Je pro ně jednodušší mluvit o věcech, které je trápí, s chatbotem než s reálnými lidmi. Odborníci ale upozorňují, že AI stále nemůže nabídnout ucelenou odbornou pomoc.
27. 5. 2025

Trump vytáhl proti univerzitám, ohrožuje jejich schopnosti a prestiž

Situace na univerzitách ve Spojených státech je v současnosti napjatá. Soud dočasně zablokoval rozhodnutí prezidenta Donalda Trumpa zakázat Harvardově univerzitě zapisovat zahraniční studenty, ale kroky šéfa Bílého domu přesto poškozují výzkumné instituce a mohou ohrozit jejich prestižní postavení.
27. 5. 2025
Načítání...