Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Meč nebes je nejvyšším stromem Asie. Je větší než Petřínská rozhledna

Nejvyšší stromy na Zemi mohou být vyšší než většina staveb, které vytvořili lidé. Platí to také pro nově popsaný nejvyšší strom v Asii, který teď přeměřili tchajwanští vědci.
před 1 hhodinou

Kůže ještěrek umí triky s ultrafialovým světlem. Funguje jako maják, popsali čeští vědci

Vědci z Univerzity Karlovy v Praze a univerzity ve Valencii objevili zatím neznámý mechanismus tvorby barev u ještěrek rodu Podarcis. Popsali, že ultrafialově modré skvrny na bocích těchto ještěrek vznikají neobvyklou interakcí mezi pigmenty a mikroskopickými odrazivými strukturami v kůži.
před 3 hhodinami

„Výkop století.“ Francouzští archeologové zkoumají podzemí u Notre-Dame

Fronta turistů strádající pod sluncem čeká, až bude moci vystoupat na katedrálu Notre-Dame a prohlédnout si její chrliče. Čtyři metry pod nimi míří tým archeologů opačným směrem – kope přímo dolů a zpět v čase do Paříže z doby starověkého Říma před dvěma tisíci roky, píše agentura AP.
před 6 hhodinami

Astronaut Svoboda poletí na ISS v roce 2027, oznámil Babiš

Projekt Česká cesta do vesmíru v pondělí prezentoval vývoj příprav české mise na Mezinárodní vesmírnou stanici (ISS) a avizuje klíčové milníky pro rok 2027. Tiskové konference v pražském planetáriu se zúčastnili premiér Andrej Babiš (ANO), ministři Karel Havlíček (ANO), Robert Plaga (za ANO) a Jaromír Zůna (za SPD), budoucí astronaut Aleš Svoboda, astronaut Evropské kosmické agentury (ESA) Andreas Mogensen a další.
včeraAktualizovánopřed 20 hhodinami

Vědci přejmenovali syndrom, který ničí ženské zdraví. Může to změnit přístup i léčbu

Lékaři po jedenácti letech studie změnili název syndromu, který trápí asi deset procent žen. Doufají, že by to mohlo změnit nejen stigmatizaci těchto problémů, ale také jim pomoci k účinnější léčbě.
před 20 hhodinami

Svoboda roky trénoval. Ve vesmíru provede řadu experimentů

Aleš Svoboda poletí do vesmíru nejen jako pasažér, ale přímo jako pilot. Jako špičkový pilot stíhacích letadel k tomu má ty nejlepší předpoklady. Jeho mise ale nebude spočívat jen v řízení. Svoboda hlavně bude dohlížet na celou řadu vědeckých experimentů.
před 22 hhodinami

Psychická pohoda českých dětí se zhoršuje. Šťastně se cítí polovina

Psychická pohoda dětí a dospívajících v tuzemsku se zhoršuje, šťastně se cítí asi polovina z nich. Více než 60 procent dětí zároveň tráví on-line více času, než by chtěly, vyplývá z průzkumu Mladé hlasy 2026, jehož hlavní závěry nyní odborníci představili v Praze na konferenci zaměřené na duševní zdraví. Výzkum UNICEF ČR realizuje od roku 2001, letos se konal poosmé. Zapojilo se do něj 1012 dětí ve věku od devíti do 17 let.
před 23 hhodinami

Vzácné setkání. Žraloka bílého natočili pod hladinou Středozemního moře

Žraloci bílí ve Středozemním moři už téměř vyhynuli, primárně kvůli nadměrnému rybolovu. Skupině dobrovolníků, kteří čistili vraky lodí od rybářských sítí, se teď podařilo tohoto predátora nafilmovat u pobřeží Sicílie.
včera v 13:02
Načítání...