Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Česko zasáhlo sucho, situace se jen tak nezlepší. Na Slovensku je ještě hůř

Kvůli nedostatku srážek a stále vyšším teplotám se ve střední Evropě prohlubuje půdní sucho. Na některých místech už odborníci varují před závažnými dopady na zemědělství.
před 11 mminutami

Štíři mají klepeta vyztužená železem. Jako by je vyrobil špičkový kovář, říká studie

Organismy na Zemi umí využívat zdroje ze svého okolí, včetně prvků, jako je železo, mangan nebo zinek. Konkrétně štíři si z nich staví své zbraně. Vědci teď poprvé detailně popsali, jak to tito tvorové dělají.
před 2 hhodinami

V Evropě přibylo rostlin, které upřednostňují dusíkatou půdu. Reagují tak na člověka

Během posledního půlstoletí v Evropě výrazně přibylo rostlinných druhů, které mají rády půdu bohatou na živiny s vysokým obsahem dusíku. Mírně přibylo i druhů tolerujících stín. Vyplývá to z výsledků dosud nejrozsáhlejšího vegetačního výzkumu v Evropě, který provedl tým vědců ze Zemědělské univerzity v Praze (ČZU) pod vedením botanika Gabriela Midola. Rostliny jako kopřiva, ostružiník nebo svízel se tak objevují v krajině stále víc.
před 5 hhodinami

Evropa se otepluje nejrychleji z kontinentů

Evropa je podle nové zprávy o klimatu nejrychleji se oteplujícím kontinentem na Zemi. Dopady se projevují ve vlnách veder, nedostatku vody v řekách, častějších požárech, ale také v mizení ledovců. Dohromady to podle vědců ohrožuje evropskou biodiverzitu.
před 13 hhodinami

Nákladní člun se s keporkakem zvaným Timmy vydal do Severního moře

Tým dobrovolníků na severu Německa se v úterý pustil do dalšího pokusu o záchranu velryby, která zde v březnu uvázla na mělčině. Podařilo se ji dostat na speciální nákladní člun, který se následně vydal na cestu z Baltského do Severního moře. Pokusy o záchranu keporkaka zvaného Timmy poutají velkou pozornost médií a veřejnosti v Německu i v zahraničí.
včeraAktualizovánopřed 19 hhodinami

Spor o léky na Alzheimerovu nemoc. Studie tvrdí, že nejsou účinné, část vědců nesouhlasí

Evropské úřady na konci loňského roku registrovaly první dva léky proti Alzheimerově chorobě. Jestli je budou členské státy proplácet z veřejného zdravotního pojištění, je na každé zemi. Právě ve fázi tohoto schvalování vyšla významná studie, která léky z této skupiny označila za nedostatečně efektivní.
včera v 14:47

Čeští vědci chtějí odstraňovat léky z vody s pomocí světla. Popsali, jak na to

Tým vědců z Ostravy a Olomouce úspěšně otestoval uhlíkový materiál, který za pomoci světla rozkládá zbytky léčiv ve vodě a snižuje tak jejich rizika pro vodní organismy. Výzkum tak naznačil, jak by se v budoucnosti daly šetrnějším způsobem čistit odpadní vody v tuzemsku.
včera v 11:30

Zemřel za úsvitu druhého dne, chránil se hmoždířem. Vědci popsali smrt v Pompejích

Archeologové objevili v Pompejích při nedávných vykopávkách pozůstatky dvou mužů, kteří zemřeli při erupci Vesuvu v roce 79 našeho letopočtu. Podle vědců se pokusili uprchnout směrem k pobřeží a před padajícím sopečným materiálem se chránili improvizovaně předměty, které měli po ruce.
včera v 10:28
Načítání...