Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Umělá inteligence zabíjí tu dětskou, varuje výzkum

V této fázi vývoje převažují rizika využívání generativní umělé inteligence (AI) ve vzdělávání nad výhodami, říkají američtí autoři studie Centra pro univerzální vzdělávání Brookings Institution. Takzvaní chatboti dětem pomáhají s referáty, úkoly a učením, současně jim toho ale podle průzkumu až příliš mnoho berou.
před 9 hhodinami

Švýcarská nemocnice vyrábí metry umělé kůže pro popálené při požáru

Po požáru ve švýcarském zimním středisku Crans-Montana, kde při silvestrovských oslavách zahynulo čtyřicet lidí, 116 utrpělo zranění a desítky jsou stále hospitalizovány, pracuje laboratoř na výrobu kůže v centru buněčné produkce Univerzitní nemocnice kantonu Vaud na plné obrátky. Pokouší se pomoci zachránit pacienty s rozsáhlými popáleninami. Speciální zařízení v obci Epalinges nedaleko Lausanne je totiž jediné svého druhu v Evropě.
před 11 hhodinami

Pouštní národy lovily žraloky už v době kamenné, ukázal český výzkum

Pravěcí obyvatelé jihu Arábie se už před zhruba sedmi tisíci lety ve velké míře živili mořskými zdroji a troufli si i na tak velkou kořist, jako byli žraloci, vyplývá z výzkumu týmu Archeologického ústavu Akademie věd ČR (AV ČR). Ten v Ománu objevil nejstarší megalitický kolektivní hrob v jižní Arábii.
před 15 hhodinami

Posádka mise Crew-11 se vrátila z ISS kvůli zdraví jednoho z astronautů

V Tichém oceánu dopoledne středoevropského času přistála kosmická loď s čtyřčlennou posádkou NASA. Z Mezinárodní vesmírné stanice (ISS) se vrátila o čtyři měsíce dřív, než bylo v plánu, kvůli zdravotnímu stavu jednoho z astronautů.
včeraAktualizovánopřed 16 hhodinami

Od ISS se na Zemi předčasně vrací loď Dragon kvůli zdravotnímu stavu astronauta

Od Mezinárodní vesmírné stanice (ISS) se ve středu odpoutala kosmická loď Dragon se čtyřmi astronauty, které americký Národní úřad pro letectví a vesmír (NASA) stahuje předčasně z mise kvůli zdravotnímu stavu jednoho z nich. Přistání lodě na Zemi se očekává ve čtvrtek okolo 9:40 SEČ. Podle zdravotního ředitele NASA Jamese Polka nejde o nouzovou evakuaci.
včera v 00:00

Rok 2025 byl po předchozích dvou letech nejteplejším v historii měření

Rok 2025 byl třetím nejteplejším rokem v historii měření. Průměrná globální teplota dosáhla 14,97 stupně Celsia. Byl tedy jen nepatrně (o 0,01 stupně Celsia) chladnějším než rok 2023 a o 0,13 stupně Celsia chladnějším než rok 2024, který byl vůbec nejteplejším rokem v historii měření. Uvedla to meteorologická služba Evropské unie Copernicus. Posledních jedenáct let bylo zároveň nejteplejších v historii měření.
14. 1. 2026Aktualizováno14. 1. 2026

Vědci naznačili, proč jsou někteří primáti homosexuální

Homosexualita je u savců natolik rozšířená, že to podle vědců nemůže být ani náhoda, ani omyl. Hledají proto evoluční příčiny a nový výzkum přinesl rovnou několik zajímavých poznatků.
14. 1. 2026

Riziko jo-jo efektu je u léků na hubnutí zásadní, zjistili vědci

Nová studie vědců z Oxfordu odhalila velkou hrozbu toho, že po vysazení nejmodernějších a velmi účinných léků proti obezitě se hmotnost opět velmi rychle vrací.
14. 1. 2026
Načítání...