Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Člověk popálený. Lidskou evoluci i geny změnila zranění způsobená ohněm

Člověk je jediný druh v přírodě, který pravidelně zažívá popáleniny. Podle nové analýzy statisíce let, co člověk s ohněm žije, ovlivnily i jeho geny.
před 15 hhodinami

Sociální síť Moltbook je jen pro AI. Narušují ji ale lidští „boti“

Přelom roku přinesl další pokrok v technologii umělých inteligencí. Nezávislý rakouský programátor vypustil do kyberprostoru poslušné umělé inteligence, které plní jako agenti jakékoliv úkoly. A vznikla pro ně i speciální sociální síť Moltbook, kde si tyto formy digitálního kódu povídají.
před 19 hhodinami

Nepodceňovat své schopnosti. Data ukazují, jak na přihlášky na střední školy

Více než třetina zájemců o studium maturitních oborů řadila v minulém roce své přihlášky na střední školy neefektivně, ukazuje analýza výzkumné agentury PAQ Research. Na druhém nebo třetím místě v přihlášce totiž měli výrazně těžší školu než na prvním míst. Další chybou podle této analýzy bylo, že šest procent deváťáků ani nevyužilo možnost podat přihlášku na tři školy.
včera v 06:10

Česká technologie pomáhá na olympiádě rozhodčím v curlingu

Kromě tuzemských sportovců se na zimní olympiádě v Itálii představuje i technologie z Česka. Ta hlídá dodržování pravidel při curlingu – konkrétně senzory na kamenech odhalí chybu při odhození. Několik měsíců je vyvíjeli experti z Českého vysokého učení technického. V curlingu vyhrává tým, který dostane co nejvíc svých kamenů do cílových kruhů. Důležité je proto správně a přesně kámen na druhý konec ledové plochy poslat. Technologie zaznamená přesné místo odhozu. To dříve kontrolovali rozhodčí pouze očima.
4. 2. 2026

Za obsah na sociálních sítích mají být trestně odpovědní jejich manažeři, plánuje Španělsko

Španělsko má v úmyslu zakázat sociální sítě pro své občany mladší 16 let. Bude také od těchto platforem vyžadovat, aby používaly přísné nástroje pro ověřování věku, které nebude možné snadno obelhat. Připojí se tak k Austrálii, Francii a Dánsku, které už oznámily vlastní pravidla, která mají snížit negativní dopady sociálních sítí na děti. Zároveň chce Madrid zavést zákony, podle nichž by trestní odpovědnost za obsah sítí měli nést i manažeři firem provozujících sociální sítě.
4. 2. 2026

Více než třetina případů rakoviny je zbytečná, tvrdí WHO a radí, čemu se vyhnout

Zhruba každému třetímu případu rakoviny se dá zabránit, pokud se lidé budou vyhýbat rizikovým faktorům, jako je kouření, pití alkoholu, znečištění ovzduší a některé infekce, uvedla ve své analýze Světová zdravotnická organizace (WHO).
4. 2. 2026

Španělský přípravek má léčit rakovinu, rozplývají se média. Experti krotí naděje

Nová studie španělských vědců popsala, že jejich nová terapie dokáže extrémně účinně ničit nádory slinivky břišní. Tedy nádory známé svou smrtelností a špatnou léčitelností. Tato informace se v posledních dnech rychle šíří nejen médii, ale zejména po sociálních sítích, kde se objevuje v extrémně zkrácené formě, která zamlčuje některé klíčové informace. Například to, že je zatím otestován pouze na myších a potenciální lék je až desítky let daleko.
3. 2. 2026

NASA odložila start mise Artemis k Měsíci

Americký Národní úřad pro letectví a vesmír (NASA) odkládá plánovaný únorový start rakety Space Launch System (SLS) se čtyřčlennou posádkou k průletu kolem Měsíce na březen, oznámil šéf NASA Jared Isaacman, který změnu termínu zdůvodnil únikem kapalného vodíku během tankování. Technici v pondělí uspořádali generální předstartovní zkoušku, aby ověřili připravenost rakety k letu. Test kvůli netěsnosti NASA předčasně ukončila.
3. 2. 2026
Načítání...