Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Rok 2025 byl třetím nejteplejším v historii měření

Rok 2025 byl třetím nejteplejším rokem v historii měření. Průměrná globální teplota dosáhla 14,97 stupně Celsia. Byl tedy jen nepatrně (o 0,01 °C) chladnějším než rok 2023 a o 0,13 °C chladnějším než rok 2024, který byl vůbec nejteplejším rokem v historii měření. Uvedla to meteorologická služba Evropské unie Copernicus. Posledních jedenáct let bylo zároveň jedenáct nejteplejších let v historii měření.
před 2 hhodinami

Virus HIV se učí odolávat jedinému léku. Tvrdě za to ale platí

Vědci z americké společnosti Gilead Sciences, která má jediný účinný lék na HIV, otestovali, jestli se tento virus této látce nedokáže přizpůsobit. Výsledky naznačují, že ano, ale současně ukazují, že to ve skutečnosti nemusí být příliš nebezpečné.
před 12 hhodinami

Stárnoucímu Česku dojdou mladí lidé, ukazují velká data

Během pouhých deseti let začne odcházet do důchodu silná generace Husákových dětí. Přinese to zásadní demografickou proměnu, která změní celou českou společnost. Nejenže bude méně lidí na to, aby vydělávali na penze stále rostoucí skupině, ale především bude potřeba mnohem více sociální péče pro seniory.
10. 1. 2026Aktualizováno12. 1. 2026

První lidé lovili pomocí jedu už před 60 tisíci lety

Lidé druhu Homo sapiens na jihu Afriky používali už před šedesáti tisíci lety otrávené šípy. Dokázali to švédští vědci na základě nálezu takových zbraní na území dnešní Jihoafrické republiky. O nejstarším nálezu svého druhu informovali v článku, který zveřejnil odborný časopis Science Advances.
12. 1. 2026

„Sedmé nebe“ je úplně nový druh vesmírného objektu

Galaxie, která selhala, respektive oblak temné hmoty z počátku vesmíru – tak astronomové popisují vzdálený kosmický objekt, který objevili. Dali mu název Cloud-9, což by se dalo do češtiny nejlépe přeložit jako „Sedmé nebe“.
11. 1. 2026

Čeští vědci navrhli řešení klimatické změny. Klíčem je kácení severských lesů

Vědci navrhli prozkoumat možnost ukládání uhlíku pomocí splavování masy vykácených stromů do Severního ledového oceánu z lesů, které rostou v povodí sibiřských veletoků Obu, Jeniseje a Leny a severoamerických řek Yukonu a Mackenzie. V této oblasti se nachází asi sto gigatun uhlíku, který je uložený ve dřevě stromů. Vykácením přibližně jednoho procenta těchto lesů a splavením kmenů do oceánu by bylo možné snížit množství emisí o jednu gigatunu, tedy desetinu emisí vypuštěných lidstvem za rok.
10. 1. 2026

Dvacet pod nulou, nebo jen pět? Předpovědi počasí na příští týden se silně liší

Úspěšnost předpovědí počasí se v posledních letech zásadně zlepšila. I tak se ale vyskytne situace, která představuje i pro nejmodernější předpovědní modely a zkušené meteorology značnou výzvu. Momentálně se týká příštího týdne.
9. 1. 2026

Genetická šifra mistra Leonarda. Vědci možná získali jeho DNA

Mezinárodní vědecký tým našel s pomocí velmi detailních analytických metod stopy DNA na kresbě připisované renesančnímu géniovi Leonardu da Vincimu. Mohly by patřit samotnému mistrovi a univerzálnímu učenci, k identifikaci jeho DNA ale ještě zbývá daleká cesta. O studii informoval časopis Science.
9. 1. 2026
Načítání...