Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Do ugandského národního parku se po dekádách vrátili nosorožci

Tento týden byli v národním parku Kidepo Valley na severovýchodě Ugandy vypuštěni do volné přírody dva bílí nosorožci jižní. Jsou prvními ze skupiny osmi jedinců, kteří se mají usadit v parku, kde byl poslední nosorožec zabit v roce 1983. Na jejich navrácení do místní přírody nyní částečně dohlíží Ugandský úřad pro ochranu divoké zvěře (UWA).
před 14 hhodinami

Vědci popsali, kdy se mezi indiány rozšířily luky a šípy

Nový archeologický výzkum zkoumal nejstarší zbraňové artefakty nalezené v Severní Americe. Vědcům se je podařilo velmi přesně datovat, takže poprvé dokázali popsat, kdy tam luky a šípy nahradily oštěpy a praky.
před 15 hhodinami

Archeologové našli ve Velkém Meziříčí středověkou studnu a asi i základ pranýře

Ve středu Velkého Meziříčí letos archeologové odkryli zasypanou středověkou studnu a kruhový podstavec, který zřejmě sloužil jako pranýř. Našli také základy středověké pece. Oznámil to Šimon Kochan ze zapsaného ústavu Archaia Brno, který na místě pracuje. Záchranný archeologický výzkum doprovází postupnou obnovu náměstí a přilehlých ulic, která začala loni zjara. Stavební práce budou podle radnice dokončené příští rok.
před 15 hhodinami

VideoUnikátním ekosystémem Pražského hradu se zabývali přírodovědci

Pražský hrad byl sídlem králů, císařů i prezidentů. Ale také více než sedmi stovek druhů rostlin, 220 druhů hmyzu a více než čtyřiceti druhů ptáků. Teď tam přírodovědci popsali dokonce několik druhů, které až doposud z tuzemské přírody vůbec neznali – včetně unikátního roztoče pancířníka. Nejzajímavějším místem v areálu je podle biologů Jelení příkop, který obsahuje neporušenou „krajinu“, jež sahá až do dob mamutích stepí z doby ledové.
před 19 hhodinami

„Panna Maria ze Szopienic“ zachraňovala olověné děti. O hrdinství čtyřicet let mlčela

Panna Maria ze Szopienic nebo slezská Erin Brokovich - to jsou dvě přirovnání, která se používají v souvislosti s polskou pediatričkou Jolantou Wadowskou-Król. Hrdinka nového seriálu platformy Netflix Olověné děti zachránila v podstatě tajně až skoro ilegálně stovky dětí před vážnými zdravotními problémy. Ty jim způsobovala otrava olovem z hutí v polských Szopienicích. To se ovšem nelíbilo komunistům, a tak Wadowská za své hrdinství tvrdě zaplatila. A svůj příběh držela v utajení - až dokud ho neobjevila její vnučka a o několik let později i filmaři.
před 20 hhodinami

Víc než polovina kojenců tráví čas u mobilu nebo televize, vyplývá z průzkumu

Celkem padesát pět procent dětí mladších než dvanáct měsíců pravidelně tráví čas u mobilu, tabletu či televize. Více než hodinu denně tato zařízení sleduje čtyřicet jedna procent batolat od jednoho do dvou let. Mezi předškoláky je to šedesát osm procent dětí. Vyplývá to z průzkumu agentury STEM, který představil spolek Zvedni hlavu a Nadace O2. Podle předsedkyně Asociace klinických logopedů Barbory Richtrové jsou čísla výrazně vyšší, než jaká jsou v tomto ohledu doporučení odborníků.
18. 3. 2026

Virus chikungunya se šíří do Evropy, kvůli oteplování asi pronikne i do Česka

Až donedávna byl virus chikungunya spojený jen s tropickými zeměmi. Vloni už ale způsobil stovky nákaz i ve Francii a Itálii. Britští vědci teď detailně popsali, jak moc na sever může proniknout. V rozhovoru pro Českou televizi upozornili, že mezi ohroženými zeměmi je i Česko.
18. 3. 2026

VideoAI a válka s Íránem zdražují elektroniku. Na víc vyjdou počítače či mobily

Situace kolem války na Blízkém východě se kromě cen energií a komodit negativně dotýká i elektroniky. Znamená to například dražší počítače nebo mobilní telefony, řekl pro ČT Vladimír Janíček z elektrotechnické fakulty ČVUT. Už před několika měsíci kvůli vysoké poptávce ze strany datových center pro umělou inteligenci přitom vystřelily nahoru ceny hlavně některých základních počítačových komponent – zejména pamětí. Nyní se může do cen čipů propsat ztížená logistika i dražší výroba způsobená nedostatkem energetických surovin, jakými jsou plyn a ropa.
18. 3. 2026
Načítání...