Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Dvě exploze a konec. Vědci našli unikátní supernovu

Astronomové se stali svědky dramatického konce hvězdy – pomocí teleskopu totiž sledovali důkazy o tom, jak explodovala rovnou dvakrát. Je to poprvé, co vědci mohli zachytit takovou „dvojitou smrt“.
před 8 hhodinami

Evropa má novou družici, která může výrazně zlepšit předpovědi počasí

Nově vypuštěný satelit MTG-S1 umí měřit teploty vzduchu v různých výškách, takže by mohl přinést úplně novou rovinu do přesností předpovědí. Největší prospěch z něj bude mít Evropa, která ho financovala.
včera v 12:20

Japonsko se jako první na světě pustí do těžby kovů z hlubokého mořského dna

Japonsko se od ledna příštího roku pokusí začít těžit kovy vzácných zemin z hlubokého mořského dna. Bude to první takový pokus na světě, řekl agentuře AFP ředitel vládního inovačního programu Šoiči Išii. Japonsko se tento týden zavázalo ke spolupráci se Spojenými státy, Austrálií a Indií na zajištění stabilních dodávek vzácných zemin. Sílí totiž obava z dominance Číny v dodávkách těchto kovů, které jsou nezbytné pro nové technologie.
včera v 10:29

Odkud k vám přijede sanitka. Mapa ukazuje, jak síť pomoci pokrývá Česko

Každý rok přijmou operační střediska záchranných služeb zhruba dva miliony tísňových volání, tedy přibližně pět a půl tisíce denně. Sanitky vyjedou k nemocným nebo zraněným více než milionkrát ročně, za den mají tedy přes tři tisíce výjezdů. V mapě najdete informace odkud a jaký typ záchranného vozidla vyjíždí.
3. 7. 2025Aktualizováno3. 7. 2025

Archeologové našli na Hradecku keltské sídliště, které v tuzemsku nemá obdoby

Archeologové v trase budoucí dálnice D35 na Královéhradecku objevili zcela výjimečné sídliště z doby laténské. Tedy z doby, kdy u nás sídlili Keltové, konkrétně Bójové, po nichž získala naše země jméno. Lokalita nemá podle vědců svým rozsahem a počtem objevených artefaktů v Česku obdoby.
3. 7. 2025Aktualizováno3. 7. 2025

Nový český patent řeší recyklaci vzácných zemin i závislost na Číně

Vědecký tým Miloslava Poláška z Ústavu organické chemie a biochemie vynalezl nový způsob separace prvků vzácných zemin, lanthanoidů, bez nichž se neobejde moderní elektronika, medicína, automobilový ani obranný průmysl. Metoda umožňuje získat kovy jako například neodym nebo dysprosium z použitých neodymových magnetů, a to ekologickou cestou, pouhým srážením ve vodě, bez organických rozpouštědel a toxických látek.
2. 7. 2025Aktualizováno3. 7. 2025

Teplotní rekordy padaly i ve čtvrtek

Meteorologové varovali také ve čtvrtek před velmi vysokými teplotami. Zatímco ve středu zasáhla vlna veder zejména Čechy, o den později se přesunula hlavně na Moravu. Padaly tak další rekordy. Nejtepleji bylo ve Strážnici, kde naměřili 36,6 stupně Celsia. Přes 36 stupňů vystoupala teplota také na Břeclavsku.
3. 7. 2025Aktualizováno3. 7. 2025

Nejslavnější mešita v ohrožení. Hagia Sofia nemusí další zemětřesení zvládnout

Po patnácti stoletích existence je slavný svatostánek Hagia Sofia stojící v Turecku v problémech. Přestože stavba prochází rekonstrukcí, nemusí to stačit na to, aby přežila další silné otřesy, které Istanbul podle vědců čekají.
3. 7. 2025
Načítání...