Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

Paleodieta je pohádka, člověk se jen masem nikdy neživil, tvrdí výzkum

Rozsáhlá analýza zbytků lidské potravy z období pravěku přinesla silné argumenty pro vyvrácení hypotéz o tom, že se v době kamenné konzumovalo hlavně maso.
před 30 mminutami

NASA mohla omylem kolonizovat Mars, naznačují vlastnosti „nesmrtelné“ bakterie

Americká vesmírná agentura NASA objevila před několika lety v opakovaně čištěné laboratoři bakterii, která přežila desítky pokusů o dezinfekci. Teď vědci popsali, jak to organismus dělá, a také potenciální dopady těchto schopností.
před 14 hhodinami

Vědci na Trutnovsku našli v trase D11 hromadné vojenské hroby z 18. a 19. století

Vědci v trase budoucí dálnice D11 v úseku mezi Jaroměří a Trutnovem objevili hromadné vojenské hroby z 18. a 19. století, které považují za mimořádný archeologický soubor doplňující poznání tehdejších válečných konfliktů. Kromě hrobu z druhé slezské války z roku 1745, o kterém již informovali, našli také tři z roku 1866.
před 17 hhodinami

Ničivé počasí v části Asie není náhoda, ale klimatické varování, tvrdí vědci

Jihovýchodní Asie letos čelí neobvykle silným bouřím. Počet obětí povodní a sesuvů půdy v Indonésii, na Srí Lance a v Thajsku dosud přesáhl 1400, přičemž více než tisícovka lidí se stále pohřešuje. V Indonésii zůstávají celé vesnice odříznuté od zbytku světa poté, co voda zničila mosty a silnice. Tisíce lidí na Srí Lance nemají přístup k pitné vodě, zatímco thajský premiér přiznal nedostatečnou reakci své vlády, píše agentura AP.
před 19 hhodinami

Stárnutí ženských vajíček se dá zvrátit, zjistili náhodou čeští vědci

Projevy stárnutí ženských vajíček, takzvaných oocytů, je možné zvrátit a jejich poškození opravit. To, co bylo dosud považováno za biologicky nemožné, dokázal mezinárodní tým vedený reprodukční bioložkou Helenou Fulkovou z Ústavu experimentální medicíny Akademie věd ČR, který o průlomu informoval v tiskové zprávě. Výsledky zveřejnil časopis Aging Cell. Podle vědců otevírají závěry práce nové otázky o biologii stárnutí a také prostor pro vývoj budoucích léčebných postupů.
před 20 hhodinami

Univerzitní spin-offy sílí. Pomáhají výzkumu a míří do světového byznysu

Univerzitní firmy, takzvané spin-offy, které vysokým školám přinášejí zisk, jsou v zahraničí běžné. V tuzemsku se tento model prosazuje pomaleji. Na konferenci v Ostravě, pořádané agenturou CzechInvest, zazněly příklady úspěšných firem, které dokážou z akademického výzkumu vytvořit mezinárodně konkurenceschopný produkt i finanční přínos pro vysoké školy.
před 22 hhodinami

Humanoidů v Číně vzniká spousta, kupuje je málokdo. Země se bojí bubliny

Čína vsadila na to, že se stane světovou velmocí v humanoidních robotech. Podle několika analýz ale možná přišla s touto technologií příliš brzy, protože reálně o ni není příliš zájem.
včera v 06:30

Cukry, „guma“ a prach mrtvých hvězd. Vědci prozkoumali vzorky z asteroidu Bennu

Když v září roku 2023 dostali vědci do rukou vzorky z mise Osiris-REx, která prostudovala temný asteroid Bennu, věděli, že drží poklad, jehož hodnota se nedá vyjádřit čísly. Analýza od té doby přináší pořád nová překvapení. Teď rovnou tři současně – a to ve formě informací o Sluneční soustavě a původu života. Vědci ve třech na sobě nezávislých studiích odhalili ve vzorcích cukry nepostradatelné pro život, v kosmu dosud nepozorovanou gumovitou látku a také nečekaně vysoký výskyt prachu vzniklého při explozích supernov.
3. 12. 2025
Načítání...