Vědci ve spolupráci se společností Google představili nový nástroj, který by mohl pomoci vytvářet mnohem detailnější představu o naší minulosti. Dokáže totiž číst rozbité texty ztracené před tisíci lety.
Písmo bylo v antickém Římě všudypřítomné – bylo vyryté na všem od císařských památek, až po běžné předměty denní potřeby. Nápisy se také týkaly všech aspektů života obyvatel tohoto impéria – od politických drbů, přes milostné básně a epitafy, až po obchodní transakce, pozvánky na narozeniny a magické formule.
Všechny tyto nápisy nabízejí moderním historikům bohatý vhled do rozmanitosti každodenního života v celém světě starověkého Říma.
Jenže texty jsou v drtivé většině rozbité, zvětralé nebo záměrně poškozené. Jejich restaurování, datování a umístění je téměř nemožné bez kontextuálních informací. Dalším problémem je dlouhodobá podfinancovanost humanitních věd, takže zkrátka není dost lidí na to, aby všechny nově objevené nápisy přečetli a rekonstruovali.
Náročná výzva
Studium starověkých nápisů je zvláštní obor historické práce a patří mezi ty nejnáročnější. Zlomky starověkých textů jsou jen málokdy úplné, je těžké určit, z jaké doby pocházejí, ale hlavně jim porozumět.
Historici analyzují texty tak, že je porovnávají s jinými nápisy obsahujícími podobná slova nebo fráze. Hledání těchto jiných nápisů je ale časově nesmírně náročné, vysvětluje spoluautorka nové studie v časopise Nature Thea Sommerschieldová z Nottinghamské univerzity ve Velké Británii. V této studii vědci představili nástroj založený na principu umělé inteligence, který dokáže všechnu tuto práci zvládnout.
Model nazvaný Aeneas by neměl historiky nahradit, ale výrazně jim zjednodušit a urychlit práci.
Obrovská databáze
Nový nástroj vznikl ve spolupráci britských a řeckých vědců a je založený na technologii DeepMind společnosti Google, která s historiky na projektu úzce spolupracovala. Experti vycvičili AI model na nápisech ze tří největších světových databází latinské epigrafiky. Kombinovaný soubor dat obsahoval přepsané texty celkem 176 861 nápisů a také jejich fotografie.
Model se skládá ze tří neuronových sítí, z nichž každá je určena pro jiné úkoly: obnovení chybějícího textu, předpověď místa, odkud text pochází, a odhad stáří textu. Spolu s výsledky poskytuje Aeneas také seznam podobných nápisů, seřazených podle toho, jak jsou relevantní pro původní text.
„Aeneas dokáže okamžitě vyhledat relevantní paralely z celého našeho souboru dat, protože každý text má v databázi jedinečný identifikátor,“ komentoval nástroj Yannis Assael ze společnosti Google DeepMind.
Test spolehlivosti
Tým testoval přesnost a užitečnost modelu tím, že požádal 23 expertů, aby obnovili text, který byl z nápisů předtím úmyslně odstraněn. Odborníci dostali současně úkol, aby nápisy datovali a určili jejich původ.
Pokud pracovali sami, bez pomoci AI modelu, dokázali se trefit s přesností na 31 let. Pokud se mohli opřít o rady Aeneasu, zlepšili svou přesnost na odchylku třinácti let.
Pokud jde o určení zeměpisného původu a obnovu částí textu, byli odborníci, kteří měli přístup k seznamu podobných nápisů v modelu a k jeho předpovědím, také výrazně přesnější než odborníci pracující samostatně, případně než samotný model bez lidské pomoci.
Aeneas umí zatím pracovat jen s latinou, ale podle autorů není těžké ho adaptovat i na jiné jazyky a písma. Aby z něj mělo prospěch celé lidstvo, uvolnili ho autoři pro všechny vědce zdarma. Na stejném místě dali přístup ke staršímu, méně pokročilému modelu Ithaca, který rekonstruuje starořecké texty.









