Celý lidský jazyk by se téměř vešel na jednu disketu. Zabere jen 1,5 megabajtů

Mozek je neuvěřitelně výkonný nástroj, ukazuje výzkum dvou expertů na teorii informace ze Spojených států. Všechny informace potřebné k dokonalému naučení angličtiny v něm zaberou jen 1,5 megabajtů. Pro srovnání – to je přibližně objem dat, která se vešla na jednu starou disketu.

Tato vědecká práce je unikátní v tom, jaký přístup k tématu autoři z Rochesterské a Kalifornské univerzity použili. Využili na množství dat, která jazyk obsahuje, informační teorii – a výsledek zveřejnili v odborném časopise Royal Society Open Science.

Jako děti se lidé učí chápat mluvený jazyk a také ho pak samy používají. Jak přesně tento proces probíhá a jak historicky vznikl, je jednou z největších otázek moderní vědy. Ví se ale, že jazykový systém je rozhodně složitější než pouhý „slovník“ slov a jejich významů. Jsou v něm také asociace, významové koncepty a představy, nebo archetypální významy. A samozřejmě také informace o výslovnosti, skladbě jazyka a obrovské množství dalších dat.

V nové studii se experti zaměřili na to, jaké množství informací je zapotřebí k tomu, aby se tento neobyčejně komplexní systém dal v mozku uložit. S pomocí teorie informace, což je část moderní matematiky, dospěli k tomu, že tento prostor může být pozoruhodně malý.

Jak spočítat jazyk

Aby to spočítali, přiřadili vědci různým aspektům angličtiny odhady, kolik informace obsahují. Začali fonémy, tedy zvuky, které rozlišují význam a pak se z nich skládají slova. Vyšli z toho, že angličtina používá kolem padesáti hlásek a že každá jednotlivá hláska potřebuje asi 15 bitů – tedy základních jednotek paměti. Pak pokračovali se slovní zásobou, ta má podle jazykovědců u průměrného člověka asi 40 tisíc slov, což je přibližně 400 tisíc bitů.

Následovala sémantika, tedy významy těchto 40 tisíc slov – ta zabrala celých 12 milionů bitů. Autoři si všimli, že důležitá je také frekvence slov, a proto odhadují, že ta zabere 80 tisíc bitů. Naopak celá syntax (větná skladba) má vlastně velmi málo pravidel, která se dají snadno popsat pomocí matematiky a logiky, proto zabere pouhých 700 bitů dat.

Ve výsledku to znamená, že podle této práce se celý jazyk podobný angličtině vejde na 1,56 megabajtů, což je přibližně stejné množství informace, jako má úvodní fotografie tohoto článku.

Tato práce je jednak přelomová díky přístupu, který zvolila, ale také proto, že může přimět vědce k jinému pohledu na vývoj jazyka. Dosavadní výzkum se díky teoriím lingvisty Noama Chomského nejvíce věnuje tomu, jak vznikají syntaktické struktury – ale datová teorie ukazuje, jak je to z hlediska dat nepodstatná oblast.

Výsledky této studie nejsou samy o sobě přelomem, ale ukazují spíše, jak málo toho o jazyce a jeho genezi víme a kolik toho ještě zbývá ke zkoumání.