Celý lidský jazyk by se téměř vešel na jednu disketu. Zabere jen 1,5 megabajtů

Mozek je neuvěřitelně výkonný nástroj, ukazuje výzkum dvou expertů na teorii informace ze Spojených států. Všechny informace potřebné k dokonalému naučení angličtiny v něm zaberou jen 1,5 megabajtů. Pro srovnání – to je přibližně objem dat, která se vešla na jednu starou disketu.

Tato vědecká práce je unikátní v tom, jaký přístup k tématu autoři z Rochesterské a Kalifornské univerzity použili. Využili na množství dat, která jazyk obsahuje, informační teorii – a výsledek zveřejnili v odborném časopise Royal Society Open Science.

Jako děti se lidé učí chápat mluvený jazyk a také ho pak samy používají. Jak přesně tento proces probíhá a jak historicky vznikl, je jednou z největších otázek moderní vědy. Ví se ale, že jazykový systém je rozhodně složitější než pouhý „slovník“ slov a jejich významů. Jsou v něm také asociace, významové koncepty a představy, nebo archetypální významy. A samozřejmě také informace o výslovnosti, skladbě jazyka a obrovské množství dalších dat.

V nové studii se experti zaměřili na to, jaké množství informací je zapotřebí k tomu, aby se tento neobyčejně komplexní systém dal v mozku uložit. S pomocí teorie informace, což je část moderní matematiky, dospěli k tomu, že tento prostor může být pozoruhodně malý.

Jak spočítat jazyk

Aby to spočítali, přiřadili vědci různým aspektům angličtiny odhady, kolik informace obsahují. Začali fonémy, tedy zvuky, které rozlišují význam a pak se z nich skládají slova. Vyšli z toho, že angličtina používá kolem padesáti hlásek a že každá jednotlivá hláska potřebuje asi 15 bitů – tedy základních jednotek paměti. Pak pokračovali se slovní zásobou, ta má podle jazykovědců u průměrného člověka asi 40 tisíc slov, což je přibližně 400 tisíc bitů.

Následovala sémantika, tedy významy těchto 40 tisíc slov – ta zabrala celých 12 milionů bitů. Autoři si všimli, že důležitá je také frekvence slov, a proto odhadují, že ta zabere 80 tisíc bitů. Naopak celá syntax (větná skladba) má vlastně velmi málo pravidel, která se dají snadno popsat pomocí matematiky a logiky, proto zabere pouhých 700 bitů dat.

Ve výsledku to znamená, že podle této práce se celý jazyk podobný angličtině vejde na 1,56 megabajtů, což je přibližně stejné množství informace, jako má úvodní fotografie tohoto článku.

Tato práce je jednak přelomová díky přístupu, který zvolila, ale také proto, že může přimět vědce k jinému pohledu na vývoj jazyka. Dosavadní výzkum se díky teoriím lingvisty Noama Chomského nejvíce věnuje tomu, jak vznikají syntaktické struktury – ale datová teorie ukazuje, jak je to z hlediska dat nepodstatná oblast.

Výsledky této studie nejsou samy o sobě přelomem, ale ukazují spíše, jak málo toho o jazyce a jeho genezi víme a kolik toho ještě zbývá ke zkoumání.

Výběr redakce

Aktuálně z rubriky Věda

Kůže ještěrek umí triky s ultrafialovým světlem. Funguje jako maják, popsali čeští vědci

Vědci z Univerzity Karlovy v Praze a univerzity ve Valencii objevili zatím neznámý mechanismus tvorby barev u ještěrek rodu Podarcis. Popsali, že ultrafialově modré skvrny na bocích těchto ještěrek vznikají neobvyklou interakcí mezi pigmenty a mikroskopickými odrazivými strukturami v kůži.
před 41 mminutami

„Výkop století.“ Francouzští archeologové zkoumají podzemí u Notre-Dame

Fronta turistů strádající pod sluncem čeká, až bude moci vystoupat na katedrálu Notre-Dame a prohlédnout si její chrliče. Čtyři metry pod nimi míří tým archeologů opačným směrem – kope přímo dolů a zpět v čase do Paříže z doby starověkého Říma před dvěma tisíci roky, píše agentura AP.
před 3 hhodinami

Astronaut Svoboda poletí na ISS v roce 2027, oznámil Babiš

Projekt Česká cesta do vesmíru v pondělí prezentoval vývoj příprav české mise na Mezinárodní vesmírnou stanici (ISS) a avizuje klíčové milníky pro rok 2027. Tiskové konference v pražském planetáriu se zúčastnili premiér Andrej Babiš (ANO), ministři Karel Havlíček (ANO), Robert Plaga (za ANO) a Jaromír Zůna (za SPD), budoucí astronaut Aleš Svoboda, astronaut Evropské kosmické agentury (ESA) Andreas Mogensen a další.
včeraAktualizovánopřed 17 hhodinami

Vědci přejmenovali syndrom, který ničí ženské zdraví. Může to změnit přístup i léčbu

Lékaři po jedenácti letech studie změnili název syndromu, který trápí asi deset procent žen. Doufají, že by to mohlo změnit nejen stigmatizaci těchto problémů, ale také jim pomoci k účinnější léčbě.
před 18 hhodinami

Svoboda roky trénoval. Ve vesmíru provede řadu experimentů

Aleš Svoboda poletí do vesmíru nejen jako pasažér, ale přímo jako pilot. Jako špičkový pilot stíhacích letadel k tomu má ty nejlepší předpoklady. Jeho mise ale nebude spočívat jen v řízení. Svoboda hlavně bude dohlížet na celou řadu vědeckých experimentů.
před 19 hhodinami

Psychická pohoda českých dětí se zhoršuje. Šťastně se cítí polovina

Psychická pohoda dětí a dospívajících v tuzemsku se zhoršuje, šťastně se cítí asi polovina z nich. Více než 60 procent dětí zároveň tráví on-line více času, než by chtěly, vyplývá z průzkumu Mladé hlasy 2026, jehož hlavní závěry nyní odborníci představili v Praze na konferenci zaměřené na duševní zdraví. Výzkum UNICEF ČR realizuje od roku 2001, letos se konal poosmé. Zapojilo se do něj 1012 dětí ve věku od devíti do 17 let.
před 20 hhodinami

Vzácné setkání. Žraloka bílého natočili pod hladinou Středozemního moře

Žraloci bílí ve Středozemním moři už téměř vyhynuli, primárně kvůli nadměrnému rybolovu. Skupině dobrovolníků, kteří čistili vraky lodí od rybářských sítí, se teď podařilo tohoto predátora nafilmovat u pobřeží Sicílie.
před 22 hhodinami

Nadšení i zděšení. Vědci poprvé upravili lidská embrya novou technologií

Nová genetická technika umožňuje mnohem přesnější úpravu lidských embryí než doposud používaný CRISPR. Tým newyorských biochemiků dokázal posunout úspěšnost postupu natolik, že řada expertů vyjadřuje znepokojení z možnosti vzniku „dětí na zakázku“.
včera v 10:45
Načítání...