Celý lidský jazyk by se téměř vešel na jednu disketu. Zabere jen 1,5 megabajtů

Mozek je neuvěřitelně výkonný nástroj, ukazuje výzkum dvou expertů na teorii informace ze Spojených států. Všechny informace potřebné k dokonalému naučení angličtiny v něm zaberou jen 1,5 megabajtů. Pro srovnání – to je přibližně objem dat, která se vešla na jednu starou disketu.

Tato vědecká práce je unikátní v tom, jaký přístup k tématu autoři z Rochesterské a Kalifornské univerzity použili. Využili na množství dat, která jazyk obsahuje, informační teorii – a výsledek zveřejnili v odborném časopise Royal Society Open Science.

Jako děti se lidé učí chápat mluvený jazyk a také ho pak samy používají. Jak přesně tento proces probíhá a jak historicky vznikl, je jednou z největších otázek moderní vědy. Ví se ale, že jazykový systém je rozhodně složitější než pouhý „slovník“ slov a jejich významů. Jsou v něm také asociace, významové koncepty a představy, nebo archetypální významy. A samozřejmě také informace o výslovnosti, skladbě jazyka a obrovské množství dalších dat.

V nové studii se experti zaměřili na to, jaké množství informací je zapotřebí k tomu, aby se tento neobyčejně komplexní systém dal v mozku uložit. S pomocí teorie informace, což je část moderní matematiky, dospěli k tomu, že tento prostor může být pozoruhodně malý.

Jak spočítat jazyk

Aby to spočítali, přiřadili vědci různým aspektům angličtiny odhady, kolik informace obsahují. Začali fonémy, tedy zvuky, které rozlišují význam a pak se z nich skládají slova. Vyšli z toho, že angličtina používá kolem padesáti hlásek a že každá jednotlivá hláska potřebuje asi 15 bitů – tedy základních jednotek paměti. Pak pokračovali se slovní zásobou, ta má podle jazykovědců u průměrného člověka asi 40 tisíc slov, což je přibližně 400 tisíc bitů.

Následovala sémantika, tedy významy těchto 40 tisíc slov – ta zabrala celých 12 milionů bitů. Autoři si všimli, že důležitá je také frekvence slov, a proto odhadují, že ta zabere 80 tisíc bitů. Naopak celá syntax (větná skladba) má vlastně velmi málo pravidel, která se dají snadno popsat pomocí matematiky a logiky, proto zabere pouhých 700 bitů dat.

Ve výsledku to znamená, že podle této práce se celý jazyk podobný angličtině vejde na 1,56 megabajtů, což je přibližně stejné množství informace, jako má úvodní fotografie tohoto článku.

Tato práce je jednak přelomová díky přístupu, který zvolila, ale také proto, že může přimět vědce k jinému pohledu na vývoj jazyka. Dosavadní výzkum se díky teoriím lingvisty Noama Chomského nejvíce věnuje tomu, jak vznikají syntaktické struktury – ale datová teorie ukazuje, jak je to z hlediska dat nepodstatná oblast.

Výsledky této studie nejsou samy o sobě přelomem, ale ukazují spíše, jak málo toho o jazyce a jeho genezi víme a kolik toho ještě zbývá ke zkoumání.

Výběr redakce

Aktuálně z rubriky Věda

Paleodieta je pohádka, člověk se jen masem nikdy neživil, tvrdí výzkum

Rozsáhlá analýza zbytků lidské potravy z období pravěku přinesla silné argumenty pro vyvrácení hypotéz o tom, že se v době kamenné konzumovalo hlavně maso.
před 1 hhodinou

NASA mohla omylem kolonizovat Mars, naznačují vlastnosti „nesmrtelné“ bakterie

Americká vesmírná agentura NASA objevila před několika lety v opakovaně čištěné laboratoři bakterii, která přežila desítky pokusů o dezinfekci. Teď vědci popsali, jak to organismus dělá, a také potenciální dopady těchto schopností.
před 15 hhodinami

Vědci na Trutnovsku našli v trase D11 hromadné vojenské hroby z 18. a 19. století

Vědci v trase budoucí dálnice D11 v úseku mezi Jaroměří a Trutnovem objevili hromadné vojenské hroby z 18. a 19. století, které považují za mimořádný archeologický soubor doplňující poznání tehdejších válečných konfliktů. Kromě hrobu z druhé slezské války z roku 1745, o kterém již informovali, našli také tři z roku 1866.
před 18 hhodinami

Ničivé počasí v části Asie není náhoda, ale klimatické varování, tvrdí vědci

Jihovýchodní Asie letos čelí neobvykle silným bouřím. Počet obětí povodní a sesuvů půdy v Indonésii, na Srí Lance a v Thajsku dosud přesáhl 1400, přičemž více než tisícovka lidí se stále pohřešuje. V Indonésii zůstávají celé vesnice odříznuté od zbytku světa poté, co voda zničila mosty a silnice. Tisíce lidí na Srí Lance nemají přístup k pitné vodě, zatímco thajský premiér přiznal nedostatečnou reakci své vlády, píše agentura AP.
před 20 hhodinami

Stárnutí ženských vajíček se dá zvrátit, zjistili náhodou čeští vědci

Projevy stárnutí ženských vajíček, takzvaných oocytů, je možné zvrátit a jejich poškození opravit. To, co bylo dosud považováno za biologicky nemožné, dokázal mezinárodní tým vedený reprodukční bioložkou Helenou Fulkovou z Ústavu experimentální medicíny Akademie věd ČR, který o průlomu informoval v tiskové zprávě. Výsledky zveřejnil časopis Aging Cell. Podle vědců otevírají závěry práce nové otázky o biologii stárnutí a také prostor pro vývoj budoucích léčebných postupů.
před 21 hhodinami

Univerzitní spin-offy sílí. Pomáhají výzkumu a míří do světového byznysu

Univerzitní firmy, takzvané spin-offy, které vysokým školám přinášejí zisk, jsou v zahraničí běžné. V tuzemsku se tento model prosazuje pomaleji. Na konferenci v Ostravě, pořádané agenturou CzechInvest, zazněly příklady úspěšných firem, které dokážou z akademického výzkumu vytvořit mezinárodně konkurenceschopný produkt i finanční přínos pro vysoké školy.
před 22 hhodinami

Humanoidů v Číně vzniká spousta, kupuje je málokdo. Země se bojí bubliny

Čína vsadila na to, že se stane světovou velmocí v humanoidních robotech. Podle několika analýz ale možná přišla s touto technologií příliš brzy, protože reálně o ni není příliš zájem.
včera v 06:30

Cukry, „guma“ a prach mrtvých hvězd. Vědci prozkoumali vzorky z asteroidu Bennu

Když v září roku 2023 dostali vědci do rukou vzorky z mise Osiris-REx, která prostudovala temný asteroid Bennu, věděli, že drží poklad, jehož hodnota se nedá vyjádřit čísly. Analýza od té doby přináší pořád nová překvapení. Teď rovnou tři současně – a to ve formě informací o Sluneční soustavě a původu života. Vědci ve třech na sobě nezávislých studiích odhalili ve vzorcích cukry nepostradatelné pro život, v kosmu dosud nepozorovanou gumovitou látku a také nečekaně vysoký výskyt prachu vzniklého při explozích supernov.
3. 12. 2025
Načítání...