Mezinárodní vědecký tým zkoumal, jaký světový jazyk je nejlépe srozumitelný pro umělé inteligence (AI). Autoři očekávali, že na prvním místě se umístí angličtina, ve skutečnosti ale skončila až šestá. První místo zaujala polština.
Autoři analyzovali celkem 26 různých jazyků, včetně češtiny. Polština se ukázala jako nejúčinnější řeč pro takzvané promptování AI, tedy pro zadávání příkazů tak, aby jim tyto velké jazykové modely rozuměly a aby se jimi řídily.
„Náš experiment přinesl několik překvapivých a neintuitivních zjištění. Zaprvé, angličtina nefungovala nejlépe ve všech modelech, ve skutečnosti se při hodnocení dlouhých textů umístila až na šestém místě z 26 jazyků, přitom polština dopadla nejlépe,“ napsali autoři zprávy.
Prozkoumali několik hlavních jazykových modelů AI, včetně ChatGPT, Google Gemini, Qwen, Llama a DeepSeek. Výsledky ukázaly, že polština měla při plnění úkolů průměrnou přesnost 88 procent.
„Dosud byla polština široce považována za jeden z nejobtížnějších jazyků pro lidi. Ukazuje se ale, že zatímco lidé s ní mají potíže, umělá inteligence nikoli,“ komentoval výsledky polský patentový úřad.
Čeština je pro AI stále problém
Podle autorů je pozoruhodné, že systémy umělé inteligence prokázaly, že skvěle rozumí polštině, a to přesto, že množství polských dat dostupných pro výcvik je mnohem menší než v případě nesrovnatelně „větších“ jazyků, jako je angličtina nebo čínština. Proč? To zatím vědci vysvětlit úplně neumí.
Ve srovnání s polštinou i angličtinou si čínština vedla výrazně špatně a z 26 testovaných jazyků se umístila až na čtvrtém místě od konce.
Pro zajímavost – čeština se umístila na šestnáctém místě, tedy v poslední třetině jazyků podle úspěšnosti. Vědci toto téma studovali na čtyřech speciálně vytyčených úkolech. Spočívaly v práci s nějakým ikonickým literárním dílem, které je pro danou řeč typické – v případě češtiny to byly Osudy dobrého vojáka Švejka.
Na studii pracoval tým expertů z Marylandské univerzity a společnosti Microsoft, polského původu byl jen jeden z autorů.







