Konec chyb v češtině. Brněnští jazykovědci vyvíjí dokonalý automatický korektor

Novinku, která by měla pomoct vyřešit většinu nejistot při tvorbě česky psaných textů, chystají odborníci z Ústavu českého jazyka Filozofické fakulty Masarykovy univerzity. Spolu s kolegy z dalších škol a partnery z komerční sféry začali vyvíjet nový pravopisný, gramatický a typografický korektor pro český jazyk, který bude časem volně dostupný veřejnosti on-line.

Různorodých nástrojů, které opravují česky psané texty už při jejich tvorbě, existuje v různých počítačových programech spousta. Ani jeden v sobě ale v současnosti nemá všechny vyjmenované funkce, neumí opravovat zároveň třeba typografii i pravopis.

„Udělat korektor překlepů není těžké, přidat další funkce už chce ale větší tým a je to výrazně složitější. Při vývoji toho našeho proto využíváme nejnovější jazykové nástroje, zdroje dat a postupy, které jsou v současné době pro češtinu k dispozici,“ uvedla vedoucí celého projektu Dana Hlaváčková.

S nápadem na univerzální automatický korektorský nástroj přišel její kolega Vojtěch Kovář z Fakulty informatiky Masarykovy univerzity, který pracuje se studenty oboru počítačová lingvistika. „Postupně začali skládat části budoucího korektoru, až nám došlo, že by z toho mohl být jeden velký projekt, který vyřeší spoustu problémů,“ doplňuje Hlaváčková.

Spolupráce napříč republikou i generacemi

Mimo dvou zmíněných fakult a jejich studentů se nakonec při práci potkávají ještě lidé z Ústavu pro jazyk český Akademie věd a Ústavu teoretické a komputační lingvistiky Filozofické fakulty Univerzity Karlovy. Jsou mezi nimi i ti, kteří vytvářeli původní a asi nejznámější český korektor, který je implementovaný v programu Microsoft Word a je už přes 13 let starý. 

Projekt je zatím v počátcích, první verze nové pomůcky by měla být k dispozici ke zkoušce v říjnu. „Průběžně si nástroj budeme testovat sami, ale v určitých fázích je v plánu i testování s koncovými uživateli. Jde o to, aby si ho skutečně vyzkoušeli i lidé, kteří píšou texty ve velkém,“ zdůrazňuje Hlaváčková.

Výsledek by se měl zrodit i za pomoci společnosti Seznam.cz, která má v projektu financovaném Technologickou agenturou České republiky roli takzvaného aplikačního garanta. Tento korektor ale nebude vytvářený konkrétně pro tuto firmu, výsledek bude sloužit všem a zdarma. Z projektu vzejde webové rozhraní, do kterého bude možné psát přímo nebo do něj vkládat už hotové texty na kontrolu. Finální verze by měla být hotová v polovině roku 2022.