Na VUT učí umělou inteligenci doostřovat fotky z webkamer a texty archivů

Vědci z brněnského Vysokého učení technického vyvíjejí speciální program na doostřování rozmazaných fotek, videí a dokumentů. Na Fakultě informačních technologií k tomu používají umělou inteligenci, učí neuronovou síť poznat rozdíly mezi ostrým a rozmazaným obrázkem a následně jej doostřit.

Fotografie před a po doostření programem
Zdroj: VUT Brno Autor: Michal Hradiš

Program umožní přečíst například poznávací značky aut z webkamer nebo nekvalitně digitalizované textové dokumenty. Využít jej může policie, archiváři i veřejnost. Neuronovou síť si může trénovat na svém počítači každý se základní znalostí programování a grafickou kartou na úrovni herního počítače.

Síť trénuje doostřování na milionech příkladů

Takzvaná konvoluční neuronová síť se dokáže, podobně jako třeba lidský mozek, naučit dovednost, kterou po ní programátoři chtějí. Využívají k tomu matematické funkce a trénink na stovkách tisíc obrázků. Na příkladech dvojic zaostřených a rozmazaných snímků sítě dokáží přiblížit nekvalitní podklady co nejvíce kvalitním originálům.

„Na rozpoznávání SPZ jsme použili dvě stě tisíc ostrých výřezů, které jsme rozmazali. Síť jich pak v průběhu učení vidí několik desítek milionů. Každou SPZ vidí několikrát a pokaždé se trochu zlepší v jejím doostření. Učení takové sítě trvá zhruba den,“ vysvětlil Michal Hradiš z Ústavu počítačové grafiky a multimédií FIT VUT. Dodal, že pokud člověk sítím předloží dostatečné množství trénovaných příkladů, dokážou časem opravit i reálné fotografie, které ještě neviděly.

Video Studio 6
video

Michal Hradiš vysvětluje princip speciálního programu

Zdroj: ČT24

Vědci z VUT se teď zaměřují hlavně na text, s cílem upravovat fotografie dokumentů pořízených mobilním telefonem na kvalitu naskenovaného materiálu nebo napomáhat čitelnosti historických dokumentů v archivech.

Ve spolupráci s Moravskou zemskou knihovnou chtějí vylepšovat zobrazování částečně poškozených nebo nekvalitně digitalizovaných tisků nebo rukopisů. Zaostřené dokumenty jsou pak čitelnější a díky konvolučním neuronovým sítím lépe funguje i automatické rozpoznání textu. 

Neuronové sítě jsou inspirované lidským mozkem ve své schopnosti učit se. Proces učení se ale liší. U sítí se používají matematické abstrakce, derivace a opakující se operace plus a minus. Pracují zároveň s informacemi, že se jedná o SPZ a že má zaostřit určitý objekt, třeba písmeno. Klíčový je trénink na dostatečném množství dat, zkreslených a originálních.