Hlas Karla Gotta díky umělé inteligenci čte z jeho biografie

Studio 6: Zpěvačka Zelenková a kreativní producent Sapík k projektu ČRo Gott navždy (zdroj: ČT24)

Český rozhlas Dvojka vysílá četbu na pokračování z autobiografie Karla Gotta Má cesta za štěstím. V režii Aleše Vrzáka ji načetl herec Igor Bareš. Vybrané pasáže čte umělá inteligence hlasem Karla Gotta. Je to vůbec poprvé v Česku, kdy je hlas vytvořený umělou inteligencí takto použit v literárně-dramatickém díle. Projekt by nevznikl bez katedry kybernetiky Západočeské univerzity (ZČU).

„Vědci museli během jednoho až dvou měsíců dokázat, že vytvoří co nejvěrnější kopii Gottova hlasu. Data jim poskytl rozhlasový archiv, neboť zpěvák v letech 2011 až 2015 na stanici Dvojka moderoval vlastní pořad Zpátky si dám tenhle film,“ uvedl mluvčí ZČU Pavel Korelus. Dostali dvě stě hodin nahrávek. „Po prostříhání zbylo asi dvacet hodin záznamu bez šumu, slov v cizím jazyce nebo písní v podkresu,“ řekl vedoucí týmu Jindřich Matoušek.

Na rekonstrukci hlasu pracoval šestičlenný tým. „Na základě nahrávek a odpovídajících přepisů jsme pak mohli natrénovat model syntézy řeči založený na moderních hlubokých neuronových sítích tak, že hlasem Karla Gotta přečte zadaný psaný text,“ řekl vědec. Hlas nakonec vznikl v šesti verzích, z nichž mohl ČRo vybírat. „Díky tomu, že zvuk ještě prošel náročnou postprodukcí, zní finální produkt asi nejlépe, jak znít mohl,“ uvedl.

Podle Matouška tím Česko ukázalo, že umí dělat výzkum a vývoj řečových technologií i umělé inteligence na světové úrovni. „Aby byl počítačový hlas plnohodnotným partnerem člověka v hlasovém dialogu, nestačí jen přečíst daný text. Syntéza musí také dokonale porozumět tématu konverzace, umět vyjádřit postoj mluvčího, náladu, emoce, mít paměť… Takové úlohy na řešení teprve čekají,“ řekl.

Upozornění ve vysílání

„Nechali jsme si vypracovat rozsáhlou právní analýzu, která nám odhalila některá rizika, která by mohla být s užitím hlasu spojena. Hlas, který je vytvořený umělou inteligencí, nikdy nepoužijeme pro věty, které ta dotyčná osoba sama nenapsala nebo nepronesla. V každém použití hlasu ve vysílání na to posluchače předem výslovně upozorníme,“ popisuje kreativní producent Lukáš Sapík.

„Přemýšlela jsem o tom, co by tomu řekl Karel. Byl příznivec různých inovativních věcí a techniky. Myslím, že by to vtipně oglosoval,“ sdělila kmotra projektu, zpěvačka Jitka Zelenková.

Katedra kybernetiky ZČU pracuje s technologií syntézy řeči od 90. let. Z poslední doby je známý například její projekt automatické konzervace hlasu, který vznikl hlavně na pomoc nemocným, jimž hrozí, že přijdou o hlas.