Vytvářet filmové trailery není nic snadného. Řada programátorů se proto snaží naučit to umělé inteligence – jenže se ukazuje, že i to je velmi náročné. Vědci teď představili zatím nejúspěšnější pokus.
Umělá inteligence se naučila vytvářet kvalitní filmové trailery. Bohužel často prozradí spoilery
Trailery bývají základem propagace nových filmů. Tyto krátké klipy sice trvají jen pár desítek sekund, mají ale klíčový dopad na úspěch či neúspěch uměleckého díla v ceně stovek milionů. Jejich výroba je nesmírně složitá: tvůrce musí vybrat zajímavé scény, které film mají dostatečně vystihnout po stránce příběhu i celkové atmosféry, ale současně nesmí z děje vyzradit příliš.
Tyto filmové upoutávky zatím vytvářeli především lidé. Už nějakou dobu ale počítačoví vědci zkoumají možnost, že by takové propagační klipy mohly být generovány také stroji – algoritmy pracujícími na principu umělé inteligence.
Výzkumníci z Edinburské univerzity teď vyvinuli model založený na umělé neuronové síti, který dokáže automaticky vyrábět filmové upoutávky. Tento model, představený v odborném článku na webu arXiv, je založen na algoritmu strojového učení na bázi grafů.
Aby byl výsledek co nejlepší, rozdělili vědci úkol pro počítač na dvě dílčí úlohy. Stroj se měl nejprve co nejlépe naučit rozpoznat strukturu vyprávěni ve filmu a také náladu a emoce, jaké snímek vyjadřuje. Jde o dvě odlišné roviny filmového díla – například akční film může být současně komedií, ale také sentimentálním, nebo dokonce depresivním vyprávěním. Technika, kterou skotští programátoři vytvořili, umí zpracovávat jak obrazovou stránku filmu, tak i tu textovou.
„Filmy modelujeme jako grafy, kde uzly jsou záběry a úsečky označují sémantické vztahy mezi nimi,“ píší autoři. Stroj tedy natrénují tak, že mu ve starších filmech označí klíčové postavy, akce nebo situace, aby se pak on sám rozhodoval, co jsou tyto uzly v dalších filmech. A v traileru pak logicky právě tyto postavy a situace divákům ukazuje.
Metoda generování filmových trailerů, kterou vytvořili, se v podstatě skládá ze dvou neuronových sítí. Zatímco jedna z těchto sítí zpracovává záběry odvozené z obrazové stopy filmu, druhá analyzuje textové reprezentace scén, které vycházejí ze scénáře filmu.
Kombinací těchto dvou neuronových sítí lze ve filmu identifikovat zlomové body, tedy části filmu, které jsou obzvláště výrazné a které by měly být uvedeny v trailerech. Zlomové body ve filmech obvykle zahrnují příležitost, změnu plánu, bod, z něhož není návratu, zásadní neúspěch nebo vyvrcholení.
Jak si vede umělá inteligence?
Vědci svůj algoritmus vyhodnotili v sérii testů. Zjistili, že program dokáže identifikovat zlomové body ve filmech s výrazně vyšší přesností než jiné základní metody generování filmových upoutávek.
Kromě toho výzkumníci použili svůj model k vytvoření upoutávek na 41 různých filmů. Pak porovnali kvalitu takto vytvořených upoutávek s upoutávkami vytvořenými jinými technikami strojového učení – oslovili lidi na platformě Amazon Mechanical Turk (AMT), kterým upoutávkám dávají přednost. Většina respondentů dala přednost upoutávkám vytvořeným novou technikou před trailery, které vytvořily umělé inteligence pracující pod lidským dohledem. Videa tým nezveřejnil.
Autoři zdůrazňují, že umělá inteligence si zatím příliš nedokázala poradit se spoilery – vyzrazovala v upoutávkách velice ráda věci, které by diváci ještě před zhlédnutím filmu neměli vidět – tedy nějaké to překvapení na konec, nečekanou pointu nebo vyústění snímku.
Tento model sice ještě nemusí vytvářet dokonalé trailery, ale časem by ho mohly využívat filmové produkční společnosti k usnadnění a urychlení jejich výroby. Mezitím tým plánuje na své technice dále pracovat, aby kvalitu dále zlepšil. „V budoucnu bychom se chtěli zaměřit na metody pro předpovídání jemných emocí (například smutek, odpor, hrůza, radost) ve filmech,“ dodávají vědci ve svém článku.