Umělé inteligence směřují k mluvení přirozeným jazykem

Umělé inteligence přestávají být záležitostí čistě psanou, stále lépe získávají schopnost samy hovořit a rozpoznávat lidskou řeč. Hlavní hráči v tomto oboru míří v dalším vývoji právě tímto směrem.

Nejznámější a současně nejúspěšnější umělou inteligencí současnosti je ChatGPT společnosti OpenAI. Ta tento týden oznámila, že začala rozšiřovat svůj populární chatovací systém o nové funkce, které uživatelům umožní komunikovat se systémem hlasem a ukazovat mu obrázky.

„ChatGPT nyní vidí, slyší a mluví,“ uvedla společnost. „Začínáme spouštět nové hlasové a obrazové funkce v systému ChatGPT. Nabízí nový intuitivní typ rozhraní, který vám umožní vést hlasovou konverzaci, nebo ukázat systému ChatGPT, o čem mluvíte,“ dodala.

Uživatel bude moci podle firmy například při cestování vyfotografovat nějakou zajímavost a následně o ní se systémem ChatGPT diskutovat. Doma pak bude moci třeba vyfotografovat obsah ledničky a požádat systém o návrh na recept na večeři. Firma uvedla, že nové funkce během dvou týdnů zpřístupní uživatelům placených verzí ChatGPT Plus a ChatGPT Enterprise.

OpenAI koncem loňského listopadu ChatGPT zdarma zpřístupnila veřejnosti a systém si rychle získal velkou popularitu. ChatGPT patří do kategorie generativní umělé inteligence a dokáže na základě jednoduchých dotazů generovat články, eseje, vtipy, ale i poezii. Na základě obrovského množství dat se podobně jako člověk učí, jak odpovídat na podněty uživatelů.

Cesta Amazonu

Podobným směrem se vydává i společnost Amazon. Ta tento týden oznámila, že investuje až čtyři miliardy dolarů (téměř 92 miliard Kč) do start-upu Anthropic. Tím získá klíčového partnera v oblasti generativní umělé inteligence. V rámci dohody Anthropic přesune většinu svého softwaru do datových center Amazon Web Services (AWS) a bude využívat domácí čipy této cloudové divize k trénování modelů, které používá k provozu chatbotů a dalších aplikací. 

Podle televizní stanice NBC je jedním z cílů tohoto propojení to, aby hlasový asistent Alexa získal schopnosti komunikace podobné té lidské. Současně upozornil, že společnost data uživatelů, kteří s tímto strojem mluví, využívá právě pro trénink umělé inteligence. Ta se může na základě obrovského množství dat učit, jak vypadá normální lidská komunikace. To pro Amazon představuje výhodu oproti konkurenci. Doposud totiž většina tréninkových dat pocházela jen z komunikace na internetu, nikoliv z toho, jak se normálně mluví.  

Amazon je významným hráčem v odvětví internetového obchodu a cloudových služeb. Firma dlouhodobě získává podíly v partnerských společnostech v těch oblastech, které považuje za prioritní, například v sektoru nákladní letecké dopravy, distribuce potravin či výroby elektromobilů.

Pokud se investice do společnosti Anthropic přiblíží čtyřem miliardám dolarů, půjde o největší známou firemní transakci přímo související s AWS. Tato divize se snaží vytvářet své vlastní produkty a nespoléhat se na technologie jiných firem.

Dohoda představuje milník v úsilí Amazonu v oblasti výroby čipů. Její procesory nazvané Trainium a Inferentia jsou navrženy pro podporu aplikací pro strojové učení. Většina aplikací AI se spoléhá na drahé čipy od firmy Nvidia, které může být obtížné sehnat. Společnost Anthropic bude používat čipy AWS k vytváření a trénování budoucích základních modelů.

Vedení společnosti Amazon uvedlo, že takzvaná generativní AI je přes rozsáhlé úspěchy vlastně teprve na počátku svého úspěchu a v Amazonu je vysloveně v plenkách. Nástroje strojového učení společnosti zatím podle managementu použilo jen asi 100 tisíc zákazníků. Základní model společnosti Anthropic, nazvaný Claude, už je k dispozici jako součást služby Bedrock, jež uživatelům zpřístupňuje modely umělé inteligence Amazonu i třetích stran.