Čínské AI modely vykradly ty americké, zlobí se firma

Umělé inteligence (AI) vznikly mnohdy na základě toho, že jejich provozovatelé je trénovali na nelegálně získaných datech. Tato praktika funguje dál a cílí na samotné modely AI. Vývojáři společnosti Anthropic tento týden upozornili, že tři čínské společnosti zabývající se umělou inteligencí „nelegálně získaly“ schopnosti modelu Claude. Ten je považovaný za jednu z nejvyspělejších AI současnosti.

Vývojáři popsali, že čínské AI „destilovaly“ schopnosti modelu společnosti Anthropic. Podněcovaly ho speciálně připravenými příkazy, aby se z jeho odpovědí samy učily a zlepšovaly se. Připomíná to špičkovou soukromou školu, kam se vloudí neplatící student.

Destilace je legitimní metoda, která se často používá například pro trénink modelů tak, aby byly levnější, menší a úspornější. V tomto případě to ale dle Anthropicu byla jiná situace: americká firma označuje aktivitu čínských konkurentů za „destilační útoky“. Podle vyjádření společnosti nejsou sice zřejmě trestné, ale pravděpodobně odporují podmínkám užívání služby Claude.

Anthropic označil obcházení pravidel za problém, zejména proto, že společnosti „podléhající kontrole Komunistické strany Číny“ tak mohou eliminovat domnělou konkurenční výhodu amerických firem.

Řada médií viní Anthropic z pokrytectví. I tato firma, stejně další v oboru, totiž získávala data pro trénink svého AI modelu Claude pomocí takzvaného scrapování – tedy získávání dat z webů, přičemž některé to ve svých podmínkách užití zapovídají.

Anthropic z toho obvinila například diskusní platforma Reddit, která tvrdí, že Claude byl natrénován na datech a konverzacích právě tohoto webu. A to dokonce i z dat, která byla označena jako určená ke smazání, což pravidla explicitně zakazují. Podle Redditu se toho měl Anthropic dopouštět v letech 2021 až 2024.

Z tohoto chování viní Anthropic také generální ředitel společností Tesla a xAI Elon Musk. Ten nedávno prohlásil, že společnost Anthropic ukradla velké množství dat za účelem trénování svých modelů. Musk tvrdí, že k této krádeži dat došlo v obrovském měřítku, což vedlo k tomu, že společnost musela zaplatit miliardy dolarů na vyrovnání. Pro zajímavost: ze stejného chování obviňují experti i Muskovu AI Grok.

AI firmy pro tréninky svých modelů použily obrovské množství licencovaného obsahu, čemuž napovídá například to, že modely jsou schopné věrně přepsat takřka celé konkrétní knihy. Společnost Meta podle spisovatelů, kteří se obrátili na soud, zneužila na osmdesát terabajtů dat z on-line knihoven. V Británii se zase hudebníci ohradili vůči tomu, aby firmy provozující umělé inteligence mohly trénovat na jejich licencované hudbě.

Anthropic v příspěvku na svém blogu označil a pojmenoval i konkrétní společnosti, které pravidla údajně porušily. Jsou to DeepSeek, Moonshot a MiniMax, přičemž největší vinu podle americké firmy měla poslední jmenovaná, která sídlí v Šanghaji a provozuje aplikaci Talkie.

Ta zaplavila chatbot Claude od Anthropicu více než třinácti miliony dotazy a výměnami dat. To výrazně přesahuje 3,4 milionu výměn u pekingské společnosti Moonshot s její AI Kimi a 150 tisíc u nejznámější čínské AI platformy DeepSeek.

Jak podvod funguje

Anthropic má svoje služby pro Čínu z důvodů národní bezpečnosti zablokované, takže by se tamní firmy k jeho službám neměly teoreticky ani dostat. Aby to obešly, využily podle Anthropicu komerční služby, které po celém světě prodávají přístup ke Claudovi a dalším špičkovým modelům umělé inteligence.

Tyto služby využívají takzvané „hydra cluster“ architektury: rozsáhlé sítě podvodných účtů, které distribuují provoz přes platformy třetích stran. „Rozsah těchto sítí znamená, že když je jeden účet zablokován, nahradí ho nový. V jednom případě spravovala jedna síť současně více než dvacet tisíc podvodných účtů a kombinovala provoz destilace s běžnými požadavky zákazníků, aby tak ztížila odhalení,“ popisuje Anthropic.

Jakmile se podařilo takto získat přístup, začaly čínské firmy vytvářet nastíněné obří objemy pečlivě vytvořených výzev, jejichž cílem bylo získat z amerického modelu specifické schopnosti. „Cílem je buď shromáždit vysoce kvalitní odpovědi pro přímý trénink modelu, nebo generovat desítky tisíc jedinečných úkolů potřebných pro spuštění posilového učení,“ popisuje americká forma formu útoku.

Čínské snahy o americká data

O podobné situaci informovala také další americká společnost OpenAI, která provozuje model ChatGPT. Na začátku února informovala americkou Sněmovnu reprezentantů v memorandu, v němž obvinila společnost DeepSeek z „pokračujících snah o bezplatné využívání schopností vyvinutých společností OpenAI a dalšími americkými laboratořemi“.

Toto zápolení probíhá v kontextu dynamických změn v úspěšnosti různých modelů umělých inteligencí. Právě čínský DeepSeek, který loni zaskočil svět svou kvalitou, by měl každým dnem uvést na trh svůj nejnovější vlajkový model DeepSeek V4.

Výběr redakce

Aktuálně z rubriky Věda

Čínské AI modely vykradly ty americké, zlobí se firma

Umělé inteligence (AI) vznikly mnohdy na základě toho, že jejich provozovatelé je trénovali na nelegálně získaných datech. Tato praktika funguje dál a cílí na samotné modely AI. Vývojáři společnosti Anthropic tento týden upozornili, že tři čínské společnosti zabývající se umělou inteligencí „nelegálně získaly“ schopnosti modelu Claude. Ten je považovaný za jednu z nejvyspělejších AI současnosti.
před 1 hhodinou

Přichází jaro v zimě. Teploty se mohou přiblížit osmnácti stupňům

Po týdnech, kdy člověk na obloze nezahlédl Slunce a z nebe padal sníh nebo déšť, se počasí nad Evropou v posledním únorovém týdnu dramaticky mění. Velká část kontinentu už zažívá nebo zažije teplotně výrazně nadprůměrné dny a také velkou oblačnost v mnoha oblastech vystřídá slunečnější ráz počasí. V některých oblastech teplota letos poprvé dokonce dosáhne nebo přesáhne hranici dvaceti stupňů. Závěr klimatologické zimy tak přinese poměrně výraznou ochutnávku pravého jara.
před 3 hhodinami

Vědci se domnívají, že našli prastarého předchůdce písma

První písmo podle učebnic dějepisu vzniklo na Blízkém východě, někdy kolem roku 3400 před naším letopočtem. Němečtí vědci ze Saarlandské univerzity teď ale tvrdí, že našli důkazy o tom, že historie písma je mnohem, mnohem starší. Možná dokonce o desítky tisíc let.
před 21 hhodinami

USA se na Trumpův pokyn vrací ke glyfosátu. Ministr Kennedy otočil

Prezident Donald Trump minulý týden vydal exekutivní příkaz, kterým se rozhodl podpořit domácí produkci fosforu a herbicidu glyfosátu. Chemikálii řada organizací viní z negativních dopadů na lidské zdraví, i kvůli možnému riziku rakoviny. Aktivně proti ní v minulosti vystupoval i současný ministr zdravotnictví Robert F. Kennedy mladší. Ve vládním angažmá otočil s tím, že na glyfosátu je závislé americké zemědělství.
před 23 hhodinami

Bouba a kiki fungují i u kuřat. Vědci boří jeden z pilířů jazykovědy

Nový výzkum italských psychologů zjistil, že jedno z univerzálních pravidel v lidském jazyce zřejmě nemá nic společného s řečí. Funguje totiž také u kuřat, která od lidí dělí tři sta milionů let evoluce.
včera v 10:55

Před 70 lety padla Stalinova modla. Pomohl k tomu ze záhrobí i Lenin

Takzvaná „Fronta na maso“ – monumentální Stalinův pomník na pražské Letné – stál na místě necelý rok, když se nad jeho existencí už začaly stahovat mraky. Před 70 lety totiž začal XX. sjezd Komunistické strany Sovětského svazu. Tehdejší první tajemník Nikita Chruščov na něm poprvé veřejně odsoudil Stalinovy zločiny a vytváření jeho kultu osobnosti. Projev byl tajný, brzo se ale dostal do světa. A Stalinova sláva začala uvadat. Příslib společenského uvolnění ale Sověti následně rázně utnuli.
včera v 07:00

Porno, sítě, hry. Hyde Park Civilizace řešil digitální hrozby

Stále mladší děti tráví stále více času na sociálních sítích. Ty jim poskytují spoustu zábavy, poznání i sociálních vazeb, ale také skýtají mnoho nástrah. Pro rodiče může být složité tato rizika pochopit, protože v jejich mládí nebyla lidská identita natolik propojená s tou digitální a většina takových hrozeb nebyla tak rozšířená. Tématu se věnoval Hyde Park Civilizace.
včera v 06:30

Marihuana v dospívání zdvojnásobuje riziko duševních nemocí

Téměř půl milionu mladých lidí zkoumali američtí vědci v rozsáhlé studii, která se věnovala konzumaci marihuany. Výzkum ukázal, že existuje souvislost mezi kouřením konopí a vznikem psychických chorob. A s velkou pravděpodobností jde o souvislost příčinnou.
23. 2. 2026
Načítání...