Čínské AI modely vykradly ty americké, zlobí se firma

Umělé inteligence (AI) vznikly mnohdy na základě toho, že jejich provozovatelé je trénovali na nelegálně získaných datech. Tato praktika funguje dál a cílí na samotné modely AI. Vývojáři společnosti Anthropic tento týden upozornili, že tři čínské společnosti zabývající se umělou inteligencí „nelegálně získaly“ schopnosti modelu Claude. Ten je považovaný za jednu z nejvyspělejších AI současnosti.

Vývojáři popsali, že čínské AI „destilovaly“ schopnosti modelu společnosti Anthropic. Podněcovaly ho speciálně připravenými příkazy, aby se z jeho odpovědí samy učily a zlepšovaly se. Připomíná to špičkovou soukromou školu, kam se vloudí neplatící student.

Destilace je legitimní metoda, která se často používá například pro trénink modelů tak, aby byly levnější, menší a úspornější. V tomto případě to ale dle Anthropicu byla jiná situace: americká firma označuje aktivitu čínských konkurentů za „destilační útoky“. Podle vyjádření společnosti nejsou sice zřejmě trestné, ale pravděpodobně odporují podmínkám užívání služby Claude.

Anthropic označil obcházení pravidel za problém, zejména proto, že společnosti „podléhající kontrole Komunistické strany Číny“ tak mohou eliminovat domnělou konkurenční výhodu amerických firem.

Řada médií viní Anthropic z pokrytectví. I tato firma, stejně další v oboru, totiž získávala data pro trénink svého AI modelu Claude pomocí takzvaného scrapování – tedy získávání dat z webů, přičemž některé to ve svých podmínkách užití zapovídají.

Anthropic z toho obvinila například diskusní platforma Reddit, která tvrdí, že Claude byl natrénován na datech a konverzacích právě tohoto webu. A to dokonce i z dat, která byla označena jako určená ke smazání, což pravidla explicitně zakazují. Podle Redditu se toho měl Anthropic dopouštět v letech 2021 až 2024.

Z tohoto chování viní Anthropic také generální ředitel společností Tesla a xAI Elon Musk. Ten nedávno prohlásil, že společnost Anthropic ukradla velké množství dat za účelem trénování svých modelů. Musk tvrdí, že k této krádeži dat došlo v obrovském měřítku, což vedlo k tomu, že společnost musela zaplatit miliardy dolarů na vyrovnání. Pro zajímavost: ze stejného chování obviňují experti i Muskovu AI Grok.

AI firmy pro tréninky svých modelů použily obrovské množství licencovaného obsahu, čemuž napovídá například to, že modely jsou schopné věrně přepsat takřka celé konkrétní knihy. Společnost Meta podle spisovatelů, kteří se obrátili na soud, zneužila na osmdesát terabajtů dat z on-line knihoven. V Británii se zase hudebníci ohradili vůči tomu, aby firmy provozující umělé inteligence mohly trénovat na jejich licencované hudbě.

Anthropic v příspěvku na svém blogu označil a pojmenoval i konkrétní společnosti, které pravidla údajně porušily. Jsou to DeepSeek, Moonshot a MiniMax, přičemž největší vinu podle americké firmy měla poslední jmenovaná, která sídlí v Šanghaji a provozuje aplikaci Talkie.

Ta zaplavila chatbot Claude od Anthropicu více než třinácti miliony dotazy a výměnami dat. To výrazně přesahuje 3,4 milionu výměn u pekingské společnosti Moonshot s její AI Kimi a 150 tisíc u nejznámější čínské AI platformy DeepSeek.

Jak podvod funguje

Anthropic má svoje služby pro Čínu z důvodů národní bezpečnosti zablokované, takže by se tamní firmy k jeho službám neměly teoreticky ani dostat. Aby to obešly, využily podle Anthropicu komerční služby, které po celém světě prodávají přístup ke Claudovi a dalším špičkovým modelům umělé inteligence.

Tyto služby využívají takzvané „hydra cluster“ architektury: rozsáhlé sítě podvodných účtů, které distribuují provoz přes platformy třetích stran. „Rozsah těchto sítí znamená, že když je jeden účet zablokován, nahradí ho nový. V jednom případě spravovala jedna síť současně více než dvacet tisíc podvodných účtů a kombinovala provoz destilace s běžnými požadavky zákazníků, aby tak ztížila odhalení,“ popisuje Anthropic.

Jakmile se podařilo takto získat přístup, začaly čínské firmy vytvářet nastíněné obří objemy pečlivě vytvořených výzev, jejichž cílem bylo získat z amerického modelu specifické schopnosti. „Cílem je buď shromáždit vysoce kvalitní odpovědi pro přímý trénink modelu, nebo generovat desítky tisíc jedinečných úkolů potřebných pro spuštění posilového učení,“ popisuje americká forma formu útoku.

Čínské snahy o americká data

O podobné situaci informovala také další americká společnost OpenAI, která provozuje model ChatGPT. Na začátku února informovala americkou Sněmovnu reprezentantů v memorandu, v němž obvinila společnost DeepSeek z „pokračujících snah o bezplatné využívání schopností vyvinutých společností OpenAI a dalšími americkými laboratořemi“.

Toto zápolení probíhá v kontextu dynamických změn v úspěšnosti různých modelů umělých inteligencí. Právě čínský DeepSeek, který loni zaskočil svět svou kvalitou, by měl každým dnem uvést na trh svůj nejnovější vlajkový model DeepSeek V4.

Výběr redakce

Aktuálně z rubriky Věda

Nákladní člun se s keporkakem zvaným Timmy vydal do Severního moře

Tým dobrovolníků na severu Německa se v úterý pustil do dalšího pokusu o záchranu velryby, která zde v březnu uvázla na mělčině. Podařilo se ji dostat na speciální nákladní člun, který se následně vydal na cestu z Baltského do Severního moře. Pokusy o záchranu keporkaka zvaného Timmy poutají velkou pozornost médií a veřejnosti v Německu i v zahraničí.
včeraAktualizovánopřed 6 hhodinami

Spor o léky na Alzheimerovu nemoc. Studie tvrdí, že nejsou účinné, část vědců nesouhlasí

Evropské úřady na konci loňského roku registrovaly první dva léky proti Alzheimerově chorobě. Jestli je budou členské státy proplácet z veřejného zdravotního pojištění, je na každé zemi. Právě ve fázi tohoto schvalování vyšla významná studie, která léky z této skupiny označila za nedostatečně efektivní.
před 12 hhodinami

Čeští vědci chtějí odstraňovat léky z vody s pomocí světla. Popsali, jak na to

Tým vědců z Ostravy a Olomouce úspěšně otestoval uhlíkový materiál, který za pomoci světla rozkládá zbytky léčiv ve vodě a snižuje tak jejich rizika pro vodní organismy. Výzkum tak naznačil, jak by se v budoucnosti daly šetrnějším způsobem čistit odpadní vody v tuzemsku.
před 15 hhodinami

Zemřel za úsvitu druhého dne, chránil se hmoždířem. Vědci popsali smrt v Pompejích

Archeologové objevili v Pompejích při nedávných vykopávkách pozůstatky dvou mužů, kteří zemřeli při erupci Vesuvu v roce 79 našeho letopočtu. Podle vědců se pokusili uprchnout směrem k pobřeží a před padajícím sopečným materiálem se chránili improvizovaně předměty, které měli po ruce.
před 16 hhodinami

Data: Proti chřipce nejsou očkované tři čtvrtiny lékařů a drtivá většina sester

Evropská unie doporučuje, aby bylo očkovaných nejméně 75 procent pracovníků ve zdravotnictví. Aktuální údaje z Česka ale ukazují, že tohoto čísla v případě vakcíny proti chřipce nedosahuje ani jediná skupina zdravotníků a proočkovanost je mezi nimi výrazně nižší.
27. 4. 2026

Vědci sestavili obří mapu vesmíru, naznačili zpochybnění Einsteinovy konstanty

Pět let trvalo, než vznikla nejkvalitnější mapa kosmu, která zachycuje 47 milionů galaxií. Vědci ji chtějí využít pro pochopení toho, jak se chová a jak je rozložená takzvaná temná energie, která tvoří většinu vesmíru. Sběr dat reálně trval kratší dobu, než bylo v plánu, celý proces totiž narušila covidová pandemie.
27. 4. 2026

Svět padá do AI pasti, tvrdí ekonomové

Umělé inteligence (AI) rychle zvyšují automatizaci v mnoha oborech. Rychlost a rozsah těchto změn jsou tak velké, že to dle nového výzkumu může ohrozit i samotné firmy. V rozhovoru pro ČT24 autoři nové studie popsali, jak by nastíněný celosvětový problém řešili právě oni.
27. 4. 2026

Nové poznatky o lidoopech narušují představu o výjimečnosti lidské mysli

Lidoopi dokážou předstírat hru s neexistujícími předměty, měnit svá přesvědčení podle síly nových informací a pamatovat si známé tváře i po více než čtvrt století. Série studií z posledních let, které shrnuje britský list The Guardian, výrazně mění pohled vědců na mentální schopnosti nejbližších příbuzných člověka a zpochybňuje dřívější představy o jedinečnosti lidské mysli.
27. 4. 2026
Načítání...