Čínská společnost nemůže trénovat svůj model R2 na čipech Huawei a musí se spoléhat na hardware NVIDIA navzdory tlaku vlády.
DeepSeek, jeden z nejslibnějších start-upů v oblasti umělé inteligence, musel ve svých plánech ustoupit o krok zpět. Čínská společnost odložila uvedení svého dlouho očekávaného modelu R2, jehož uvedení bylo původně plánováno na první polovinu roku 2024. Hlavním důvodem odkladu je nemožnost vycvičit systém s procesory Huawei, na čemž čínská vláda trvala, aby se snížila závislost na zahraničních technologiích.
Tento neúspěch následuje po obrovském úspěchu modelu R1, který byl vycvičen především na čipech Nvidia. Podle TechSpotu Peking tlačil na DeepSeek, aby při vývoji R2 používal výhradně domácí hardware, ale výsledky nebyly takové, jak se očekávalo. Situace poukazuje na napětí mezi politickými ambicemi a technickou realitou.
Technická realita má přednost před politickými ambicemi
Inženýři společnosti DeepSeek čelili vážným problémům, když se snažili vycvičit R2 s procesory Huawei Ascend. Tyto čipy, ačkoli teoreticky slibné, představovaly problémy se spolehlivostí, pomalou vzájemnou komunikací a především postrádaly robustní ekosystém, jako je CUDA společnosti Nvidia, který je pro efektivní trénování modelů umělé inteligence nezbytný. Přestože Huawei vyslal své vlastní inženýry, aby pomohli tyto problémy vyřešit, potíže přetrvávaly a DeepSeek byl nucen přehodnotit svou strategii.
Nakonec se společnost rozhodla pro hybridní řešení: trénování R2 pomocí výkonných čipů Nvidia H20 a použití čipů Huawei pouze pro inferenci, což je fáze, která vyžaduje menší výpočetní výkon. Toto rozhodnutí umožňuje společnosti DeepSeek pokračovat v práci, ačkoli to nebylo původním plánem. Společnost je známá svým pečlivým přístupem a vybroušenějším vývojem ve srovnání s ostatními hráči v oboru, takže jakékoli technické problémy mají významný dopad na celé odvětví.
Čínské úřady jsou znepokojeny závislostí na americkém hardwaru a obávají se, že čipy společnosti Nvidia mohou mít zadní vrátka nebo zranitelnosti. Rozdíl mezi přáním a dosažením něčeho je však značný, zejména v technologické oblasti. Zpoždění je ranou pro společnost DeepSeek, která urychlila uvedení své nové umělé inteligence, aby mohla přímo konkurovat GPT-5, a slibovala produkt, který je efektivnější a až 20krát levnější.
Pochvala od konkurentů
Především lídři v oboru, jako je OpenAI a Microsoft, veřejně uznali kvalitu práce společnosti DeepSeek a její dopad na průmysl. Obdržet pochvalu od konkurentů a následně odložit zásadní vydání není zrovna nejlepší situace. DeepSeek očekává, že R2 bude připraven během několika týdnů a plně funkční na hardwaru Nvidia, ale tato epizoda ukazuje, jak složité je dosáhnout technologické nezávislosti, když technické možnosti nejsou na úrovni.

Zdroj: Youtube.com
Ve světě umělé inteligence mají nakonec technická rozhodnutí přednost před politickými, pokud jde o vývoj funkčních produktů. Čína může mít ambice, jaké chce, ale pokud hardware nesplňuje potřebné standardy, nedá se s tím mnoho dělat. Tento incident s DeepSeekem je připomínkou toho, že technologie překračuje hranice a nacionalismy: buď funguje, nebo nefunguje, bez ohledu na to, odkud pochází.
Tento případ také zdůrazňuje, jak je důležité mít dobře integrovaný softwarový a hardwarový ekosystém, čehož společnost Nvidia dosáhla díky své platformě CUDA, která vývojářům umožňuje optimalizovat výkon jejich modelů umělé inteligence. Absence podobného prostředí v čipech Huawei je významnou překážkou technologické nezávislosti Číny v této oblasti. Situace společnosti DeepSeek je jasným příkladem toho, jak může technická složitost zpochybnit i ty nejpečlivěji naplánované strategie.