DeepSeek ma problemy z działaniem – bo rząd kazał unikać chipów Nvidii, używać Huawei
Jak wiadomo, chiński model AI DeepSeek R1 okazał się rynkowym hitem, będąc z miejsca uznanym za odpowiedź Chin na dominację botów amerykańskich, takich jak ChatGPT, Grok, Perplexity i inne. Na przekór teorii głoszącej, że Chińczycy są znakomici w kopiowaniu, ale już nie w pracy kreatywnej, DeepSeek okazał się zawierać rozwiązania, które znakomicie podnosiły jego efektywność. Chodzi tu o architekturę mixture-of-experts (MoE), funkcje zapewniające kompresję pamięci czy optymalizację dostępnych zasobów obliczeniowych.
I choć w przeciągu ostatniego roku bot stał się także obiektem bardziej chłodnych ocen, zaś krytycy twierdzili, że bot firmy Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co. (jak brzmi jej pełna nazwa) wykazuje zadziwiające podobieństwo algorytmiczne do modeli firmy OpenAI – czyli, mówiąc nieco bardziej nieparlamentarnie, swoją efektywność osiągnął nie dzięki nowatorskim rozwiązaniom, a zerżnięciu na tzw. chama już opracowanych algorytmów – to fakt pozostawał faktem. Ten mianowicie, że DeepSeek jest i działa.
DeepSeek się popsuł…?
Czy też może bardziej „działał” – okazuje się bowiem, że najnowszy model tego bota, R2 ma z tym zadziwiająco duże problemy. W tym tygodniu ogłoszono, że firma przesuwa premierę jego nowej wersji. Była do tego zmuszona po niezadowalających efektach treningu modelu. W czym problem? W chipach – a ściślej w tym, że w ich kwestię wtrąciło się chińskie państwo. Z przewidywalnymi (szczególnie w przypadku państw działających wedle wzorców komunistycznych) efektami.
Pierwszy model, R1, rozwijany był z wykorzystaniem chipów Nvidia H20. W ciągu pierwszych miesięcy tego roku chipy tej wiodącej obecnie na tym rynku firmy stały się jednak zakładnikiem wielkiej polityki – i obiektem amerykańskich restrykcji eksportowych. W toczonych negocjacjach handlowych Chiny uporczywie domagały się od USA zniesienia zakazu ich eksportu. To zresztą w końcu nastąpiło. Co natomiast nie nastąpiło to powrót do ich wykorzystania w Chinach na zasadach rynkowych. Przeszkodził w tym sam chiński rząd.
Pekin wprowadził bowiem politykę „zachęcania” chińskich firm do nie-używania produktów Nvidii i zastępowania ich chińskimi odpowiednikami. Co owo „zachęcanie” oznacza w chińskich realiach politycznych, najpewniej nie trzeba tłumaczyć. Tamtejsze Ministerstwo Informacji i Technologii nałożyło nawet obowiązek składania formalnych uzasadnień, czemu dana firma chciałaby nabyć chipy H20, zamiast szczególnie mocno promowanego ich substytutu – chipów Ascend produkcji koncernu Huawei.
Władza „pomogła”
Czy owa cokolwiek samo-przecząca sobie polityka jest wywołana faktycznymi obawami o bezpieczeństwo i amerykańskie backdoory w chipach Nvidii – czy też chodzi o typową dla polityki ekipy Xi Jinpinga kwestię ambicjonalno-propagandową, w myśl zasady „że Chińczycy nie gęsi, że swoje chipy mają” – utrudnienia graniczące z faktyczną blokadą dostępu do produktów zza oceanu są w Chinach faktem. DeepSeek próbował zrealizowac rządowe „sugestie” i wykorzystać chipy Ascend do treningu swego bota w wersji R2. Napotkał jednak ciągłe problemy.
Chipy produkcji Huawei miały bowiem cechować się gorszymi niż w przypadku Nvidii osiągami w zakresie przesyły danych, a także cierpieć na kłopoty ze stabilnością działania. Koncern Huawei ze swej strony miał nawet przysłać do firmy DeepSeek zespół swoich inżynierów, aby rozwiązali problemy – mimo to nie udało się z sukcesem przeprowadzić procesu szkolenia bota w wersji R2. W ramach kompromisu DeepSeek usiłował stosować oprzyrządowanie mieszane, wykorzystując zarówno chipy obydwu producentów.
To jednak, prócz osiągów, które miały nie zadowalać założyciela firmy, doprowadziło także do opóźnień. Wedle planów, DeepSeeek R2 miał być gotowy do premiery już w maju. Dzięki wpływowi polityki harmonogram odszedł jednak w odstawkę. Co zaś z samymi efektami treningu? Póki model nie zostanie udostępniony i zanalizowany – nie wiadomo.
