DeepSeek AI: Czy spowoduje krach na Nasdaq? Czarny łabędź nad Wall Street
Operujący na sztucznej inteligencji fundusz quant HighFlyer Capital z Chin wywołał panikę w amerykańskiej Dolinie Krzemowej. Powód? Firma DeepSeek, za którą stoi wydawała superwydajny model AI DeepSeek R-1 w ’open source’ na licencji MIT. Według szeregu analiz model rywalizuje na równi lub przewyższa szereg 'zachodnich’ behemotów m.in. Chat GPT w wersji o-1. Amerykańskie firmy zainwestowały setki miliardów dolarów, by skalować moc obliczeniową sztucznej inteligencji. Okazuje się jednak, że Chińczycy osiągnęli porównywalne, lub lepsze wyniki, inwestując w 'chipy AI’ ułamek tej kwoty.
Model może przewyższyć najlepsze amerykańskie, mimo że budowany jest przy użyciu mniej wydajnych układów. Kładzie oprogramowanie ponad 'infrastrukturę’ w postaci 'brutalnej mocy obliczeniowej’. Jego przełomowość nie ulega wątpliwości. Czy zatrzęsie notowaniami gigantów z indeksu Nasdaq? Czy czeka nas krach na akcjach taki firm jak Nvidia, Microsoft, czy Oracle? Jeśli prawdą jest, że przy użyciu mniej wydajnych chipów chiński startup nawiązał równą walkę z BigTech… Sytuacja może wywołać prawdziwy wstrząs na rynkach.
Najważniejsze fakty
- Chińska firma DeepSeek stworzyło model AI R-1, który wypada w niektórych płaszczyznach lepiej, niż wiele zachodnich modeli, w tym flagowy produkt Open AI, Chat GPT o-1
- Za spółką stoi fundusz quant HighFlyer Capital, który współfinansował od początku projekt DeepSeek. W firmie pracują zdolni programiści – brak jednak 'rozgłosu’ wokół twórców, a Chińczycy nazywają firmę efektem 'zbiorowej pracy’
- Największe, amerykańskie firmy kupowały osprzęt (chipy AI, szafy serwerowe i inne) w potężnych ilościach od firm jak Nvidia, czy Broadcom
- Mowa o takich spółkach jak Microsoft, Meta Platforms (niegdyś Facebook), Alphabet (Google). Meta przekazała ostatnio, że przeznaczy ponad 60 miliardów dolarów na inwestycje w nowym roku (CAPEX)
- Sukces DeepSeek R-1 podważa dogmat, wedle którego stworzenie silnych modeli AI wymaga potężnych nakładów na infrastrukturę (w tym zakupy chipów i usług od Nvidia). Finalnie, także tworzenie potężnych centrów danych może być kwestionowane
- Firmy mogą zacząć ponownie analizować swoje zamówienia, a 'zachód’ prawdopodobnie podejmie wysiłki, by stworzyć inne 'ekonomicznie opłacalne’ modele AI, skoro udało się to Chinom
- W efekcie nastroje na rynkach akcji, napędzane od ponad 2 lat przez firmy BigTech z Nasdaq tj. potencjalnych beneficjentów hossy AI mogą złapać zadyszkę
- Nvidia może nie otrzymać zadowalającego popytu na niesamowicie drogie układy AI Blackwell, jako ekonomicznie niewydajne, a firmy, które zainwestowały już łącznie setki miliardów dolarów w sztuczną inteligencję mogą tracić… Inwestorzy obawiają się, że mogły wydać fortunę na darmo.
- Prawdopodobnie wyszkolenie DeepSeek R-1 kosztowało ok. 5.5 do 6.5 miliona dolarów. Wszystko to bez dostępu do najwyższej jakości układów półprzewodnikowych. Administracja USA ciężko i bezskutecznie pracowała nad ograniczeniem eksportu tych chipów do Chin…
- Finalnie okazać się może, że ograniczenia nie tylko były niedokładne (obchodzono je z powodu nagrody ekonomicznej), ale sprawiły, że Chiny potroiły wysiłki nad szukaniem rozwiązań ekspansji AI w warunkach ograniczonego dostępu do mocy obliczeniowej.
- Wreszcie, z historii DeepSeek wynika, że inne, dużo biedniejsze kraje jak Rosja mogą z powodzeniem uruchomić własne modele AI. To także szansa dla Polski, która dysponuje potężnymi talentami w zakresie programowania.

DeepSeek i 'moment Sputnika’
Rywalizacja mocarstw w zakresie rozwoju sztucznej inteligencji przypomina nieco 'kosmiczną wojnę’ z ZSRR, w czasach Zimnej Wojny. Wydanie DeepSeek przypomina nieco 'kryzys Sputnika’ spowodowany był falą strachu i niepokoju w krajach zachodnich w związku z postępującą luką technologiczną między Stanami Zjednoczonymi a Związkiem Radzieckim, spowodowaną wystrzeleniem przez Sowietów Sputnika 1. Czyli pierwszego na świecie sztucznego satelity.
Dziś wiemy, że kryzys był znaczącym wydarzeniem w zimnej wojnie. Zapoczątkował utworzenie NASA i wyścig kosmiczny między mocarstwami. Satelita został wystrzelony 4 października 1957 roku z kosmodromu Bajkonur. Zachodnia prasa dosłownie 'oszalała’ wówczas na punkcie tematu Sputnika, który szeroko dyskutowany był zarówno przez czołowych polityków, naukowców jak i zwykłych Amerykanów.

Kto stworzył DeepSeek?
Zacznijmy od początku. DeepSeek to chińska firma zajmująca się sztuczną inteligencją, finansowana wyłącznie przez chiński fundusz hedgingowy High-Flyer. Aktualnie fundusz zarządza aktywami wartymi ok. 8 miliardy dolarów. W porównaniu do amerykańskich gigantów jest zatem 'pyłkiem’. Założył go Liang Wenfeng, który zaczął handlować na rynkach podczas kryzysu 2007-2008 roku, jako student.
W końcu stworzył fundusz hedgingowy skupiający się na opracowywaniu i wykorzystywaniu algorytmów tradingowych, opartych na sztucznej inteligencji. Od roku 2021 fundusz High-Flyer wykorzystywał wyłącznie sztuczną inteligencję do handlu. Zainteresował się nim wówczas legendarny, amerykański wehikuł Renaissance Technologies. Pisaliśmy o nim tutaj.
W kwietniu roku 2023 fundusz High-Flyer ogłosił, że utworzy nowy niezależny organ do badania sztucznej inteligencji (AGI). Stwierdził, że jego praca nie będzie wykorzystywana do handlu na rynkach i będzie oddzielona od działalności finansowej High-Flyer. Miesiąc później, w maju 2023 roku powstał DeepSeek. Firmy venture capital miały być niezainteresowane współpracą nad nim, obawiając się zbyt długiego horyzontu rentowności. Firma pozyskała na niego łącznie prawdopodobnie niewiele ponad 4 mln USD finansowania.

Złożony z chińskich 'technologicznych geeków’ DeepSeek (pprowadzirekrutację wyłącznie na podstawie umiejętności, nie historii zatrudnienia), ze wsparciem High-Flyer nie poddał się. W maju model DeepSeek-V2 oferował wysoką wydajność za niską cenę. Stopniowo firma stała się znana z powodu agresywnej polityki cenowej. Nazwano ją nawet 'Temu sztucznej inteligencji’ (właścicielem Temu jest chińskie Pinduoduo).
Inni główni giganci technologiczni, tacy jak ByteDance, Tencent, Baidu i Alibaba, zaczęli obniżać ceny swoich modeli sztucznej inteligencji, by konkurować z DeepSeek. Ale ten osiągnął rentowność bardzo szybko. W DeepSeek nie pracują nobliści, ani prominentni naukowcy. Niewidzialną pracę wykonują prawdopodobnie niezwykle uzdolnieni, genialni programiści. Których nazwisk być może nigdy nie pozna świat.
Według anonimowego postu na Teamblind, forum dla zweryfikowanych pracowników firm Big Tech, dział sztucznej inteligencji Meta Platforms już odczuwa presję. Jako pierwszy poinformował o tym branżowy The Decoder. W poście napisano, że Meta jest „W panice (…) Inżynierowie gorączkowo analizują DeepSeek i kopiują z niego wszystko, co się da”.

Czym jest DeepSeek?
Przejdźmy do rzeczy. DeepSeek zaprezentowało pod koniec grudnia darmowy model językowy o otwartym kodzie źródłowym. Jego zbudowanie zajęło ok. 2 miesiące i kosztowało mniej niż 6 milionów dolarów. Nieoficjalnie miało miejsce przy użyciu chipów Nvidii o obniżonej wydajności o nazwie H800. Nowe wydarzenia podniosły alarm w kwestii tego, czy globalna przewaga Ameryki w dziedzinie sztucznej inteligencji kurczy się i zakwestionowały ogromne wydatki wielkich firm technologicznych na budowę modeli sztucznej inteligencji i centrów danych.
Model stanął w centrum zainteresowania rynków finansowych. Dyskutował o nim m.in. prezes Microsoftu, Satya Nadella na Światowym Forum Ekonomicznym (WEF) w Davos. Skąd takie zainteresowanie? Mowa nie tylko o niższych kosztach, które stanowią 'zachętę ekonomiczną’. Oraz dowód na to, że firmy mogły (lub nadal to robią) przepłacać, łożąc na rozwój AI dziesiątki miliardów dolarów. Meta Platforms (dawny Facebook), Zuckerberga przekazał, iż zainwestuje rekordowe 65 miliardów dolarów w CAPEX związany z AI, w bieżącym roku.
W zestawie testów porównawczych innych firm model DeepSeek osiągnął lepsze wyniki, niż Meta
Llama 3.1, GPT-4o firmy OpenAI i Claude Sonnet 3.5 firmy Anthropic w zakresie dokładności, od rozwiązywania złożonych problemów po matematykę i kodowanie. DeepSeek w poniedziałek wydał r1, model rozumowania, który również przewyższył najnowszy o1 OpenAI w wielu testach innych firm.

Microsoft widzi zagrożenie
CEO Microsoftu, Nadella w Davos mówił: „Aby zobaczyć nowy model DeepSeek, jest on imponujący zarówno pod względem tego, jak naprawdę skutecznie stworzyli model open-source, który wykonuje obliczenia w czasie wnioskowania i jest super wydajny obliczeniowo (…) Powinniśmy traktować rozwój sytuacji w Chinach bardzo, bardzo poważnie”. Prawdopodobnie DeepSeek musiało obejść ograniczenia dotyczące eskportu półprzewodników.
Rząd USA nałożył je na Chiny, odcinając kraj od dostępu do najpotężniejszych chipów, takich jak H100 firmy Nvidia. Szereg analiz sugeruje, że DeepSeek znalazł sposób na obejście zasad. W efekcie Nvidia może znaleźć się w centrum zainteresowania. W końcu jest jakiś powód, dla którego DeepSeek R1 bije ChatGPT 0-1 w rozumowaniu matematycznym, wydajności i skalowalności. Prawdopodobnie jednak 'moc’ na której pracował DeepSeek była nieporównywalnie mniejsza, od tej w OpenAI i innych firmach amerykańskich.
DeepSeek nie jest też jedyną chińską firmą, która wkracza na rynek. Cytowany w mediach, znany badacz sztucznej inteligencji Kai-Fu Lee powiedział, że jego startup 01.ai został przeszkolony przy użyciu zaledwie 3 milionów dolarów. Firma macierzysta TikTok, ByteDance, opublikowała w środę aktualizację swojego modelu, który twierdzi, że przewyższa o1 OpenAI w kluczowym teście porównawczym. Zatem dochodzimy do wniosku, że 'Potrzeba jest matką wynalazku’. Chiny musiały radzić sobie bez dostępu do wielkich mocy obliczeniowej. Dlatego w rzeczywistości zbudowali coś o wiele bardziej wydajnego i opłacalnego ekonomicznie.
Droga na pierwsze strony gazet
DeepSeek rozpoczął działalność od opracowania modeli sztucznej inteligencji dla zastrzeżonego chatbota. Jeszcze nim udostępnił je do użytku publicznego. Niewiele wiadomo na temat dokładnego podejścia firmy, ale szybko otworzyła ona swoje modele i jest prawdopodobne, że opierała się na otwartych projektach stworzonych przez Meta tj. na modelach Llama i ML Pytorch.
Aby trenować modele, High-Flyer Quant zabezpieczył ponad 10 000 procesorów graficznych Nvidia przed ograniczeniami eksportowymi w USA. Niektóre źródła podają, że rozszerzył je do 50 000 procesorów graficznych za pośrednictwem alternatywnych łańcuchów dostaw. Pomimo barier celnych. To praktycznie nic z czołowymi OpenAI, Google i Anthropic. Te działają z ponad 500 000 procesorów graficznych każdy.
Najnowsza premiera DeepSeek R1 wstrząsnęła społecznością AI. Nie bez powodu, bo DeepSeek dorównał o1 OpenAI, ponosząc zaledwie ok. 3%-5% jego kosztów. Wprawił w zachwyt i rzucił wyzwanie przedsiębiorstwom, aby ponownie przemyślały strategie AI. To właśnie może zatrząść rynkiem akcji. Wiemy jedno, model szybko został najpopularniejszym modelem pobieranym na HuggingFace i błyskawicznie przekroczył 100 000 pobrań.
Programiści spieszą się, aby go testować i starają się zrozumieć, co oznacza dla ich rozwoju sztucznej inteligencji. Użytkownicy komentują, że towarzysząca DeepSeek funkcja wyszukiwania (którą można znaleźć na stronie DeepSeek) jest teraz lepsza od konkurencji, jak OpenAI i Perplexity. Rywalizuje z nią tylko Gemini Deep Research Google. Dzięki obniżonym kosztom i 'open source’ firmy mają teraz alternatywę dla kosztownych, zastrzeżonych modeli m.in. od OpenAI.
To dopiero początek?
W listopadzie DeepSeek trafił do mediów, ogłaszając, że osiągnął wydajność przewyższającą o1 OpenAI. Wtedy oferował tylko ograniczony model R1-lite-preview. Przejrzystość w postaci kodu open source to spory cios w OpenAI. Firma Sama Altmana do tej pory ukrywała swoje 'procesy wnioskowania’ przed użytkownikami. Rzecz jasna wskazywała wtedy na standardy konkurencyjne. Jednak to właśnie open source pozwala programistom wskazać i rozwiązać błędy w rozumowaniu i działaniu modelu, usprawniając go. To kolejny punkt na korzyść DeepSeek.
Wszystko to prowadzi do wniosku, że mniejsze, bardziej wydajne praktyki programistyczne staną się coraz bardziej opłacalne. Przedsiębiorstwa mogą być zmuszone do ponownej oceny swoich umów z wielkimi dostawcami sztucznej inteligencji, jak Nvidia. Przeanalizują, czy wysokie koszty związane z tymi usługami są uzasadnione, gdy alternatywy open source mogą zapewnić porównywalne, jeśli nie lepsze, wyniki.
Rzecz jasna innowacja DeepSeek jest przełomowa. Ale w żadnym wypadku model DeepSeek nie ma (jeszcze) wiodącej pozycji na rynku. Opublikował badania, więc inne firmy zajmujące się modelami będą się z nich uczyć i zmieniać straategie. Między innymi Meta Platforma oraz Mistral, francuska firma zajmująca się modelami open source, mogą być w tyle, ale prawdopodobnie minie tylko kilka miesięcy, zanim nadrobią zaległości.
Zmarnowano setki miliardów dolarów?
Główny badacz w Meta, Yann Lecun przekazał, że: „Pomysł polega na tym, że każdy czerpie zyski z pomysłów innych. Nikt nikogo nie „wyprzedza” i żaden kraj nie „przegrywa” z innym. Nikt nie ma monopolu na dobre pomysły. Wszyscy uczą się od innych”. Ostatecznie to konsumenci, startupy i inni użytkownicy zdobędą dzięki DeepSeek najwięcej. Dlaczego? Ponieważ oferta DeepSeek będzie nadal podnosić cenę korzystania z tych modeli w pobliże zera (ponownie pomijając koszt uruchomienia modeli przy wnioskowaniu).
Tymczasem wiele firm zdążyło już zainwestować fortunę w infrastrukturę AI. Jak twierdzi wielu komentatorów, w tym Chamath Palihapitiya, inwestor i były dyrektor wykonawczy w Meta, może to oznaczać, że lata inwestycji w OpEx i CapEx przez OpenAI (orz inne firmy) są już zmarnowane. Wszystko to rodzi poważne pytania dotyczące planów inwestycyjnych. Wart 500 miliardów dolarów, współfinansowany przez USA projekt Stargate od OpenAI odzwierciedla jej zaangażowanie w budowę ogromnych centrów danych w celu zasilania zaawansowanych modeli.
Strategia ta, wspierana przez partnerów takich jak Oracle i Softbank, opiera się na przekonaniu, że osiągnięcie sztucznej inteligencji ogólnej (AGI) wymaga bezprecedensowych zasobów obliczeniowych. Jednak demonstracja przez DeepSeek wysokowydajnego modelu za ułamek kosztów podważa trwałość tego podejścia, budząc wątpliwości co do zdolności OpenAI do zapewnienia zwrotu z tak monumentalnej inwestycji. Chiny dogoniły – a w niektórych obszarach wyprzedziły – Stany Zjednoczone w dziedzinie innowacji.
Chiny nie zwalniają tempa
Inna chińska firma, ByteDance, ogłosiła Doubao-1.5-pro, który zawiera tryb „głębokiego myślenia”. Model przewyższył o1 OpenAI w teście porównawczym AIME. Czy chiński DeepSeek zakłóci działalność firmy NVIDIA i amerykańskiego przemysłu AI? Rozwój technologii ma wielkie i bezpośrednie implikacje dla rynku sztucznej inteligencji. Może negatywnie wpłynąć na wyceny akcji firm takich jak Nvidia i innych dostawców, związanych ze sztuczną inteligencją.
Amerykańska Nvidia, w roku 2024 stała się największą firmą giełdową świata. Od dawna jest niekwestionowanym liderem w dziedzinie sprzętu AI, wykorzystując swoje układy GPU i ekosystem CUDA do dominacji rynku. Z drugiej strony DeepSeek oferuje bardziej opłacalne rozwiązanie AI. Zatem może być pewnego rodzaju „tańszym smartfonem” dla „iPhone’a” od Nvidia.
W branży smartfonów dostępność tańszych alternatyw niezaprzeczalnie zmieniła udział w rynku, szczególnie na rynkach wschodzących. Ale czy zakłóciło to kurs akcji Apple lub jego dominację wśród lojalnej bazy użytkowników? Praktycznie w żadnym stopniu. Jednak to optymistyczny wariant. Niezależnie od długoterminowego efektu DeepSeek, niepewność może wstrząsnąć akcjami Nvidia. Perspektywa tańszego AI w zasięgu ręki stawia spory znak zapytania nad tym, czy inwestycje miliardów dolarów w nowe układy AI mają sens.
Jak zareagowały akcje Nvidia?
Odkąd pojawiły się pierwsze informacje o DeepSeek, akcje Nvidia nie zareagowały drastycznie. W rzeczywistości wzrosły nawet o około 2,5%. Także akcje innych, technologicznych spółek reagowały optymistycznie m.in. na ogłoszenie projektu Stargate. Zatem rynek nie postrzega jeszcze DeepSeek jako znaczącego czynnika zakłócającego. Gdyby tak było, spodziewalibyśmy się gwałtownego i trwałego spadku cen. Nie oznacza to jednak, że rynek ma racje. Przed pandemią koronawirusa, informacje o wycieku wirusa pojawiły się na tygodnie zanim na Wall Street nastąpił krach.

Podsumowanie
Chcąc utrudnić Chińczykom postęp, Zachód wręczył w ich ręce broń, której wyrazem jest determinacja nad osiągnięciem pełnej niezależności. To właśnie stało za sukcesem DeepSeek. W dalszym ciągu istnieje wiele pytań dotyczących motywów DeepSeek. Także tych, dotyczących komercjalizacji i strategii cenowej, planów na przyszłość… Oraz rzeczywistych relacji z chińskim rządem, które z pewnością muszą 'układać się po myśli’ partii Xi Jinpinga.
Czy kolejne ograniczenia eksportu AI w USA sprawią, że chińska sztuczna inteligencja nie powstanie? To pytanie odchodzi już do przeszłości. Wiemy, że Chiny rozwinęły AI taniej i nie gorzej od Amerykanów. W zasadzie nie powinno to dziwić, patrząc na sukcesy naukowe Chińczyków, z ostatnich dekad. Agresywna polityka Stanów Zjednoczonych nie jest w stanie zahamować rozwoju. Teraz to piłka jest po stronie USA.
Przywołać możemy tu Misesa, jednego z ojców austriackiej szkoły ekonomicznej. Interwencje rządowe mają ważne niezamierzone konsekwencje wtórne. Aby sprawdzić, czy dana polityka zadziała, należy wziąć pod uwagę nie tylko jej bezpośredni wpływ. Lecz także skutki drugiego i trzeciego rzędu. W tym wypadku wiele wskazuje na rzeczywistą porażkę Amerykanów. Czy od lat zakochane w technologicznych firmach i akcjach Nvidia Wall Street wyjdzie z tego obronną ręką?
Jestem pod wrażeniem jak można było rozciągnąć ten artykuł;) EjAj czy autor ma taką wprawę? Naprawdę jestem pod wrażeniem- pozdrawiam;)