Ta firma wyprodukowała chipy 10x wydajniejsze i 20x tańsze od Nvidia. Akcje spadną?
Rynek sprzętu AI właśnie dostał wstrząsu. Kanadyjski startup Taalas ogłosił, że opracował układ scalony zdolny do uruchamiania modeli sztucznej inteligencji nawet 10 razy szybciej niż obecnie. Do tego przy znacznie niższym koszcie oraz zużyciu energii. Jeśli te deklaracje potwierdzą, może to być jedno z najbardziej przełomowych wydarzeń w branży półprzewodników od lat. Tylko ile w tym prawdy, a ile marketingowych herezji?
AI „wypalona” w krzemie
Zamiast korzystać z elastycznych GPU, takich jak układy Nvidii, Taalas proponuje radykalnie inne podejście. „Utwardzanie” konkretnego modelu AI bezpośrednio w krzemie. Oznacza to, że chip jest projektowany pod jeden konkretny model, wraz z jego wagami i parametrami, zamiast obsługiwać szerokie spektrum zastosowań.
Pierwszy produkt firmy, HC1, został zoptymalizowany pod model Llama 3.1 8B. Według spółki osiąga on nawet 17 tys. tokenów na sekundę na użytkownika. To niemal 10 razy więcej niż obecne rozwiązania GPU, przy kosztach nawet 20 razy niższych i zużyciu energii rzędu 12–15 kW na rack, wobec 120–600 kW w przypadku serwerów GPU.
Brzmi jak science fiction? Taalas twierdzi, że opracowanie nowego chipu pod świeży model zajmuje im zaledwie dwa miesiące.
Nvidia zagrożona? Jeszcze nie tak szybko
W teorii propozycja Taalas wygląda jak nokaut dla liderów, w tym Nvidii, AMD czy producentów wyspecjalizowanych akceleratorów AI. Jednak diabeł tkwi w szczegółach.
GPU są elastyczne. Mogą obsługiwać różne modele, zmieniające się architektury i nowe zastosowania – od AI, przez HPC, po grafikę. Taalas stawia wszystko na jedną kartę: maksymalną specjalizację. Jeden chip to jeden model. I tyle.
Dla centrów danych oznacza to potencjalnie ogromne oszczędności, ale też koszmar operacyjny. Każda aktualizacja modelu wymaga nowej iteracji sprzętu. Każdy inny model osobnej wersji układu. To mnożenie SKU, logistyki i ryzyka.
Co ciekawe, mimo pojawienia się Taalas, Meta zdecydowała się na wieloletnią współpracę z Nvidią. To sygnał, że giganci technologiczni wciąż stawiają na sprawdzone, skalowalne rozwiązania.
219 milionów dolarów i ambicje zmiany rynku
Taalas zebrał już 219 milionów dolarów finansowania. Firma twierdzi, że jej architektura może radykalnie obniżyć koszt tokena w modelach AI. W czasach, gdy OpenAI planuje setki miliardów dolarów wydatków na infrastrukturę obliczeniową do 2030 roku, każda redukcja kosztów o rząd wielkości może mieć gigantyczne znaczenie.
Startup planuje kolejne wersje chipów. W tym bardziej zaawansowane modele oparte na nowej generacji krzemu (HC2). Celem jest obsługa większych modeli LLM przy zachowaniu przewagi kosztowej i energetycznej.
Rewolucja czy niszowy eksperyment?
Na razie Nvidia wciąż rozdaje karty, a jej pozycja wydaje się niezachwiana. Ale jeśli choć kilka dużych centrów danych zdecyduje się na eksperyment z wyspecjalizowanymi chipami, presja cenowa na gigantów może się pojawić.
Czy akcje Nvidia spadną? Dziś to bardziej intrygująca hipoteza niż realne zagrożenie. Rynek półprzewodników właśnie dostał nowego, bardzo ambitnego gracza. Dopiero czas pokaże, czy to gamechanger czy raczej ciekawostka dla geeków.
