Ta firma wyprodukowała chipy 10x wydajniejsze i 20x tańsze od Nvidia. Akcje spadną?

Rynek sprzętu AI właśnie dostał wstrząsu. Kanadyjski startup Taalas ogłosił, że opracował układ scalony zdolny do uruchamiania modeli sztucznej inteligencji nawet 10 razy szybciej niż obecnie. Do tego przy znacznie niższym koszcie oraz zużyciu energii. Jeśli te deklaracje potwierdzą, może to być jedno z najbardziej przełomowych wydarzeń w branży półprzewodników od lat. Tylko ile w tym prawdy, a ile marketingowych herezji?

AI „wypalona” w krzemie

Zamiast korzystać z elastycznych GPU, takich jak układy Nvidii, Taalas proponuje radykalnie inne podejście. „Utwardzanie” konkretnego modelu AI bezpośrednio w krzemie. Oznacza to, że chip jest projektowany pod jeden konkretny model, wraz z jego wagami i parametrami, zamiast obsługiwać szerokie spektrum zastosowań.

Pierwszy produkt firmy, HC1, został zoptymalizowany pod model Llama 3.1 8B. Według spółki osiąga on nawet 17 tys. tokenów na sekundę na użytkownika. To niemal 10 razy więcej niż obecne rozwiązania GPU, przy kosztach nawet 20 razy niższych i zużyciu energii rzędu 12–15 kW na rack, wobec 120–600 kW w przypadku serwerów GPU.

Brzmi jak science fiction? Taalas twierdzi, że opracowanie nowego chipu pod świeży model zajmuje im zaledwie dwa miesiące.

17,000 tokens per second!! Read that again!
LLM is hard-wired directly into silicon. no HBM, no liquid cooling, just raw specialized hardware. 10x faster and 20x cheaper than a B200.
the "waiting for the LLM to think" era is dead. Code generates at the speed of human thought.… pic.twitter.com/Ia5BinyHI4
— Wildminder (@wildmindai) February 20, 2026

Nvidia zagrożona? Jeszcze nie tak szybko

W teorii propozycja Taalas wygląda jak nokaut dla liderów, w tym Nvidii, AMD czy producentów wyspecjalizowanych akceleratorów AI. Jednak diabeł tkwi w szczegółach.

GPU są elastyczne. Mogą obsługiwać różne modele, zmieniające się architektury i nowe zastosowania – od AI, przez HPC, po grafikę. Taalas stawia wszystko na jedną kartę: maksymalną specjalizację. Jeden chip to jeden model. I tyle.

Dla centrów danych oznacza to potencjalnie ogromne oszczędności, ale też koszmar operacyjny. Każda aktualizacja modelu wymaga nowej iteracji sprzętu. Każdy inny model osobnej wersji układu. To mnożenie SKU, logistyki i ryzyka.

Co ciekawe, mimo pojawienia się Taalas, Meta zdecydowała się na wieloletnią współpracę z Nvidią. To sygnał, że giganci technologiczni wciąż stawiają na sprawdzone, skalowalne rozwiązania.

So Talaas effectively burned a Llama model into a chip. The quantum leap here is not AI on a chip. It's startup latency and what this means for coding.

Right now, an AI call takes "ages" compared to a CPU calculation. Network, inference, network, parsing. Hundreds of… https://t.co/hHX0H05f71
— Arvid Kahl (@arvidkahl) February 22, 2026

219 milionów dolarów i ambicje zmiany rynku

Taalas zebrał już 219 milionów dolarów finansowania. Firma twierdzi, że jej architektura może radykalnie obniżyć koszt tokena w modelach AI. W czasach, gdy OpenAI planuje setki miliardów dolarów wydatków na infrastrukturę obliczeniową do 2030 roku, każda redukcja kosztów o rząd wielkości może mieć gigantyczne znaczenie.

Startup planuje kolejne wersje chipów. W tym bardziej zaawansowane modele oparte na nowej generacji krzemu (HC2). Celem jest obsługa większych modeli LLM przy zachowaniu przewagi kosztowej i energetycznej.

Rewolucja czy niszowy eksperyment?

Na razie Nvidia wciąż rozdaje karty, a jej pozycja wydaje się niezachwiana. Ale jeśli choć kilka dużych centrów danych zdecyduje się na eksperyment z wyspecjalizowanymi chipami, presja cenowa na gigantów może się pojawić.

Czy akcje Nvidia spadną? Dziś to bardziej intrygująca hipoteza niż realne zagrożenie. Rynek półprzewodników właśnie dostał nowego, bardzo ambitnego gracza. Dopiero czas pokaże, czy to gamechanger czy raczej ciekawostka dla geeków.

Dziękujemy, że przeczytałeś/aś nasz artykuł do końca. Obserwuj nas w Wiadomościach Google i bądź na bieżąco!