Mamy nowego króla AI? Powstał bez miliardów, dogania DeepSeek przy ułamku danych!

Wygląda na to, że chiński DeepSeek czy ChatGPT mają nowego poważnego konkurenta. Międzynarodowy zespół badaczy, związany z amerykańskimi i europejskimi uczelniami oraz instytucjami technologicznymi, zaprezentował OpenThinker-32B. Model AI, który z animuszem rzuca rękawicę dotychczasowym liderom.

OpenThinker rozstawia konkurencję po kątach – lepszy od DeepSeek, choć trenował na ułamku danych

Co w tym wszystkim jest najbardziej imponujące? OpenThinker osiągnął lepsze wyniki niż DeepSeek, korzystając jedynie z 14% liczby danych użytych przez chińskiego giganta. To ogromny przełom dla świata open-source AI. I przede wszystkim dowód, że nie trzeba miliardów dolarów i tysięcy GPU, aby stworzyć coś, co może konkurować z czołowymi modelami.

OpenThinker-32B uzyskał 90,6% skuteczności na benchmarku MATH500, co oznacza, że wyprzedził DeepSeek, który osiągnął 89,4%. Na innym kluczowym teście – GPQA-Diamond, mierzącym wiedzę naukową – OpenThinker osiągnął 61,6 punktów, zostawiając DeepSeek w tyle z wynikiem 57,6.

Choć chiński model nadal ma przewagę w kodowaniu (71,2 vs. 68,9 dla OpenThinkera), należy pamiętać, że nowy projekt to open-source. Społeczność może go rozwijać i ulepszać w tempie, którego zamknięte systemy nigdy nie osiągną.

Efektywność AI na najwyższym poziomie

Największy szok? OpenThinker został wytrenowany na zaledwie 114 000 przykładach. Dla porównania DeepSeek pochłonął 800 000. Zespół wykorzystał zaledwie cztery węzły obliczeniowe z ośmioma kartami H100 i zamknął całość w 90 godzin. W porównaniu do absurdalnych ilości energii i mocy obliczeniowej, jakie pochłaniają modele od OpenAI czy Google, to prawdziwy majstersztyk optymalizacji.

Do tego wykorzystano innowacyjny system walidacji danych – Curator Framework, który sprawdzał poprawność kodu i rozwiązań matematycznych w czasie rzeczywistym. Model zbudowano na bazie Qwen2.5-32B-Instruct od Alibaby, ale to tylko punkt wyjścia – otwartość projektu pozwala go dostosować i rozwijać w dowolnym kierunku.

Czy OpenThinker zmieni reguły gry?

Model ten cechuje pełna transparentność. W przeciwieństwie do DeepSeek, który trzyma swoje dane treningowe w tajemnicy, tutaj wszystko jest dostępne. Dosłownie każdy może przeanalizować kod i dokładnie prześledzić proces uczenia.

W świecie AI, gdzie giganci jak OpenAI, Google czy xAI Elona Muska rywalizują na zamknięte, kosztowne modele, OpenThinker pokazuje, że da się stworzyć coś konkurencyjnego bez miliardów na infrastrukturę.