Nieznany sprawca wykorzystał model językowy Claude firmy Anthropic do przeprowadzenia serii ataków na systemy administracji publicznej Meksyku, co doprowadziło do wykradzenia około 150 GB danych. Akcja trwała od grudnia 2025 r. do stycznia 2026 r. i objęła co najmniej kilkanaście podmiotów sektora publicznego. Niemal samo nasuwa się podejrzenie, czy atak ten może mieć coś wspólnego z obecnym zamieszaniem, które przeżywa Meksyk?
Według ustaleń izraelskiej firmy Gambit Security, która wedle dostępnych doniesień jako pierwsza zidentyfikowała incydent, skradzione informacje obejmują m.in. dane 195 mln podatników (rejestr SAT, tj. Servicio de Administración Tributaria), spisy wyborców (Instituto Nacional Electoral – INE), dane osobowe i uwierzytelniające pracowników administracji oraz pliki z rejestru cywilnego.
Atak dotknął także m.in. federalną administrację skarbową, krajowy instytut wyborczy, rządy stanowe Jalisco, Michoacán i Tamaulipas, rejestr cywilny Miasta Meksyk oraz miejskie przedsiębiorstwo wodociągowe w Monterrey. Kluczową rolę odegrał Claude – model Anthropic został wykorzystany na kilku etapach łańcucha ataku.
Cladue dał się przekonać
Cyberprzestępca, posługując się promptami w języku hiszpańskim, zmusił system do działania w roli „elitarnego hakera”. Początkowo Claude odmawiał realizacji szkodliwych poleceń, wskazując na naruszenie zasad użytkowania. Sprawca zastosował jednak kreatywną technikę jailbreaku: przedstawił aktywność jako legalny program bug-bounty, dostarczając szczegółowy scenariusz działań, co pozwoliło ominąć zabezpieczenia.
Po „urobieniu” bota i uzyskaniu jego współpracy, wygenerował on tysiące szczegółowych raportów zawierających gotowe do wykonania plany: wskazówki dotyczące konkretnych celów wewnętrznych, poszukiwanych poświadczeń, sekwencji ruchów pobocznych (lateral movement) oraz metod unikania wykrycia. Claude posłużył przede wszystkim do:
- automatycznego wyszukiwania i analizy luk w infrastrukturze rządowej,
- tworzenia skryptów eksploatujących te luki,
- generowania kodu automatyzującego pobieranie dużych wolumenów danych.
W momentach, gdy Claude napotykał trudności lub ponownie odmawiał, haker uzupełniał instrukcje promptami kierowanymi do bota ChatGPT konkurencyjnej OpenAI, uzyskując dodatkowe wskazówki dotyczące ruchu w sieci i oceny ryzyka detekcji – a przede wszystkim wzajemnie uzupełniając informacje podawane przez obydwa modele IA.
Demokratyzacja w sferze technologii
Gambit Security zidentyfikowała co najmniej 20 konkretnych podatności wykorzystanych w trakcie kampanii. Atak miał charakter oportunistyczny – celem było maksymalne pozyskanie tożsamości i poświadczeń w jak największej liczbie systemów rządowych. Firma Anthropic potwierdziła incydent, zablokowała wszystkie powiązane konta i wdrożyła dodatkowe mechanizmy detekcji nadużyć.
Najnowsza wersja Claude Opus 4.6 zawierać ma już ulepszone sondy wykrywające próby podobnego wykorzystania. Firma zapowiedziała włączenie zebranych przykładów do dalszego treningu modelu. Także OpenAI twierdzi, że zablokowała konta „kreatywnego” użytkownika, kimkolwiek ów jest. To wszystko nie zmienia jednak faktu, że atak ewidentnie się powiódł – bowiem dane skutecznie wykradziono.
Na temat sprawcy na razie oficjalnie nic nie wiadomo. Przy takich okazjach podejrzenia padają z reguły na „grupy powiązane z rządami”, czyli innymi słowy hakerów na usługach służb specjalnych rozmaitych państw, ze względu na potencjał technologiczny i organizacyjny, jakim te dysponują. W przypadku Meksyku do grona podejrzanych dochodzą także ogromnie tam potężne kartele narkotykowe.
Co jednak zabawne (jeśli można tutaj mówić o jakimkolwiek humorze), ekspansja narzędzi AI, takich jak właśnie Claude, sprawiła, że sfera cyberprzestępczości na powrót, w szybkim tempie, się „zdemokratyzowała”, i atak ten równie dobrze mógł być dziełem nawet pojedynczej osoby. A przynajmniej to sugerowałby fakt kreatywnego zmanipulowania, nie złamania zabezpieczeń firmowych Anthropica.