Sztuczna inteligencja miała, wedle wizjonerskich zapowiedzi, stanowić kolejny wielki przełom w technologicznym rozwoju ludzkości. Powszechne zastosowanie AI miało uczynić życie łatwiejszym i bardziej produktywnym, napędzić rozwój ekonomiczny i cywilizacyjny oraz zdjąć z barków ludzi najbardziej uciążliwe, jednak niezbędne zadania. Jak to idzie w praktyce? To ostatnie częściowo się udaje – choć kosztem wciąż rosnącego bezrobocia. Zamiast realizacji wizjonerskich zapowiedzi ws. AI, notabene kosztujących nieprzytomne pieniądze, jest natomiast tzw. proza życia i rynku.
Oto bowiem OpenAI, do niedawna lider rynku sztucznej inteligencji, znów znalazło się w ogniu krytyki. Tym razem nie chodzi o błędne odpowiedzi jej modeli AI czy wybryki tych modeli (jak zachęcanie do samobójstw czy pomaganie przestępcom w układaniu planów zbrodni), ale o praktyki, które kłócą się z własnymi deklaracjami firmy dotyczącymi tego, że firma nie zbiera danych, na których zbieranie użytkownicy nie wyrazili zgody. Okazuje się, że i owszem zbiera, i to nawet te najbardziej prywatne, brak zgody użytkowników mając w głębokim lekceważeniu.
OpenAI przechowuje bowiem prompty wpisywane użytkowników – nawet tych, którzy wyłączyli historię czatów i zrezygnowali z trenowania modeli na swoich danych. Dokumentacja firmy ma zdradzać, że firma uzasadnia owo paserstwo danych działaniami „w celach monitorowania nadużyć”. Paserstwo jest tu terminem o tyle uzasadnionym, że OpenAI dzieli się tymi danymi z „zaufanymi partnerami”. Firma naturalnie egzaltuje się ich zaufanym statusem i wymogami dot. bezpieczeństwa – cóż jednak warte są te deklaracje, gdy mowa o danych, których, jak zapewniano, firma w ogóle miała nie zbierać?
Co to my tu obiecywaliśmy? Oj tam, oj tam…
Co gorsza – choć być może zwykłych użytkowników, zirytowanym traktowaniem korporacji i instytucji jako świętych krów, przyprawi to o uczucie Schadenfreude – nawet w przypadku wspomnianych klientów korporacyjnych, korzystających z opcji Zero Data Retention, stopień retencji danych wcale nie był zerowy, prompty i odpowiedzi były przechowywane, „jeśli wymaga tego prawo lub wewnętrzne procedury firmy”. Co w praktyce oznacza, że są przechowywane, pomimo zapewnień o nierobieniu tego, pod dowolnym pretekstem i w każdej sytuacji, w której OpenAI uzna, że chce je przechowywać.
Co najzabawniejsze, informacja ta ujrzała światło dzienne w wyniku wpadki samej firmy. W USA toczy się bowiem publiczna dyskusja dot. centrów danych AI i ich kosztów. W kręgach politycznych pojawiają się podejrzenia, że ruch sprzeciwu wobec tych centrów, wykorzystując rzeczywiste obawy, jest wzmacniany działaniami propagandowymi przez Chiny, które konkurują z USA na tym polu. Działania te, w myśl podejrzeń, miały wykorzystywać modele AI dostępne w samych USA do kreowania treści propagandowych. Jednym z tych modeli był ChatGPT należący do OpenAI.
W odpowiedzi na kierowane przez polityków wezwania do wszczęcia dochodzeń wyjaśniających, OpenAI oświadczyła, że dochodzenia te są zbędne. Ma ona bowiem niezbite dowody, z których wynika, że nie, ChatGPT ani inne narzędzia AI tej firmy nie były wykorzystywane w owych działaniach – tymi dowodami były właśnie gromadzone prompty użytkowników. Oczywiście w ten sposób z rozpędu przyznała, że dane te w ogóle są zbierane, mimo że nie powinny, następnie zaś, w ramach łagodzenia skutków ujawnienia wiarołomstwa, firma zaczęła się tłumaczyć, dlaczego jednak miała prawo to robić.
Wysoka etyka strażnikiem wysokich zysków
Tymczasem Anthropic, główny konkurent OpenAI, właśnie wykonał spektakularny woltę – też niezbyt dlań pochlebną. Firma wprowadziła mechanizmy skrycie degradujące wydajność swoich modeli (w tym Claude Fable 5) dla użytkowników używających tego narzędzia do badań, w szczególności tych rozwoju open-source’owych modeli AI. Celowo paraliżowano możliwość realizacji zadań związanych z pretrenowaniem modeli AI czy projektowaniem akceleratorów ML. Anthropic zaimplementował „wektory sterujące” i modyfikacje promptów, które obniżały jakość odpowiedzi, nie informując o tym użytkowników.
Celem było naturalnie przyziemne sabotowanie potencjalnego zagrożenia dla swojej wyłączności. Lawina krytyki, z jaką firma się spotkała, sprawiła, że zadeklarowała ona wycofanie się ona z tej praktyki – choć pozostaje zobaczyć, czy dotrzyma zobowiązania. Co ciekawe, Anthropic od dawna buduje wizerunek podmiotu odpowiedzialnego, zwracającego uwagę na etyczne wykorzystanie AI oraz konsekwencje społeczno-cywilizacyjne jej zastosowania – i zaryzykowała nawet trafienie na czarną listę Pentagonu oraz potencjalną utratę miliardowych kontraktów od rządu federalnego USA, by ten wizerunek utrzymać.
Tymczasem okazało się, że wysokie standardy etyczne firmy nie obejmują potajemnego torpedowania działań open-source’owej konkurencji, jak zawsze pod płaszczykiem dbania o „bezpieczeństwo”. To zresztą nie pierwszy raz, gdy firma stara się zablokować dostęp do swoich modeli dla narzędzi open-source-owych. Podobnie miało to miejsce w przypadku narzędzia AI OpenCode, którego integracja z Claude została na początku 2026 roku zablokowana – co z kolei wywołało lawinę krytyki i paradoksalnie przyspieszyło rozwój OpenCode’a
Upadek AI na horyzoncie?
Sytuację dopełniają najnowsze badania, które dowodzą, że modele AI stają się coraz „głupsze”. Winne jest tu zjawisko zwane „upadkiem modelu” czy „zapaścią modelu” – chodzi o stopniową utrata jakości, oryginalności i niepowtarzalności odpowiedzi, spowodowaną coraz większym udziałem treści generowanych przez same AI w danych wykorzystywanych do szkolenia. W wyraźny sposób ilustrują to badania naukowców z uniwersytetów w Oxfordzie, Cambridge, Londynie, Edynburgu i Toronto, opublikowane w „Nature”, oraz analizy Elephas AI z kwietnia tego roku
Wykazały one, że niekontrolowane szkolenie modeli AI na mieszance prawdziwych i sztucznie wygenerowanych danych prowadzi do zapaści jakościowej. Modele tracą zdolność do generowania zróżnicowanych, merytorycznie poprawnych odpowiedzi, zaczynają powtarzać błędy i stylistyczne schematy, a ich „myślenie” staje się płytkie i zatraca zdolność do logicznego wnioskowania. Problem rośnie, ponieważ treści generowane przez AI coraz bardziej zaśmiecają Internet – szacuje się, że w tym roku większość nowych danych tekstowych z sieci to już dane „umoczone” przez AI.
Skutek? Użytkownicy używają (a liczni – także za to płacą) narzędzi, które z miesiąca na miesiąc działają gorzej. Producenci wydają się zaś nie mieć prostej recepty na rozwiązanie tego problemu – zwłaszcza, jeśli miałoby to przy okazji nie doprowadzić do pęknięcia bańki na rynku AI. Ciężko przecież spodziewać się, że tuż przed wartymi setki miliardów dolarów debiutami giełdowymi zarówno OpenAI, jak i Anthropica, ktokolwiek w kierownictwie tych lub innych firm będzie ryzykował zepsucie nastroju i spłoszenie inwestorów. A jeśli potem wszystko jednak się załamie? No cóż, zarządy swoje miliardy już będą miały.