OpenAI zaskoczyło rewolucją! Odesłali stary model na emeryturę, nowy jest olśniewający

OpenAI właśnie wykonało gruby ruch: generowanie obrazów trafia bezpośrednio do ChatGPT, a DALL-E odchodzi na zasłużoną emeryturę. Nowa funkcja oparta na modelu GPT-4o pozwala tworzyć grafiki bez opuszczania okna czatu – w jednej spójnej sesji, razem z tekstem, analizą danych czy przetwarzaniem zdjęć. Z tym, że będzie to narzędzie znacznie lepsze niż do tej pory.

Koniec DALL-E. GPT-4o od OpenAI przejmuje tworzenie obrazów – i robi to „niewiarygodnie lepiej”

Dotąd działało to na dwa fronty: GPT odpowiadał za tekst, a DALL-E za obrazy. Teraz wszystko zrobi GPT-4o. Według OpenAI, nowy model jest dokładniejszy, lepiej rozumie polecenia i radzi sobie z tekstem na obrazach, czyli jednym z najtrudniejszych wyzwań dla generatorów graficznych. Do tej pory karkołomność generowania tekstów i cyfr przekraczała granice absurdu.

W pokazowym wideo Sam Altman przyznał, że firma kazała użytkownikom czekać długo, ale „było warto”. Graficzne GPT-4o pokazano w akcji przy generowaniu mangi o teorii względności, kart kolekcjonerskich, monet łączących kilka zdjęć i grafiki tworzonej z ekstremalnie długiego prompta. Model wykorzystuje pełen kontekst rozmowy i wiedzę „z głowy”, więc potrafi reagować jak rozmówca-artysta.

Nowość? Obrazy generują się „na żywo” – linia po linii, w czasie rzeczywistym. Nie ma już efektu „puff” jak przy DALL-E. To wolniejsze, ale znacznie bardziej precyzyjne. I OpenAI obiecuje, że z czasem jeszcze to przyspieszy.

Nie będzie wolnej amerykanki

Model nie służy tylko do robienia ładnych obrazków. GPT-4o tworzy schematy naukowe, plakaty edukacyjne, ilustracje do materiałów dydaktycznych, a nawet edytuje przesłane zdjęcia. Właśnie to OpenAI podkreśla: sztuczna inteligencja nie tylko wie, ale wreszcie potrafi to „zobaczyć” i pokazać.

Nie zabrakło też zabezpieczeń. GPT-4o nie wygeneruje deepfake’ów, przemocy czy treści nielegalnych. Nie dodaje widocznych znaków wodnych, ale wszystkie obrazy mają ukryte metadane C2PA, które informują, że powstały z pomocą AI. OpenAI szykuje też narzędzia do śledzenia ich źródła.

Nadchodzi też integracja z API – więc deweloperzy będą mogli wbudować GPT-4o image w swoje apki. Użytkownicy zachowują prawa do obrazów, które stworzyli – oczywiście w granicach regulaminu.

Krótko mówiąc: DALL-E był etapem. GPT-4o to przyszłość.

Dziękujemy, że przeczytałeś/aś nasz artykuł do końca. Obserwuj nas w Wiadomościach Google i bądź na bieżąco!