ChatGPT-4 stał się nareszcie multimodalny. Zrobi za nas wszystko?
Firma OpenAI wprowadziła właśnie monumentalną aktualizację dla swojego flagowego chatbota, ChatGPT-4. Nowy, ulepszony arsenał funkcjonalności znacząco wzbogaca możliwości algorytmu i umożliwia interakcje z różnego rodzaju plikami (jak PDF), co czyni go de facto modelem multimodalnym. Nowinka zapowiada też nową erę w sektorze sztucznej inteligencji i komunikacji, w której nasz wirtualny asystent przetworzy dla nas nie tylko format tekstowy, ale też obraz i dźwięk.
Nowe szaty ChatGPT-4
ChatGPT-4 to najnowsza wersja oprogramowania firmy z branży technologii przyszłości, OpenAI. Model zdobył świat szturmem umożliwiając masom korzystanie za darmo z własnego wirtualnego asystenta przy pomocy zaledwie internetu i klawiatury telefonu lub komputera. Wersja pierwotna nosiła numer GPT-3, przy czym wersja czwarta została wytrenowana na o wiele większym zasobie informacji, ma nowsze bazy danych i docelowo miała przetwarzać zarówno tekst, jak i obrazy. Do niedawna była to jedynie funkcjonalność beta, obecnie jest ona dostępna dla każdej osoby korzystającej z płatnej subskrypcji (ok. 20 dolarów miesięcznie).
Oto pełna, opisowa lista nowych funkcjonalności w najpopularniejszym modelu językowym opartym na uczeniu maszynowym: GPT-4:
Przetwarzanie plików tekstowych i graficznych: Subskrybenci planu ChatGPT Plus mogą teraz korzystać z chatbota do przetwarzania zarówno plików tekstowych, jak i graficznych. Oznacza to, że użytkownicy mogą przesyłać pliki PDF, grafiki lub inne formaty i zadawać pytania dotyczące ich treści. ChatGPT potrafi analizować zawartość tych plików i udzielać odpowiedzi na pytania użytkowników.
Generowanie obrazów na podstawie przesłanych grafik: W ramach tej aktualizacji ChatGPT Plus pozwala użytkownikom przesłać grafikę i wydać polecenie generowania obrazu na jej podstawie. Użytkownicy mogą także dowolnie modyfikować wygenerowane obrazy, co otwiera nowe możliwości w zakresie tworzenia grafiki i projektowania.
Zobacz też: Amazon Prime Gaming ogłosił partnerstwo z kolejnym altcoinem. Kurs rośnie!
Praca z dokumentami, także z wykorzystaniem sieci: Aktualizacja umożliwia chatbotowi obsługę i analizę różnego rodzaju plików, w tym plików PDF. Po krótkim zapoznaniu się z treścią dokumentu, ChatGPT jest w stanie odpowiedzieć na pytania użytkownika dotyczące tego dokumentu. Może także wykonać krótkie streszczenie zawartości pliku. Dla użytkowników planu Plus istnieje również możliwość korzystania z dostępu do internetu, co pozwala chatbotowi np. na znalezienie danych i stworzenie infografiki na ich podstawie.
Automatyczne przełączanie trybów: ChatGPT Plus będzie mógł automatycznie przełączać tryby, dzięki czemu użytkownicy nie będą musieli ręcznie określać, w jakim trybie chcą pracować. Na przykład, chatbot sam rozpozna, kiedy należy generować kod w języku programistycznym, a kiedy użyć DALL-E do generowania obrazu.
Nowe funkcje bota ChatGPT w wersji Plus znacząco wpływają na przyszłość interakcji z sztuczną inteligencją. Możliwość pracy z plikami, generowania obrazów i automatycznego przełączania trybów sprawia, że chatbot staje się jeszcze bardziej wszechstronny i przydatny dla użytkowników. Aktualizacja otwiera nową erę i nowy wyścig zbrojeń między pionierami rozwiązań z zakresu sztucznej inteligencji którzy będą starali się zaoferować użytkownikowi jak najlepsze doświadczenia w tym zakresie.
Może Cię zainteresować: