ChatGPT-4 stał się nareszcie multimodalny. Zrobi za nas wszystko?

Firma OpenAI wprowadziła właśnie monumentalną aktualizację dla swojego flagowego chatbota, ChatGPT-4. Nowy, ulepszony arsenał funkcjonalności znacząco wzbogaca możliwości algorytmu i umożliwia interakcje z różnego rodzaju plikami (jak PDF), co czyni go de facto modelem multimodalnym. Nowinka zapowiada też nową erę w sektorze sztucznej inteligencji i komunikacji, w której nasz wirtualny asystent przetworzy dla nas nie tylko format tekstowy, ale też obraz i dźwięk.

Nowe szaty ChatGPT-4

ChatGPT-4 to najnowsza wersja oprogramowania firmy z branży technologii przyszłości, OpenAI. Model zdobył świat szturmem umożliwiając masom korzystanie za darmo z własnego wirtualnego asystenta przy pomocy zaledwie internetu i klawiatury telefonu lub komputera. Wersja pierwotna nosiła numer GPT-3, przy czym wersja czwarta została wytrenowana na o wiele większym zasobie informacji, ma nowsze bazy danych i docelowo miała przetwarzać zarówno tekst, jak i obrazy. Do niedawna była to jedynie funkcjonalność beta, obecnie jest ona dostępna dla każdej osoby korzystającej z płatnej subskrypcji (ok. 20 dolarów miesięcznie).

Oto pełna, opisowa lista nowych funkcjonalności w najpopularniejszym modelu językowym opartym na uczeniu maszynowym: GPT-4:

Przetwarzanie plików tekstowych i graficznych: Subskrybenci planu ChatGPT Plus mogą teraz korzystać z chatbota do przetwarzania zarówno plików tekstowych, jak i graficznych. Oznacza to, że użytkownicy mogą przesyłać pliki PDF, grafiki lub inne formaty i zadawać pytania dotyczące ich treści. ChatGPT potrafi analizować zawartość tych plików i udzielać odpowiedzi na pytania użytkowników.

Generowanie obrazów na podstawie przesłanych grafik: W ramach tej aktualizacji ChatGPT Plus pozwala użytkownikom przesłać grafikę i wydać polecenie generowania obrazu na jej podstawie. Użytkownicy mogą także dowolnie modyfikować wygenerowane obrazy, co otwiera nowe możliwości w zakresie tworzenia grafiki i projektowania.

Zobacz też: Amazon Prime Gaming ogłosił partnerstwo z kolejnym altcoinem. Kurs rośnie!

https://twitter.com/NorthstarBrain/status/1718708111706636403?s=20

Praca z dokumentami, także z wykorzystaniem sieci: Aktualizacja umożliwia chatbotowi obsługę i analizę różnego rodzaju plików, w tym plików PDF. Po krótkim zapoznaniu się z treścią dokumentu, ChatGPT jest w stanie odpowiedzieć na pytania użytkownika dotyczące tego dokumentu. Może także wykonać krótkie streszczenie zawartości pliku. Dla użytkowników planu Plus istnieje również możliwość korzystania z dostępu do internetu, co pozwala chatbotowi np. na znalezienie danych i stworzenie infografiki na ich podstawie.

Automatyczne przełączanie trybów: ChatGPT Plus będzie mógł automatycznie przełączać tryby, dzięki czemu użytkownicy nie będą musieli ręcznie określać, w jakim trybie chcą pracować. Na przykład, chatbot sam rozpozna, kiedy należy generować kod w języku programistycznym, a kiedy użyć DALL-E do generowania obrazu.

My thoughts:

'Use Tools without Switching' is going to be a huge unlock.

Having everything in one spot feels like we're one step closer to the all-in-one AI assistant that we're all predicting.

Combining Data analysis with other features is going to be insanely powerful.
— Rowan Cheung (@rowancheung) October 29, 2023

Nowe funkcje bota ChatGPT w wersji Plus znacząco wpływają na przyszłość interakcji z sztuczną inteligencją. Możliwość pracy z plikami, generowania obrazów i automatycznego przełączania trybów sprawia, że chatbot staje się jeszcze bardziej wszechstronny i przydatny dla użytkowników. Aktualizacja otwiera nową erę i nowy wyścig zbrojeń między pionierami rozwiązań z zakresu sztucznej inteligencji którzy będą starali się zaoferować użytkownikowi jak najlepsze doświadczenia w tym zakresie.

Może Cię zainteresować:

ChatGPT-4 i Google Bard rekomendują 5 kryptowalut o niskiej kapitalizacji na nową hossę. Czy to gemy?

Dziękujemy, że przeczytałeś/aś nasz artykuł do końca. Obserwuj nas w Wiadomościach Google i bądź na bieżąco!