OpenAI, firma odpowiedzialna za stworzenie ChatGPT, postanowiła wprowadzić innowacyjne zmiany w funkcjonalności tego popularnego narzędzia. Użytkownicy niebawem będą mogli komunikować się z nim, korzystając z komend głosowych oraz przesyłając zdjęcia do analizy.
ChatGPT – teraz też ze zrozumieniem obrazów i dźwięków
Od początku istnienia ChatGPT uchodził za wyjątkowe narzędzie w świecie AI, rozwiązujące tekstowe zapytania użytkowników. Wkrótce jego zdolności mają zostać znacząco poszerzone. OpenAI wprowadza funkcje głosowe, które umożliwią prowadzenie z botem płynnych rozmów.
Kluczową technologią w tym rozwiązaniu jest Whisper – system rozpoznawania mowy. Do dyspozycji użytkowników ma być pięć różnych opcji głosu, stworzonych przez profesjonalnych aktorów.
Kolejny krok ewolucji w ChatGPT to system rozpoznawania zdjęć. Dzięki niemu użytkownicy będą mogli prezentować botowi grafiki, fotografie czy zrzuty ekranu w celu ich analizy. Nowa funkcja będzie korzystać z technologii GPT-3.5 oraz GPT-4, zapewniając precyzyjne rozumienie przesłanych obrazów.
Takie rozwiązanie znajdzie zastosowanie chociażby w rozwiązywaniu problemów technicznych, planowaniu posiłków czy też analizie skomplikowanych danych graficznych.
Zobacz również: Koniec pięknego snu kasjerki z Australii. Krypto milionerka z przypadku skazana!
Bezpieczeństwo przede wszystkim?
OpenAI jest świadome potencjalnych ryzyk związanych z nowymi funkcjami. Organizacja zdaje sobie sprawę z niebezpieczeństwa oszustw czy podszywania się. W odpowiedzi na te wyzwania, głos ChatGPT oparty jest wyłącznie na aktorach głosowych, a nie na głosach użytkowników.
Współpracując z takimi partnerami jak Spotify, OpenAI testuje różnorodne zastosowania swoich nowych funkcji, zapewniając jednocześnie ich odpowiednią ochronę i bezpieczeństwo.
Nowe funkcje ChatGPT zostaną udostępnione użytkownikom wersji Plus i Enterprise w ciągu najbliższych dwóch tygodni. OpenAI planuje także ich rozbudowę dla innych, w tym dla deweloperów tworzących własne aplikacje oparte na GPT.
Wprowadzenie funkcji głosowych i rozpoznawania obrazów w ChatGPT to ogromny krok naprzód w komunikacji człowieka z technologią. OpenAI nieustannie pracuje nad poprawą funkcjonalności swojego bota, a najnowsze aktualizacje świadczą o ambicjach organizacji w zakresie tworzenia przyszłościowej i wszechstronnej komunikacji.
Może Cię również zainteresować: