OpenAI rozpoczęło wdrażanie nowej funkcji Advanced Voice Mode dla użytkowników ChatGPT Plus oraz Teams. Nowy tryb pozwala na prowadzenie rozmów w czasie rzeczywistym. To sprawia, że interakcje z AI mają być bardziej płynne i zbliżone do rozmów z prawdziwymi ludźmi. Ta funkcja oparta jest na modelu GPT-4o, który łączy tekst, wizję i dźwięk, aby dostarczać odpowiedzi szybciej i bardziej naturalnie. Nowość ta ma na celu poprawę doświadczenia użytkowników. Szczególnie w przypadku długich rozmów, gdzie szybkość i płynność odpowiedzi odgrywają kluczową rolę.
OpenAI wprowadza Advanced Voice Mode dla użytkowników ChatGPT Plus i Teams
Wprowadzili także pięć nowych głosów: Arbor, Maple, Sol, Spruce i Vale. Te zostały zaprojektowane tak, aby umożliwić bardziej naturalne i emocjonalnie responsywne rozmowy z AI. Zastępują one głos Sky, który wzbudził kontrowersje z powodu podobieństwa do głosu aktorki Scarlett Johansson.
Dodatkowo OpenAI umożliwia większą personalizację poprzez funkcję custom instructions oraz „wspomnienia”, które pozwalają chatbotowi lepiej dostosować się do preferencji użytkownika. Oznacza to, że zarówno głosy, jak i odpowiedzi AI lepiej dopasują się do specyficznych potrzeb każdej osoby, co uczyni interakcje bardziej spersonalizowanymi.
OpenAI się rozwija, ale konkurencja nie śpi
Na rynku AI pojawia się coraz większa konkurencja, a Google i Meta również rozwijają swoje własne rozwiązania głosowe. Google, dzięki narzędziu NotebookLM, oferuje obecnie najbardziej zaawansowane głosy AI, zdolne do symulowania realistycznych rozmów. Meta AI również wprowadza bardziej naturalne rozmowy, choć wciąż z pewnymi ograniczeniami. OpenAI, prezentując nowe rozszerzenia, stara się utrzymać przewagę na szybko rozwijającym się rynku technologii głosowych.
Czy funkcja jest dostępna w Polsce?
Choć Advanced Voice Mode jest już dostępne dla użytkowników Plus i Teams w niektórych regionach, w Europie, Wielkiej Brytanii oraz kilku innych krajach (w tym w Polsce), użytkownicy będą musieli jeszcze poczekać. OpenAI zapowiada jednak, że wkrótce także użytkownicy korporacyjni i edukacyjni otrzymają dostęp do tej technologii. Wprowadzenie tej funkcji to tylko jeden z wielu kroków, które mają zbliżyć sztuczną inteligencję do bardziej naturalnej i ludzkiej interakcji.