Doczekaliśmy się. OpenAI wreszcie uruchomiło zapowiadane od miesięcy funkcje wideo dla ChatGPT. Co to za bajer? Pozwala użytkownikom na analizę obiektów w czasie rzeczywistym za pomocą kamery w smartfonie. Nowa opcja, dostępna w zaawansowanym trybie głosowym, umożliwia chatbotowi nie tylko odpowiadanie na pytania, ale także analizowanie otaczającego nas świata. Brzmi spektakularnie? Niestety, na ten moment użytkownicy GPT z Unii Europejskiej muszą uzbroić się w cierpliwość.
OpenAI wprowadza długo oczekiwaną funkcję wideo w ChatGPT
Co ciekawe, rozszerzenie to było gotowe już w maju, ale jego premiera została opóźniona ze względu na kontrowersje związane z wykorzystaniem głosów celebrytów bez ich zgody. Dopiero teraz użytkownicy subskrypcji Plus, Team i Pro mogą korzystać z tej technologii, która wprowadza na kolejny, nieznany wcześniej poziom interakcji z AI.
Model rozpoznaje obiekty, analizuje obraz i dostarcza odpowiedzi w sposób naturalny, niemal bez jakichkolwiek opóźnień. Dzięki temu sztuczna inteligencja potrafi rozwiązywać równania matematyczne, proponować przepisy kulinarne. Nawet angażować się w gry edukacyjne z dziećmi. OpenAI zachwala swoje osiągnięcie jako najbardziej intuicyjne i zaawansowane narzędzie na rynku.
Konkurencja w grze – Google i Meta też rozwijają swoje AI
Na rynku, który – to trzeba podkreślić – robi się coraz trudniejszy. Google i Meta również zaprezentowały swoje propozycje w tej samej kategorii. Ci pierwsi, dzięki projektowi Astra, wprowadzają AI zdolne do rozumienia wideo w czasie rzeczywistym i wykonywania zadań na bieżąco. Krok dalej poszła Meta. Postawili na zupełnie inną kartę. Stworzyli inteligentne okulary w ramach projektu Orion. Mmają umożliwiać interakcje z AI za pomocą rzeczywistości rozszerzonej (AR). Dzięki wbudowanej kamerze AI może analizować otoczenie i wchodzić w interakcje w sposób niemal niezauważalny.
Projekty, choć różniące się od siebie, zbiegają się praktycznie w jednym punkcie. Od teraz oprócz klawiatury i dźwięku, do interakcji ze sztuczną inteligencją będziemy mogli dorzucić jeszcze obraz w czasie rzeczywistym.
Kevin Weil, Chief Product Officer OpenAI, zapowiedział, że funkcje wideo i udostępniania ekranu to dopiero początek. Ponoć fajerwerki trzymają na jeszcze lepszą okazję. W ramach kampanii „12 dni OpenAI” firma w najbliższym czasie zaprezentuje jeszcze kilka nowości.
ChatGPT, choć stale rozwijany i wciąż będący numerem jeden, nie może spać spokojnie. Konkurencja nie śpi i wygląda na to, że zrobi wszystko, żeby odebrać OpenAI kawałki tego tortu.