Sztuczna inteligencja przejmie kontrolę nad Twoim komputerem! Claude AI wprowadza rewolucyjną funkcję, co może pójść nie tak?
Firma Anthropic zszokowała świat sztucznej inteligencji najnowszą aktualizacją swojego autorskiego modelu językowego Claude. Nowa wersja, znana jako Claude Sonnet 3.5, nie tylko przewyższa GPT-4 w wielu kluczowych benchmarkach, ale także wprowadza przełomową funkcję computer use, pozwalającą SI na pełną interakcję z komputerem użytkownika. To może być koniec mozolnego wprowadzania kolejnych promptów, ale jakim kosztem?
Claude Sonnet 3.5: Nowy lider wśród modeli językowych
W październiku 2024 roku Anthropic ogłosił aktualizację modelu Claude do wersji Sonnet 3.5. Według pierwszych niezależnych testów nowy wersja przewyższa GPT-4 od OpenAI w obszarach takich jak zaawansowane rozumowanie, programowanie oraz wizualne pytania i odpowiedzi. Claude osiągnął szczególnie imponujący wynik w benchmarku inżynierii oprogramowania, rozwiązując 49% problemów zgłaszanych na platformie programistycznej GitHub — wynik znacznie wyższy niż te uzyskane przez konkurencyjne modele.
Mimo że GPT-4 pozostaje groźnym i głównym rywalem w wyścigu o najlepszy algorytm AI zwłaszcza w dziedzinie matematyki (gdzie detronizuje Claude), różnice w metodologii testowania (np. wykorzystanie techniki chain of thought przez GPT-4) utrudniają bezpośrednie porównania. Niemniej jednak, osiągnięcia Claude Sonnet 3.5 są niezaprzeczalne i wskazują na wykładniczy postęp w dziedzinie sztucznej inteligencji.
Funkcja computer use: nowa era interakcji z AI
Najbardziej innowacyjną aktualizacją od Anthropic jest bez cienia wątpliwości wprowadzenie funkcji o nazwie computer use, dostępnej dla deweloperów poprzez API. Dzięki niej Claude może symulować działania użytkownika na komputerze, takie jak użycie myszy, klawiatury czy interakcje z różnymi aplikacjami. Robot przyjmuje od użytkownika językowy prompt po to, by następnie potraktować swoją własną odpowiedź jako kolejne zapytanie. Tworzy to swoistą pętlę aż do momentu rozwiązania problemu postawionego na wstępie.
Nowe rozwiązanie otwiera drzwi do automatyzacji wielu zadań, które dotychczas wymagały stałego nadzoru i bezpośredniej interwencji człowieka. Poniżej prezentujemy kilka przypadków jego zastosowania.
Praktyczne zastosowania funkcji computer use
W jednym z testów Claude został poproszony o znalezienie kodu SVG dla logotypu platformy do nauki programowania FireShip. Model:
- Zrobił zrzut ekranu pulpitu i zidentyfikował ikonę przeglądarki Firefox.
- Kliknął na ikonę, otwierając przeglądarkę.
- Wpisał adres URL strony internetowej.
- Odnalazł odpowiedni obrazek na stronie, kliknął prawym przyciskiem myszy i wybrał opcję „Inspektor” w celu analizy kodu HTML.
- Skopiował kod SVG i zwrócił go użytkownikowi.
Innym przykładem jest stworzenie kalkulatora wartości netto w programie Excel. Claude nie tylko wprowadził wszystkie dane, ale również stworzył odpowiednie formuły do obliczeń. W jeszcze innym teście model użył programu graficznego wbudowanego w Windowsa – MS Paint – do narysowania prostego obrazu konia, wykorzystując narzędzia rysunkowe w sposób zbliżony do ludzkiego.
Pełny eksperyment obejrzycie tutaj:
Anthropic chwali się postępami w promocyjnym filmie
Sam Ringer, jeden z pracowników Anthropic odpowiedzialny za pion badawczy, zaprezentował w formie instruktażu wideo praktyczne zastosowanie funkcji computer use. W ramach promocyjnej demonstracji Claude został poproszony o wypełnienie formularza zgłoszeniowego dla fikcyjnej firmy Ant Equipment Company. Dane potrzebne do wypełnienia formularza były rozproszone w różnych miejscach na komputerze — w arkuszu kalkulacyjnym oraz w systemie CRM. Claude:
- Sprawdził arkusz kalkulacyjny w poszukiwaniu firmy.
- Gdy nie znalazł potrzebnych informacji, przeniósł się do systemu CRM.
- Odnalazł firmę i zebrał niezbędne dane.
- Wypełnił formularz, przenosząc informacje w odpowiednie pola.
- Zatwierdził i wysłał formularz.
Imponujące? Dla niżej podpisanego redaktora – jak najbardziej.
Co może pójść nie tak?
Funkcja computer use otwiera przed nami ogromne możliwości w zakresie automatyzacji codziennych zadań. Może ona znacząco zwiększyć produktywność w wielu branżach, od medycyny po finanse. Jednakże przekazanie AI pełnego dostępu do komputera niesie ze sobą pewne ryzyka.
W jednym z testów Claude podczas realizacji zadania programistycznego niespodziewanie zaczął przeglądać zdjęcia Parku Narodowego Yellowstone. Choć w tym przypadku było to absolutnie nieszkodliwe, podobne zachowania w przypadku chociażby infrastruktury krytycznej mogą prowadzić do lawiny niepożądanych i trudnych do przewidzenia skutków.
Istnieją również obawy dotyczące bezpieczeństwa danych i prywatności. Funkcja ta może potencjalnie umożliwić AI dostęp do wrażliwych informacji lub wykonywanie nieautoryzowanych operacji, takich jak zarządzanie kontami bankowymi czy modyfikowanie ważnych dokumentów.
Pomimo wyzwań, jakie niesie ze sobą nowa funkcjonalność, nic już chyba nie jest w stanie zatrzymać tego wyścigu zbrojeń. Firmy takie jak Amazon, Google czy Microsoft stale pompują nowe fundusze zarówno w rozwój swoich modeli sztucznej inteligencji, jak i w infrastrukturę niezbędnej do obsługi zaawansowanych modeli AI, w tym choćby energetykę jądrową do zasilania ogromnych centrów danych, na których uczone są i operują maszyny.
Przyszłość, jak widzimy powyżej, będzie z pewnością mocno zautomatyzowana.