Google po programistycznej „wpadce” przywraca ważną funkcję w Gemini AI
Jak czytamy w artykule opublikowanym na blogu Google, Imagen 3, najnowszy model generowania obrazów firmy, zostanie wprowadzony w najbliższych dniach do modelu Gemini AI. Wiadomo już, że będzie on generował obrazy ludzi, ale nie będą to obrazy fotorealistyczne.
W założeniach twórców Imagen 3 ma na celu ustanowienie nowego standardu jakości obrazu. Podobnie jak w przypadku Imagen 2, użyto w nimy SynthID, narzędzia Google służącego do znakowania wodnego obrazów generowanych przez sztuczną inteligencję.
Google naprawia błędy
Google zapowiada, że Gemini nie będzie generować fotorealistycznych obrazów ludzi, nie będzie tworzyć obrazów zawierających dzieci lub możliwych do zidentyfikowania osób, a także będzie dążyć do zapobiegania przedstawianiu „nadmiernie krwawych, brutalnych lub seksualnych scen”. Możliwość generowania obrazów będzie póki co dostępna tylko w języku angielskim dla użytkowników Gemini Advanced, Business i Enterprise.
Niezorientowanym w temacie przypomnijmy, że w lutym br. Google wycofało z Gemini funkcję generowania obrazów ludzi. W sieci pojawiły się bowiem posty świadczące o tym, że narzędzie generuje różnorodne, ale niezgodne z faktami historycznymi obrazy. Przykładem mogą tu być ciemnoskórzy niemieccy żołnierze z czasów nazistowskich.
Internauci nie zostawili na Google suchej nitki. Próbując wyjść z twarzą z całej tej sytuacji przedstawiciele przedsiębiorstwa stwierdzili, że generowanie przez Gemini obrazów ludzi w szerokim ujęciu było „ogólnie dobrą rzeczą”, ponieważ bot miał globalnych użytkowników, ale jednocześnie przyznano, że to rozwiązanie „nie trafiło w sedno”. „Oczywiście, podobnie jak w przypadku każdego generatywnego narzędzia sztucznej inteligencji, nie każdy obraz stworzony przez Gemini będzie idealny, ale będziemy nadal słuchać opinii od pierwszych użytkowników, gdy będziemy go ulepszać” – czytamy w najnowszym komunikacie Google.
Jak zapowiada technologiczny gigant, już niebawem subskrybenci będą mogli rozpocząć tworzenie i czatowanie z Gems, niestandardowymi wersjami Gemini. Będzie je można dostosowywać tak, by pełniły rolę eksperta w danej dziedzinie lub by były dostosowane do konkretnych celów. Wystarczy napisać instrukcje dla elementu, nadać mu nazwę, a następnie rozpocząć z nim rozmowę. „Dzięki Gems możesz stworzyć zespół ekspertów, którzy pomogą ci przemyśleć trudny projekt, przeprowadzić burzę mózgów na temat nadchodzącego wydarzenia lub napisać idealny podpis do postu w mediach społecznościowych. Twój Gem może również zapamiętać szczegółowy zestaw instrukcji, aby pomóc Ci zaoszczędzić czas na żmudnych, powtarzalnych lub trudnych zadaniach” – zachęca Google. „Ulepszyliśmy nasze możliwości kreatywnego generowania obrazów, a w najbliższych dniach wprowadzimy nasz najnowszy model generowania obrazów, Imagen 3 do Gemini Apps i rozszerzymy jego dostępność dla użytkowników we wszystkich językach” – czytamy w komunikacie.