Aigest.
Narzędzia AI

Gemini 3.5 Flash z wbudowaną funkcją obsługi komputera

Google zintegrowało funkcję obsługi komputera bezpośrednio z modelem Gemini 3.5 Flash, umożliwiając tworzenie zaawansowanych agentów AI zdolnych do interakcji z różnymi platformami.

RA

Opracowano z udziałem AI pod redakcją · zasady

Udostępnij
Gemini 3.5 Flash z wbudowaną funkcją obsługi komputera
Fot. Google DeepMind

Model Gemini 3.5 Flash został wzbogacony o wbudowaną funkcję obsługi komputera, co stanowi znaczące usprawnienie w tworzeniu agentów zdolnych do interakcji z różnymi platformami. Wcześniej dostępna jedynie jako samodzielny model Gemini 2.5, ta zdolność jest teraz natywnie zintegrowana z głównym modelem Gemini Flash, oferując najlepszą dotychczas wydajność w zadaniach związanych z agentową obsługą komputera.

Nowe możliwości dla deweloperów

Gemini już wcześniej wyróżniało się w wywoływaniu funkcji oraz korzystaniu z wbudowanych narzędzi, takich jak wyszukiwarka i mapy. Dzięki nowej integracji, deweloperzy mogą teraz wykorzystać 3.5 Flash do niezawodnego tworzenia niestandardowych agentów, którzy potrafią "widzieć", "rozumieć" i "działać" w środowiskach przeglądarek, urządzeń mobilnych oraz komputerów stacjonarnych. Otwiera to drogę do zwiększonej wydajności w długoterminowych i korporacyjnych zadaniach automatyzacji, takich jak ciągłe testowanie oprogramowania czy praca koncepcyjna w profesjonalnych aplikacjach.

Deweloperzy i przedsiębiorstwa mogą rozpocząć korzystanie z funkcji obsługi komputera w 3.5 Flash za pośrednictwem Gemini API oraz platformy Gemini Enterprise Agent Platform.

Przykłady zastosowań i bezpieczeństwo

Funkcja obsługi komputera w 3.5 Flash znajduje zastosowanie w analizie aplikacji Gemini, zwracając skategoryzowaną listę funkcji, a także w audytowaniu własnej dokumentacji pod kątem dostępności. Aby złagodzić ryzyko ataków typu prompt injection w agentach działających w środowiskach produkcyjnych, Google stosuje ukierunkowane szkolenia adwersaryjne dla funkcji obsługi komputera w Gemini 3.5 Flash. Dodatkowo, udostępniono dwa opcjonalne systemy zabezpieczeń dla przedsiębiorstw, które mają na celu zwiększenie bezpieczeństwa.

Google zachęca deweloperów do przyjęcia podejścia "obrony w głąb" (defense-in-depth), łącząc te funkcje z bezpiecznym środowiskiem sandbox, weryfikacją "człowiek w pętli" (human-in-the-loop) oraz ścisłą kontrolą dostępu. Dodatkowe informacje dotyczące środków bezpieczeństwa są dostępne w dokumentacji najlepszych praktyk.

Integracja funkcji obsługi komputera w Gemini 3.5 Flash stanowi istotny krok w rozwoju agentów AI, umożliwiając im bardziej złożone i autonomiczne działanie w cyfrowym środowisku. To posunięcie podkreśla dążenie Google do dostarczania narzędzi, które nie tylko zwiększają wydajność, ale także zapewniają niezbędne mechanizmy bezpieczeństwa w obliczu rosnących wyzwań związanych z wdrażaniem sztucznej inteligencji w krytycznych zastosowaniach biznesowych.

Źródło: deepmind.google

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Czytaj dalej

Hugging Face Hub: Cotygodniowe aktualizacje dzięki AI i ludzkiej kontroli
Google przeprojektowuje wyszukiwarkę po 25 latach: AI zmienia sposób interakcji
Wojna proxy o regulacje AI w Nowym Jorku: 27 milionów dolarów wydane na wybory Alexa Boresa
MoEngage stawia na miliony agentów AI w przyszłości marketingu, przejmując Aampe
Hollywood ugina się przed OpenAI: Film o Samie Altmannie bez dystrybucji
Claude Tag od Anthropic: AI, która uczy się firmy przez Slacka

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.