Anthropic wprowadza Claude Sonnet 5: tańszy model do zadań agentowych
Anthropic zaprezentował Claude Sonnet 5, nową wersję swojego średniego modelu, która oferuje zaawansowane możliwości agentowe przy znacznie niższych kosztach, stając się domyślnym wyborem dla wielu użytkowników.

Anthropic, w odpowiedzi na rosnące zapotrzebowanie na możliwości agentowe w modelach fundamentowych, wprowadził na rynek Claude Sonnet 5. Jest to bardziej zaawansowana i agentowa wersja średniego modelu firmy, która ma oferować wysoką wydajność przy niższych kosztach, stając się domyślnym modelem dla planów bezpłatnych i Pro.
Nowa era modeli agentowych
Według Anthropic, Claude Sonnet 5 potrafi tworzyć plany, korzystać z narzędzi takich jak przeglądarki i terminale, oraz działać autonomicznie na poziomie, który jeszcze kilka miesięcy temu wymagał znacznie większych i droższych modeli. To podejście jest zbieżne z trendami obserwowanymi u konkurencji. OpenAI niedawno wprowadziło GPT-5.6 Sol, swój najbardziej agentowy model, umożliwiający podział pracy na podagenty dla dłuższych zadań autonomicznych. Z kolei Google w maju zaprezentowało Gemini 3.5 Flash, które jest promowane jako narzędzie agentowe, zdolne do planowania, budowania i iterowania rzeczywistej pracy z minimalnym udziałem człowieka.
Wprowadzenie Sonnet 5 potwierdza, że zdolności agentowe stają się nowym standardem na każdym poziomie cenowym. Kluczowym wyróżnikiem na rynku nie będzie już to, kto najlepiej wykonuje pracę agentową, ale jak tanio i niezawodnie można to zrobić, minimalizując potrzebę nadzoru człowieka.
Wydajność i koszty
Sonnet 5 obiecuje wydajność zbliżoną do Opus 4.8, ale przy znacznie niższych kosztach. Od wtorku model ten jest domyślnie dostępny dla planów bezpłatnych i Pro, a także dla wszystkich subskrypcji. W momencie premiery, do 31 sierpnia, cena Sonnet 5 wynosi 2 dolary za milion tokenów wejściowych i 10 dolarów za milion tokenów wyjściowych. Po tym okresie cena tokenów wejściowych wzrośnie do 3 dolarów za milion. Czyni to Sonnet 5 tańszym niż Opus 4.8, a także niż OpenAI GPT-5.5 i Google Gemini 3.1 Pro, choć pozostaje droższy niż Gemini 3.5 Flash.
Nowy model wykazuje również znaczące ulepszenia w stosunku do swojego poprzednika, Sonnet 4.6, wydanego w lutym, w zakresie wydajności agentowej, obejmującej rozumowanie, użycie narzędzi, kodowanie oprogramowania i pracę z wiedzą. Na przykład, w jednym z testów porównawczych, Sonnet 5 osiągnął 63,2% w kodowaniu agentowym, w porównaniu do 69,2% Opus 4.8 i 58,1% Sonnet 4.6. W teście pracy z wiedzą, Sonnet 5 nieznacznie przewyższył Opus 4.8, który jest znany z rozwiązywania najtrudniejszych problemów, takich jak subtelne oceny i głębokie badania.
Anthropic podkreśla, że Opus 4.8 nadal pozostaje modelem preferowanym dla wyższej dokładności w tych zadaniach, ale Sonnet 5 oferuje deweloperom tańsze opcje o znacznie wyższej jakości niż te dostępne wcześniej. Użytkownicy mogą teraz dostosować poziom wysiłku, aby znaleźć odpowiednią równowagę między kosztem a wydajnością.
Bezpieczeństwo i praktyczne zastosowania
Według testerów cytowanych w blogu Anthropic, Sonnet 5 doskonale radzi sobie z kończeniem złożonych zadań, w których poprzednie wersje modeli zawodziły, a także "sprawdza własne wyniki bez wyraźnego polecenia". Daniel Shepard, starszy inżynier w Zapier, stwierdził, że Claude Sonnet 5 z powodzeniem wykonał dwuczęściowe zadanie: aktualizację poziomów kont Salesforce i wysłanie ogłoszenia o premierze do kontaktów korporacyjnych. Dodał, że wcześniej takie zadania często zatrzymywały się w połowie, a dla codziennej automatyzacji Sonnet 5 jest "oczywistym wyborem".
W kwestii bezpieczeństwa, Sonnet 5 wykazuje niższy wskaźnik "niepożądanych zachowań", takich jak współpraca w niewłaściwym użyciu i oszustwach, w porównaniu do swojego poprzednika, co czyni go bezpieczniejszym w kontekstach agentowych. Lepiej odmawia złośliwych żądań i unika prób przejęcia w atakach typu prompt-injection. Ma również niższy wskaźnik halucynacji i zachowań sycophantycznych niż Sonnet 4.6. Należy jednak zaznaczyć, że nie jest na tym samym poziomie co Opus 4.8 i Claude Mythos Preview w zakresie niewłaściwych zachowań. Anthropic wskazuje, że Sonnet 5 ma znacznie niższą zdolność do wykonywania niebezpiecznych zadań cyberbezpieczeństwa niż obecne modele Opus.
Fabian Hedin, współzałożyciel Lovable, potwierdził, że Claude Sonnet 5 "odmawia niebezpiecznych żądań czysto i konsekwentnie". Podkreślił, że model, który wie, kiedy powiedzieć "nie", jest równie ważny, jak ten, który wie, jak budować.
Wprowadzenie Claude Sonnet 5 przez Anthropic stanowi istotny krok w demokratyzacji dostępu do zaawansowanych możliwości sztucznej inteligencji. Obniżenie kosztów przy zachowaniu wysokiej wydajności i poprawie bezpieczeństwa może przyspieszyć adopcję modeli agentowych w wielu branżach, umożliwiając firmom i deweloperom tworzenie bardziej złożonych i autonomicznych rozwiązań bez konieczności ponoszenia wygórowanych kosztów. To z kolei może prowadzić do dalszych innowacji i szerszego wykorzystania AI w codziennych procesach biznesowych.
Źródło: techcrunch.com
Komentarze
Zaloguj się, aby dołączyć do dyskusji.
Nikt jeszcze nie skomentował. Bądź pierwszy!
Czytaj dalej

Austria chce przyciągnąć Anthropic do UE w obliczu blokady modeli AI z USA
W odpowiedzi na amerykańskie ograniczenia w dostępie do zaawansowanych modeli AI, Austria proponuje przyciągnięcie firmy Anthropic do Europy, dążąc do niezależności technologicznej.
Redakcja Aigestwczoraj

Od chatbota do cyfrowego współpracownika: AI musi kończyć zadania, nie tylko odpowiadać
Systemy AI staną się niezawodnymi współpracownikami, gdy zaczną realizować całe zadania w trwałych środowiskach pracy, zamiast jedynie generować odpowiedzi. Klucz tkwi w ponownym wykorzystywaniu „umiejętności”.
Redakcja Aigest2 dni temu

Azjatyckie startupy AI wprowadzają modele podobne do Mythos w obliczu amerykańskiego zakazu eksportu Anthropic
W odpowiedzi na zakaz eksportu modeli AI Anthropic przez administrację USA, azjatyckie startupy, takie jak chińskie 360 i japońskie Sakana AI, wprowadzają na rynek własne zaawansowane rozwiązania.
Redakcja Aigest3 dni temu

Gemini 3.5 Flash z wbudowaną funkcją obsługi komputera
Google zintegrowało funkcję obsługi komputera bezpośrednio z modelem Gemini 3.5 Flash, umożliwiając tworzenie zaawansowanych agentów AI zdolnych do interakcji z różnymi platformami.
Redakcja Aigest6 dni temu

Claude Tag od Anthropic: AI, która uczy się firmy przez Slacka
Anthropic wprowadza Claude Tag, nową funkcję AI w Slacku, która ma działać jak "zawsze aktywny Claude". Narzędzie uczy się kontekstu organizacji, integrując się z komunikacją zespołową.
Redakcja Aigest23 cze 2026

Fugu od Sakana AI: orkiestracja wielu modeli LLM rzuca wyzwanie gigantom
Japoński startup Sakana AI wprowadza Fugu – system, który dynamicznie koordynuje wiele modeli językowych, działając jak jeden model. Twórcy twierdzą, że Fugu dorównuje, a nawet przewyższa najlepsze modele Anthropic w tes
Redakcja Aigest23 cze 2026
Bądź na bieżąco ze światem AI
Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.