Aigest.
Newsy

Anthropic wprowadza Claude Sonnet 5: tańszy model do zadań agentowych

Anthropic zaprezentował Claude Sonnet 5, nową wersję swojego średniego modelu, która oferuje zaawansowane możliwości agentowe przy znacznie niższych kosztach, stając się domyślnym wyborem dla wielu użytkowników.

RA

Udostępnij
Anthropic wprowadza Claude Sonnet 5: tańszy model do zadań agentowych
Fot. Samuel Boivin / NurPhoto / Getty Images

Anthropic, w odpowiedzi na rosnące zapotrzebowanie na możliwości agentowe w modelach fundamentowych, wprowadził na rynek Claude Sonnet 5. Jest to bardziej zaawansowana i agentowa wersja średniego modelu firmy, która ma oferować wysoką wydajność przy niższych kosztach, stając się domyślnym modelem dla planów bezpłatnych i Pro.

Nowa era modeli agentowych

Według Anthropic, Claude Sonnet 5 potrafi tworzyć plany, korzystać z narzędzi takich jak przeglądarki i terminale, oraz działać autonomicznie na poziomie, który jeszcze kilka miesięcy temu wymagał znacznie większych i droższych modeli. To podejście jest zbieżne z trendami obserwowanymi u konkurencji. OpenAI niedawno wprowadziło GPT-5.6 Sol, swój najbardziej agentowy model, umożliwiający podział pracy na podagenty dla dłuższych zadań autonomicznych. Z kolei Google w maju zaprezentowało Gemini 3.5 Flash, które jest promowane jako narzędzie agentowe, zdolne do planowania, budowania i iterowania rzeczywistej pracy z minimalnym udziałem człowieka.

Wprowadzenie Sonnet 5 potwierdza, że zdolności agentowe stają się nowym standardem na każdym poziomie cenowym. Kluczowym wyróżnikiem na rynku nie będzie już to, kto najlepiej wykonuje pracę agentową, ale jak tanio i niezawodnie można to zrobić, minimalizując potrzebę nadzoru człowieka.

Wydajność i koszty

Sonnet 5 obiecuje wydajność zbliżoną do Opus 4.8, ale przy znacznie niższych kosztach. Od wtorku model ten jest domyślnie dostępny dla planów bezpłatnych i Pro, a także dla wszystkich subskrypcji. W momencie premiery, do 31 sierpnia, cena Sonnet 5 wynosi 2 dolary za milion tokenów wejściowych i 10 dolarów za milion tokenów wyjściowych. Po tym okresie cena tokenów wejściowych wzrośnie do 3 dolarów za milion. Czyni to Sonnet 5 tańszym niż Opus 4.8, a także niż OpenAI GPT-5.5 i Google Gemini 3.1 Pro, choć pozostaje droższy niż Gemini 3.5 Flash.

Nowy model wykazuje również znaczące ulepszenia w stosunku do swojego poprzednika, Sonnet 4.6, wydanego w lutym, w zakresie wydajności agentowej, obejmującej rozumowanie, użycie narzędzi, kodowanie oprogramowania i pracę z wiedzą. Na przykład, w jednym z testów porównawczych, Sonnet 5 osiągnął 63,2% w kodowaniu agentowym, w porównaniu do 69,2% Opus 4.8 i 58,1% Sonnet 4.6. W teście pracy z wiedzą, Sonnet 5 nieznacznie przewyższył Opus 4.8, który jest znany z rozwiązywania najtrudniejszych problemów, takich jak subtelne oceny i głębokie badania.

Anthropic podkreśla, że Opus 4.8 nadal pozostaje modelem preferowanym dla wyższej dokładności w tych zadaniach, ale Sonnet 5 oferuje deweloperom tańsze opcje o znacznie wyższej jakości niż te dostępne wcześniej. Użytkownicy mogą teraz dostosować poziom wysiłku, aby znaleźć odpowiednią równowagę między kosztem a wydajnością.

Bezpieczeństwo i praktyczne zastosowania

Według testerów cytowanych w blogu Anthropic, Sonnet 5 doskonale radzi sobie z kończeniem złożonych zadań, w których poprzednie wersje modeli zawodziły, a także "sprawdza własne wyniki bez wyraźnego polecenia". Daniel Shepard, starszy inżynier w Zapier, stwierdził, że Claude Sonnet 5 z powodzeniem wykonał dwuczęściowe zadanie: aktualizację poziomów kont Salesforce i wysłanie ogłoszenia o premierze do kontaktów korporacyjnych. Dodał, że wcześniej takie zadania często zatrzymywały się w połowie, a dla codziennej automatyzacji Sonnet 5 jest "oczywistym wyborem".

W kwestii bezpieczeństwa, Sonnet 5 wykazuje niższy wskaźnik "niepożądanych zachowań", takich jak współpraca w niewłaściwym użyciu i oszustwach, w porównaniu do swojego poprzednika, co czyni go bezpieczniejszym w kontekstach agentowych. Lepiej odmawia złośliwych żądań i unika prób przejęcia w atakach typu prompt-injection. Ma również niższy wskaźnik halucynacji i zachowań sycophantycznych niż Sonnet 4.6. Należy jednak zaznaczyć, że nie jest na tym samym poziomie co Opus 4.8 i Claude Mythos Preview w zakresie niewłaściwych zachowań. Anthropic wskazuje, że Sonnet 5 ma znacznie niższą zdolność do wykonywania niebezpiecznych zadań cyberbezpieczeństwa niż obecne modele Opus.

Fabian Hedin, współzałożyciel Lovable, potwierdził, że Claude Sonnet 5 "odmawia niebezpiecznych żądań czysto i konsekwentnie". Podkreślił, że model, który wie, kiedy powiedzieć "nie", jest równie ważny, jak ten, który wie, jak budować.

Wprowadzenie Claude Sonnet 5 przez Anthropic stanowi istotny krok w demokratyzacji dostępu do zaawansowanych możliwości sztucznej inteligencji. Obniżenie kosztów przy zachowaniu wysokiej wydajności i poprawie bezpieczeństwa może przyspieszyć adopcję modeli agentowych w wielu branżach, umożliwiając firmom i deweloperom tworzenie bardziej złożonych i autonomicznych rozwiązań bez konieczności ponoszenia wygórowanych kosztów. To z kolei może prowadzić do dalszych innowacji i szerszego wykorzystania AI w codziennych procesach biznesowych.

Źródło: techcrunch.com

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Czytaj dalej

Austria chce przyciągnąć Anthropic do UE w obliczu blokady modeli AI z USA
Od chatbota do cyfrowego współpracownika: AI musi kończyć zadania, nie tylko odpowiadać
Azjatyckie startupy AI wprowadzają modele podobne do Mythos w obliczu amerykańskiego zakazu eksportu Anthropic
Gemini 3.5 Flash z wbudowaną funkcją obsługi komputera
Claude Tag od Anthropic: AI, która uczy się firmy przez Slacka
Fugu od Sakana AI: orkiestracja wielu modeli LLM rzuca wyzwanie gigantom

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.