Fugu od Sakana AI: orkiestracja wielu modeli LLM rzuca wyzwanie gigantom

Japoński startup Sakana AI wprowadza Fugu – system, który dynamicznie koordynuje wiele modeli językowych, działając jak jeden model. Twórcy twierdzą, że Fugu dorównuje, a nawet przewyższa najlepsze modele Anthropic w tes

Redakcja Aigest

23 czerwca 2026

Opracowano z udziałem AI pod redakcją · zasady

Udostępnij

Fugu od Sakana AI: orkiestracja wielu modeli LLM rzuca wyzwanie gigantom — Fot. Sakana Fugu dynamically orchestrates multiple language models from a swappable agent pool to tackle complex tasks. To the user, it behaves like a single model with one API. | Image: Sakana AI

Japoński startup Sakana AI zaprezentował Fugu, innowacyjny system, który dynamicznie koordynuje wiele dużych modeli językowych (LLM) z wymiennej puli, zachowując się dla użytkownika jak pojedynczy model dostępny poprzez jedno API. Firma twierdzi, że Fugu przewyższa w testach porównawczych modele Fable i Mythos firmy Anthropic, mimo że żadne z nich nie wchodzą w skład puli LLM Fugu.

Fugu: Architektura i warianty

Fugu to model językowy, który został wytrenowany do wywoływania innych LLM z puli agentów, włączając w to kopie samego siebie. W zależności od zapytania, system albo samodzielnie wykonuje zadanie, albo angażuje zespół wyspecjalizowanych modeli. Procesy selekcji, delegowania, weryfikacji i syntezy odbywają się wewnętrznie, a użytkownicy uzyskują dostęp do wszystkich funkcji za pośrednictwem pojedynczego API kompatybilnego z OpenAI.

Sakana AI wprowadza dwie wersje Fugu:

Fugu (wersja podstawowa): Zaprojektowana z myślą o niskim opóźnieniu i solidnej codziennej wydajności w zadaniach związanych z kodowaniem, przeglądem kodu i zastosowaniach chatbotów. Zespoły z wymogami prywatności mogą wykluczać określonych agentów z puli.
Fugu Ultra: Stworzona dla maksymalnej jakości odpowiedzi w złożonych, wieloetapowych problemach. Wcześni użytkownicy wykorzystywali ją do badań AI, reprodukcji artykułów naukowych, analizy cyberbezpieczeństwa oraz wyszukiwania patentów i literatury.

Według opublikowanych przez Sakana AI wyników testów porównawczych, Fugu Ultra dorównuje modelom Anthropic Fable 5 i Mythos Preview w szeregu benchmarków dotyczących kodowania, rozumowania, nauki i agentów. Sakana AI podkreśla, że modele Anthropic nie są częścią puli Fugu, ponieważ nie są publicznie dostępne, a ich włączenie mogłoby jeszcze bardziej poprawić wyniki.

Niezależność i wydajność w praktyce

Sakana AI promuje Fugu jako zabezpieczenie przed zależnością od jednego dostawcy. Firma wskazuje na niedawne kontrole eksportowe na modele Fable i Mythos Anthropic jako konkretny przykład, ilustrujący, jak dostęp do kluczowych systemów AI może zniknąć z dnia na dzień z powodu zmian regulacyjnych lub decyzji polityki zagranicznej. Pula modeli Fugu jest w pełni wymienna, co pozwala systemowi przekierować zadania do innych modeli, jeśli jeden z dostawców stanie się niedostępny.

Około 500 beta testerów sprawdziło system w rzeczywistych warunkach. Fugu okazało się najsilniejsze w długich, wieloetapowych procesach, takich jak zautomatyzowane badania danych, analiza bezpieczeństwa i przeglądy kodu. Jeden z deweloperów oprogramowania zauważył, że Fugu Ultra wykrywa znacznie więcej błędów podczas przeglądu kodu niż GPT-5.5, znajdując ponad dwadzieścia problemów, podczas gdy inne narzędzia wskazywały około trzech. Sakana AI twierdzi również, że Fugu pokonało Gemini 3.1 Pro, Opus 4.8 i GPT 5.5 w swoich testach dotyczących zautomatyzowanych badań, projektowania mechanicznego i prognoz finansowych.

Wczesne opinie i wyzwania

Pierwsze recenzje Fugu są jednak mniej entuzjastyczne niż wyniki benchmarków. Badacz AI Ethan Mollick na platformie X (dawniej Twitter) określił Fugu Ultra jako „niewiarygodnie wolne”, a jego testy kodowania trwały 30 minut. Wyniki były „w porządku”, ale ustępowały Fable. Użytkownik @LLMJunky zużył całą pięciogodzinną pulę na planie za 20 dolarów za pomocą jednego promptu, a zadanie kodowania ThreeJS było „znacznie gorsze niż GPT 5.5”. Deweloperzy na Hacker News narzekają, że plan za 200 dolarów miesięcznie oferuje mniej niż trzy godziny pracy tygodniowo, a jakość API jest niska. Mimo to, przeglądy kodu zostały ocenione pozytywnie, dorównując Opus 4.8 lub GPT 5.5.

Mark Santos, użytkownik X, przeprowadził porównanie Fugu Ultra z Opus 4.8 w zadaniu klonowania gry Crossy Road. Fugu Ultra ukończyło zadanie w 22 minuty za 7,32 dolara, znacznie szybciej i taniej niż Opus 4.8 (79 minut, 37,85 dolara), choć Santos ocenił jakość wyniku Fugu jako niższą. Twierdzenie Sakana AI o suwerenności również spotkało się z krytyką, ponieważ system nadal zależy od modeli w swojej puli, a Sakana wykorzystuje zastrzeżone modele, takie jak Claude Opus, do swoich testów.

Fugu opiera się na badaniach Sakana AI nad orkiestracją modeli, w szczególności na dwóch artykułach przedstawionych na ICLR 2026: Trinity i Conductor. Podejście to wpisuje się w szerszą wizję firmy, która zakłada stosowanie zasad naturalnych, takich jak zachowania roju, ewolucja i inteligencja zbiorowa, do systemów AI. Sakana AI, założona przez byłych badaczy Google AI, Lliona Jonesa i Davida Ha, postrzega potężną sztuczną inteligencję nie jako problem pojedynczego modelu, ale jako współpracujący ekosystem, który wykracza poza możliwości jednego modelu.

Fugu, mimo początkowych wyzwań związanych z wydajnością i kosztami, stanowi interesujący krok w kierunku bardziej elastycznych i odpornych systemów AI. Koncepcja dynamicznej orkiestracji wielu modeli może zaoferować alternatywę dla dominujących, monolitycznych rozwiązań, potencjalnie zmniejszając ryzyko związane z zależnością od jednego dostawcy i otwierając drogę do bardziej zróżnicowanego ekosystemu sztucznej inteligencji.

Źródło: the-decoder.com

#Anthropic #LLM #AI #Sakana AI #Fugu

Udostępnij

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Powiązane w Newsy

Newsy

OpenAI rozszerza inicjatywę Daybreak: GPT-5.5-Cyber i partnerstwa w cyberbezpieczeństwie

OpenAI rozwija swoją inicjatywę Daybreak, wprowadzając model GPT-5.5-Cyber, który ma przewyższać konkurencję w testach cyberbezpieczeństwa. Firma stawia na automatyzację łatania luk i współpracę z ponad 25 firmami oraz r

Redakcja Aigest3 godz. temu

#OpenAI #cyberbezpieczeństwo

Newsy

Nvidia stawia na chłodzenie cieczą i wyższe temperatury, by zredukować zużycie wody w centrach danych

Nvidia ogłosiła, że jej nowa referencyjna konstrukcja centrum danych, oparta na chłodzeniu cieczą i wyższych temperaturach pracy, ma niemal całkowicie wyeliminować zużycie wody.

Redakcja Aigest14 godz. temu

Newsy

GM instaluje roboty w fabryce pojazdów elektrycznych, zwalniając pracowników

General Motors zainstalował dziesiątki nowych ramion robotycznych w swojej flagowej fabryce pojazdów elektrycznych w Detroit, mimo że 1300 pracowników pozostaje bez pracy po wcześniejszych zwolnieniach.

Redakcja Aigest16 godz. temu

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.