Anthropic Claude Fable 5 i Mythos 5 dostępne globalnie po zniesieniu restrykcji USA
Modele AI Anthropic, Fable 5 i Mythos 5, otrzymały zielone światło od rządu USA na globalne udostępnienie po tym, jak początkowo zostały uznane za zagrożenie dla bezpieczeństwa narodowego. Firma podjęła szereg działań w

Rząd Stanów Zjednoczonych zniósł ograniczenia eksportowe na najnowsze modele sztucznej inteligencji firmy Anthropic, Claude Fable 5 i Mythos 5, zaledwie trzy tygodnie po tym, jak administracja Trumpa uznała je za potencjalne zagrożenie dla bezpieczeństwa narodowego. W efekcie, Fable 5 jest już dostępny globalnie, a organizacje w USA od 26 czerwca ponownie mają dostęp do Mythos 5. Anthropic zapowiedział również rozszerzenie dostępu do Mythos w ramach programu Glasswing, który umożliwia badaczom cyberbezpieczeństwa w zaufanych firmach wykorzystywanie modelu do celów obronnych.
Współpraca z rządem i wzmocnienie bezpieczeństwa
Sekretarz Handlu, Howard Lutnick, w liście do Anthropic, którego treść widziały Reuters i The New York Times, potwierdził, że firma nie będzie już potrzebować licencji na eksport ani transfer modeli Claude Mythos i Claude Fable. Podkreślił, że Anthropic podjął działania w ścisłej koordynacji z rządem USA, aby zaradzić ryzykom związanym z modelami. W obliczu perspektywy dłuższego opóźnienia w wydaniu modeli, Anthropic zgodził się na rozszerzenie partnerstwa z rządem. Firma uruchomiła również program współpracy z hakerami w celu testowania swoich modeli (tzw. red-teaming) oraz stworzyła dedykowany wewnętrzny zespół, który całodobowo monitoruje zgłoszenia dotyczące nowych zagrożeń typu „jailbreak”.
Lutnick zaznaczył, że USA zastrzegają sobie prawo do ponownej oceny decyzji i ponownego nałożenia ograniczeń eksportowych w dowolnym momencie. Mimo to, wraz z szefową sztabu Białego Domu, Susie Wiles, świętował ponowne wdrożenie Fable 5 na platformie X. Lutnick podkreślił, że „w ciągu ostatnich dwóch tygodni ściśle współpracowaliśmy z Anthropic, aby przeanalizować i zatwierdzić Fable 5, zapewniając zgodność w całym rządzie USA i wzmacniając przywództwo Ameryki w dziedzinie AI”. Wiles, choć nie wspomniała bezpośrednio o Anthropic, uznała to za sukces administracji Trumpa, pisząc, że „rząd i sektor prywatny współpracowały w sposób, jakiego nigdy wcześniej nie widzieliśmy, a ten fundament 'America First' jest bezprecedensowy. Naszym wspólnym priorytetem pozostaje: wdrażać najlepszą technologię tak szybko i bezpiecznie, jak to możliwe”.
Geneza ograniczeń i unikalne zdolności Mythos
12 czerwca Departament Handlu nakazał Anthropic zablokowanie dostępu do swoich najbardziej zaawansowanych modeli dla użytkowników spoza USA. Decyzja ta wynikała z obaw, że Chiny, Rosja lub inne kraje mogą wykorzystać te modele do atakowania infrastruktury USA, takiej jak sieć energetyczna czy system bankowy. W odpowiedzi Anthropic całkowicie zablokował dostęp, ponieważ nie miał możliwości blokowania użytkowników według kraju.
Szczególnie model Mythos był postrzegany jako „wyjątkowo atrakcyjny dla złośliwych podmiotów, które chcą go wykorzystać w cyberatakach”, jak podano na blogu Anthropic. Według firmy, model ten „może być używany do skuteczniejszego znajdowania i wykorzystywania luk w oprogramowaniu niż jakikolwiek inny model – i wszyscy poza najbardziej wykwalifikowanymi ekspertami ds. bezpieczeństwa”, a jego „zdolności w zakresie cyberbezpieczeństwa” mogłyby zostać użyte przeciwko USA. Fable 5, choć oparty na tym samym modelu, „nie zapewnia takich unikalnych zdolności ofensywnych”. Zaprojektowany dla szerokiej publiczności, Fable 5 posiadał już najsilniejsze zabezpieczenia, jakie Anthropic kiedykolwiek zastosował, a przed ponownym wdrożeniem zostały one jeszcze bardziej wzmocnione.
Testy bezpieczeństwa i przyszłe wyzwania
Po tygodniach testów okazało się, że Fable 5 nie jest już podatny na metodę omijania zabezpieczeń odkrytą przez badaczy z Amazon, która zidentyfikowała kilka luk w oprogramowaniu i doprowadziła do nałożenia ograniczeń eksportowych. Najbardziej niepokojący był przypadek, w którym model został zmanipulowany do wygenerowania kodu demonstrującego, jak można wykorzystać lukę. Testy potwierdziły, że mniej zaawansowane modele konkurencji, takie jak GPT-5.5 i Kimi K2.7, „były w stanie zidentyfikować te same luki, co Fable 5 w raporcie”. Potwierdziło to, że „zgłoszona technika nie ujawniła żadnych unikalnych zdolności cybernetycznych na poziomie Mythos” i „dotyczyła jedynie rutynowych prac z zakresu defensywnego cyberbezpieczeństwa”.
Anthropic szybko zareagował na zgłoszone ominięcie zabezpieczeń, a obecnie metoda ta jest blokowana w ponad 99 procentach przypadków. Firma przyznała jednak, że zaostrzenie zabezpieczeń wiąże się z „kompromisem”, który może powodować blokowanie niektórych nieszkodliwych zapytań podczas rutynowych zadań kodowania i debugowania. Firma przeszkoliła ulepszony klasyfikator bezpieczeństwa, który blokuje niebezpieczne zachowania. Użytkownicy, których zapytania do Fable 5 zostaną zablokowane, zostaną powiadomieni, a ich prośba zostanie przekierowana do Opus 4.8.
Anthropic od dawna twierdzi, że zbudowanie modelu całkowicie „odpornego” na jailbreaki jest „prawdopodobnie niemożliwe”. Poprzez intensyfikację działań red-teamingowych firma ma nadzieję „zapewnić, że my i nasi partnerzy ds. bezpieczeństwa będziemy pierwsi, którzy znajdą poważne jailbreaki i naprawią je, zanim złośliwi aktorzy będą mogli je wykorzystać do wyrządzenia szkód”. Obecnie Anthropic współpracuje z Amazonem, Microsoftem, Google i innymi partnerami Glasswing nad „opracowaniem ram konsensusu do oceny powagi jailbreaków AI i sposobu, w jaki deweloperzy AI powinni na nie reagować”.
Szersze konsekwencje i wezwanie do działania
Współpraca z rządem wydaje się być korzystna dla Anthropic, zwłaszcza po wcześniejszym konflikcie dotyczącym klasyfikacji ryzyka dla bezpieczeństwa narodowego. Firma rozszerza swoje zobowiązania do współpracy z partnerami rządowymi w zakresie testowania i oceny modeli przed wdrożeniem, w tym poprzez wczesny dostęp do modeli granicznych i wspólne badania. Anthropic postrzega tę współpracę jako „początek szablonu dla skutecznej globalnej koordynacji w zakresie ryzyka i korzyści płynących z AI” i wzywa Kongres do uchwalenia przepisów, które zapewnią spójne podejście wszystkich deweloperów modeli granicznych. Dyrektor generalny Anthropic, Dario Amodei, porównał powolne tempo działań rządu do Entów z „Władcy Pierścieni”, podkreślając potrzebę szybkiego działania w obliczu dynamicznego rozwoju AI. Isaac Harris z Frontier Security Institute wyraził obawy, jak administracja USA poradzi sobie z podobnie niebezpiecznymi zdolnościami pochodzącymi z Chin, które mogą mieć mniej zabezpieczeń. Anthropic oskarżył niedawno chińską firmę Alibaba o masowe klonowanie modelu Claude i wezwał Kongres do wprowadzenia przepisów karzących chińskie firmy za kradzież pracy amerykańskich firm, aby zapobiec wykorzystywaniu mniej bezpiecznych modeli przez cyberprzestępców.
Źródło: arstechnica.com
Komentarze
Zaloguj się, aby dołączyć do dyskusji.
Nikt jeszcze nie skomentował. Bądź pierwszy!
Czytaj dalej

Gemini Spark od Google dostępny na macOS, rozszerza integracje i funkcje
Google udostępniło Gemini Spark, swojego agenta AI, na system macOS, integrując go z istniejącą aplikacją Gemini Desktop. Nowa wersja oferuje rozszerzone możliwości, w tym pracę z plikami lokalnymi i integrację z wieloma
Redakcja Aigest7 godz. temu

Nowy atak „BioShocking” ujawnia poważne luki w bezpieczeństwie przeglądarek AI
Badacze z LayerX zademonstrowali nową metodę ataku na przeglądarki AI, która pozwala ominąć zabezpieczenia poprzez wprowadzenie modelu językowego w stan „urojenia”, co otwiera drogę do kradzieży danych.
Redakcja Aigestwczoraj

ScarfBench: Nowe narzędzie IBM Research do oceny agentów AI w migracji Java
IBM Research wprowadza ScarfBench, innowacyjny benchmark do oceny zdolności agentów AI w automatyzacji migracji aplikacji Java między frameworkami. Ma to usprawnić procesy modernizacji oprogramowania.
Redakcja Aigestwczoraj

Anthropic wprowadza Claude Sonnet 5: tańszy model do zadań agentowych
Anthropic zaprezentował Claude Sonnet 5, nową wersję swojego średniego modelu, która oferuje zaawansowane możliwości agentowe przy znacznie niższych kosztach, stając się domyślnym wyborem dla wielu użytkowników.
Redakcja Aigestwczoraj

Sztuczna inteligencja a rynek pracy: nowe dane komplikują debatę o utracie miejsc pracy
Raport firm Ramp i Revelio Labs wskazuje, że przedsiębiorstwa intensywnie inwestujące w AI szybciej zwiększają zatrudnienie, nawet na stanowiskach niższego szczebla, co podważa tezę o masowych zwolnieniach.
Redakcja Aigestwczoraj

Base44 wprowadza własny model AI, dążąc do niezależności na rynku platform vibe-codingu
Platforma vibe-codingowa Base44, przejęta przez Wix, uruchomiła własny model sztucznej inteligencji, aby zwiększyć optymalizację, obniżyć koszty i wzmocnić swoją pozycję rynkową w obliczu rosnącej konkurencji.
Redakcja Aigestwczoraj
Bądź na bieżąco ze światem AI
Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.