Aigest.
Newsy

Anthropic Claude Fable 5 i Mythos 5 dostępne globalnie po zniesieniu restrykcji USA

Modele AI Anthropic, Fable 5 i Mythos 5, otrzymały zielone światło od rządu USA na globalne udostępnienie po tym, jak początkowo zostały uznane za zagrożenie dla bezpieczeństwa narodowego. Firma podjęła szereg działań w

RA

Udostępnij
Anthropic Claude Fable 5 i Mythos 5 dostępne globalnie po zniesieniu restrykcji USA
Fot. NurPhoto / Contributor | NurPhoto

Rząd Stanów Zjednoczonych zniósł ograniczenia eksportowe na najnowsze modele sztucznej inteligencji firmy Anthropic, Claude Fable 5 i Mythos 5, zaledwie trzy tygodnie po tym, jak administracja Trumpa uznała je za potencjalne zagrożenie dla bezpieczeństwa narodowego. W efekcie, Fable 5 jest już dostępny globalnie, a organizacje w USA od 26 czerwca ponownie mają dostęp do Mythos 5. Anthropic zapowiedział również rozszerzenie dostępu do Mythos w ramach programu Glasswing, który umożliwia badaczom cyberbezpieczeństwa w zaufanych firmach wykorzystywanie modelu do celów obronnych.

Współpraca z rządem i wzmocnienie bezpieczeństwa

Sekretarz Handlu, Howard Lutnick, w liście do Anthropic, którego treść widziały Reuters i The New York Times, potwierdził, że firma nie będzie już potrzebować licencji na eksport ani transfer modeli Claude Mythos i Claude Fable. Podkreślił, że Anthropic podjął działania w ścisłej koordynacji z rządem USA, aby zaradzić ryzykom związanym z modelami. W obliczu perspektywy dłuższego opóźnienia w wydaniu modeli, Anthropic zgodził się na rozszerzenie partnerstwa z rządem. Firma uruchomiła również program współpracy z hakerami w celu testowania swoich modeli (tzw. red-teaming) oraz stworzyła dedykowany wewnętrzny zespół, który całodobowo monitoruje zgłoszenia dotyczące nowych zagrożeń typu „jailbreak”.

Lutnick zaznaczył, że USA zastrzegają sobie prawo do ponownej oceny decyzji i ponownego nałożenia ograniczeń eksportowych w dowolnym momencie. Mimo to, wraz z szefową sztabu Białego Domu, Susie Wiles, świętował ponowne wdrożenie Fable 5 na platformie X. Lutnick podkreślił, że „w ciągu ostatnich dwóch tygodni ściśle współpracowaliśmy z Anthropic, aby przeanalizować i zatwierdzić Fable 5, zapewniając zgodność w całym rządzie USA i wzmacniając przywództwo Ameryki w dziedzinie AI”. Wiles, choć nie wspomniała bezpośrednio o Anthropic, uznała to za sukces administracji Trumpa, pisząc, że „rząd i sektor prywatny współpracowały w sposób, jakiego nigdy wcześniej nie widzieliśmy, a ten fundament 'America First' jest bezprecedensowy. Naszym wspólnym priorytetem pozostaje: wdrażać najlepszą technologię tak szybko i bezpiecznie, jak to możliwe”.

Geneza ograniczeń i unikalne zdolności Mythos

12 czerwca Departament Handlu nakazał Anthropic zablokowanie dostępu do swoich najbardziej zaawansowanych modeli dla użytkowników spoza USA. Decyzja ta wynikała z obaw, że Chiny, Rosja lub inne kraje mogą wykorzystać te modele do atakowania infrastruktury USA, takiej jak sieć energetyczna czy system bankowy. W odpowiedzi Anthropic całkowicie zablokował dostęp, ponieważ nie miał możliwości blokowania użytkowników według kraju.

Szczególnie model Mythos był postrzegany jako „wyjątkowo atrakcyjny dla złośliwych podmiotów, które chcą go wykorzystać w cyberatakach”, jak podano na blogu Anthropic. Według firmy, model ten „może być używany do skuteczniejszego znajdowania i wykorzystywania luk w oprogramowaniu niż jakikolwiek inny model – i wszyscy poza najbardziej wykwalifikowanymi ekspertami ds. bezpieczeństwa”, a jego „zdolności w zakresie cyberbezpieczeństwa” mogłyby zostać użyte przeciwko USA. Fable 5, choć oparty na tym samym modelu, „nie zapewnia takich unikalnych zdolności ofensywnych”. Zaprojektowany dla szerokiej publiczności, Fable 5 posiadał już najsilniejsze zabezpieczenia, jakie Anthropic kiedykolwiek zastosował, a przed ponownym wdrożeniem zostały one jeszcze bardziej wzmocnione.

Testy bezpieczeństwa i przyszłe wyzwania

Po tygodniach testów okazało się, że Fable 5 nie jest już podatny na metodę omijania zabezpieczeń odkrytą przez badaczy z Amazon, która zidentyfikowała kilka luk w oprogramowaniu i doprowadziła do nałożenia ograniczeń eksportowych. Najbardziej niepokojący był przypadek, w którym model został zmanipulowany do wygenerowania kodu demonstrującego, jak można wykorzystać lukę. Testy potwierdziły, że mniej zaawansowane modele konkurencji, takie jak GPT-5.5 i Kimi K2.7, „były w stanie zidentyfikować te same luki, co Fable 5 w raporcie”. Potwierdziło to, że „zgłoszona technika nie ujawniła żadnych unikalnych zdolności cybernetycznych na poziomie Mythos” i „dotyczyła jedynie rutynowych prac z zakresu defensywnego cyberbezpieczeństwa”.

Anthropic szybko zareagował na zgłoszone ominięcie zabezpieczeń, a obecnie metoda ta jest blokowana w ponad 99 procentach przypadków. Firma przyznała jednak, że zaostrzenie zabezpieczeń wiąże się z „kompromisem”, który może powodować blokowanie niektórych nieszkodliwych zapytań podczas rutynowych zadań kodowania i debugowania. Firma przeszkoliła ulepszony klasyfikator bezpieczeństwa, który blokuje niebezpieczne zachowania. Użytkownicy, których zapytania do Fable 5 zostaną zablokowane, zostaną powiadomieni, a ich prośba zostanie przekierowana do Opus 4.8.

Anthropic od dawna twierdzi, że zbudowanie modelu całkowicie „odpornego” na jailbreaki jest „prawdopodobnie niemożliwe”. Poprzez intensyfikację działań red-teamingowych firma ma nadzieję „zapewnić, że my i nasi partnerzy ds. bezpieczeństwa będziemy pierwsi, którzy znajdą poważne jailbreaki i naprawią je, zanim złośliwi aktorzy będą mogli je wykorzystać do wyrządzenia szkód”. Obecnie Anthropic współpracuje z Amazonem, Microsoftem, Google i innymi partnerami Glasswing nad „opracowaniem ram konsensusu do oceny powagi jailbreaków AI i sposobu, w jaki deweloperzy AI powinni na nie reagować”.

Szersze konsekwencje i wezwanie do działania

Współpraca z rządem wydaje się być korzystna dla Anthropic, zwłaszcza po wcześniejszym konflikcie dotyczącym klasyfikacji ryzyka dla bezpieczeństwa narodowego. Firma rozszerza swoje zobowiązania do współpracy z partnerami rządowymi w zakresie testowania i oceny modeli przed wdrożeniem, w tym poprzez wczesny dostęp do modeli granicznych i wspólne badania. Anthropic postrzega tę współpracę jako „początek szablonu dla skutecznej globalnej koordynacji w zakresie ryzyka i korzyści płynących z AI” i wzywa Kongres do uchwalenia przepisów, które zapewnią spójne podejście wszystkich deweloperów modeli granicznych. Dyrektor generalny Anthropic, Dario Amodei, porównał powolne tempo działań rządu do Entów z „Władcy Pierścieni”, podkreślając potrzebę szybkiego działania w obliczu dynamicznego rozwoju AI. Isaac Harris z Frontier Security Institute wyraził obawy, jak administracja USA poradzi sobie z podobnie niebezpiecznymi zdolnościami pochodzącymi z Chin, które mogą mieć mniej zabezpieczeń. Anthropic oskarżył niedawno chińską firmę Alibaba o masowe klonowanie modelu Claude i wezwał Kongres do wprowadzenia przepisów karzących chińskie firmy za kradzież pracy amerykańskich firm, aby zapobiec wykorzystywaniu mniej bezpiecznych modeli przez cyberprzestępców.

Źródło: arstechnica.com

Udostępnij

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Czytaj dalej

Gemini Spark od Google dostępny na macOS, rozszerza integracje i funkcje
Nowy atak „BioShocking” ujawnia poważne luki w bezpieczeństwie przeglądarek AI
ScarfBench: Nowe narzędzie IBM Research do oceny agentów AI w migracji Java
Newsy

ScarfBench: Nowe narzędzie IBM Research do oceny agentów AI w migracji Java

IBM Research wprowadza ScarfBench, innowacyjny benchmark do oceny zdolności agentów AI w automatyzacji migracji aplikacji Java między frameworkami. Ma to usprawnić procesy modernizacji oprogramowania.

Redakcja Aigestwczoraj

Anthropic wprowadza Claude Sonnet 5: tańszy model do zadań agentowych
Sztuczna inteligencja a rynek pracy: nowe dane komplikują debatę o utracie miejsc pracy
Newsy

Sztuczna inteligencja a rynek pracy: nowe dane komplikują debatę o utracie miejsc pracy

Raport firm Ramp i Revelio Labs wskazuje, że przedsiębiorstwa intensywnie inwestujące w AI szybciej zwiększają zatrudnienie, nawet na stanowiskach niższego szczebla, co podważa tezę o masowych zwolnieniach.

Redakcja Aigestwczoraj

Base44 wprowadza własny model AI, dążąc do niezależności na rynku platform vibe-codingu
Newsy

Base44 wprowadza własny model AI, dążąc do niezależności na rynku platform vibe-codingu

Platforma vibe-codingowa Base44, przejęta przez Wix, uruchomiła własny model sztucznej inteligencji, aby zwiększyć optymalizację, obniżyć koszty i wzmocnić swoją pozycję rynkową w obliczu rosnącej konkurencji.

Redakcja Aigestwczoraj

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.