Aigest.
Biznes AI

OpenAI i Broadcom prezentują „Jalapeño” – autorski układ dla wnioskowania LLM

OpenAI we współpracy z Broadcomem zaprezentowało „Jalapeño”, swój pierwszy autorski procesor do wnioskowania w dużych modelach językowych, który ma działać na dużą skalę do końca 2026 roku.

RA

Opracowano z udziałem AI pod redakcją · zasady

Udostępnij
OpenAI i Broadcom prezentują „Jalapeño” – autorski układ dla wnioskowania LLM
Fot. The Decoder

OpenAI wprowadza do swojego stosu technologicznego niestandardowy sprzęt. Układ „Jalapeño”, opracowany wspólnie z firmą Broadcom, został zaprojektowany specjalnie do wnioskowania w dużych modelach językowych (LLM) i ma zostać wdrożony na dużą skalę do końca 2026 roku.

Pierwszy „Procesor Inteligencji” OpenAI

Zgodnie ze wspólnym ogłoszeniem, OpenAI i Broadcom zaprezentowały „Jalapeño” – pierwszy tak zwany „Procesor Inteligencji” OpenAI. Jest to niestandardowy akcelerator stworzony specjalnie do wnioskowania w LLM, a także pierwszy układ w wielogeneracyjnej platformie, którą obie firmy budują razem. Prezes Broadcomu, Hock Tan, oraz prezes Charlie Kawwas przekazali pierwszy wafel krzemowy dyrektorowi generalnemu OpenAI, Samowi Altmanowi, i prezesowi Gregowi Brockmanowi. Dla OpenAI jest to pierwszy krok w kierunku własnego sprzętu po latach skupiania się na modelach i produktach.

OpenAI podkreśla, że „Jalapeño” nie jest zmodyfikowanym układem ogólnego przeznaczenia. Został zaprojektowany od podstaw z myślą o nowoczesnym wnioskowaniu LLM. OpenAI odpowiada za projekt układu, Broadcom wnosi technologię produkcji półprzewodników i sieciową, w tym swoje układy sieciowe Tomahawk, natomiast firma Celestica zajmuje się płytami, szafami serwerowymi i integracją systemów.

Wyniki testów i proces rozwoju

Według OpenAI, wczesne testy wykazały „znacznie lepszą” wydajność na wat w porównaniu z obecnym, najnowocześniejszym sprzętem. Są to jednak dane zgłoszone przez samą firmę, które nie zostały jeszcze ostatecznie potwierdzone. Planowane jest opublikowanie raportu technicznego. Obecnie nie jest jasne, z jakimi układami „Jalapeño” było testowane, w jakich zadaniach i w jakich warunkach.

Architektura układu ma ograniczać ruch danych i maksymalizować wykorzystanie zasobów, zbliżając je do teoretycznego maksimum. Próbki inżynieryjne już teraz uruchamiają obciążenia uczenia maszynowego w laboratorium, w tym model GPT-5.3-Codex-Spark. Model ten obecnie działa na sprzęcie firmy Cerebras, która również specjalizuje się w wnioskowaniu.

OpenAI informuje, że proces od projektu do produkcji prototypu (tape-out) zajął zaledwie dziewięć miesięcy, co firma określa jako najszybszy cykl rozwoju układu ASIC dla wysokowydajnych półprzewodników, o jakim wie. Własne modele OpenAI pomogły przyspieszyć niektóre etapy procesu projektowania. Plotki o planach dotyczących własnych układów krążyły jednak już od 2023 roku.

Strategia pełnej kontroli i partnerstwa

Ogłoszenie to odzwierciedla argumentację OpenAI, że kontrola nad całym stosem technologicznym, od układu po produkt, pozwala na szybsze, bardziej niezawodne i tańsze uruchamianie modeli. Prezes Broadcomu, Tan, stwierdził, że pierwsze wdrożenie planowane jest na koniec 2026 roku na skalę gigawatową, we współpracy z Microsoftem i innymi partnerami. Broadcom miał podobno zażądać od Microsoftu gwarancji zakupu 40 procent układów, aby zabezpieczyć pierwszą fazę projektu.

Rozwój własnego układu „Jalapeño” przez OpenAI i Broadcom stanowi znaczący krok w kierunku pionowej integracji w branży sztucznej inteligencji. Ta strategia, mająca na celu optymalizację sprzętu pod kątem specyficznych potrzeb dużych modeli językowych, może potencjalnie obniżyć koszty operacyjne i zwiększyć wydajność, co jest kluczowe w obliczu rosnącego zapotrzebowania na moc obliczeniową w AI. Wprowadzenie własnych układów może również zmniejszyć zależność OpenAI od zewnętrznych dostawców, co ma strategiczne znaczenie dla przyszłego rozwoju firmy i całej branży.

Źródło: the-decoder.com

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Czytaj dalej

Hollywood ugina się przed OpenAI: Film o Samie Altmannie bez dystrybucji
OpenAI rozszerza inicjatywę Daybreak: GPT-5.5-Cyber i partnerstwa w cyberbezpieczeństwie
Fugu od Sakana AI: orkiestracja wielu modeli LLM rzuca wyzwanie gigantom
OpenAI uruchamia inicjatywę „Patch the Planet” dla bezpieczeństwa open source
Subquadratic twierdzi, że przełamało kluczową barierę w rozwoju LLM
MoEngage stawia na miliony agentów AI w przyszłości marketingu, przejmując Aampe

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.