OpenAI i Broadcom prezentują „Jalapeño” – autorski układ dla wnioskowania LLM
OpenAI we współpracy z Broadcomem zaprezentowało „Jalapeño”, swój pierwszy autorski procesor do wnioskowania w dużych modelach językowych, który ma działać na dużą skalę do końca 2026 roku.

OpenAI wprowadza do swojego stosu technologicznego niestandardowy sprzęt. Układ „Jalapeño”, opracowany wspólnie z firmą Broadcom, został zaprojektowany specjalnie do wnioskowania w dużych modelach językowych (LLM) i ma zostać wdrożony na dużą skalę do końca 2026 roku.
Pierwszy „Procesor Inteligencji” OpenAI
Zgodnie ze wspólnym ogłoszeniem, OpenAI i Broadcom zaprezentowały „Jalapeño” – pierwszy tak zwany „Procesor Inteligencji” OpenAI. Jest to niestandardowy akcelerator stworzony specjalnie do wnioskowania w LLM, a także pierwszy układ w wielogeneracyjnej platformie, którą obie firmy budują razem. Prezes Broadcomu, Hock Tan, oraz prezes Charlie Kawwas przekazali pierwszy wafel krzemowy dyrektorowi generalnemu OpenAI, Samowi Altmanowi, i prezesowi Gregowi Brockmanowi. Dla OpenAI jest to pierwszy krok w kierunku własnego sprzętu po latach skupiania się na modelach i produktach.
OpenAI podkreśla, że „Jalapeño” nie jest zmodyfikowanym układem ogólnego przeznaczenia. Został zaprojektowany od podstaw z myślą o nowoczesnym wnioskowaniu LLM. OpenAI odpowiada za projekt układu, Broadcom wnosi technologię produkcji półprzewodników i sieciową, w tym swoje układy sieciowe Tomahawk, natomiast firma Celestica zajmuje się płytami, szafami serwerowymi i integracją systemów.
Wyniki testów i proces rozwoju
Według OpenAI, wczesne testy wykazały „znacznie lepszą” wydajność na wat w porównaniu z obecnym, najnowocześniejszym sprzętem. Są to jednak dane zgłoszone przez samą firmę, które nie zostały jeszcze ostatecznie potwierdzone. Planowane jest opublikowanie raportu technicznego. Obecnie nie jest jasne, z jakimi układami „Jalapeño” było testowane, w jakich zadaniach i w jakich warunkach.
Architektura układu ma ograniczać ruch danych i maksymalizować wykorzystanie zasobów, zbliżając je do teoretycznego maksimum. Próbki inżynieryjne już teraz uruchamiają obciążenia uczenia maszynowego w laboratorium, w tym model GPT-5.3-Codex-Spark. Model ten obecnie działa na sprzęcie firmy Cerebras, która również specjalizuje się w wnioskowaniu.
OpenAI informuje, że proces od projektu do produkcji prototypu (tape-out) zajął zaledwie dziewięć miesięcy, co firma określa jako najszybszy cykl rozwoju układu ASIC dla wysokowydajnych półprzewodników, o jakim wie. Własne modele OpenAI pomogły przyspieszyć niektóre etapy procesu projektowania. Plotki o planach dotyczących własnych układów krążyły jednak już od 2023 roku.
Strategia pełnej kontroli i partnerstwa
Ogłoszenie to odzwierciedla argumentację OpenAI, że kontrola nad całym stosem technologicznym, od układu po produkt, pozwala na szybsze, bardziej niezawodne i tańsze uruchamianie modeli. Prezes Broadcomu, Tan, stwierdził, że pierwsze wdrożenie planowane jest na koniec 2026 roku na skalę gigawatową, we współpracy z Microsoftem i innymi partnerami. Broadcom miał podobno zażądać od Microsoftu gwarancji zakupu 40 procent układów, aby zabezpieczyć pierwszą fazę projektu.
Rozwój własnego układu „Jalapeño” przez OpenAI i Broadcom stanowi znaczący krok w kierunku pionowej integracji w branży sztucznej inteligencji. Ta strategia, mająca na celu optymalizację sprzętu pod kątem specyficznych potrzeb dużych modeli językowych, może potencjalnie obniżyć koszty operacyjne i zwiększyć wydajność, co jest kluczowe w obliczu rosnącego zapotrzebowania na moc obliczeniową w AI. Wprowadzenie własnych układów może również zmniejszyć zależność OpenAI od zewnętrznych dostawców, co ma strategiczne znaczenie dla przyszłego rozwoju firmy i całej branży.
Źródło: the-decoder.com
Komentarze
Zaloguj się, aby dołączyć do dyskusji.
Nikt jeszcze nie skomentował. Bądź pierwszy!
Czytaj dalej

Hollywood ugina się przed OpenAI: Film o Samie Altmannie bez dystrybucji
Wielkie studia filmowe odmawiają dystrybucji filmu Luki Guadagnino o Samie Altmannie, co budzi obawy o niezależność Hollywood w krytykowaniu gigantów technologicznych.
Redakcja Aigest19 godz. temu

OpenAI rozszerza inicjatywę Daybreak: GPT-5.5-Cyber i partnerstwa w cyberbezpieczeństwie
OpenAI rozwija swoją inicjatywę Daybreak, wprowadzając model GPT-5.5-Cyber, który ma przewyższać konkurencję w testach cyberbezpieczeństwa. Firma stawia na automatyzację łatania luk i współpracę z ponad 25 firmami oraz r
Redakcja Aigestwczoraj

Fugu od Sakana AI: orkiestracja wielu modeli LLM rzuca wyzwanie gigantom
Japoński startup Sakana AI wprowadza Fugu – system, który dynamicznie koordynuje wiele modeli językowych, działając jak jeden model. Twórcy twierdzą, że Fugu dorównuje, a nawet przewyższa najlepsze modele Anthropic w tes
Redakcja Aigestwczoraj

OpenAI uruchamia inicjatywę „Patch the Planet” dla bezpieczeństwa open source
OpenAI ogłosiło nową inicjatywę „Patch the Planet”, mającą na celu wzmocnienie cyberbezpieczeństwa projektów open source we współpracy z firmą Trail of Bits.
Redakcja Aigestwczoraj

Subquadratic twierdzi, że przełamało kluczową barierę w rozwoju LLM
Startup Subquadratic ogłosił opracowanie nowego modelu językowego SubQ, który ma być szybszy, tańszy i bardziej energooszczędny niż obecne rozwiązania, dzięki zastosowaniu rzadkiej uwagi zamiast gęstej.
Redakcja Aigest5 dni temu

MoEngage stawia na miliony agentów AI w przyszłości marketingu, przejmując Aampe
Indyjska firma MoEngage, specjalizująca się w oprogramowaniu do angażowania klientów, przejęła startup Aampe, stawiając na autonomicznych agentów AI jako przyszłość marketingu spersonalizowanego.
Redakcja Aigest18 godz. temu
Bądź na bieżąco ze światem AI
Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.