Matematica din spatele cipului Jalapeño de la OpenAI

OpenAI se confruntă cu o presiune financiară uriașă, iar costurile de infrastructură sunt principala cauză. Pentru a face față acestei provocări, compania a dezvoltat propriul cip personalizat, numit Jalapeño, în colaborare cu Broadcom. Acest circuit integrat specific aplicației (ASIC) reprezintă o încercare directă de a reduce cheltuielile masive de capital asociate cu hardware-ul terților. În timp ce Nvidia obține un profit estimat de 75% pe procesoarele sale de vârf, OpenAI operează pe marje mult mai subțiri, păstrând aproximativ 33 de cenți din fiecare dolar generat, după ce acoperă costurile operaționale uriașe.

Povara financiară a rulării modelelor de limbaj la scară largă este severă. Anul trecut, menținerea serverelor ChatGPT a costat OpenAI nu mai puțin de 8,4 miliarde de dolari. Cu platforma care atrage acum 900 de milioane de utilizatori săptămânal, costul operațional este estimat să ajungă la aproximativ 14 miliarde de dolari în acest an. Pe următorii opt ani, OpenAI s-a angajat să cheltuiască aproximativ 1,4 trilioane de dolari pentru putere de calcul, un pariu masiv pentru o companie care generează în prezent venituri anuale de 25 de miliarde de dolari.

Cipul Jalapeño, numit de companie „primul său Procesor de Inteligență”, este construit special pentru inferența modelelor de limbaj mari (LLM), nu pentru sarcini generale de AI. OpenAI a furnizat designul arhitectural de bază, bazat pe foile de parcurs specifice ale modelelor sale și pe sistemele de servire, în timp ce Broadcom s-a ocupat de ingineria siliciului și de integrarea rețelelor de înaltă performanță. TSMC gestionează fabricarea fizică în Taiwan, iar Celestica este responsabilă pentru construirea plăcilor și a sistemelor de rack. Potrivit OpenAI, mostrele timpurii de laborator rulează deja sarcini de frontieră, inclusiv un model GPT-5.3-Codex-Spark nelansat, la frecvența și puterea țintă de producție.

Richard Ho, șeful programului hardware al OpenAI, a subliniat că arhitectura minimizează mișcarea datelor pentru a aduce utilizarea reală cât mai aproape de performanța teoretică maximă. Spre deosebire de acceleratoarele de uz general adaptate de la sarcinile de lucru AI moștenite, această arhitectură echilibrează în mod specific resursele de calcul, memorie și rețea pentru a rezolva blocajele de mișcare a datelor native serviciului interactiv LLM. Pentru a realiza acest lucru la scară, platforma integrează direct siliciul de rețea Tomahawk de la Broadcom în design, permițând procesoarelor personalizate să comunice în medii masive de centre de date clusterizate.

Prin trecerea la siliciu personalizat, OpenAI se transformă dintr-un simplu strat software într-o companie de infrastructură integrată vertical. Această strategie full-stack acoperă întregul pipeline: arhitectura cipului, kernel-urile software, sistemele de memorie, programarea rețelei și stratul final al aplicației. La fel ca și cuplarea strânsă a hardware-ului proprietar și a iOS-ului de la Apple, OpenAI își poate optimiza acum infrastructura în funcție de foile de parcurs exacte ale modelelor sale interne. Această integrare alimentează un volant operațional continuu. Eficiența îmbunătățită a infrastructurii reduce costul atât al antrenării, cât și al servirii modelelor. O servire mai accesibilă duce la produse mai bune și mai receptive, ceea ce crește volumul de utilizatori și veniturile, care sunt reinvestite în următoarea generație de infrastructură personalizată.

Prin introducerea propriului siliciu, OpenAI intră într-un peisaj în care principalii săi concurenți au petrecut aproape un deceniu dezvoltând hardware proprietar. Google a început să implementeze unitățile de procesare tensor (TPU) în 2015 și controlează acum aproximativ un sfert din capacitatea globală de calcul AI din afara lanțului de aprovizionare al Nvidia. Amazon a livrat peste un milion de cipuri personalizate, în timp ce Meta și Microsoft continuă să își extindă propria infrastructură.

„Jalapeño face parte din strategia noastră pe termen lung de infrastructură full-stack pentru a face calculul mai abundent”, a declarat Greg Brockman, președinte și co-fondator al OpenAI. „Proiectând mai mult din stivă noi înșine, putem servi mai multă inteligență cu o eficiență mai mare.”

Pentru a închide acest decalaj de timp, OpenAI a accelerat faza de dezvoltare. Cipul Jalapeño a trecut de la un design pe hârtie la tape-out (etapa finală înainte de producția fizică) în doar nouă luni. Echipele de inginerie au reușit acest lucru utilizând propriile modele de limbaj ale OpenAI pentru a automatiza și optimiza părți ale procesului de proiectare hardware. Acest lucru creează o buclă de feedback unică: modelele servite utilizatorilor sunt folosite activ pentru a construi infrastructura fizică care va rula iterațiile viitoare.

Implementarea inițială a hardware-ului în centrele de date este programată să înceapă până la sfârșitul anului 2026. CEO-ul Broadcom, Hock Tan, a confirmat că lansarea va fi scalată împreună cu partenerii de infrastructură, inclusiv Microsoft, pentru a pregăti integrarea în centre de date de scară gigawatt.

De ce este important:

Acest cip nu este doar o piesă hardware – este o schimbare fundamentală de strategie pentru OpenAI. Prin controlul propriului siliciu, compania poate reduce dependența de Nvidia și poate scădea costurile operaționale masive. În contextul în care costurile de inferență pentru ChatGPT au ajuns la 14 miliarde de dolari anual, orice eficientizare are un impact direct asupra profitabilității și accesibilității AI. Mai mult, această mișcare ar putea redefini echilibrul de putere în industria AI, unde Google, Amazon și Meta dețin deja propriile cipuri. Dacă OpenAI reușește să-și scaleze infrastructura, ar putea oferi servicii mai rapide și mai ieftine, accelerând adoptarea AI la scară globală. Pe termen lung, Jalapeño reprezintă un pas către o AI mai democratică, unde costurile nu mai sunt o barieră insurmontabilă.

Filtrează articolele

De ce este important: