Startup-ul care a strâns 135 de milioane de dolari pe o idee simplă: principala problemă a AI nu este puterea de calcul, ci memoria

De fiecare dată când îi pui o întrebare lui ChatGPT, cererea ta declanșează o cursă de ștafetă a datelor. Informația părăsește memoria, trece printr-un CPU pentru preprocesare, călătorește către un GPU pentru calculele grele, apoi se întoarce înapoi – iar acest drum se repetă pentru fiecare cuvânt pe care inteligența artificială îl generează. Problema este structurală: înseamnă să tranzitezi prin unele dintre cele mai scumpe și mai energofage cipuri din industrie la fiecare cerere. Această ineficiență este exact ceea ce încearcă să rezolve XCENA, un startup cu birouri în Coreea de Sud și Statele Unite.

Fondat acum patru ani, startup-ul a proiectat un cip care plasează capacitățile de calcul mult mai aproape de DRAM – acele cipuri de memorie rapidă pe termen scurt care stochează datele pe care procesorul le folosește activ. Astfel, operațiunile de rutină cu date pot fi gestionate lângă memorie, fără costisitoarele drumuri dus-întors între CPU, GPU și memorie. Dacă soluția funcționează la scară largă, implicațiile pentru costurile infrastructurii AI ar putea fi uriașe, ceea ce explică entuziasmul investitorilor.

XCENA tocmai a strâns 135 de milioane de dolari într-o rundă de finanțare Seria B, la o evaluare de 570 de milioane de dolari, aducând totalul fondurilor atrase la 185 de milioane de dolari. CEO-ul Jin Kim a co-fondat startup-ul în 2022 alături de CTO Dohun Kim și CPO Harry Juhyun Kim, toți veterani ai Samsung și SK Hynix – giganții memoriei care furnizează cipuri pentru GPU-urile Nvidia.

„CPU-urile și GPU-urile au devenit mai inteligente de-a lungul deceniilor. Memoria nu a făcut niciodată acest salt. XCENA vrea să schimbe asta”, a declarat Jin Kim într-un interviu pentru TechCrunch. „Creșterea recentă a prețurilor memoriei și a acțiunilor companiilor din domeniu indică o schimbare mai amplă în infrastructura AI, către arhitecturi centrate pe memorie”, a adăugat el. (Luna aceasta, cele trei companii care domină piața globală a cipurilor de memorie – Samsung, SK Hynix și Micron – au depășit fiecare o evaluare de un trilion de dolari pentru prima dată.)

XCENA mizează pe teza că „inferența nu este doar o problemă de calcul; este din ce în ce mai mult o problemă de scalare a memoriei”, spune Kim. Cipul lor, MX1, se conectează la CPU prin CXL (Compute Express Link) – practic o bandă dedicată expres între procesor și memorie – procesând datele înainte ca acestea să părăsească modulul de memorie. Aduce calculul la date, nu invers. Compania susține că ceea ce necesita 10 servere ar putea rula pe unul singur.

„În timp ce GPU-urile excelează la înmulțirea matricelor – matematica grea din spatele antrenării modelelor AI – mare parte din orchestrarea datelor din jur, inclusiv preprocesarea, gestionarea cache-ului KV (sistemul care stochează contextul conversațiilor anterioare pentru ca modelul să nu fie nevoit să le reproceseze) și stocarea în cache a datelor, rulează încă pe CPU-uri. Cipul nostru se ocupă de aceste sarcini direct în modulul de memorie”, explică Kim.

Cererea de soluții de memorie a explodat din a doua jumătate a anului trecut, iar compania consideră că momentul este favorabil. Discuțiile cu mai mulți producători globali de memorie sunt în stadii incipiente, deși Kim a refuzat să îi numească. Clienții ideali ai companiei sunt hyperscalerii care cheltuiesc zeci de miliarde de dolari pe an pe infrastructură AI, unde chiar și un câștig mic în eficiența memoriei poate însemna sute de milioane de economii.

MX1 este încă un prototip. Cipurile pentru producția de masă sunt programate să iasă de pe liniile de producție ale Samsung până la sfârșitul anului 2026, compania estimând că va începe să genereze venituri din 2027. În timp ce producătorii de unități de procesare neurală (NPU) concurează pentru a contesta dominația Nvidia în sarcinile de antrenare, XCENA vizează stratul intensiv în memorie care stă la baza tuturor acestora.

Principalii rivali ai XCENA includ Astera Labs și Marvell, ambele companii listate la Nasdaq care lucrează la conectivitatea de generație următoare a memoriei. Marvell este un jucător mare și consacrat care lucrează deja în același spațiu, spune Kim, adăugând că diferențiatorul constă în proprietatea intelectuală. „Avem mii de nuclee”, spune Kim. Pe baza specificațiilor publice, abordarea Marvell se bazează pe o mână de nuclee de uz general, prin comparație. Aceste nuclee sunt construite pe RISC-V – un design open-source de cip – și optimizate special pentru procesarea datelor, fiecare nucleu fiind menținut în mod deliberat mic și eficient.

Dincolo de nuclee, XCENA își proiectează propria ierarhie internă de memorie, magistrala de interconectare și controlerul DRAM – un nivel de integrare verticală pe care majoritatea companiilor de cipuri, inclusiv rivalii mai mari, îl externalizează de obicei.

Fondurile de capital de risc din Seul, Atinum și IMM Investment, au co-condus runda Seria B, alături de Corstone Asia și investitorii existenți SBI Investment și Mirae Asset Capital. Compania, care are peste 90 de angajați în birourile din Pangyo, o zonă tehnologică din afara Seulului, și Sunnyvale, poartă de asemenea discuții cu investitori internaționali pentru finanțare suplimentară.

De ce este important:

Această finanțare semnalează o schimbare fundamentală în modul în care industria AI privește constrângerile de performanță. Până acum, toată lumea s-a concentrat pe a face procesoarele mai rapide – GPU-uri mai puternice, NPU-uri specializate. Dar XCENA arată că adevărata gât de sticlă nu este cât de repede poți calcula, ci cât de repede poți muta datele. Dacă tehnologia lor se dovedește viabilă, ar putea reduce dramatic costurile de operare ale centrelor de date AI, făcând inferența mai accesibilă și mai eficientă energetic. Într-o eră în care consumul de energie al AI devine o preocupare majoră, soluțiile care optimizează memoria ar putea fi cheia pentru scalarea sustenabilă a inteligenței artificiale.

Filtrează articolele

De ce este important: