Nvidia a raportat venituri record de 81,6 miliarde de dolari în trimestrul încheiat în aprilie, cu 75,2 miliarde din centrele de date. Compania a dezvăluit dețineri de 43 de miliarde de dolari în startup-uri, aproape dublate față de începutul anului, și a anunțat răscumpărări de acțiuni de 80 de miliarde. Creșterea încetinește la 12% în următorul trimestru, iar exporturile către China rămân incerte.
NVIDIA a lansat Nemotron-Labs-Diffusion, o familie de modele de limbaj care combină trei moduri de decodare (autoregresiv, difuziune paralelă și auto-speculație) într-o singură arhitectură. Disponibil în variante de 3B, 8B și 14B parametri, modelul oferă de 6 ori mai multe tokenuri per pas decât Qwen3-8B, menținând o calitate comparabilă. Articolul analizează inovația, performanța și aplicațiile practice.
Summitul Trump-Xi a lăsat impresia că s-ar putea ajunge la un acord privind exporturile de cipuri Nvidia H200 în China, dar realitatea este alta: licențele americane sunt aprobate, însă Beijingul blochează livrările, forțând companiile chineze să treacă la soluții interne precum Huawei Ascend. Un pariu strategic care redefinește lanțurile de aprovizionare AI.
NVIDIA a dezvoltat o metodologie de pre-antrenare pe 4 biți folosind formatul NVFP4, validată pe un model hibrid Mamba-Transformer de 12 miliarde de parametri antrenat pe 10 trilioane de tokeni. Rezultatele arată o acuratețe aproape identică cu cea a antrenării pe 8 biți (62,58% vs 62,62% pe MMLU-Pro), deschizând calea către o reducere drastică a costurilor și consumului de energie în antrenarea modelelor AI.
NVIDIA a lansat SANA-WM, un model mondial open-source cu 2,6 miliarde de parametri, capabil să genereze videoclipuri de 720p de până la un minut pe un singur GPU. Articolul explică tehnologia, comparațiile cu Sora, aplicațiile și impactul asupra democratizării generării video.
Cerebras a strâns 5,5 miliarde de dolari în IPO, cu acțiuni la 185 de dolari, depășind estimările. Compania, rivală a Nvidia, a revenit la profit și atrage clienți precum OpenAI și AWS, marcând un moment crucial pentru piața cipurilor AI.
Sakana AI și NVIDIA au lansat TwELL, o tehnologie care accelerează inferența cu 20,5% și antrenamentul cu 21,9% pentru modelele de limbaj mari, folosind nuclee CUDA optimizate. Articolul explică cum funcționează, impactul și importanța acestei inovații.
NVIDIA a lansat cuda-oxide, un backend experimental de compilare care transformă kernel-uri SIMT scrise în Rust direct în PTX, deschizând calea către programarea GPU-urilor cu siguranța și performanța oferite de Rust.
NVIDIA a lansat Star Elastic, o metodă post-antrenare care înglobează trei modele de raționament (30B, 23B și 12B parametri) într-un singur checkpoint, reducând costurile de antrenare de 360 de ori și permițând rularea pe GPU-uri RTX. Controlul elastic al bugetului îmbunătățește acuratețea cu 16% și reduce latența de 1,9 ori.
Nvidia a investit peste 40 de miliarde de dolari în companii AI în 2026, inclusiv 30 de miliarde în OpenAI. Criticii vorbesc despre tranzacții circulare, dar analiștii văd o strategie de consolidare a dominației pe piața AI.
OpenAI, în parteneriat cu AMD, Broadcom, Intel, Microsoft și NVIDIA, lansează MRC (Multipath Reliable Connection), un protocol de rețea deschis care îmbunătățește performanța și reziliența clusterelor de antrenare AI, permițând distribuirea pachetelor pe sute de căi simultan și recuperarea în microsecunde după defecțiuni.
SAP achiziționează startup-ul german Prior Labs pentru a crea un laborator AI specializat pe date structurate, investind 1,16 miliarde de dolari. În același timp, compania blochează agenții AI neautorizați, dar aprobă NemoClaw de la Nvidia, într-o mișcare care redefinește peisajul enterprise AI.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.