Filtrează articolele

Subiect: #decodare paralelă

NVIDIA lansează Nemotron-Labs-Diffusion: un model de limbaj cu trei moduri de decodare și de 6 ori mai multe tokenuri per pas față de Qwen3-8B

NVIDIA a lansat Nemotron-Labs-Diffusion, o familie de modele de limbaj care combină trei moduri de decodare (autoregresiv, difuziune paralelă și auto-speculație) într-o singură arhitectură. Disponibil în variante de 3B, 8B și 14B parametri, modelul oferă de 6 ori mai multe tokenuri per pas decât Qwen3-8B, menținând o calitate comparabilă. Articolul analizează inovația, performanța și aplicațiile practice.

🕒 3 săptămâni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.