#decodare paralelă | World News

NVIDIA lansează Nemotron-Labs-Diffusion: un model de limbaj cu trei moduri de decodare și de 6 ori mai multe tokenuri per pas față de Qwen3-8B

NVIDIA a lansat Nemotron-Labs-Diffusion, o familie de modele de limbaj care combină trei moduri de decodare (autoregresiv, difuziune paralelă și auto-speculație) într-o singură arhitectură. Disponibil în variante de 3B, 8B și 14B parametri, modelul oferă de 6 ori mai multe tokenuri per pas decât Qwen3-8B, menținând o calitate comparabilă. Articolul analizează inovația, performanța și aplicațiile practice.

🕒 3 săptămâni în urmă

Filtrează articolele

Subiect: #decodare paralelă

NVIDIA lansează Nemotron-Labs-Diffusion: un model de limbaj cu trei moduri de decodare și de 6 ori mai multe tokenuri per pas față de Qwen3-8B