Filtrează articolele

Subiect: #Qwen3

NVIDIA lansează Nemotron-Labs-Diffusion: un model de limbaj cu trei moduri de decodare și de 6 ori mai multe tokenuri per pas față de Qwen3-8B

NVIDIA a lansat Nemotron-Labs-Diffusion, o familie de modele de limbaj care combină trei moduri de decodare (autoregresiv, difuziune paralelă și auto-speculație) într-o singură arhitectură. Disponibil în variante de 3B, 8B și 14B parametri, modelul oferă de 6 ori mai multe tokenuri per pas decât Qwen3-8B, menținând o calitate comparabilă. Articolul analizează inovația, performanța și aplicațiile practice.

🕒 1 luni în urmă
AI Accelerarea agentului Qwen3-8B pe procesoarele Intel® Core™ Ultra folosind modele draft cu eliminare stratificată a profunzimii

Accelerarea agentului Qwen3-8B pe procesoarele Intel® Core™ Ultra folosind modele draft cu eliminare stratificată a profunzimii

Acest articol explorează optimizarea modelului Qwen3-8B pe procesoarele Intel® Core™ Ultra, folosind decodare speculativă și modele draft cu eliminare stratificată. Se detaliază integrarea cu 🤗 smolagents pentru agenți AI locali rapizi.

🕒 2 luni în urmă
AI DeepMath: Un agent ușor de raționament matematic, construit cu smolagents

DeepMath: Un agent ușor de raționament matematic, construit cu smolagents

DeepMath este un agent inovator de raționament matematic bazat pe modelul Qwen3-4B, care utilizează fragmente de cod Python executate într-un mediu securizat pentru a reduce erorile și lungimea output-ului cu până la 66%, demonstrând că modelele mici pot depăși limitările tradiționale ale LLM-urilor prin antrenament GRPO și arhitecturi hibride.

🕒 2 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.