NVIDIA lansează Nemotron 3.5 ASR: Un model de streaming de 600M parametri, conștient de cache, care transcrie 40 de limbi și variante locale în timp real
NVIDIA a lansat Nemotron 3.5 ASR, un model de recunoaștere a vorbirii cu 600 de milioane de parametri, proiectat pentru streaming în timp real și optimizat pentru cache. Suportă 40 de limbi și variante locale, inclusiv româna, și este disponibil open-source. Acest articol analizează arhitectura, performanța, comparația cu concurenții și impactul asupra industriei voice AI.
🕒 1 săptămâni în urmă