NVIDIA a lansat Nemotron 3.5 ASR, un model de recunoaștere a vorbirii cu 600 de milioane de parametri, proiectat pentru streaming în timp real și optimizat pentru cache. Suportă 40 de limbi și variante locale, inclusiv româna, și este disponibil open-source. Acest articol analizează arhitectura, performanța, comparația cu concurenții și impactul asupra industriei voice AI.
Wispr Flow, un startup american de AI vocal, pariază pe piața dificilă din India, unde complexitatea lingvistică și obiceiurile mixte de utilizare reprezintă provocări majore. Cu suport pentru Hinglish și prețuri reduse, compania speră să transforme notițele vocale într-un strat de calcul universal, vizând atât profesioniști, cât și gospodării.
Salesforce AI Research a dezvoltat VoiceAgentRAG, un sistem revoluționar cu router dual-agent de memorie care reduce latența recuperării informațiilor în sistemele RAG vocale de 316 ori. Tehnologia utilizează agenți inteligenți de rutare și optimizare pentru a anticipa necesitățile informaționale și a accelera accesul la date, eliminând pauzele inconfortabile din conversațiile vocale cu AI și deschizând noi posibilități pentru asistenți virtuali enterprise în timp real.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.