IBM a lansat două modele open-source Granite Speech 4.1 2B, care combină recunoașterea vocală autoregresivă cu traducere și un modul de editare non-autoregresiv pentru inferență rapidă. Articolul explică arhitectura, aplicațiile și impactul acestor modele asupra industriei AI.
Platforma X lansează funcții revoluționare de traducere automată și editare foto alimentate de AI-ul Grok, oferind utilizatorilor instrumente avansate pentru a depăși barierele lingvistice și a crea conținut vizual adaptat prin comenzi în limbaj natural.
NVIDIA lansează un set de date masiv de raționament multilingv, extinzând suportul pentru AI-ul deschis. Noul model Nemotron Nano 2 9B introduce o arhitectură hibridă și un „buget de gândire” configurabil, promițând costuri de raționament cu 60% mai mici.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.