Filtrează articolele

Subiect: #procesare audio-video

Alibaba Qwen3.5-LiveTranslate-Flash: Traducere simultană multimodală în 60 de limbi, cu o latență de doar 2,8 secunde

Alibaba a lansat Qwen3.5-LiveTranslate-Flash, un model de traducere multimodală în timp real care procesează audio și video, cu o latență de 2,8 secunde, acoperind 60 de limbi de intrare și 29 de ieșire, incluzând clonarea vocii și înțelegere vizuală. Depășește GPT-4o și alte soluții pe benchmark-uri.

🕒 3 săptămâni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.