Alibaba Qwen3.5-LiveTranslate-Flash: Traducere simultană multimodală în 60 de limbi, cu o latență de doar 2,8 secunde
Alibaba a lansat Qwen3.5-LiveTranslate-Flash, un model de traducere multimodală în timp real care procesează audio și video, cu o latență de 2,8 secunde, acoperind 60 de limbi de intrare și 29 de ieșire, incluzând clonarea vocii și înțelegere vizuală. Depășește GPT-4o și alte soluții pe benchmark-uri.
🕒 3 săptămâni în urmă