#AI multimodal | World News

AI

Qwen3.7-Plus: Alibaba lansează un nou model revoluționar cu viziune, raționament profund și autonomie pe platforma Bailian

Alibaba a lansat Qwen3.7-Plus pe platforma Bailian, un model multimodal care combină viziune computațională, raționament profund, invocare de unelte externe și capacitate de iterație autonomă. Lansarea accelerează competiția globală în AI și oferă dezvoltatorilor europeni o alternativă serioasă la modelele occidentale, cu implicații directe pentru companiile care construiesc aplicații agentice complexe.

🕒 2 săptămâni în urmă

AI

Google Gemini Omni transformă imagini, audio și text în video – și acesta e doar începutul

Google a lansat Gemini Omni, o nouă familie de modele multimodale care combină imagini, audio, text și video pentru a genera conținut coerent. Primul model, Omni Flash, este disponibil din 26 mai 2026 în aplicația Gemini, YouTube Shorts și Flow, permițând crearea de videoclipuri de 10 secunde, editare foto prin text și generare de avataruri digitale. Google promite că Omni va înțelege fizica, cultura și știința, iar în viitor va fi disponibil și pentru uz enterprise prin API.

🕒 1 luni în urmă

AI

Automatizarea fluxurilor de lucru financiar complexe prin intermediul inteligenței artificiale multimodale

Liderii din sectorul financiar adoptă cadre de inteligență artificială multimodală pentru a automatiza fluxuri de lucru complexe, depășind limitările sistemelor OCR tradiționale și îmbunătățind semnificativ acuratețea în procesarea documentelor.

🕒 2 luni în urmă

Filtrează articolele

Subiect: #AI multimodal

Qwen3.7-Plus: Alibaba lansează un nou model revoluționar cu viziune, raționament profund și autonomie pe platforma Bailian

Google Gemini Omni transformă imagini, audio și text în video – și acesta e doar începutul

Automatizarea fluxurilor de lucru financiar complexe prin intermediul inteligenței artificiale multimodale