Alibaba a lansat Qwen3.7-Plus pe platforma Bailian, un model multimodal care combină viziune computațională, raționament profund, invocare de unelte externe și capacitate de iterație autonomă. Lansarea accelerează competiția globală în AI și oferă dezvoltatorilor europeni o alternativă serioasă la modelele occidentale, cu implicații directe pentru companiile care construiesc aplicații agentice complexe.
Google a lansat Gemini Omni, o nouă familie de modele multimodale care combină imagini, audio, text și video pentru a genera conținut coerent. Primul model, Omni Flash, este disponibil din 26 mai 2026 în aplicația Gemini, YouTube Shorts și Flow, permițând crearea de videoclipuri de 10 secunde, editare foto prin text și generare de avataruri digitale. Google promite că Omni va înțelege fizica, cultura și știința, iar în viitor va fi disponibil și pentru uz enterprise prin API.
Liderii din sectorul financiar adoptă cadre de inteligență artificială multimodală pentru a automatiza fluxuri de lucru complexe, depășind limitările sistemelor OCR tradiționale și îmbunătățind semnificativ acuratețea în procesarea documentelor.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.