Modelele Viziune-Limbaj evoluează rapid, dar alinierea lor la preferințele umane rămâne o provocare critică. Acest articol explorează noile tehnici din TRL, precum MPO și GRPO, care depășesc limitările DPO tradițional, oferind o robustete superioară și o capacitate de raționament îmbunătățită pentru modelele multimodale.
Pe măsură ce modelele de inteligență artificială cresc la dimensiuni de zeci sau sute de miliarde de parametri, provocarea principală devine gestionarea memoriei și comunicarea între dispozitive. Acest ghid explorează strategiile de paralelism — de la Data Parallelism la tehnici avansate precum Tensor Parallelism și Fully Sharded Data Parallelism — oferind o perspectivă detaliată asupra modului în care acestea pot fi combinate pentru a optimiza antrenarea modelelor la scară largă.
Hugging Face lansează AI Sheets, o unealtă revoluționară de tip „no-code” care permite construirea, transformarea și îmbogățirea seturilor de date folosind modele AI open-source, direct dintr-o interfață intuitivă de tip spreadsheet.
FilBench este o suită de evaluare lansată în 2025 pentru a testa capacitatea modelelor AI de a înțelege și genera limbaj în filipineză, tagalog și cebuano. Studiul relevă că deși modelele regionale rămân în urma GPT-4, ele oferă o alternativă cost-eficientă și promițătoare pentru comunitățile locale.
TextQuests este un nou benchmark bazat pe 25 de jocuri clasice de ficțiune interactivă, menit să evalueze capacitatea modelelor lingvistice mari de a raționa pe termen lung și de a învăța prin explorare, relevând dificultăți semnificative în raționamentul spațial și gestionarea contextului extins.
Rețeaua de televiziune Al Araby din Qatar a condamnat atacul asupra biroului său din Tehran, care a dus la rănirea a cel puțin 10 persoane, calificându-l drept o agresiune ilegală împotriva jurnaliștilor, în contextul escaladării conflictului dintre SUA, Israel și Iran.
Purtătorul de cuvânt al Gărzii Revoluționare Iraniene (IRGC), Ebrahim Zolfaghari, a declarat că președintele american Donald Trump „înțelege doar limbajul forței”, respingând amenințările cu operațiuni militare la sol. Declarația vine ca reacție la rapoartele conform cărora Pentagonul pregătește planuri de desfășurare a trupelor în Iran, marcând o escaladare majoră a tensiunilor dintre cele două națiuni.
Meta lansează modelele de ochelari inteligenti Ray-Ban destinate purtătorilor de lentile corectoare, o mișcare strategică ce vizează capturarea unei cote semnificative din piața globală de optică, transformând o necesitate medicală într-o poartă de acces către ecosistemul AI.
Într-un șoc pentru industria tehnologică, toți cei 11 cofondatori ai xAI au părăsit compania lui Elon Musk, la scurt timp după achiziția acesteia de către SpaceX. Plecarea elitei cercetării AI, inclusiv a unor nume precum Jimmy Ba și Igor Babuschkin, ridică semne de întrebare grave despre viitorul companiei evaluate la 250 de miliarde de dolari.
Săptămâna 23-29 martie a adus o serie de finanțări semnificative în ecosistemul european, evidențiind o tendință clară de susținere a infrastructurii critice. De la tehnologia semiconductorilor Kandou AI, care a ridicat 225 de milioane de dolari, până la fondul Air Street Capital și aplicația Granola, investitorii pariază pe fundațiile tehnologice care vor defini viitorul.
Arm lansează Neural Super Sampling (NSS), o tehnologie revoluționară de upscaling bazată pe AI, care reduce încărcarea GPU cu 50% și permite randarea 1080p din 540p în doar 4ms. Optimizată pentru dispozitive mobile și integrată în Unreal Engine, NSS deschide calea către grafică de înaltă fidelitate cu consum redus de energie.
Arm revoluționează peisajul tehnologic prin integrarea KleidiAI în ExecuTorch 0.7, aducând capabilități de Inteligență Artificială Generativă, inclusiv modele de limbaj de mari dimensiuni, pe miliarde de dispozitive mobile și edge vechi, democratizând accesul la tehnologia AI.
Echipa Kimina lansează kimina-prover-rl, un pipeline open-source de învățare prin întărire pentru demonstrarea teoremelor în Lean 4, care utilizează un paradigmă de raționament structurat și un mecanism inovator de corecție a erorilor, obținând performanțe de top pentru modelele de dimensiuni mici.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.