#Computer Vision | World News

AI

Implementările de viziune computerizată transformă productivitatea în retail: pierderi de sute de miliarde și soluții inteligente

Implementările de viziune computerizată în retail reduc pierderile de sute de miliarde de dolari cauzate de rafturi goale și prețuri incorecte. Studiul Coresight Research arată că 60% dintre retaileri au adoptat deja soluții la scară largă, iar cazuri precum BJ's Wholesale Club, Albertsons și Lowe's demonstrează câștiguri de productivitate de până la 40%.

🕒 2 zile în urmă

AI

Meta AI Lansăm EUPE: O Familie Compactă de Encodere Vizuale Sub 100 de Milioane de Parametri Care Depășește Modelele Specializate în Înțelegerea Imaginilor, Predicția Densă și Task-urile VLM

Meta AI a dezvoltat EUPE, o familie de encodere vizuale sub 100M parametri care rivalizează cu modele specializate în înțelegerea imaginilor, predicția densă și task-urile VLM, marking un moment important pentru eficiența în AI vizual.

🕒 2 luni în urmă

AI

PRX Part 3 — Antrenarea unui model Text-to-Image în doar 24 de ore! O revoluție în ingineria modelelor de difuzie

O echipă de cercetare demonstrează că este posibil să antrenezi un model competitiv text-to-image în doar 24 de ore, combinând tehnici precum antrenarea în spațiul pixelilor, rutarea TREAD și optimizerul Muon, eliminând nevoia unui VAE și reducând drastic costurile de computație.

🕒 2 luni în urmă

AI

Implementarea Inteligenței Artificiale în Robotică pe Platforme Embedded: Înregistrarea Seturilor de Date, Fine-Tuning VLA și Optimizări On-Device

Aducerea modelelor VLA (Vision-Language-Action) pe platforme robotice embedded necesită mai mult decât compresie de model; este o problemă de inginerie a sistemelor. Acest articol detaliază bunele practici NXP pentru înregistrarea seturilor de date, fine-tuning-ul politicilor și optimizările în timp real pe procesorul i.MX 95, demonstrând cum inferența asincronă și cuantizarea selectivă pot reduce latența de la 2.86s la 0.32s.

🕒 2 luni în urmă

Filtrează articolele

Subiect: #Computer Vision

Implementările de viziune computerizată transformă productivitatea în retail: pierderi de sute de miliarde și soluții inteligente

Meta AI Lansăm EUPE: O Familie Compactă de Encodere Vizuale Sub 100 de Milioane de Parametri Care Depășește Modelele Specializate în Înțelegerea Imaginilor, Predicția Densă și Task-urile VLM

PRX Part 3 — Antrenarea unui model Text-to-Image în doar 24 de ore! O revoluție în ingineria modelelor de difuzie

Implementarea Inteligenței Artificiale în Robotică pe Platforme Embedded: Înregistrarea Seturilor de Date, Fine-Tuning VLA și Optimizări On-Device