NVIDIA lansează Cosmos Reason 2, un model vizual-lingvistic revoluționar care oferă roboților și agenților AI capacitatea de a raționa și planifica în lumea fizică. Cu îmbunătățiri majore în înțelegerea spațio-temporală și suport pentru 256K tokeni, modelul lider pe Physical AI Bench transformă analiza video, adnotarea datelor și planificarea robotică.
Aducerea modelelor VLA (Vision-Language-Action) pe platforme robotice embedded necesită mai mult decât compresie de model; este o problemă de inginerie a sistemelor. Acest articol detaliază bunele practici NXP pentru înregistrarea seturilor de date, fine-tuning-ul politicilor și optimizările în timp real pe procesorul i.MX 95, demonstrând cum inferența asincronă și cuantizarea selectivă pot reduce latența de la 2.86s la 0.32s.
LeRobot v0.5.0 revoluționează robotica open-source prin integrarea robotului umanoid Unitree G1, introducerea modelelor autoregressive Pi0-FAST și optimizarea masivă a fluxului de date, eliminând timpii morți în înregistrare și accelerând antrenarea modelelor vizuale.
Physical Intelligence, un startup de robotică din San Francisco, negociază o finanțare de 1 miliard de dolari la o evaluare de peste 11 miliarde, dublându-și valoarea în doar patru luni. Investitorii, inclusiv Founders Fund și Lightspeed Venture Partners, par să susțină viziunea companiei de a crea un „ChatGPT pentru roboți”, chiar și în absența unui orizont clar de comercializare.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.