Filtrează articolele

AI

LeRobot v0.4.0: O nouă eră în învățarea robotică open-source

LeRobot v0.4.0: O nouă eră în învățarea robotică open-source
Comunitatea robotică open-source traversează un moment definitoriu. Echipa Hugging Face a anunțat lansarea versiunii LeRobot v0.4.0, o actualizare majoră care promite să redefinescă standardele de dezvoltare, antrenare și implementare a roboților inteligenți. Această versiune nu este o simplă iterație incrementală, ci un salt cuantic ce aduce în prim-plan seturi de date scalabile, modele VLA (Vision-Language-Action) de ultimă generație și un sistem revoluționar de plugin-uri pentru integrarea hardware. Într-o epocă în care inteligența artificială își găsește tot mai des locul în lumea fizică, LeRobot v0.4.0 se poziționează ca puntea esențială între algoritmii complecți și realitatea mecanică.

Seturi de date: Infrastructura pentru următoarea generație de roboți

Orice sistem de inteligență artificială este la fel de bun ca datele pe care a fost antrenat. Înțelegând această axiomă, echipa LeRobot a supus infrastructurii de date o revizuire completă, lansând LeRobotDataset v3.0. Această nouă arhitectură introduce un format de episoade fragmentate (chunked episodes) și capabilități de streaming, o schimbare fundamentală pentru gestionarea unor seturi de date masive, precum OXE (Open X Embodiment) și Droid, care depășesc frecvent 400 GB.

Noutățile din versiunea 3.0 aduc soluții la problemele cronice ale cercetătorilor: stocarea eficientă a videoului permite streaming rapid, eliminând timpul pierdut cu încărcarea datelor, iar metadatele unificate în format Parquet scapă utilizatorii de haosul fișierelor JSON împrăștiate. Performanța este și ea la înălțime, timpii de inițializare a seturilor de date fiind reduși drastic, iar utilizarea memoriei optimizată pentru a permite procesarea pe scară largă. Pentru a asigura o tranziție lină, dezvoltatorii au pus la dispoziție scripturi de conversie automată a seturilor de date existente din versiunea v2.1.

În plus, au fost introduse instrumente puternice de editare a seturilor de date. Utilizatorii pot acum fuziona mai multe seturi de date într-unul singur sau pot șterge episoade specifice pentru a curăța și optimiza informația, totul printr-o interfață simplă de linie de comandă. Această flexibilitate permite cercetătorilor să curețe datele și să le adapteze rapid cerințelor experimentelor lor.

Medii de simulare: Terenuri de antrenament virtuale extinse

Simularea rămâne piatra de temelie a antrenării roboților, permițând iterarea rapidă fără riscuri fizice. LeRobot v0.4.0 extinde semnificativ capacitățile de simulare prin integrarea oficială a LIBERO, unul dintre cele mai mari benchmark-uri deschise pentru politicile VLA, care include peste 130 de sarcini complexe. Această integrare este un pas crucial către construirea unui hub centralizat pentru evaluarea modelelor vizual-lingvistice-acționale.

De asemenea, a fost integrat Meta-World, un benchmark premier pentru testarea abilităților de manipulare robotică în scenarii multi-sarcină. Cu peste 50 de sarcini diverse de manipulare și utilizarea standardizată a bibliotecilor Gymnasium și MuJoCo, LeRobot asigură un mediu de simulare determinist și robust, esențial pentru reproductibilitatea științifică.

Codebase: Instrumente puternice pentru democratizarea roboticii

O inovație tehnică majoră o reprezintă noul pipeline de procesare a datelor, denumit „Processors”. Această arhitectură modulară acționează ca un traducător universal între datele brute ale senzorilor și cerințele tensorilor normalizați ai modelelor AI. Gândit ca o linie de asamblare, fiecare pas (ProcessorStep) gestionează o sarcină specifică – normalizare, tokenizare text sau transfer pe GPU – permițând înlănțuirea lor pentru un flux de date perfect. Acest sistem simplifică drastic conectarea oricărei politici la orice robot.

Pe frontul antrenării, suportul pentru Multi-GPU a fost simplificat prin integrarea directă a librăriei Accelerate. Cercetătorii pot acum scala experimentele pe mai multe GPU-uri cu o singură comandă, reducând timpul de antrenament la jumătate cu 2 GPU-uri sau la o treime cu 3 GPU-uri. Această democratizare a puterii de calcul accelerează dezvoltarea modelelor complexe.

Politici: Generalizare în lumea deschisă

Versiunea v0.4.0 marchează integrarea modelelor de top PI0 și PI0.5 de la Physical Intelligence. Aceste modele VLA reprezintă un salt semnificativ în abordarea generalizării deschise în robotică, permițând roboților să înțeleagă și să execute sarcini complexe bazate pe instrucțiuni vizuale și lingvistice. Modelele sunt disponibile pe Hugging Face Hub, accesibile comunității globale.

În colaborare cu echipa de robotică NVIDIA, a fost integrat și modelul GR00T N1.5. Acesta este un model fundamental deschis, specializat în raționamentul robotic generalizat. Fiind un model cross-embodiment, GR00T N1.5 acceptă intrări multimodale (limbaj și imagini) pentru a executa sarcini complexe de manipulare în medii diverse, consolidând poziția LeRobot ca platformă de referință pentru inteligența artificială încorporată (Embodied AI).

Roboți: O nouă eră de integrare hardware

Poate cea mai așteptată funcționalitate pentru entuziaștii hardware este noul sistem de plugin-uri. Acesta revoluționează modul în care dispozitivele terțe sunt integrate, eliminând necesitatea modificării bibliotecii centrale. Acum, conectarea unui robot, a unei camere sau a unui dispozitiv de teleoperare este la fel de simplă ca o instalare prin pip. Acest sistem crește scalabilitatea și scade bariera de intrare pentru contribuțiile comunitare.

Dintre integrările notabile se numără Reachy 2 de la Pollen Robotics, disponibil atât pentru control real cât și pentru simulare, și o soluție inovatoare de teleoperare prin telefonul mobil (iOS/Android). Telefonul acționează ca un dispozitiv de control, pipeline-ul de procesare gestionând transformările necesare pentru a conduce roboți în spații de acțiune diferite.

Educație și comunitate

Pentru a completa acest ecosistem tehnologic, Hugging Face lansează un curs complet, gratuit și open-source de învățare robotică. Acest curs este conceput pentru a face accesibile conceptele complexe ale roboticilor moderne tuturor celor curioși, oferind o bază solidă pentru viitorii ingineri și cercetători.

În concluzie, LeRobot v0.4.0 nu este doar o actualizare software; este o manifestare a viziunii că roboții inteligenți trebuie să fie deschiși, accesibili și colaborativi. Prin unificarea seturilor de date masive, a modelelor de ultimă generație și a unui ecosistem hardware flexibil, această versiune invită comunitatea globală să împingă limitele a ceea ce roboții pot face pentru umanitate.

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.