Modelele lumii: Cheia pentru o inteligență artificială cu adevărat fiabilă

Inteligența artificială de astăzi este încă nesigură. Unii cercetători cred că rezolvarea acestei probleme necesită învățarea sistemelor AI să înțeleagă lumea din jurul lor. Sistemele AI au câștigat deja o stăpânire impresionantă asupra lumii digitale, dar lumea fizică rămâne încă domeniul umanității. După cum se dovedește, construirea unui sistem AI care poate compune un roman sau poate scrie codul unei aplicații este mult mai ușoară decât dezvoltarea unuia care să poată împături rufe sau să navigheze pe o stradă a orașului. Pentru a ajunge acolo, mulți cercetători cred că ai nevoie de ceva numit „model al lumii” (world model).

Modelele lumii nu sunt o idee nouă, dar evoluțiile recente de la Google DeepMind și World Labs, startup-ul profesorului Fei-Fei Li de la Stanford, precum și plecarea spectaculoasă a lui Yann LeCun de la Meta pentru a forma o companie axată pe modele ale lumii, le-au adus în prim-planul discuțiilor despre AI. Nici OpenAI nu stă deoparte, realocând resurse de la aplicația video închisă Sora către „cercetări pe termen lung privind simularea lumii”. Susținători precum Li și LeCun susțin că modelele lumii vor permite cercetătorilor să depășească limitările binecunoscute ale modelelor de limbaj mari (LLM-uri) și să realizeze promisiunea AI pentru robotică.

Definițiile termenului „model al lumii” variază, dar toate se concentrează pe modurile în care sistemele inteligente reprezintă lumea exterioară. Unii oameni de știință spun că oamenii își folosesc propriile modele mentale ale lumii pentru a naviga în mediul înconjurător și a-și ghida acțiunile; cumva, creierele noastre simulează mediile cu suficientă fidelitate pentru a ne permite să prezicem eficient ce vom observa dacă împingem o cană de pe marginea unei mese sau îi spunem unui prieten părerea noastră sinceră, iar aceste predicții ne ajută să decidem ce să facem.

LLM-urile ar putea părea că fac deja o treabă bună în acest sens – cu siguranță pot spune ce se va întâmpla dacă dai o cană de pe masă. Dar cercetările sugerează că „înțelegerea” lor asupra lumii este fragilă. Un studiu a constatat că modelele de limbaj antrenate pe o bază de date cu curse simulate de taxiuri din New York pot oferi indicații eficiente pentru a naviga dintr-un punct în altul din Manhattan – cu excepția cazului în care modelul este forțat să facă ocoluri ocazionale, caz în care eșuează complet. Acest rezultat și altele sugerează că sistemele AI cu un model al lumii – în acest caz, o hartă mentală precisă a orașului New York – ar putea fi mult mai robuste și mai fiabile decât LLM-urile capricioase de care ne-am obișnuit.

Mulți cercetători consideră că modelele lumii vor fi esențiale pentru viitorul roboticii. Li, fondatoarea World Labs, a scris despre cum acestea ar putea facilita dezvoltarea roboților care explorează adâncurile mării și asistă personalul medical, dar deocamdată aplicațiile sunt mai modeste. De exemplu, creatorii jocului Pokémon Go folosesc miliarde de imagini colectate de jucători pentru a construi primele piese ale unui model al lumii care, speră ei, ar putea ajuta la ghidarea roboților de livrare.

Google DeepMind și World Labs își concentrează în prezent eforturile pe construirea de modele care pot genera medii virtuale interactive 3D dintr-o combinație de text, imagini și, în cazul World Labs, solicitări video. Astfel de instrumente ar putea fi folosite pentru a eficientiza proiectarea jocurilor video și a experiențelor imersive de realitate virtuală, dar, comparativ cu modelele de limbaj mari, ele par să aibă o gamă limitată de aplicații. Adevăratele descoperiri vor veni probabil din integrarea unor astfel de sisteme în agenți inteligenți flexibili care își pot reprezenta mediile, pot prezice consecințele acțiunilor lor și apoi pot decide ce să facă.

OpenAI, la rândul său, investește masiv în construirea unui cercetător complet automatizat. Niantic, compania din spatele Pokémon Go, a lansat un spin-off AI care antrenează un nou model al lumii folosind 30 de miliarde de imagini cu repere urbane, colectate de la jucători. Potrivit indicelui AI 2026 al Universității Stanford, AI accelerează, iar noi ne străduim să ținem pasul. Axiom Math oferă gratuit un nou instrument AI puternic, dar rămâne de văzut dacă va accelera cercetarea atât cât speră compania.

De ce este important:

Modelele lumii reprezintă o schimbare fundamentală de paradigmă în inteligența artificială. În timp ce modelele de limbaj mari (LLM-uri) excelează în procesarea textului și generarea de conținut digital, ele rămân fragile în fața sarcinilor din lumea reală, unde contextul fizic și imprevizibilitatea joacă un rol crucial. Dezvoltarea unor modele ale lumii robuste ar putea duce la roboți care nu doar „înțeleg” comenzile, ci și anticipează consecințele acțiunilor lor, navighează în medii complexe și interacționează sigur cu oamenii. Aceasta nu este doar o chestiune de eficiență, ci de siguranță și fiabilitate – de la vehicule autonome la asistenți medicali robotizați. Fără modele ale lumii, AI va rămâne un instrument puternic, dar limitat la ecrane. Cu ele, putem deschide ușa către o eră în care mașinile nu doar gândesc, ci și acționează inteligent în lumea noastră.

Filtrează articolele

De ce este important: