Filtrează articolele

AI

De la Fortnite la roboți: General Intuition strânge 2,3 miliarde de dolari pe pariul că jocurile video pot antrena agenți AI pentru lumea reală

De la Fortnite la roboți: General Intuition strânge 2,3 miliarde de dolari pe pariul că jocurile video pot antrena agenți AI pentru lumea reală
Când am pășit pe etajul de cercetare și dezvoltare al General Intuition, în biroul din New York, fondatorul și CEO-ul companiei, Pim de Witte, în vârstă de 31 de ani, mi-a atras imediat atenția asupra unui monitor așezat pe un birou în picioare. Cineva părea să joace Fortnite. Nu era o persoană.

„Agentul nostru joacă de 100 de ore neîntrerupt”, a spus Kent Rollins, directorul de produs al companiei, zâmbind.

Înainte să mă pierd în spectacolul unui AI care navighează mediul virtual al jocului, am auzit pașii electronici ai unui robot patruped mare care se apropia.

„Aceeași putere cerebrală care îl face pe agent să joace Fortnite alimentează și robotul”, mi-a spus de Witte. Josh Duplantis, un analist de date care ținea un laptop cu un flux live de la singura cameră a robotului, a intervenit să explice că modul implicit al robotului era „explorare”.

Bazându-se pe acea cameră, unicul său ochi, robotul uriaș, asemănător unei insecte, s-a apropiat de mine, m-a ocolit și a continuat în birou. Din când în când, se lovea de picioarele scaunelor sau se izbea de un coș de gunoi rătăcit, exact ca un copil mic care încă nu a învățat cum se raportează corpul său la lumea din jur. Duplantis a spus că a fost nevoie de doar opt minute de date robotice din lumea reală pentru a regla fin un model AI pentru patruped. Mai mult, acele date au fost colectate pe stradă, nu în interiorul biroului unde robotul se naviga singur în acel moment.

Un model agentic care poate generaliza de la gameplay la simulare și la încorporare fizică este rațiunea de a fi a General Intuition. Iar capacitatea acelui model de a-și da seama de locul său în lume i-a asigurat sprijinul unor nume grele.

Joi, General Intuition a anunțat că a strâns 320 de milioane de dolari la o evaluare de 2,3 miliarde de dolari, confirmând informațiile publicate anterior de TechCrunch. Runda aduce finanțarea totală dezvăluită a General Intuition la 454 de milioane de dolari, după runda de 134 de milioane de dolari strânsă la lansare, în octombrie anul trecut.

Startup-ul a fost desprins din cealaltă companie a lui de Witte, Medal, care permite jucătorilor să încarce și să partajeze clipuri video din jocuri. Sutele de milioane de ore de gameplay încărcate au oferit setul inițial de date pentru a antrena modelul General Intuition în raționament spațio-temporal – adică înțelegerea modului de a se mișca prin spațiu și timp. Dar ingredientul cheie nu a fost filmarea jocului; au fost etichetele de acțiuni încorporate în acele clipuri: înregistrări exacte ale butoanelor pe care un jucător le-a apăsat și când. Majoritatea concurenților, spune de Witte, încearcă să deducă acțiunile doar din video, ceea ce, susține el, este insuficient.

„Vedem acest lucru doar ca următoarea etapă a pre-antrenamentului viitor”, a spus de Witte. „Avem un singur model care poate răspunde la informațiile de pe ecran din Fortnite și poate acționa, dar și la dinamica lumii reale într-un mod în care un model lingvistic mare nu ar putea niciodată.”

La un moment dat, de Witte mi-a pus la dispoziție un laptop care rula modelul lumii al General Intuition, un mediu simulat generat cadru cu cadru, nu redat de un motor de joc tradițional. Așa cum fac adesea când testez modele ale lumii, am mers direct într-o serie de pereți. În alte demonstrații pe care le-am încercat, agenții pe care îi controlezi trec uneori prin ei, dar acesta nu a făcut-o. Din milioanele de ore de gameplay, a învățat cumva că pereții sunt pereți, scările sunt pentru urcat, iar umbrele se lungesc pe măsură ce soarele se mișcă.

Pentru General Intuition, acest model al lumii nu este produsul; este mediul de antrenament (denumit intern „sala de sport”). Compania vrea în cele din urmă să vândă modelul agentic în sine, iar de Witte susține că datele de acțiuni încorporate în gameplay ajută modelul să distingă „sinele” de „mediu” într-un mod care îi oferă o înțelegere mai bogată a cauzalității.

Impresionantă pe cât pare tehnologia General Intuition, rămâne de văzut dacă această abordare va scala suficient de bine pentru a justifica evaluarea uriașă. Competiția este acerbă: companii precum Covariant, Physical Intelligence și chiar gigantul Google își construiesc proprii agenți generaliști. Diferența cheie, spune de Witte, constă în calitatea datelor de acțiune – nu doar videoclipuri, ci înregistrări precise ale comenzilor umane. „Noi nu învățăm doar din observație, ci din intenție”, a adăugat el.

În timp ce robotul continua să exploreze biroul, ciocnindu-se ocazional de mobilă, mi-am dat seama că asista la un experiment care ar putea redefini modul în care înțelegem inteligența artificială. Dacă un model antrenat pe milioane de ore de Fortnite poate învăța să navigheze într-un birou real, atunci poate că jocurile video nu sunt doar divertisment – ci un teren de antrenament perfect pentru agenții care vor conduce mașini, vor livra colete sau vor ajuta în operații chirurgicale.

De ce este important:


Această finanțare masivă semnalează o schimbare de paradigmă în domeniul inteligenței artificiale: trecerea de la modele care doar procesează text sau imagini la agenți care pot acționa fizic în lumea reală. General Intuition demonstrează că datele din jocuri video, cu etichetele lor precise de acțiuni, pot fi o resursă incredibil de valoroasă pentru antrenarea roboților. Dacă reușește, această abordare ar putea accelera dramatic dezvoltarea roboților autonomi, reducând nevoia de date costisitoare din lumea reală. În același timp, evaluarea de 2,3 miliarde de dolari arată cât de mult pariază investitorii pe această viziune, chiar și într-un peisaj concurențial aglomerat.

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.