Filtrează articolele

AI

Google Genie: Lumea reală devine simulare interactivă cu Street View

Google Genie: Lumea reală devine simulare interactivă cu Street View
Cu toții am folosit Street View pe Google Maps pentru a arăta unui prieten cum arăta casa copilăriei noastre sau pentru a plasa omulețul galben pe străzile Parisului, ca să verificăm dacă hotelul rezervat este într-un cartier mișto. Acum, imaginează-ți că poți face același lucru, dar într-un mod mult mai imersiv și interactiv – un mod care îți permite să simulezi cu adevărat strada și împrejurimile, ba chiar să ajustezi vremea sau să vezi cum ar arăta totul într-un scenariu apocaliptic, gen „The Day After Tomorrow”. Exact asta își propune cea mai recentă integrare a Google. Începând de astăzi, Google DeepMind conectează Street View la Project Genie, modelul general de lume al companiei, capabil să genereze medii diverse și interactive. Noua funcție a fost lansată în cadrul conferinței pentru dezvoltatori Google I/O.

„Este extrem de puternic atât pentru cazurile de utilizare ale agenților [și roboticii], cât și pentru oamenii care vor să se joace cu el – și aceasta a fost întotdeauna teza lui Genie”, a declarat Jack Parker-Holder, cercetător în echipa de deschidere a DeepMind, pentru TechCrunch. El a dat exemplul unui robot nou, desfășurat în Londra, unde soarele apare rar. Genie ar putea, spune Parker-Holder, să simuleze acele ocazii rare când razele soarelui strălucesc pe casele victoriene, astfel încât razele să nu șocheze robotul atunci când se întâmplă. „În același timp, ai putea spune: «Mă duc în New York City, dar nu în perioada asta a anului», a continuat el. «Va fi zăpadă. Vreau să văd cum arată acel bloc în zăpadă.»”

Google colectează date Street View de 20 de ani, prin mașini cu camere și persoane echipate cu „rucsacuri de urmărire”. Gigantul tech a adunat peste 280 de miliarde de imagini din 110 țări și de pe șapte continente. „Cu Street View, avem imagini dintr-o mare parte a lumii”, a spus Jack. „Vă puteți imagina cât de puternic este să combini această sursă bogată de informații reale cu abilitatea de a simula lumi.”

Google a lansat cel mai recent model al său, Genie 3, în august anul trecut, pentru previzualizare de cercetare, iar în ianuarie a deschis accesul la instrument pentru abonații Google AI Ultra din SUA, permițând clienților să creeze lumi de joc interactive din texte sau imagini. Scopul este de a folosi Genie pentru experiențe educaționale, jocuri și antrenament în robotică. Genie 3 ajută deja la alimentarea unuia dintre simulatoarele Waymo pentru a antrena mașinile autonome în „evenimente extrem de rare”, cum ar fi tornade sau întâlniri întâmplătoare cu elefanți. Adăugarea datelor Street View ar putea ajuta Waymo să se pregătească pentru lansarea în mai multe orașe din întreaga lume. Waymo are propriul simulator, pe care s-a bazat pentru a se extinde în 11 orașe americane și pentru a testa șoferul AI în alte câteva. Diferența cu Genie, spune Parker-Holder, este că acele simulări sunt toate din punctul de vedere al mașinii. Street View permite nu doar simularea unei lumi ancorate într-un loc real, ci și schimbarea perspectivei către alte tipuri de agenți, cum ar fi un om sau un robot.

Google lansează Street View în Genie pentru unii utilizatori Ultra din Statele Unite începând de astăzi, accesul urmând să fie extins treptat. Utilizatorii Ultra din întreaga lume vor primi acces în următoarele săptămâni, potrivit companiei. Scopul cercetătorilor este de a pune această nouă capacitate în cât mai multe mâini, a declarat Diego Rivas, manager de produs la DeepMind. El a avertizat că Street View în special și Genie în general sunt încă experimentale, așa că mai sunt multe de îmbunătățit în ceea ce privește acuratețea. În mostrele pe care echipa Google mi le-a arătat – inclusiv o simulare subacvatică a unui cartier în care am locuit cândva – rezultatele sunt impresionante și recognoscibile, dar încă la nivel de calitate a unui joc video, nu fotorealiste. Modelele nu sunt încă conștiente de fizică, ceea ce înseamnă că nu înțeleg cauza și efectul. De exemplu, într-o simulare a unei femei care aleargă printr-un Joshua Tree înzăpezit, ea a trecut direct prin cactuși și tufișuri. Compară asta cu, să zicem, generatorul de imagini Nano Banana al Google – care poate genera acum text perfect în infografice – sau cu generatorul său video Veo – care înțelege că bărcile de hârtie plutesc pe curenți de apă, fumul se dispersează în aer, iar materialele textile se drapează pforme.

Fizica nu este codificată direct în aceste modele; ele o învață intuitiv în timp, prin observație pasivă, așa cum ar face o ființă vie. „Cred că pentru acest tip de model, este poate cu șase până la douăsprezece luni în urma video-ului în ceea ce privește acuratețea și calitatea, așa că cred că este ceva ce vom rezolva”, a spus Parker-Holder.

Jonathan Herbert, directorul Google Maps, care a început în echipa Street View ca stagiar acum 12 ani, a spus că Genie nu poate încă să creeze o reconstrucție fidelă a unei străzi. El consideră că adevărata descoperire este continuitatea spațială a AI-ului. Dacă te întorci la 360 de grade, AI-ul își amintește corect și simulează mediul din spatele tău. Din acel punct, modelul poate construi un nou mediu pe deasupra. „Ne-am gândit mult timp cum putem construi cel mai bun și mai bogat model al lumii pe baza datelor Street View”, a spus Herbert. „Cu siguranță a fost o idee de-a noastră de mult timp să folosim datele Maps în moduri noi și pentru noi tipuri de cercetare AI.”

De ce este important:


Această integrare marchează un pas semnificativ în direcția creării de simulări realiste ale lumii reale, cu aplicații vaste în robotică, educație, divertisment și planificare urbană. Capacitatea de a simula condiții meteorologice extreme sau evenimente rare poate ajuta la antrenarea roboților și a mașinilor autonome fără riscuri. De asemenea, deschide uși pentru experiențe imersive personalizate, cum ar fi vizitarea virtuală a unui oraș în orice anotimp. Deși tehnologia este încă în fază experimentală și nu atinge perfecțiunea fizică, potențialul de a transforma modul în care interacționăm cu hărțile și cu lumea din jur este imens.

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.