Filtrează articolele

AI

Internetul este reconstruit pentru mașini: AWS redeschide infrastructura cloud pentru agenți AI

Internetul este reconstruit pentru mașini: AWS redeschide infrastructura cloud pentru agenți AI
Timp de decenii, infrastructura internetului a fost construită pentru oameni: căutăm, dăm click, derulăm pagini și facem streaming într-un ritm previzibil. Însă agenții AI nu se comportă deloc așa. Ei pot declanșa un val de activitate, lansând simultan sub-agenți care interoghează sute de baze de date, caută documente și apelează API-uri în câteva secunde, apoi dispar la fel de repede cum au apărut. Această realitate forțează giganții tehnologiei să regândească fundațiile cloud-ului.

Săptămâna aceasta, Amazon Web Services (AWS) a lansat următoarea generație a OpenSearch Serverless – un sistem de căutare și bază de date vectorială complet gestionat, conceput special pentru sarcinile de lucru ale agenților AI. Noul sistem poate scala instantaneu atunci când agenții declanșează operațiuni și poate reduce la zero resursele atunci când nu sunt utilizate. „Anterior, chiar și în versiunea noastră Serverless anterioară, trebuia să ai cel puțin o instanță operațională, deoarece stocarea și calculul erau cuplate”, explică Tia White, manager general pentru Amazon OpenSearch Service. „Nu puteai să pornești automat resursele de calcul la ritmul de care aveai nevoie, așa că plăteai mereu pentru resurse idle, chiar dacă nu le foloseai.”

Gândește-te ca la o parcare: înainte plăteai pentru un loc de parcare permanent, chiar și când mașina nu era acolo. Acum, cu OpenSearch Serverless actualizat, plătești doar când parchezi efectiv. Această decuplare a calculului de stocare este cheia tehnică: permite scalarea în câteva secunde pentru a face față vârfurilor de trafic generate de agenți și reducerea la zero, astfel încât clienții plătesc 0 dolari când agenții sunt inactivi.

Lansarea reflectă o conștientizare tot mai mare în întreaga industrie tech: infrastructura proiectată inițial pentru un internet condus de oameni nu mai funcționează optim într-o lume populată tot mai mult de agenți. Deși agenții AI reprezintă încă o porțiune relativ mică din activitatea totală de pe internet, traficul generat de mașini este deja semnificativ și va crește exponențial. Cloudflare raportează că roboții au reprezentat 31% din traficul HTTP total în ultimele șase luni, iar crawler-ele AI, motoarele de căutare și asistenții au constituit aproximativ un sfert din toate cererile de boti în această perioadă.

„Traficul non-uman va depăși traficul uman cândva în prima jumătate a anului 2027”, a declarat Lai Yi Ohlsen, senior product manager la Cloudflare, pentru TechCrunch. La conferința Google I/O de săptămâna trecută, compania a anunțat că utilizatorii vor putea delega sarcini sistemelor AI – de la cercetarea achizițiilor și rezervarea călătoriilor până la navigarea pe web și interacțiunea cu aplicații. Dar nu doar agenții pentru consumatori contează. Întreprinderile implementează din ce în ce mai mult agenți interni și pentru clienții lor, generând noi tipuri de trafic mașină-la-mașină în culise.

Ca urmare, furnizorii de cloud și companiile de infrastructură se confruntă cu provocarea de a adapta sistemele construite pentru oameni la o lume a agenților care recuperează constant și autonom informații, invocă instrumente și generează trafic. „Momentul este simplu: agenții trec de la experimentare la producție și creează modele de trafic pentru care infrastructura anterioară pur și simplu nu a fost proiectată”, spune Tia White. „Agenții au vârfuri fără avertisment, intră în inactivitate fără notificare, iar întreprinderile au nevoie de căutări care să țină pasul fără a plăti pentru resurse idle.”

La lansare, OpenSearch Serverless se va integra nativ cu platforme de dezvoltare AI precum Vercel și Kiro, permițând dezvoltatorilor să implementeze back-end-uri de căutare și vectoriale gata de producție pentru agenți, fără a gestiona infrastructura. Această schimbare se răspândește în întreaga industrie cloud. Databricks și Snowflake se repoziționează ca sisteme de memorie și regăsire AI pentru datele enterprise. Microsoft a lansat actualizări pentru Azure menite să gestioneze vârfurile de trafic ale agenților AI și să partajeze memoria între agenți. Cloudflare, într-o notă similară cu Amazon, a introdus luna trecută infrastructură care oferă agenților medii persistente și scalabilitate instantanee.

Cu cât companiile implementează mai mulți agenți AI, cu atât va fi mai mare presiunea de a reproiecta infrastructura în jurul sarcinilor generate de mașini. Acest lucru, la rândul său, ar putea face agenții mai ieftini și mai ușor de implementat la scară largă. Este un cerc virtuos care va accelera transformarea internetului dintr-un spațiu centrat pe om într-un ecosistem hibrid, unde mașinile comunică cu mașinile în ritmul lor alert.

De ce este important:


Această schimbare nu este doar o actualizare tehnică – este o reconfigurare fundamentală a modului în care funcționează internetul. Pe măsură ce agenții AI devin omniprezenți în viața de zi cu zi (asistenți personali, roboți de serviciu, sisteme enterprise autonome), infrastructura trebuie să se adapteze pentru a suporta miliarde de interacțiuni mașină-la-mașină. Decuplarea calculului de stocare și scalarea la zero înseamnă costuri mai mici pentru companii și, implicit, pentru consumatori. În plus, această evoluție deschide calea către o nouă generație de aplicații AI care pot funcționa fără întreruperi, fără a fi limitate de constrângerile infrastructurii tradiționale. Pentru oricine urmărește viitorul tehnologiei, acesta este un semnal clar: internetul nu mai este doar al oamenilor.

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.