Hack-ul de la Meta arată că securitatea AI este mai mult decât Mythos

Pe 5 iunie, publicația 404 Media a dezvăluit că atacatorii au folosit agentul de asistență AI al Meta pentru a fura conturi de Instagram. Metoda lor a fost simplă: au cerut agentului să asocieze conturile cu adrese de e-mail pe care le controlau, iar agentul a executat cererea. Un atacator a spart contul inactiv al Casei Albe din era Obama și a postat mesaje pro-iraniene; alții au preluat conturi cu nume valoroase, de un singur cuvânt, probabil pentru a le vinde. Problemele de securitate cibernetică legate de AI nu sunt o noutate. De când Anthropic a anunțat în aprilie că modelul său Mythos era prea bun la hacking pentru a fi lansat publicului larg, comentatori, cercetători și oficiali federali s-au concentrat pe ideea că sistemele AI super-puternice ar putea distruge infrastructura noastră informatică. Dar hack-ul de la Instagram nu a fost exact așa: acolo, AI a fost ținta, nu atacatorul, iar metoda a fost mult mai simplă decât orice ar fi conceput Mythos. Însă, pe măsură ce companiile externalizează tot mai multă muncă către AI, aceste atacuri relativ necomplexate își pot face simțită prezența în mod devastator.„Pe măsură ce AI devine din ce în ce mai utilizat – mai ales când AI este folosit pentru a automatiza fluxurile noastre de lucru, cum ar fi recuperarea conturilor – cred că atacatorii vor fi din ce în ce mai motivați să atace AI-ul în sine”, spune Neil Gong, profesor de inginerie electrică și informatică la Duke University. Gong și alți cercetători au emis avertismente de ceva vreme despre vulnerabilitățile de securitate ale agenților AI. Ei publică lucrări și postări pe blog care detaliază exploit-uri precum injectarea indirectă de prompt, care implică deturnarea agenților prin comenzi ascunse în site-uri web, e-mailuri sau alte surse de date aparent inofensive. Comparativ cu aceste tehnici, hack-ul de la Meta a fost practic lipsit de inteligență. Singura complicație pe care hackerii au trebuit să o depășească a fost utilizarea unui VPN care să se potrivească cu locația adevăratului proprietar al contului; apoi au cerut direct agentului de suport să schimbe adresa de e-mail a contului, iar acesta s-a conformat.Meta nu a comentat public cum a scăpat această vulnerabilitate prin plasa de siguranță. Dar, având în vedere simplitatea exploit-ului, Gong spune că ar fi trebuit descoperită cu ușurință, înainte ca agentul să fie implementat. „Este cu adevărat surprinzător”, spune el. „Nu înțeleg de ce nu au găsit această problemă simplă”. Jessica Ji, analist principal de cercetare la Centrul pentru Securitate și Tehnologie Emergentă de la Georgetown, este de acord. „Aceasta ridică întrebări precum: Existau măcar măsuri de protecție?” spune ea. „S-a gândit cineva să testeze acest tip de scenariu?” Ea observă că supravegherea este cu atât mai izbitoare cu cât vine de la o companie precum Meta, care are o expertiză vastă atât în AI, cât și în securitate cibernetică. Meta nu a răspuns solicitării de comentariu pentru acest articol, dar luni un purtător de cuvânt al Meta a declarat pe X că vulnerabilitatea a fost rezolvată.Oricât de jenant ar fi acest moment pentru Meta în mod special, el evidențiază și câteva vulnerabilități fundamentale comune tuturor agenților AI. Spre deosebire de software-ul tradițional, agenții pot răspunde în moduri flexibile – și neașteptate – la circumstanțe noi, motiv pentru care ar putea înlocui agenții umani de asistență. Dar agenții AI pot fi și păcăliți în moduri în care oamenii nu ar fi, iar pentru că pot lua acțiuni în lumea reală, acele greșeli au consecințe. „Un om ar spune: «Bine, de ce vrei să schimbi adresa de e-mail?» și poate ar răspunde cu o întrebare de securitate”, spune Somesh Jha, profesor de informatică la Universitatea Wisconsin-Madison. „Ceea ce se întâmplă cu acești agenți este că sunt foarte dornici să finalizeze sarcina. Este aproape ca un elev de școală primară care vrea doar să-i facă pe plac profesorului.”Există modalități de a atenua riscurile. Companiile pot folosi software tradițional pentru a construi măsuri de protecție care să asigure că agenții respectă reguli stricte, cum ar fi solicitarea întotdeauna a răspunsurilor la întrebările de securitate înainte de a trimite informații sensibile către o nouă adresă de e-mail. Iar experții consultați pentru acest articol sunt cu toții de acord că agenții ar trebui să fie supuși unui „red-teaming” riguros, un proces în care dezvoltatorii încearcă tot posibilul să atace un sistem pentru a descoperi vulnerabilitățile înainte de implementare.Dar există și forțe contrare. Companiile doresc să implementeze agenți capabili, iar cu cât un agent are mai multă putere – și cu cât este supus mai puținor măsuri de protecție – cu atât mai multă muncă poate prelua. „Securitatea și utilitatea sunt întotdeauna în compromis”, spune Bo Li, profesor de informatică la Universitatea Illinois Urbana-Champaign. Iar un „red-teaming” adecvat poate fi costisitor. Apărătorii trebuie să cheltuiască mai multe resurse decât atacatorii, deoarece atacatorii trebuie doar să descopere un singur exploit, în timp ce apărătorii încearcă să descopere și să repare cât mai multe. Când atacatorii vizează ceva la fel de valoros ca un nume de utilizator Instagram de un singur cuvânt, ei vor investi resurse în găsirea de exploit-uri, așa că apărătorii trebuie să cheltuiască și mai mulți bani pentru a proteja acea comoară.Pe măsură ce modelele AI continuă să se îmbunătățească, consolidarea apărării lor ar putea deveni de fapt mai ușoară. Deși natura probabilistică a modelelor de limbaj mari înseamnă că agenții LLM vor fi întotdeauna vulnerabili la unele forme de atac, un model mai sofisticat ar fi putut identifica o tentativă de schimbare a e-mailului asociat contului Casei Albe din era Obama ca fiind suspectă. Iar sistemele AI pot fi folosite pentru „red-teaming” al agenților, la fel cum participanții la Project Glasswing al Anthropic folosesc Mythos pentru a identifica vulnerabilități în software-ul lor.Cu toate acestea, experții se așteaptă ca problema securizării agenților AI să devină și mai presantă în viitor. Pe măsură ce agenții devin mai capabili, companiile care îi adoptă vor dori probabil să le ofere mai multă putere, atât pentru a oferi mai multe servicii cu mai puțini oameni, cât și pentru a nu rămâne în urma concurenților. În lumea AI care se mișcă rapid, timpul necesar pentru a securiza cu atenție sistemele agentice riscante poate părea o întârziere de neconceput. „Toată lumea vrea să fie primul care face ceva și să lanseze lucrurile fără o examinare atentă și „red-teaming””, spune Jha. „Cred că este un lucru foarte periculos.”### De ce este important:Acest incident demonstrează că securitatea AI nu înseamnă doar a ne teme de modele super-puternice precum Mythos, ci și de vulnerabilitățile simple, dar devastatoare, ale agenților AI deja implementați. Pe măsură ce companii precum Meta integrează AI în fluxuri critice de lucru – cum ar fi recuperarea conturilor –, orice lacună poate fi exploatată cu ușurință, ducând la furturi de identitate, propagandă sau pierderi financiare. Lecția este clară: în goana după inovație și automatizare, testarea riguroasă și măsurile de protecție nu trebuie sacrificate. Altfel, AI-ul devine o unealtă ușor de manipulat pentru atacatori.

Filtrează articolele