Postarea, semnată de cofondatorul Jack Clark și de Marina Favaro, șefa institutului de cercetare al companiei, atrage atenția asupra unui fenomen îngrijorător: „auto-îmbunătățirea recursivă”. Pe baza tendințelor actuale și având suficientă putere de calcul, un sistem AI ar putea fi capabil să-și proiecteze și să-și dezvolte propriul succesor. Cu alte cuvinte, mașinile ar putea începe să construiască mașini mai inteligente decât ele însele, într-un ritm pe care nici societatea, nici cercetătorii nu l-ar mai putea controla. „Acesta ar fi un moment major în tehnologie, care ar aduce beneficii în știință, medicină și alte domenii, dar ar putea crește și riscurile de a pierde controlul asupra sistemelor AI”, se arată în articol.
Anthropic nu este singura voce care trage un semnal de alarmă. Săptămâna aceasta, o echipă de cercetători de la Universitatea din Toronto a demonstrat cum instrumentele AI pot fi folosite pentru a crea un nou tip de „vierme” digital, capabil să-și adapteze strategia de hack în timp ce se răspândește de la un dispozitiv la altul, preluând controlul asupra unor rețele de calculatoare uriașe. „Cred că este foarte important ca oamenii să înțeleagă că nu doar cele mai mari și mai puternice modele lingvistice reprezintă o problemă de securitate”, a declarat într-un interviu cercetătorul principal Nicolas Papernot. Acesta a subliniat că, în trecut, atacatorii cibernetici se concentrau pe ținte de mare valoare – bănci, spitale, rețele electrice. „Acum, orice dispozitiv conectat la internet este în pericol, pentru că costul lansării unor astfel de atacuri a scăzut dramatic.” Papernot a anunțat autoritățile canadiene de securitate cibernetică înainte de a publica raportul, care arată cum viermele a fost creat în laborator folosind un instrument AI open-source, ușor accesibil și modificabil de către dezvoltatori.
Propunerea concretă a Anthropic este crearea unui mecanism global coordonat, care să permită laboratoarelor avansate de AI să verifice dacă rivalii din întreaga lume au oprit sau încetinit efectiv munca. „Fără acest mecanism, un actor rău intenționat ar putea folosi aparența unei încetiniri coordonate pentru a sări înainte, în secret”, avertizează Clark și Favaro. Ei recunosc că o încetinire unilaterală ar putea permite „jucătorilor mai puțin precauți” să recupereze decalajul, crescând presiunea asupra companiilor și guvernelor atunci când trebuie să ia decizii dificile legate de siguranța AI.
OpenAI, rivalul direct al Anthropic (și creatorul ChatGPT), a răspuns cu o poziție diferită. Într-un raport publicat miercuri, OpenAI susține că „guvernele democratice – nu companiile private care acționează singure – trebuie să stabilească în cele din urmă regulile, garanțiile și mecanismele de responsabilitate”. Compania condusă de Sam Altman este de părere că deciziile privind ritmul inovației în AI nu ar trebui lăsate pe seama niciunui laborator, companie sau grup de interese speciale. Această dispută reflectă tensiunile din industrie cu privire la modul de a gestiona o tehnologie care evoluează exponențial.
Apelul Anthropic vine într-un moment tensionat pentru piața AI. Atât Anthropic, cât și OpenAI se pregătesc să iasă la bursă, iar o ofertă publică inițială (IPO) ar putea evalua Anthropic la aproape un trilion de dolari. În același timp, reglementările rămân în urmă, mai ales în Statele Unite, unde se află cele mai importante laboratoare de AI. Un ordin executiv al administrației Trump, emis la începutul săptămânii, pune poveri pe umerii laboratoarelor, cerându-le să își supună voluntar cele mai capabile modele testelor guvernamentale de securitate cibernetică înainte de lansarea publică. O soluție considerată de mulți critici drept insuficientă.
Nu este prima dată când cercetătorii cer o pauză în dezvoltarea AI. În 2023, Future of Life Institute, o organizație non-profit, a adunat semnături de la Elon Musk (proprietarul laboratorului xAI) și de la sute de experți pentru a cere o oprire de șase luni, pentru a permite instalarea unor balustrade de siguranță. Inițiativa a eșuat, însă, iar ritmul dezvoltării a continuat să accelereze.
Anthropic s-a poziționat de mult timp ca un laborator focalizat pe siguranță. La începutul acestui an, compania a refuzat să permită armatei americane să folosească modelele sale pentru supraveghere internă și arme complet autonome, ceea ce a provocat o reacție dură din partea guvernului. Ca represalii, Pentagonul a inclus Anthropic pe o listă neagră de securitate națională, care urmează să intre în vigoare la sfârșitul anului 2026.
În acest context tensionat, vocea lui Nicolas Papernot, de la Universitatea din Toronto, rezonează puternic: „Acel laptop vechi din subsol, pe care nu îl verifici regulat, nu pare o țintă de mare valoare, dar poate fi folosit ca rampă de lansare pentru a ataca ținte mult mai importante.” El este de acord că este nevoie de mai multă colaborare între companii, agenții guvernamentale și cercetători academici pentru a dezvolta contramăsuri, pe măsură ce instrumentele AI alimentează căutarea vulnerabilităților informatice.
De ce este important:
Acest articol nu este doar un avertisment tehnic, ci o dezbatere fundamentală despre viitorul omenirii. Dacă AI-ul ajunge să se auto-îmbunătățească fără supraveghere, riscul de a pierde controlul devine o amenințare existențială. Propunerea Anthropic de a crea un mecanism global de pauză coordonată este una dintre puținele încercări de a pune frâna înainte de a fi prea târziu. În același timp, apariția unor „viermi” AI adaptivi arată că pericolele nu sunt doar teoretice – ele se întâmplă acum, în laboratoare și, în curând, în lumea reală. Dezbaterea dintre Anthropic și OpenAI reflectă două viziuni opuse: una care pune accent pe cooperarea voluntară a industriei și alta care pledează pentru reglementare guvernamentală strictă. Alegerea pe care o facem astăzi va influența dacă inteligența artificială va rămâne un instrument controlabil sau va deveni un stăpân autoproclamat.