De ce contează totul? Mythos este cel mai capabil model AI al Anthropic, unul pe care compania l-a prezentat la începutul lunii aprilie și pe care l-a ținut strict restricționat de atunci, din cauza abilității sale excepționale de a găsi vulnerabilități de securitate în software. Potrivit Anthropic, Mythos a identificat defecte în fiecare sistem de operare major și browser web pe care le-a testat, așa că, în loc să îl lanseze pe scară largă, compania a lansat un program controlat numit Project Glasswing, împărtășindu-l cu aproximativ 50 de organizații verificate, inclusiv Amazon, Apple, Google, Microsoft și CrowdStrike, pentru a fi utilizat în scopuri defensive de securitate cibernetică.
Fable 5, lansat cu doar trei zile în urmă, a fost răspunsul Anthropic la presiunea comercială evidentă: o versiune a Mythos echipată cu garduri de protecție care blochează răspunsurile în domenii cu risc ridicat, cum ar fi securitatea cibernetică și biologia, făcându-l suficient de sigur pentru lansarea generală, a argumentat compania. A fost imediat cel mai capabil model AI disponibil publicului, conform testelor de referință de la Vals AI, o companie care urmărește performanța tehnologiei AI.
Directiva guvernului este încadrată ca o acțiune de control al exporturilor, restricționând accesul cetățenilor străini la modele. Dar, într-o postare lungă pe blog, Anthropic spune că înțelege că preocuparea de bază este o așa-numită „jailbreak” a Fable 5. Până acum, compania spune că guvernul a furnizat doar dovezi verbale ale unui „potențial jailbreak îngust, non-universal” – unul care, așa cum îl descrie Anthropic, echivalează cu a determina modelul să citească o bază de cod specifică și să identifice defecte software. Și, apropo, adaugă compania, este un „nivel de capacitate” care este deja disponibil pe scară largă în alte modele accesibile publicului, inclusiv GPT-5.5 de la OpenAI. De asemenea, este folosit în mod obișnuit de profesioniștii în securitate cibernetică în scopuri defensive, observă Anthropic.
Argumentul mai larg al Anthropic este că cele mai puternice măsuri de siguranță funcționează prin sisteme de clasificare independente care funcționează separat de modelul în sine, ceea ce înseamnă că, chiar dacă cineva convinge Fable să continue să vorbească după un refuz, protecțiile subiacente împotriva celor mai periculoase rezultate rămân în vigoare. Compania notează, de asemenea, în postarea sa că o revizuire a utilizării recente nu a găsit nicio dovadă că aceste măsuri de siguranță au fost ocolite cu succes pentru a produce conținut cu adevărat dăunător.
În mod clar, nimic din toate acestea nu a fost suficient pentru a opri guvernul să acționeze, iar Anthropic nu își ascunde frustrarea. „Nu suntem de acord că descoperirea unui jailbreak îngust potențial ar trebui să fie un motiv pentru retragerea unui model comercial implementat la sute de milioane de oameni”, a scris compania. „Dacă acest standard ar fi aplicat în întreaga industrie, credem că ar opri practic toate noile implementări de modele pentru toți furnizorii de modele de frontieră.”
Se așteaptă pe scară largă ca Anthropic să urmărească o ofertă publică inițială (IPO) în acest an și și-a bazat o mare parte din identitatea publică pe faptul că este alternativa conștientă de siguranță la rivalii săi. Ironia nu este pierdută pentru observatori că tocmai prudența pe care Anthropic a afișat-o în restricționarea Mythos – pe care l-a promovat ca un model atât de periculos încât nu putea fi lansat public – a atras acum exact tipul de scrutin guvernamental care ar putea perturba cel mai mult afacerea sa. Sam Altman de la OpenAI trebuie să se bucure de asta, cel puțin. În aprilie, el i-a spus podcasterului Ashlee Vance că modul în care Anthropic a gestionat Mythos a fost o greșeală strategică.
De ce este important:
Această decizie a guvernului SUA marchează un precedent periculos pentru întreaga industrie AI. Pe de o parte, arată că autoritățile încep să ia în serios riscurile de securitate națională asociate cu modelele AI avansate, dar pe de altă parte, riscă să sufoce inovația și să creeze un climat de incertitudine pentru companiile care investesc masiv în dezvoltarea acestor tehnologii. Pentru Anthropic, care și-a construit reputația pe siguranță și responsabilitate, această situație este o lovitură dură, demonstrând că, uneori, chiar și cele mai bune intenții pot atrage consecințe neașteptate. Rămâne de văzut dacă această acțiune va duce la o reglementare mai strictă a AI la nivel global sau dacă va fi doar un episod izolat într-un peisaj tehnologic aflat în continuă schimbare.