Anthropic lansează Claude Sonnet 5 și redeschide accesul la modelele Fable și Mythos

Anthropic a anunțat lansarea modelului Claude Sonnet 5 și restabilirea accesului la modelele sale de frontieră Fable și Mythos, în urma unei revizuiri federale a controalelor la export. Decizia marchează sfârșitul unei pauze operaționale de optsprezece zile, declanșată de o directivă a guvernului SUA privind controlul exporturilor, intrată în vigoare pe 12 iunie, care a forțat suspendarea temporară a sistemelor cu cea mai mare capacitate ale Anthropic.

Autoritățile guvernamentale au impus restricția după ce cercetătorii de la Amazon au documentat o metodă de a ocoli controalele de siguranță ale modelului Fable 5, permițându-i acestuia să identifice vulnerabilități software și să furnizeze cod de exploatare. Anthropic a dezvoltat ulterior un clasificator automat actualizat pentru a remedia vulnerabilitatea, deschizând calea pentru o lansare comercială completă pe platforma sa, infrastructura cloud și rețelele partenere.

Suspendarea temporară a modelelor Fable 5 și Mythos 5 a evidențiat presiunile de reglementare cu care se confruntă sistemele de inteligență de frontieră. Când mandatul de control al exporturilor a intrat în vigoare, lipsa sistemelor de verificare a naționalității în timp real a impus o întrerupere totală a accesului pentru toți utilizatorii globali. Evaluările de securitate efectuate în timpul întreruperii au confirmat că comportamentul de identificare a vulnerabilităților nu era unic pentru Fable 5. Arhitecturi mai vechi și mai puțin capabile de la mai mulți furnizori, inclusiv Claude Opus 4.8, GPT-5.5 și Kimi K2.7, au reprodus exact aceleași rezultate.

Pentru a rezolva directiva federală, inginerii au antrenat un clasificator automat de siguranță care vizează mecanismul specific de ocolire raportat de Amazon. Acest strat software funcționează cu o marjă largă de siguranță, identificând și blocând solicitări ambigue ale dezvoltatorilor care prezintă o probabilitate statistică de intenție rău intenționată. Datele interne de validare indică faptul că clasificatorul actualizat previne tehnica de exploatare raportată în peste 99% din încercări. Atunci când un dezvoltator emite o solicitare care declanșează această limită, platforma redirecționează automat sarcina către arhitectura mai veche Opus 4.8 pentru a menține continuitatea.

Marja de siguranță extinsă introduce un compromis distinct pentru echipele de inginerie, deoarece sistemul automat semnalizează solicitări benigne mai frecvent în timpul dezvoltării obișnuite a aplicațiilor și depanării software. În timp ce modelele de frontieră se confruntă cu o supraveghere strictă din partea statului, focalizarea comercială imediată vizează noul model Claude Sonnet 5, recent implementat. Echipele de inginerie trec agenții autonomi la acest model pentru a reduce cheltuielile operaționale, menținând în același timp o capacitate ridicată de execuție.

Datele de performanță validează că sistemul execută planuri multi-pas, operează terminale și navighează în browsere web fără intervenție umană. Costul pe milion de tokenuri pentru Sonnet 5 este de 2,00 USD pentru intrare și 10,00 USD pentru ieșire, tarife introductive valabile până la 31 august 2026. Implementările din lumea reală demonstrează modul în care organizațiile folosesc această arhitectură în cadrul pipeline-urilor live de dezvoltare software.

La Rakuten, echipele tehnologice au implementat arhitectura împotriva a zeci dintre cele mai dificile cereri de pull request din codul de producție al companiei. Sistemul a procesat fiecare submisie independent, executând teste și verificând rezultatele înainte de a prezenta codul finalizat inginerilor umani pentru aprobarea structurală finală. Firma de automatizare software Zapier a integrat sistemul în fluxurile sale de lucru principale pentru a executa sarcini administrative multi-parte. Într-o implementare documentată, inginerii au însărcinat modelul să actualizeze nivelurile conturilor Salesforce și, ulterior, să genereze și să transmită anunțuri de lansare către contactele enterprise. Arhitecturile anterioare de model se blocau frecvent la jumătatea acestor operațiuni multi-etapă, în timp ce sistemul actual a executat întreaga secvență de la cap la coadă fără remediere umană.

Furnizorul de instrumente de dezvoltare Zed a utilizat sistemul pentru a automatiza proceduri complexe de depanare. În timpul încercărilor interne, echipele de inginerie au direcționat modelul să investigheze un bug software activ. Lucrând fără solicitări explicite sau instrucțiuni pas cu pas, sistemul a generat independent un script de testare reproductibil, a aplicat corecția de cod necesară și a stocat modificările pentru a verifica dacă bug-ul reapărea în absența patch-ului. Întreaga secvență de diagnosticare și remediere a avut loc într-o singură trecere de procesare.

Platforma de inginerie software Factory a implementat arhitectura pentru a gestiona sarcini de codare susținute în medii complexe de baze de cod. Echipele tehnice au raportat că sistemul a menținut o fundamentare logică și o consistență a execuției în depozitele de cod corporative, depășind straturile software din generația anterioară prin finalizarea sarcinilor care anterior expirau sau eșuau.

Datele din fișa oficială a sistemului indică faptul că sistemul atinge aceste capacități autonome fără o inflație corespunzătoare a riscurilor de securitate. Auditurile comportamentale automate concepute pentru a testa tendințele înșelătoare și cooperarea cu solicitări neautorizate arată că modelul prezintă o rată generală mai scăzută de comportament neconform în comparație cu predecesorul său direct, Sonnet 4.6. Arhitectura nu posedă capacități avansate de securitate cibernetică ofensivă. Inginerii Anthropic au omis seturi de date specializate de securitate cibernetică din protocolul de antrenare, limitând sistemul la sarcini tehnice de rutină și defensive.

În evaluările publice de securitate efectuate în parteneriat cu Mozilla, cercetătorii au testat capacitatea modelului de a construi exploatări funcționale pentru vulnerabilități cunoscute din nucleul browserului Firefox 147. Modelul nu a reușit să genereze o singură exploatare funcțională în toate ferestrele de evaluare, înregistrând o rată de succes de zero procente. A atins o rată de succes parțială de 13,2%, ceea ce a reprezentat o creștere minoră față de Sonnet 4.6, deși inginerii atribuie această variație câștigurilor generale în raționamentul logic, mai degrabă decât antrenamentului ofensiv specific domeniului. Din precauție, versiunile comerciale sunt livrate cu clasificatoare de siguranță implicite în timp real, echivalente cu cele utilizate în cadrul premierului Opus 4.8.

Fricțiunea de reglementare din jurul lui Fable 5 a determinat un parteneriat formal între Anthropic, Amazon, Microsoft și Google pentru a stabili un cadru obiectiv de evaluare a siguranței modelelor de frontieră. Acest parteneriat își propune să dezvolte standarde comune și procese de certificare care să prevină situații similare în viitor, asigurând în același timp că inovația nu este sufocată de birocrație. Deși detaliile specifice ale acordului nu au fost încă făcute publice, surse din interior indică faptul că părțile lucrează la un sistem de audit independent, care să poată evalua comportamentul modelelor înainte de lansare, reducând astfel nevoia de intervenții guvernamentale de urgență.

De ce este important:

Această evoluție subliniază tensiunea dintre inovația rapidă în domeniul inteligenței artificiale și nevoia de reglementare și siguranță. Restabilirea accesului la modelele Fable și Mythos, împreună cu lansarea lui Claude Sonnet 5, arată că Anthropic a reușit să găsească un echilibru între conformitatea cu cerințele guvernamentale și menținerea competitivității tehnologice. Parteneriatul cu giganții tech pentru un cadru comun de siguranță ar putea stabili un precedent pentru întreaga industrie, influențând modul în care sunt dezvoltate și implementate modelele de frontieră la nivel global. Pentru dezvoltatori și companii, aceasta înseamnă acces continuu la instrumente puternice, dar cu costuri operaționale potențial mai mari din cauza filtrelor de siguranță suplimentare.

Filtrează articolele

De ce este important: