Nous Research a lansat modul „Blank Slate” pentru Hermes Agent, care permite fixarea seturilor de instrumente prin comenzile platform_toolsets.cli și disabled_toolsets. Această actualizare oferă un control granular asupra instrumentelor pe care le poate folosi un agent AI, sporind securitatea și predictibilitatea.
Ghid complet pentru utilizarea NVIDIA SkillSpector în scanarea competențelor AI pentru riscuri de securitate. Include construirea unui corpus, analiză statică, organizare cu pandas, vizualizare, export SARIF și integrare CI/CD.
Anthropic lansează Claude Fable 5, o versiune publică a modelului său avansat Mythos, cu restricții stricte de securitate în domenii sensibile. Modelul excelează în inginerie software și analiză, dar vine cu prețuri duble și politici de retenție a datelor, marcând un pas important în dezbaterea privind siguranța AI.
Descoperă cum să folosești NVIDIA garak pentru a construi un workflow complet de red-teaming defensiv pentru LLM-uri, cu sonde și detectoare personalizate. Tutorial pas cu pas, de la instalare la analiza rezultatelor.
OpenAI a lansat Modul Blocare, o funcție care protejează datele sensibile împotriva atacurilor prin injecție de prompturi, dezactivând navigarea live, imaginile și modurile avansate. Disponibilă inițial pentru conturile Business și cele personale eligibile, aceasta reduce riscul de exfiltrare a datelor, deși nu elimină complet vulnerabilitățile.
Microsoft a lansat Agent Control Specification (ACS), un standard open-source care le permite dezvoltatorilor să definească reguli clare pentru agenții AI — ce pot face, ce le este interzis, când au nevoie de aprobare umană și ce trebuie înregistrat pentru audit. Specificația funcționează ca un strat comun de guvernanță, integrabil cu LangChain, OpenAI, Anthropic, AutoGen, CrewAI și alte framework-uri majore, rezolvând problema fragmentării controalelor din ecosistemul actual de AI agentic.
OpenAI a lansat un cadru de guvernanță pentru modele de frontieră, oferind întreprinderilor un plan pentru scalarea sigură a AI-ului, aliniat la reglementările UE și din California. Articolul detaliază categorii de risc, măsuri de securitate și strategii de conformitate.
Ziua a doua a TechEx America de Nord a adus o analiză profundă a blocajelor în implementarea AI enterprise, de la proiecte pilot eșuate la securitatea cibernetică și AI fizic. Vorbitorii au subliniat importanța guvernanței datelor, a zero trust și a scalării responsabile a AI-ului agentic, în timp ce noile piste Physical AI și sesiunile practice de codare au atras un public numeros.
Google a lansat la Cloud Next '26 platforma Gemini Enterprise Agent Platform, integrând guvernanța AI agentică direct în produs. Cu toate acestea, doar 36% dintre organizații au o abordare centralizată a guvernanței, iar majoritatea proiectelor agentice nu ajung în producție. Articolul analizează provocările și necesitatea unei guvernanțe solide pentru succesul AI agentic.
Pe măsură ce inteligența artificială devine omniprezentă în operațiunile critice ale companiilor, securizarea acestor sisteme necesită o abordare multi-nivelată care include controlul accesului, criptarea datelor, protecția împotriva injecției de prompturi, monitorizarea continuă și planuri detaliate de răspuns la incidente.
AprielGuard este un model de protecție de 8 miliarde de parametri, lansat în 2025, care unifică detectarea riscurilor de siguranță și a atacurilor adversariale în sistemele LLM moderne, oferind suport pentru contexte lungi și fluxuri de lucru agentice complexe.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.