Filtrează articolele

Subiect: #Securitate AI

AI Nous Research lansează modul „Blank Slate” pentru Hermes Agent: instrumente fixate prin platform_toolsets.cli și disabled_toolsets

Nous Research lansează modul „Blank Slate” pentru Hermes Agent: instrumente fixate prin platform_toolsets.cli și disabled_toolsets

Nous Research a lansat modul „Blank Slate” pentru Hermes Agent, care permite fixarea seturilor de instrumente prin comenzile platform_toolsets.cli și disabled_toolsets. Această actualizare oferă un control granular asupra instrumentelor pe care le poate folosi un agent AI, sporind securitatea și predictibilitatea.

🕒 chiar acum

Ghid NVIDIA SkillSpector: Scanarea competențelor AI pentru riscuri de securitate cu analiză statică și rapoarte SARIF

Ghid complet pentru utilizarea NVIDIA SkillSpector în scanarea competențelor AI pentru riscuri de securitate. Include construirea unui corpus, analiză statică, organizare cu pandas, vizualizare, export SARIF și integrare CI/CD.

🕒 2 zile în urmă
AI Anthropic lansează Claude Fable 5: puterea modelului Mythos, acum accesibilă publicului larg, dar cu restricții stricte de securitate

Anthropic lansează Claude Fable 5: puterea modelului Mythos, acum accesibilă publicului larg, dar cu restricții stricte de securitate

Anthropic lansează Claude Fable 5, o versiune publică a modelului său avansat Mythos, cu restricții stricte de securitate în domenii sensibile. Modelul excelează în inginerie software și analiză, dar vine cu prețuri duble și politici de retenție a datelor, marcând un pas important în dezbaterea privind siguranța AI.

🕒 1 săptămâni în urmă
AI NVIDIA garak: Cum să construiești un flux complet de red-teaming defensiv pentru LLM-uri cu sonde și detectoare personalizate

NVIDIA garak: Cum să construiești un flux complet de red-teaming defensiv pentru LLM-uri cu sonde și detectoare personalizate

Descoperă cum să folosești NVIDIA garak pentru a construi un workflow complet de red-teaming defensiv pentru LLM-uri, cu sonde și detectoare personalizate. Tutorial pas cu pas, de la instalare la analiza rezultatelor.

🕒 1 săptămâni în urmă
AI OpenAI lansează Modul Blocare pentru a proteja datele sensibile de atacurile prin injecție de prompturi

OpenAI lansează Modul Blocare pentru a proteja datele sensibile de atacurile prin injecție de prompturi

OpenAI a lansat Modul Blocare, o funcție care protejează datele sensibile împotriva atacurilor prin injecție de prompturi, dezactivând navigarea live, imaginile și modurile avansate. Disponibilă inițial pentru conturile Business și cele personale eligibile, aceasta reduce riscul de exfiltrare a datelor, deși nu elimină complet vulnerabilitățile.

🕒 2 săptămâni în urmă
AI Microsoft lansează o armă secretă pentru a ține agenții AI sub control: ce trebuie să știe dezvoltatorii

Microsoft lansează o armă secretă pentru a ține agenții AI sub control: ce trebuie să știe dezvoltatorii

Microsoft a lansat Agent Control Specification (ACS), un standard open-source care le permite dezvoltatorilor să definească reguli clare pentru agenții AI — ce pot face, ce le este interzis, când au nevoie de aprobare umană și ce trebuie înregistrat pentru audit. Specificația funcționează ca un strat comun de guvernanță, integrabil cu LangChain, OpenAI, Anthropic, AutoGen, CrewAI și alte framework-uri majore, rezolvând problema fragmentării controalelor din ecosistemul actual de AI agentic.

🕒 2 săptămâni în urmă
AI Scalarea sigură a AI-ului enterprise cu cadrele de guvernanță OpenAI

Scalarea sigură a AI-ului enterprise cu cadrele de guvernanță OpenAI

OpenAI a lansat un cadru de guvernanță pentru modele de frontieră, oferind întreprinderilor un plan pentru scalarea sigură a AI-ului, aliniat la reglementările UE și din California. Articolul detaliază categorii de risc, măsuri de securitate și strategii de conformitate.

🕒 3 săptămâni în urmă
AI Blocaje și hărți rutiere în AI enterprise, securitate și AI fizic: Ziua a doua la TechEx

Blocaje și hărți rutiere în AI enterprise, securitate și AI fizic: Ziua a doua la TechEx

Ziua a doua a TechEx America de Nord a adus o analiză profundă a blocajelor în implementarea AI enterprise, de la proiecte pilot eșuate la securitatea cibernetică și AI fizic. Vorbitorii au subliniat importanța guvernanței datelor, a zero trust și a scalării responsabile a AI-ului agentic, în timp ce noile piste Physical AI și sesiunile practice de codare au atras un public numeros.

🕒 1 luni în urmă
AI Google transformă guvernanța AI agentică într-un produs. Întreprinderile încă trebuie să se pună la punct

Google transformă guvernanța AI agentică într-un produs. Întreprinderile încă trebuie să se pună la punct

Google a lansat la Cloud Next '26 platforma Gemini Enterprise Agent Platform, integrând guvernanța AI agentică direct în produs. Cu toate acestea, doar 36% dintre organizații au o abordare centralizată a guvernanței, iar majoritatea proiectelor agentice nu ajung în producție. Articolul analizează provocările și necesitatea unei guvernanțe solide pentru succesul AI agentic.

🕒 1 luni în urmă
AI 5 cele mai bune practici pentru securizarea sistemelor de inteligență artificială

5 cele mai bune practici pentru securizarea sistemelor de inteligență artificială

Pe măsură ce inteligența artificială devine omniprezentă în operațiunile critice ale companiilor, securizarea acestor sisteme necesită o abordare multi-nivelată care include controlul accesului, criptarea datelor, protecția împotriva injecției de prompturi, monitorizarea continuă și planuri detaliate de răspuns la incidente.

🕒 2 luni în urmă
AI AprielGuard: O nouă barieră de protecție pentru siguranță și robustețe adversarială în sistemele LLM moderne

AprielGuard: O nouă barieră de protecție pentru siguranță și robustețe adversarială în sistemele LLM moderne

AprielGuard este un model de protecție de 8 miliarde de parametri, lansat în 2025, care unifică detectarea riscurilor de siguranță și a atacurilor adversariale în sistemele LLM moderne, oferind suport pentru contexte lungi și fluxuri de lucru agentice complexe.

🕒 2 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.