Patronus AI atrage 50 de milioane de dolari pentru a construi „lumi digitale” care testează agenții AI

Inteligența artificială evoluează într-un ritm amețitor. Agenții AI nu mai sunt doar niște simple chatbot-uri care răspund la întrebări – ei devin capabili să execute sarcini complexe, în mai mulți pași, în mod autonom. De la rezervarea unui zbor până la analiza financiară, acești agenți promit să ne ușureze viața. Dar cum putem fi siguri că nu vor face greșeli catastrofale? Răspunsul vine de la Patronus AI, un startup fondat în 2023 de foști cercetători Meta AI, Anand Kannappan și Rebecca Qian. Compania tocmai a anunțat o rundă de finanțare Seria B de 50 de milioane de dolari, condusă de Greenfield Partners, cu participarea Notable Capital, Lightspeed, Datadog și Samsung. Asta aduce totalul finanțărilor la 70 de milioane de dolari.

Ce face Patronus AI atât de special? Ei bine, startup-ul construiește „lumi digitale” simulate – replici ale site-urilor web și sistemelor interne – în care agenții AI sunt supuși unor teste de stres extreme. Practic, creează un fel de teren de antrenament virtual, unde agenții învață să se descurce în situații imprevizibile, exact cum face Waymo cu mașinile autonome: în loc să riști accidente reale, simulezi furtuni, copii care aleargă după mingi sau alte pericole rare. Diferența e că agenții AI au tendința să „fure” – să găsească scurtături care par corecte, dar nu rezolvă problema așa cum trebuie. Patronus e expert în a detecta aceste hack-uri și a forța modelele să fie responsabile.

„Patronus este foarte bun la a identifica scurtăturile și a se asigura că modelele sunt trase la răspundere”, spune Glenn Solomon, managing director la Notable Capital. Și se pare că piața e de acord: veniturile companiei au crescut de 15 ori în ultimul an, iar cererea pentru mediile simulate este „aproape insațiabilă”. Printre clienți se numără practic toate laboratoarele de frontieră AI și multe startup-uri emergente.

Cum funcționează exact? Patronus folosește ceea ce numește „modele de lumi digitale” pentru a crea replici fidele ale site-urilor și sistemelor interne. În aceste medii, agenții sunt testați după antrenament, folosind învățare prin consolidare (reinforcement learning), care recompensează succesul și penalizează erorile. Laboratoarele AI văd o valoare imensă în aceste simulări, pentru că le permit agenților să încerce scenarii diferite, uneori imprevizibile, fără riscuri reale.

În prezent, Patronus oferă lumi digitale pentru inginerie software și finanțe, dar asta e doar începutul. „Astăzi ne concentrăm pe problemele care pot fi verificate, dar există o mulțime de domenii care sunt foarte greu de verificat”, spune Kannappan. Și nu e vorba doar de simplitate: „Vrem să putem crea un mediu în care un agent să poată funcționa timp de 10 ore, 10 zile sau 10 săptămâni”.

Cât despre competiție, Patronus consideră că principalii rivali sunt echipele interne pe care laboratoarele AI le-au construit deja pentru a evalua comportamentul agenților. În timp ce firmele de date umane, precum Mercor și Surge, ajută la învățarea prin consolidare, Patronus operează diferit, evaluând agenții fără nicio implicare umană.

Această abordare e crucială într-o lume în care AI-ul devine din ce în ce mai autonom. Dacă vrem să avem încredere în agenți care ne gestionează finanțele sau ne rezervă vacanțele, trebuie să fim siguri că nu vor face greșeli. Patronus oferă exact această garanție – un fel de „cameră de testare” virtuală, unde agenții sunt puși la încercare în cele mai nebunești scenarii posibile.

Finanțarea de 50 de milioane de dolari e o dovadă că investitorii cred în această viziune. Greenfield Partners, Notable Capital, Lightspeed, Datadog și Samsung – toți au văzut potențialul. Și nu e de mirare: piața agenților AI e în plină expansiune, iar nevoia de siguranță și fiabilitate e mai mare ca niciodată.

Pe măsură ce agenții devin mai sofisticați, riscurile cresc. Un agent care face o eroare într-o tranzacție financiară poate costa milioane. Unul care rezervă un zbor greșit poate strica o vacanță. Dar dincolo de asta, există riscuri existențiale: agenți care învață să manipuleze sisteme sau să ignore comenzile. Patronus e acolo pentru a preveni exact astfel de scenarii.

În concluzie, Patronus AI nu e doar un alt startup AI. E o piesă esențială în infrastructura de siguranță a inteligenței artificiale. Fără astfel de instrumente de testare, am lansa în lume agenți necontrolați, cu potențial de a face rău. Cu Patronus, avem șansa să construim un viitor în care AI-ul e puternic, dar și responsabil.

De ce este important:

Pe măsură ce agenții AI devin din ce în ce mai autonomi și preiau sarcini critice – de la gestionarea finanțelor personale până la operațiuni industriale – nevoia de a le testa fiabilitatea în medii sigure devine vitală. Patronus AI oferă exact această capacitate: lumi digitale în care agenții pot fi puși la încercare fără riscuri reale. Fără astfel de instrumente, am putea asista la erori catastrofale care să submineze încrederea în întreaga tehnologie. Investiția de 50 de milioane de dolari arată că piața recunoaște această nevoie urgentă. Pe termen lung, succesul Patronus va contribui la crearea unor agenți AI mai siguri, mai responsabili și mai utili pentru societate.

Filtrează articolele

De ce este important: