Andrej Karpathy, co-fondator OpenAI, se alătură echipei de pre-training a Anthropic

Andrej Karpathy, cercetătorul în inteligență artificială care a co-fondat și a lucrat anterior la OpenAI și a condus divizia de AI a Tesla, s-a alăturat Anthropic. „M-am alăturat Anthropic”, a postat Karpathy marți pe X. „Cred că următorii ani la frontiera modelelor de limbaj de mari dimensiuni (LLM) vor fi deosebit de formativi. Sunt foarte entuziasmat să mă alătur echipei și să revin la cercetare și dezvoltare.”

Karpathy a început să lucreze la Anthropic săptămâna aceasta, unde face parte din echipa de pre-training condusă de Nick Joseph. Pre-training-ul este responsabil pentru antrenamentele la scară largă care îi conferă lui Claude cunoștințele și capacitățile de bază, potrivit companiei. Este, de asemenea, una dintre cele mai costisitoare și mai intensive faze de calcul în construirea unui model de frontieră. Un purtător de cuvânt al Anthropic a declarat pentru TechCrunch că Karpathy va înființa o echipă axată pe utilizarea lui Claude pentru a accelera cercetarea în pre-training.

Karpathy este unul dintre puținii cercetători care pot face puntea între teoria LLM și practica antrenamentului la scară largă. Faptul că Anthropic l-a cooptat pentru a construi o astfel de echipă este un semn clar că firma crede că cercetarea asistată de AI, mai degrabă decât puterea brută de calcul, este modul în care rămâne competitivă cu OpenAI și Google.

În timp ce se afla la OpenAI, Karpathy s-a concentrat pe deep learning și viziune computerizată, până când a plecat în 2017 pentru a se alătura Tesla. A condus programele Full Self-Driving (FSD) și Autopilot ale Tesla înainte de a pleca în 2022. Apoi s-a întors la OpenAI pentru un an, înainte de a pleca din nou în 2024 pentru a înființa Eureka Labs, un startup dedicat aplicării asistenților AI în educație. Karpathy nu a împărtășit multe actualizări despre Eureka Labs de la lansare și nu este clar dacă renumitul cercetător va continua cu startup-ul. De asemenea, a predat un curs online numit „Neural Networks: Zero to Hero” care îi ajută pe studenți să învețe să construiască rețele neuronale de la zero în cod și are un canal YouTube unde postează semi-regulat prelegeri despre LLM și AI.

„Rămân profund pasionat de educație și intenționez să îmi reiau activitatea în acest domeniu la timp”, a spus Karpathy.

Separat, Anthropic l-a adus și pe Chris Rohlf în echipa sa de red team de frontieră, care testează la limită modelele avansate de AI împotriva amenințărilor severe. Rohlf este un veteran al industriei de securitate cibernetică, cu peste 20 de ani de experiență. A lucrat anterior la binecunoscuta echipă de securitate cibernetică a Yahoo, cunoscută sub numele de „The Paranoids”, și mai recent la Meta, unde a lucrat timp de șase ani înainte de a se alătura Anthropic. Rohlf a fost, de asemenea, fellow la Centrul pentru Securitate și Tehnologii Emergente de la Georgetown, unde a lucrat la proiectul CyberAI.

„Avem o oportunitate reală în fața noastră de a îmbunătăți dramatic securitatea cibernetică cu ajutorul AI”, a spus Rohlf într-o postare pe X. „Nu mă pot gândi la o companie sau o echipă mai bună de care să mă alătur în acest moment critic.”

De ce este important:

Mutarea lui Andrej Karpathy la Anthropic nu este doar o simplă schimbare de job, ci un semnal puternic despre direcția în care se îndreaptă cercetarea în inteligența artificială. Karpathy este una dintre cele mai respectate figuri din domeniu, cu o experiență vastă atât în teorie, cât și în aplicații practice la scară largă. Faptul că Anthropic îl pune să conducă o echipă care folosește Claude pentru a accelera pre-training-ul arată că firma mizează pe inovația asistată de AI, nu doar pe puterea brută de calcul, pentru a concura cu giganți precum OpenAI și Google. În același timp, aducerea lui Chris Rohlf în echipa de red team subliniază importanța tot mai mare a securității cibernetice în dezvoltarea AI-ului de frontieră. Într-o perioadă în care modelele devin din ce în ce mai puternice, testarea lor împotriva amenințărilor este crucială pentru a preveni abuzurile. Aceste mișcări ar putea redefini peisajul competiției în domeniul AI, punând accent pe colaborarea om-mașină și pe securitate, nu doar pe performanța brută.

Filtrează articolele

De ce este important: