Filtrează articolele

Subiect: #inteligență artificială

AI AssetOpsBench: Puntea dintre benchmark-urile AI și realitatea industrială – Un nou standard pentru evaluarea agenților inteligenți

AssetOpsBench: Puntea dintre benchmark-urile AI și realitatea industrială – Un nou standard pentru evaluarea agenților inteligenți

AssetOpsBench reprezintă o evoluție necesară în evaluarea agenților AI, trecând de la simplul succes binar la o analiză complexă a eșecurilor în medii industriale reale. Acest cadru innovator evidențiază lacunele critice ale modelelor actuale în coordonarea multi-agent și gestionarea incertitudinii operaționale.

🕒 1 luni în urmă
AI Claude construiește kernele CUDA și instruiește modelele open-source: O revoluție în optimizarea AI

Claude construiește kernele CUDA și instruiește modelele open-source: O revoluție în optimizarea AI

Un articol detaliat despre utilizarea modelului Claude pentru a genera și transfera abilități de programare CUDA către modele open-source mai mici, democratizând accesul la expertiza avansată în optimizarea GPU.

🕒 1 luni în urmă
AI Prezentând Daggr: Înlănțuirea programabilă a aplicațiilor cu inspecție vizuală

Prezentând Daggr: Înlănțuirea programabilă a aplicațiilor cu inspecție vizuală

Daggr revoluționează dezvoltarea aplicațiilor AI prin combinarea abordării code-first cu vizualizarea automată a fluxurilor de lucru, permițând dezvoltatorilor să inspecteze și reexecute pași individuali fără a relua întregul pipeline.

🕒 1 luni în urmă
Tehnologie Noul model Holo2 de la H Company stabilește noi standarde în localizarea interfețelor grafice (UI)

Noul model Holo2 de la H Company stabilește noi standarde în localizarea interfețelor grafice (UI)

H Company lansează Holo2-235B-A22B Preview, un model revoluționar de localizare UI care stabilește recorduri SOTA în benchmark-uri precum Screenspot-Pro și OSWorld G, utilizând o abordare agentică pentru a naviga interfețele complexe 4K.

🕒 1 luni în urmă
AI IBM și UC Berkeley diagnostichează motivele eșecului agenților enterprise folosind IT-Bench și MAST

IBM și UC Berkeley diagnostichează motivele eșecului agenților enterprise folosind IT-Bench și MAST

Un studiu realizat de IBM și UC Berkeley utilizează taxonomia MAST pentru a diseca eșecurile agenților AI în medii enterprise, dezvăluind diferențele critice dintre modelele de frontieră și cele open-source și oferind o metodologie clară pentru diagnosticarea și remedierea erorilor sistematice.

🕒 1 luni în urmă
AI Antrenarea modelelor AI cu Unsloth și Hugging Face Jobs: Ghid Complet Gratuit

Antrenarea modelelor AI cu Unsloth și Hugging Face Jobs: Ghid Complet Gratuit

Un ghid complet despre cum să antrenați modele AI gratuit folosind Unsloth și Hugging Face Jobs. Aflați cum să utilizați modele mici precum LFM2.5-1.2B-Instruct, să instalați skill-uri pentru agenți de codare și să rulați job-uri de antrenare pe GPU-uri cloud gestionate automat.

🕒 1 luni în urmă
AI LeRobot v0.5.0: O nouă eră în robotică și inteligența artificială încorporată

LeRobot v0.5.0: O nouă eră în robotică și inteligența artificială încorporată

LeRobot v0.5.0 revoluționează robotica open-source prin integrarea robotului umanoid Unitree G1, introducerea modelelor autoregressive Pi0-FAST și optimizarea masivă a fluxului de date, eliminând timpii morți în înregistrare și accelerând antrenarea modelelor vizuale.

🕒 1 luni în urmă
AI Menținând Fluxul de Token-uri: Lecții din 16 Biblioteci Open-Source de Învățare prin Întărire

Menținând Fluxul de Token-uri: Lecții din 16 Biblioteci Open-Source de Învățare prin Întărire

O analiză tehnică detaliată a arhitecturilor de învățare prin întărire asincronă, extrăgând principii de design esențiale din 16 biblioteci open-source pentru a optimiza antrenarea modelelor de limbaj de mari dimensiuni.

🕒 1 luni în urmă
AI Holotron-12B: O nouă eră în agenții AI pentru utilizarea computerelor – performanță, eficiență și scalabilitate

Holotron-12B: O nouă eră în agenții AI pentru utilizarea computerelor – performanță, eficiență și scalabilitate

H Company lansează Holotron-12B, un model AI multimodal revoluționar, optimizat pentru agenți care utilizează computerele. Cu o arhitectură hibridă SSM ce dublează debitul de inferență față de predecesorii săi, modelul excelează în sarcini complexe de navigare și interacțiune vizuală, deschizând calea pentru automatizarea autonomă la scară largă.

🕒 1 luni în urmă
AI Construiește un Model de Embedding Specific pe Domeniu în Mai Puțin de o Zi: Ghid Complet de Optimizare și Implementare

Construiește un Model de Embedding Specific pe Domeniu în Mai Puțin de o Zi: Ghid Complet de Optimizare și Implementare

Acest ghid tehnic detaliază procesul de construire a unui model de embedding specific domeniului în mai puțin de 24 de ore, utilizând generare sintetică de date și minerit de negative dure. Soluția, validată de cazul Atlassian care a obținut o îmbunătățire de 26% a Recall-ului, democratizează accesul la modele AI de înaltă performanță, eliminând necesitatea etichetării manuale a datelor.

🕒 1 luni în urmă
AI EVA: Un Nou Cadru de Evaluare pentru Agenții Vocali Inteligenți — O Revoluție în Măsurarea Performanței AI Conversațional

EVA: Un Nou Cadru de Evaluare pentru Agenții Vocali Inteligenți — O Revoluție în Măsurarea Performanței AI Conversațional

EVA (Evaluating Voice Agents) este un nou cadru de evaluare care abordează provocarea duală a agenților vocali: acuratețea sarcinii și experiența conversațională. Studiul relevă un compromis constant între aceste două dimensiuni, demonstrând că un agent perfect din punct de vedere tehnic poate eșua în oferirea unei experiențe utilizator satisfăcătoare.

🕒 1 luni în urmă
AI Bluesky pariază pe inteligența artificială cu Attie, o aplicație revoluționară pentru crearea de fluxuri informaționale personalizate

Bluesky pariază pe inteligența artificială cu Attie, o aplicație revoluționară pentru crearea de fluxuri informaționale personalizate

Echipa Bluesky lansează Attie, un asistent AI revoluționar care permite utilizatorilor să creeze fluxuri informaționale personalizate folosind limbaj natural, marcând o schimbare de paradigmă în modul în care interacționăm cu algoritmii rețelelor sociale.

🕒 1 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.