Filtrează articolele

Subiect: #Modele de Limbaj

AI Startup-ul Goodfire lansează Silico: un instrument de interpretabilitate mecanică pentru depanarea modelelor de limbaj

Startup-ul Goodfire lansează Silico: un instrument de interpretabilitate mecanică pentru depanarea modelelor de limbaj

Goodfire lansează Silico, un instrument de interpretabilitate mecanică care permite cercetătorilor să privească în interiorul modelelor AI și să le ajusteze parametrii, transformând construirea acestora dintr-un proces alchimic într-o inginerie de precizie.

🕒 5 zile în urmă

Presupunerea LoRA care eșuează în producție

LoRA este o tehnică populară de fine-tuning, dar în producție, presupunerea că funcționează la fel ca fine-tuning-ul complet se sparge adesea. Află care sunt capcanele și cum să le eviți.

🕒 1 săptămâni în urmă

Anthropic Lansază Claude Opus 4.7: O Actualizare Majoră pentru Programare Agentică, Viziune de Înaltă Rezoluție și Task-uri Autonome pe Termen Lung

Anthropic a lansat Claude Opus 4.7 cu capabilități avansate de programare agentică, procesare vizuală de înaltă rezoluție și executare autonomă a task-urilor pe termen lung.

🕒 2 săptămâni în urmă
AI Bun venit GPT OSS, noua familie de modele open-source de la OpenAI!

Bun venit GPT OSS, noua familie de modele open-source de la OpenAI!

OpenAI lansează familia de modele GPT OSS sub licență Apache 2.0, marcând un angajament major față de comunitatea open-source. Cu arhitecturi MoE eficiente de 21B și 117B parametri, optimizări precum cuantizarea mxfp4 și Flash Attention 3, modelele pot rula local pe GPU-uri consumer, democratizând accesul la AI de ultimă generație.

🕒 1 luni în urmă
AI 🇵🇭 FilBench: Pot modelele de limbaj să înțeleagă și să genereze filipineză?

🇵🇭 FilBench: Pot modelele de limbaj să înțeleagă și să genereze filipineză?

FilBench este o suită de evaluare lansată în 2025 pentru a testa capacitatea modelelor AI de a înțelege și genera limbaj în filipineză, tagalog și cebuano. Studiul relevă că deși modelele regionale rămân în urma GPT-4, ele oferă o alternativă cost-eficientă și promițătoare pentru comunitățile locale.

🕒 1 luni în urmă
AI Familia Palmyra-mini: Modele puternice, ușoare și pregătite pentru raționament complex

Familia Palmyra-mini: Modele puternice, ușoare și pregătite pentru raționament complex

Familia Palmyra-mini redefinesc standardele modelelor de limbaj ușoare, combinând eficiența computațională cu capacități avansate de raționament. Descoperă noile modele „thinking”, antrenate cu Chain of Thought, care obțin scoruri remarcabile pe benchmark-uri precum GSM8K și AMC23.

🕒 1 luni în urmă
AI Inteligența Artificială Publică devine furnizor de inferență pe Hugging Face: O nouă eră pentru modelele suverane și accesibile

Inteligența Artificială Publică devine furnizor de inferență pe Hugging Face: O nouă eră pentru modelele suverane și accesibile

Hugging Face anunță integrarea Public AI ca furnizor de inferență, oferind acces gratuit și simplificat la modele suverane de la instituții precum Swiss AI Initiative și AI Singapore, prin interfața web și SDK-uri dedicate pentru dezvoltatori.

🕒 1 luni în urmă
AI Apriel-H1: Cheia surprinzătoare pentru distilarea modelelor eficiente de raționament

Apriel-H1: Cheia surprinzătoare pentru distilarea modelelor eficiente de raționament

Descoperă cum Apriel-H1 redefinește eficiența modelelor de raționament prin distilare hibridă, înlocuind straturile de atenție cu Mamba și obținând o creștere a vitezei de 2.1x fără a compromite calitatea gândirii logice.

🕒 1 luni în urmă
AI OVHcloud devine furnizor oficial de inferență AI pe platforma Hugging Face: O nouă eră pentru modelele open-source în Europa

OVHcloud devine furnizor oficial de inferență AI pe platforma Hugging Face: O nouă eră pentru modelele open-source în Europa

OVHcloud devine furnizor oficial de inferență pe Hugging Face, oferind acces securizat, cu latență redusă și costuri competitive la modele AI de top precum Llama și DeepSeek, direct din Europa.

🕒 1 luni în urmă
AI Construirea Deep Research: Cum am atins performanța de ultimă generație (State of the Art)

Construirea Deep Research: Cum am atins performanța de ultimă generație (State of the Art)

O analiză detaliată a procesului de dezvoltare a sistemului Deep Research, evidențiind importanța ingineriei contextului, gestionarea eficientă a tokenilor și trecerea de la fluxuri de lucru la agenți autonomi pentru a atinge performanța de ultimă generație.

🕒 1 luni în urmă
AI Diffusers întâmpină cu brațele deschise noul model FLUX.2: O revoluție în generația imaginelor prin inteligență artificială

Diffusers întâmpină cu brațele deschise noul model FLUX.2: O revoluție în generația imaginelor prin inteligență artificială

Black Forest Labs lansează FLUX.2, un model revoluționar de generare a imaginilor, integrat în ecosistemul Hugging Face Diffusers. Cu o arhitectură nouă, bazată pe un singur encoder de text (Mistral Small 3.1) și un DiT optimizat, FLUX.2 oferă capacități avansate de editare și generare ghidată de imagini multiple, fiind accesibil și pe hardware-uri cu resurse limitate datorită tehnicilor de cuantizare și offloading.

🕒 1 luni în urmă
AI DeepMath: Un agent ușor de raționament matematic, construit cu smolagents

DeepMath: Un agent ușor de raționament matematic, construit cu smolagents

DeepMath este un agent inovator de raționament matematic bazat pe modelul Qwen3-4B, care utilizează fragmente de cod Python executate într-un mediu securizat pentru a reduce erorile și lungimea output-ului cu până la 66%, demonstrând că modelele mici pot depăși limitările tradiționale ale LLM-urilor prin antrenament GRPO și arhitecturi hibride.

🕒 1 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.