Filtrează articolele

Subiect: #Modele de Limbaj

AI Bun venit GPT OSS, noua familie de modele open-source de la OpenAI!

Bun venit GPT OSS, noua familie de modele open-source de la OpenAI!

OpenAI lansează familia de modele GPT OSS sub licență Apache 2.0, marcând un angajament major față de comunitatea open-source. Cu arhitecturi MoE eficiente de 21B și 117B parametri, optimizări precum cuantizarea mxfp4 și Flash Attention 3, modelele pot rula local pe GPU-uri consumer, democratizând accesul la AI de ultimă generație.

🕒 2 luni în urmă
AI 🇵🇭 FilBench: Pot modelele de limbaj să înțeleagă și să genereze filipineză?

🇵🇭 FilBench: Pot modelele de limbaj să înțeleagă și să genereze filipineză?

FilBench este o suită de evaluare lansată în 2025 pentru a testa capacitatea modelelor AI de a înțelege și genera limbaj în filipineză, tagalog și cebuano. Studiul relevă că deși modelele regionale rămân în urma GPT-4, ele oferă o alternativă cost-eficientă și promițătoare pentru comunitățile locale.

🕒 2 luni în urmă
AI Familia Palmyra-mini: Modele puternice, ușoare și pregătite pentru raționament complex

Familia Palmyra-mini: Modele puternice, ușoare și pregătite pentru raționament complex

Familia Palmyra-mini redefinesc standardele modelelor de limbaj ușoare, combinând eficiența computațională cu capacități avansate de raționament. Descoperă noile modele „thinking”, antrenate cu Chain of Thought, care obțin scoruri remarcabile pe benchmark-uri precum GSM8K și AMC23.

🕒 2 luni în urmă
AI Inteligența Artificială Publică devine furnizor de inferență pe Hugging Face: O nouă eră pentru modelele suverane și accesibile

Inteligența Artificială Publică devine furnizor de inferență pe Hugging Face: O nouă eră pentru modelele suverane și accesibile

Hugging Face anunță integrarea Public AI ca furnizor de inferență, oferind acces gratuit și simplificat la modele suverane de la instituții precum Swiss AI Initiative și AI Singapore, prin interfața web și SDK-uri dedicate pentru dezvoltatori.

🕒 2 luni în urmă
AI Apriel-H1: Cheia surprinzătoare pentru distilarea modelelor eficiente de raționament

Apriel-H1: Cheia surprinzătoare pentru distilarea modelelor eficiente de raționament

Descoperă cum Apriel-H1 redefinește eficiența modelelor de raționament prin distilare hibridă, înlocuind straturile de atenție cu Mamba și obținând o creștere a vitezei de 2.1x fără a compromite calitatea gândirii logice.

🕒 2 luni în urmă
AI OVHcloud devine furnizor oficial de inferență AI pe platforma Hugging Face: O nouă eră pentru modelele open-source în Europa

OVHcloud devine furnizor oficial de inferență AI pe platforma Hugging Face: O nouă eră pentru modelele open-source în Europa

OVHcloud devine furnizor oficial de inferență pe Hugging Face, oferind acces securizat, cu latență redusă și costuri competitive la modele AI de top precum Llama și DeepSeek, direct din Europa.

🕒 2 luni în urmă
AI Construirea Deep Research: Cum am atins performanța de ultimă generație (State of the Art)

Construirea Deep Research: Cum am atins performanța de ultimă generație (State of the Art)

O analiză detaliată a procesului de dezvoltare a sistemului Deep Research, evidențiind importanța ingineriei contextului, gestionarea eficientă a tokenilor și trecerea de la fluxuri de lucru la agenți autonomi pentru a atinge performanța de ultimă generație.

🕒 2 luni în urmă
AI Diffusers întâmpină cu brațele deschise noul model FLUX.2: O revoluție în generația imaginelor prin inteligență artificială

Diffusers întâmpină cu brațele deschise noul model FLUX.2: O revoluție în generația imaginelor prin inteligență artificială

Black Forest Labs lansează FLUX.2, un model revoluționar de generare a imaginilor, integrat în ecosistemul Hugging Face Diffusers. Cu o arhitectură nouă, bazată pe un singur encoder de text (Mistral Small 3.1) și un DiT optimizat, FLUX.2 oferă capacități avansate de editare și generare ghidată de imagini multiple, fiind accesibil și pe hardware-uri cu resurse limitate datorită tehnicilor de cuantizare și offloading.

🕒 2 luni în urmă
AI DeepMath: Un agent ușor de raționament matematic, construit cu smolagents

DeepMath: Un agent ușor de raționament matematic, construit cu smolagents

DeepMath este un agent inovator de raționament matematic bazat pe modelul Qwen3-4B, care utilizează fragmente de cod Python executate într-un mediu securizat pentru a reduce erorile și lungimea output-ului cu până la 66%, demonstrând că modelele mici pot depăși limitările tradiționale ale LLM-urilor prin antrenament GRPO și arhitecturi hibride.

🕒 2 luni în urmă
AI AprielGuard: O nouă barieră de protecție pentru siguranță și robustețe adversarială în sistemele LLM moderne

AprielGuard: O nouă barieră de protecție pentru siguranță și robustețe adversarială în sistemele LLM moderne

AprielGuard este un model de protecție de 8 miliarde de parametri, lansat în 2025, care unifică detectarea riscurilor de siguranță și a atacurilor adversariale în sistemele LLM moderne, oferind suport pentru contexte lungi și fluxuri de lucru agentice complexe.

🕒 2 luni în urmă
AI Prezentarea Falcon-H1-Arabic: Extinderea limitelor inteligenței artificiale pentru limba arabă printr-o arhitectură hibridă inovatoare

Prezentarea Falcon-H1-Arabic: Extinderea limitelor inteligenței artificiale pentru limba arabă printr-o arhitectură hibridă inovatoare

Falcon-H1-Arabic reprezintă un salt tehnologic major în procesarea limbajului natural pentru limba arabă, introducând o arhitectură hibridă Mamba-Transformer inovatoare. Cu modele de 3B, 7B și 34B parametri capabile să proceseze până la 256.000 de tokeni, această familie depășește performanțele modelelor existente, inclusiv pe cele mai mari, stabilind noi standarde în benchmark-urile OALL și 3LM.

🕒 2 luni în urmă
AI Antrenarea modelelor AI cu Unsloth și Hugging Face Jobs: Ghid Complet Gratuit

Antrenarea modelelor AI cu Unsloth și Hugging Face Jobs: Ghid Complet Gratuit

Un ghid complet despre cum să antrenați modele AI gratuit folosind Unsloth și Hugging Face Jobs. Aflați cum să utilizați modele mici precum LFM2.5-1.2B-Instruct, să instalați skill-uri pentru agenți de codare și să rulați job-uri de antrenare pe GPU-uri cloud gestionate automat.

🕒 2 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.