Filtrează articolele

Subiect: #Machine Learning

AI mmBERT: ModernBERT devine multilingv – o nouă eră pentru modelele de limbaj

mmBERT: ModernBERT devine multilingv – o nouă eră pentru modelele de limbaj

mmBERT reprezintă o evoluție majoră în domeniul modelelor de limbaj multilingve, fiind primul care depășește performanțele XLM-R. Antrenat pe peste 3 trilioane de tokeni în 1800 de limbi, modelul introduce tehnici inovatoare de antrenament progresiv și fuzionare, oferind simultan performanță superioară și eficiență computațională ridicată.

🕒 1 luni în urmă
AI Jupyter Agents: Antrenarea modelelor de limbaj pentru raționament bazat pe notebook-uri

Jupyter Agents: Antrenarea modelelor de limbaj pentru raționament bazat pe notebook-uri

Jupyter Agent reprezintă o inovație majoră în antrenarea modelelor de limbaj de mici dimensiuni pentru a raționa și executa cod în medii Jupyter. Proiectul detaliază un pipeline complex de curățare a datelor din Kaggle și fine-tuning, demonstrând cum modelele mici pot deveni agenți eficienți în știința datelor.

🕒 1 luni în urmă
AI Together AI și Hugging Face revoluționează antrenarea modelelor: Acum poți adapta orice LLM în doar câteva minute

Together AI și Hugging Face revoluționează antrenarea modelelor: Acum poți adapta orice LLM în doar câteva minute

Parteneriatul dintre Together AI și Hugging Face permite dezvoltatorilor să efectueze fine-tuning pe orice model LLM compatibil direct prin infrastructura cloud, eliminând complexitatea tehnică și reducând timpul de la descoperire la implementare la doar câteva minute.

🕒 1 luni în urmă
AI Nu Doar Înțelege, Ci Evoluează: Noul JiuwenClaw Auto-Evoluabil Își Face Debutul

Nu Doar Înțelege, Ci Evoluează: Noul JiuwenClaw Auto-Evoluabil Își Face Debutul

Lansarea platformei JiuwenClaw marchează o nouă eră în inteligența artificială, trecând dincolo de simpla înțelegere a datelor către capacitatea de auto-evoluție. Această tehnologie promite să redefinească adaptabilitatea sistemelor algorithmice în ecosistemul digital modern.

🕒 1 luni în urmă
AI A-Evolve: Momentul PyTorch pentru sistemele de Inteligență Artificială Agentică – Înlocuirea reglajului manual cu mutații automate de stare și autocorecție

A-Evolve: Momentul PyTorch pentru sistemele de Inteligență Artificială Agentică – Înlocuirea reglajului manual cu mutații automate de stare și autocorecție

A-Evolve reprezintă o revoluție în dezvoltarea sistemelor AI agentice, automatizând procesele de adaptare și corecție. Similar cu impactul pe care PyTorch l-a avut asupra învățării profunde, această nouă paradigmă elimină necesitatea reglajului manual, permițând agenților să-și modifice starea și să se autocorecteze în timp real.

🕒 1 luni în urmă
AI Trucuri de la OpenAI gpt-oss pe care TU 🫵 le poți utiliza cu transformers

Trucuri de la OpenAI gpt-oss pe care TU 🫵 le poți utiliza cu transformers

Lansarea GPT-OSS de la OpenAI aduce o serie de inovații tehnice în ecosistemul open-source. Acest articol explorează integrarea acestora în biblioteca `transformers`, de la kernel-e zero-build și Flash Attention 3, până la cuantizarea MXFP4 și paralelismul tensorial, oferind un ghid detaliat pentru optimizarea inferenței modelelor de limbaj de mari dimensiuni.

🕒 1 luni în urmă
AI Familia Palmyra-mini: Modele puternice, ușoare și pregătite pentru raționament complex

Familia Palmyra-mini: Modele puternice, ușoare și pregătite pentru raționament complex

Familia Palmyra-mini redefinesc standardele modelelor de limbaj ușoare, combinând eficiența computațională cu capacități avansate de raționament. Descoperă noile modele „thinking”, antrenate cu Chain of Thought, care obțin scoruri remarcabile pe benchmark-uri precum GSM8K și AMC23.

🕒 1 luni în urmă
Tehnologie LeRobotDataset v3.0: Revoluționarea învățării robotice prin seturi de date la scară largă și streaming

LeRobotDataset v3.0: Revoluționarea învățării robotice prin seturi de date la scară largă și streaming

Hugging Face lansează LeRobotDataset v3.0, un format standardizat care revoluționează învățarea robotică prin suport pentru seturi de date la scară largă și funcționalitate de streaming, eliminând necesitatea descărcării locale a volumelor mari de date.

🕒 1 luni în urmă
AI Smol2Operator: Antrenarea agenților AI pentru automatizarea interfețelor grafice (GUI) – O abordare revoluționară

Smol2Operator: Antrenarea agenților AI pentru automatizarea interfețelor grafice (GUI) – O abordare revoluționară

Smol2Operator reprezintă o metodologie inovatoare pentru antrenarea agenților AI capabili să automatizeze interfețele grafice (GUI). Proiectul demonstrează transformarea unui model VLM compact într-un agent funcțional printr-un proces de antrenare în două faze, de la percepție la cogniție, folosind seturi de date unificate și resurse open-source.

🕒 1 luni în urmă
AI Swift Transformers atinge versiunea 1.0 – și privește spre viitorul inteligenței artificiale pe dispozitivele Apple

Swift Transformers atinge versiunea 1.0 – și privește spre viitorul inteligenței artificiale pe dispozitivele Apple

Biblioteca Swift Transformers a lansat versiunea 1.0, stabilind un nou standard pentru dezvoltarea aplicațiilor AI locale pe Apple Silicon, cu un accent pe integrarea MLX și cazuri de utilizare agentică.

🕒 1 luni în urmă
AI Prezentând RTEB: Un Noua Standard pentru Evaluarea Recuperării Datelor în Era Inteligenței Artificiale

Prezentând RTEB: Un Noua Standard pentru Evaluarea Recuperării Datelor în Era Inteligenței Artificiale

RTEB (Retrieval Embedding Benchmark) redefinesc evaluarea modelelor de embedding prin utilizarea unei strategii hibride, care combină seturi de date deschise și private pentru a combate supra-ajustarea și a oferi o măsură reală a capacității de generalizare în domenii precum finanțe, drept, cod și sănătate.

🕒 1 luni în urmă
AI Optimizarea recunoașterii optice a caracterelor (OCR) de ultimă generație cu Core ML și Dots.OCR: O călătorie tehnică

Optimizarea recunoașterii optice a caracterelor (OCR) de ultimă generație cu Core ML și Dots.OCR: O călătorie tehnică

Acest articol detaliază procesul tehnic complex de conversie a modelului OCR Dots.OCR pentru a rula pe dispozitivele Apple, folosind Core ML și Motorul Neural. Autorii descriu strategia de simplificare a modelului, provocările întâmpinate în compatibilitatea dintre PyTorch și Core ML și rezultatele benchmark-urilor inițiale, care evidențiază necesitatea optimizărilor ulterioare.

🕒 1 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.