#LLM - Pagină 2 | World News

Together AI lansează open-source OSCAR: un sistem de cuantizare a cache-ului KV pe 2 biți, conștient de atenție, pentru servirea LLM-urilor cu context lung

Together AI a lansat open-source OSCAR, un sistem de cuantizare a cache-ului KV pe 2 biți, care reduce memoria de 8 ori și accelerează decodarea de 3 ori pentru LLM-uri cu contexte lungi, menținând o acuratețe ridicată.

🕒 3 săptămâni în urmă

AI

Construiește un Pipeline Complet de Observabilitate și Evaluare cu Langfuse: Urmărire, Gestionarea Prompturilor, Scoruri și Experimente

Descoperă cum să construiești un pipeline complet de observabilitate și evaluare cu Langfuse, incluzând urmărirea, gestionarea prompturilor, scoruri și experimente, pentru a optimiza aplicațiile bazate pe LLM-uri.

🕒 3 săptămâni în urmă

AI

Cum redefinește CopilotKit stiva AI agentică în 2026

CopilotKit, un framework open-source pentru agenți AI, revoluționează stiva tehnologică în 2026 prin integrarea seamless cu React, suport pentru multiple LLM-uri și acțiuni personalizabile. Descoperă cum democratizează AI-ul și ce impact are asupra industriei.

🕒 4 săptămâni în urmă

AI

Cohere lansează Command A+: Un model MoE de 218B parametri pentru fluxuri de lucru agentice, care rulează pe doar două GPU-uri H100

Cohere lansează Command A+, un model de 218 miliarde de parametri cu arhitectură Mixture of Experts, capabil să ruleze pe doar două GPU-uri H100. Modelul este optimizat pentru fluxuri de lucru agentice, stabilind noi recorduri de performanță și democratizând accesul la AI avansat.

🕒 4 săptămâni în urmă

AI

Mese rotunde: Poate AI să învețe să înțeleagă lumea?

O discuție exclusivă între editorii MIT Technology Review explorează cum AI poate trece dincolo de text și învăța să înțeleagă lumea fizică prin modele ale lumii, cu implicații uriașe pentru robotică, mașini autonome și etică.

🕒 1 luni în urmă

AI

Cum să comprimi și să evaluezi modelele lingvistice instruite cu FP8, GPTQ și SmoothQuant folosind llmcompressor

Află cum poți comprima modelele lingvistice instruite (instruction-tuned LLMs) folosind FP8, GPTQ și SmoothQuant cu ajutorul bibliotecii llmcompressor. Articolul explică pașii de implementare, rezultatele benchmark-urilor și importanța cuantizării pentru eficiență și accesibilitate.

🕒 1 luni în urmă

AI

ArXiv interzice autorii care lasă AI-ul să scrie în locul lor: un an de suspendare pentru lucrări generate neglijent

ArXiv, depozitul deschis de preprinturi științifice, introduce o interdicție de un an pentru autorii care nu verifică rezultatele generate de modelele de limbaj mari (LLM). Măsura vizează lucrările cu dovezi clare de neglijență, cum ar fi referințe halucinate sau comentarii ale AI-ului, și impune ca ulterior trimiterile să fie acceptate de o revistă cu evaluare inter pares.

🕒 1 luni în urmă

AI

Zyphra lansează ZAYA1-8B-Diffusion-Preview: primul model de difuzie MoE convertit dintr-un LLM autoregresiv, cu o accelerare de până la 7,7 ori

Zyphra a lansat ZAYA1-8B-Diffusion-Preview, primul model de difuzie MoE convertit dintr-un LLM autoregresiv, care oferă o accelerare de până la 7,7 ori. Articolul explică tehnologia din spate, performanțele și impactul asupra industriei AI.

🕒 1 luni în urmă

AI

Osaurus: Un server LLM open-source pentru Mac care îmbină inteligența artificială locală cu cea din cloud

Osaurus este un server LLM open-source pentru Mac care permite utilizatorilor să alterneze între modele AI locale și din cloud, păstrând fișierele și instrumentele pe propriul hardware. Oferă o interfață ușor de utilizat, securitate prin sandboxing și suportă peste 20 de pluginuri native. Fondatorii văd potențialul de a reduce dependența de centrele de date AI.

🕒 1 luni în urmă

AI

Sistemul Meta al Poetiq construiește automat un ham independent de model care a îmbunătățit fiecare LLM testat pe LiveCodeBench Pro, fără fine-tuning

Poetiq a dezvoltat un meta-sistem care construiește automat un ham independent de model, capabil să îmbunătățească performanța oricărui LLM pe benchmark-ul LiveCodeBench Pro, fără a necesita fine-tuning. Rezultatele arată creșteri semnificative ale scorurilor pentru toate modelele testate, deschizând calea către o nouă paradigmă în optimizarea inteligenței artificiale.

🕒 1 luni în urmă

AI

Nous Research revoluționează antrenarea modelelor lingvistice: Token Superposition Training reduce timpul de pre-antrenare de până la 2,5 ori

Nous Research lansează Token Superposition Training (TST), o metodă de pre-antrenare în două faze care reduce timpul de antrenare al modelelor lingvistice de mari dimensiuni cu până la 2,5 ori, fără a modifica arhitectura sau performanța la inferență. Validată pe modele de la 270M la 10B parametri, TST promite să democratizeze accesul la antrenarea LLM-urilor.

🕒 1 luni în urmă

AI

Clio atinge pragul de 500 de milioane de dolari în venituri recurente, în timp ce Anthropic ridică miza în domeniul juridic

Clio, compania canadiană de software juridic, a atins 500 de milioane de dolari în venituri anuale recurente, datorită integrării AI. În același timp, Anthropic lansează funcții juridice pentru Claude, intensificând competiția pe o piață în plină expansiune.

🕒 1 luni în urmă

Filtrează articolele

Subiect: #LLM

Together AI lansează open-source OSCAR: un sistem de cuantizare a cache-ului KV pe 2 biți, conștient de atenție, pentru servirea LLM-urilor cu context lung

Construiește un Pipeline Complet de Observabilitate și Evaluare cu Langfuse: Urmărire, Gestionarea Prompturilor, Scoruri și Experimente

Cum redefinește CopilotKit stiva AI agentică în 2026

Cohere lansează Command A+: Un model MoE de 218B parametri pentru fluxuri de lucru agentice, care rulează pe doar două GPU-uri H100

Mese rotunde: Poate AI să învețe să înțeleagă lumea?

Cum să comprimi și să evaluezi modelele lingvistice instruite cu FP8, GPTQ și SmoothQuant folosind llmcompressor

ArXiv interzice autorii care lasă AI-ul să scrie în locul lor: un an de suspendare pentru lucrări generate neglijent

Zyphra lansează ZAYA1-8B-Diffusion-Preview: primul model de difuzie MoE convertit dintr-un LLM autoregresiv, cu o accelerare de până la 7,7 ori

Osaurus: Un server LLM open-source pentru Mac care îmbină inteligența artificială locală cu cea din cloud

Sistemul Meta al Poetiq construiește automat un ham independent de model care a îmbunătățit fiecare LLM testat pe LiveCodeBench Pro, fără fine-tuning

Nous Research revoluționează antrenarea modelelor lingvistice: Token Superposition Training reduce timpul de pre-antrenare de până la 2,5 ori

Clio atinge pragul de 500 de milioane de dolari în venituri recurente, în timp ce Anthropic ridică miza în domeniul juridic