Together AI a lansat open-source OSCAR, un sistem de cuantizare a cache-ului KV pe 2 biți, care reduce memoria de 8 ori și accelerează decodarea de 3 ori pentru LLM-uri cu contexte lungi, menținând o acuratețe ridicată.
Descoperă cum să construiești un pipeline complet de observabilitate și evaluare cu Langfuse, incluzând urmărirea, gestionarea prompturilor, scoruri și experimente, pentru a optimiza aplicațiile bazate pe LLM-uri.
CopilotKit, un framework open-source pentru agenți AI, revoluționează stiva tehnologică în 2026 prin integrarea seamless cu React, suport pentru multiple LLM-uri și acțiuni personalizabile. Descoperă cum democratizează AI-ul și ce impact are asupra industriei.
Cohere lansează Command A+, un model de 218 miliarde de parametri cu arhitectură Mixture of Experts, capabil să ruleze pe doar două GPU-uri H100. Modelul este optimizat pentru fluxuri de lucru agentice, stabilind noi recorduri de performanță și democratizând accesul la AI avansat.
O discuție exclusivă între editorii MIT Technology Review explorează cum AI poate trece dincolo de text și învăța să înțeleagă lumea fizică prin modele ale lumii, cu implicații uriașe pentru robotică, mașini autonome și etică.
Află cum poți comprima modelele lingvistice instruite (instruction-tuned LLMs) folosind FP8, GPTQ și SmoothQuant cu ajutorul bibliotecii llmcompressor. Articolul explică pașii de implementare, rezultatele benchmark-urilor și importanța cuantizării pentru eficiență și accesibilitate.
ArXiv, depozitul deschis de preprinturi științifice, introduce o interdicție de un an pentru autorii care nu verifică rezultatele generate de modelele de limbaj mari (LLM). Măsura vizează lucrările cu dovezi clare de neglijență, cum ar fi referințe halucinate sau comentarii ale AI-ului, și impune ca ulterior trimiterile să fie acceptate de o revistă cu evaluare inter pares.
Zyphra a lansat ZAYA1-8B-Diffusion-Preview, primul model de difuzie MoE convertit dintr-un LLM autoregresiv, care oferă o accelerare de până la 7,7 ori. Articolul explică tehnologia din spate, performanțele și impactul asupra industriei AI.
Osaurus este un server LLM open-source pentru Mac care permite utilizatorilor să alterneze între modele AI locale și din cloud, păstrând fișierele și instrumentele pe propriul hardware. Oferă o interfață ușor de utilizat, securitate prin sandboxing și suportă peste 20 de pluginuri native. Fondatorii văd potențialul de a reduce dependența de centrele de date AI.
Poetiq a dezvoltat un meta-sistem care construiește automat un ham independent de model, capabil să îmbunătățească performanța oricărui LLM pe benchmark-ul LiveCodeBench Pro, fără a necesita fine-tuning. Rezultatele arată creșteri semnificative ale scorurilor pentru toate modelele testate, deschizând calea către o nouă paradigmă în optimizarea inteligenței artificiale.
Nous Research lansează Token Superposition Training (TST), o metodă de pre-antrenare în două faze care reduce timpul de antrenare al modelelor lingvistice de mari dimensiuni cu până la 2,5 ori, fără a modifica arhitectura sau performanța la inferență. Validată pe modele de la 270M la 10B parametri, TST promite să democratizeze accesul la antrenarea LLM-urilor.
Clio, compania canadiană de software juridic, a atins 500 de milioane de dolari în venituri anuale recurente, datorită integrării AI. În același timp, Anthropic lansează funcții juridice pentru Claude, intensificând competiția pe o piață în plină expansiune.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.