Filtrează articolele

Subiect: #Machine Learning

AI PRX Part 3 — Antrenarea unui model Text-to-Image în doar 24 de ore! O revoluție în ingineria modelelor de difuzie

PRX Part 3 — Antrenarea unui model Text-to-Image în doar 24 de ore! O revoluție în ingineria modelelor de difuzie

O echipă de cercetare demonstrează că este posibil să antrenezi un model competitiv text-to-image în doar 24 de ore, combinând tehnici precum antrenarea în spațiul pixelilor, rutarea TREAD și optimizerul Muon, eliminând nevoia unui VAE și reducând drastic costurile de computație.

🕒 1 luni în urmă
Tehnologie Prezentarea Modular Diffusers: Blocuri de Construire Compozabile pentru Pipeline-uri de Difuzie

Prezentarea Modular Diffusers: Blocuri de Construire Compozabile pentru Pipeline-uri de Difuzie

Modular Diffusers introduce o nouă eră în inteligența artificială generativă, transformând pipeline-urile de difuzie rigide în colecții flexibile de blocuri componabile. Acest articol explorează de la conceptele fundamentale și rularea primelor exemple, până la crearea de blocuri personalizate și integrarea vizuală cu Mellon.

🕒 1 luni în urmă
AI Implementarea Inteligenței Artificiale în Robotică pe Platforme Embedded: Înregistrarea Seturilor de Date, Fine-Tuning VLA și Optimizări On-Device

Implementarea Inteligenței Artificiale în Robotică pe Platforme Embedded: Înregistrarea Seturilor de Date, Fine-Tuning VLA și Optimizări On-Device

Aducerea modelelor VLA (Vision-Language-Action) pe platforme robotice embedded necesită mai mult decât compresie de model; este o problemă de inginerie a sistemelor. Acest articol detaliază bunele practici NXP pentru înregistrarea seturilor de date, fine-tuning-ul politicilor și optimizările în timp real pe procesorul i.MX 95, demonstrând cum inferența asincronă și cuantizarea selectivă pot reduce latența de la 2.86s la 0.32s.

🕒 1 luni în urmă
AI LeRobot v0.5.0: O nouă eră în robotică și inteligența artificială încorporată

LeRobot v0.5.0: O nouă eră în robotică și inteligența artificială încorporată

LeRobot v0.5.0 revoluționează robotica open-source prin integrarea robotului umanoid Unitree G1, introducerea modelelor autoregressive Pi0-FAST și optimizarea masivă a fluxului de date, eliminând timpii morți în înregistrare și accelerând antrenarea modelelor vizuale.

🕒 1 luni în urmă
AI Paralelismul de Secvență Ulysses: Antrenarea modelelor AI cu contexte de un milion de token-uri

Paralelismul de Secvență Ulysses: Antrenarea modelelor AI cu contexte de un milion de token-uri

Ulysses Sequence Parallelism oferă o soluție revoluționară pentru antrenarea modelelor AI cu contexte de milioane de token-uri, distribuind calculul atenției pe multiple GPU-uri prin paralelismul capetelor de atenție, integrată acum complet în ecosistemul Hugging Face.

🕒 1 luni în urmă
AI Menținând Fluxul de Token-uri: Lecții din 16 Biblioteci Open-Source de Învățare prin Întărire

Menținând Fluxul de Token-uri: Lecții din 16 Biblioteci Open-Source de Învățare prin Întărire

O analiză tehnică detaliată a arhitecturilor de învățare prin întărire asincronă, extrăgând principii de design esențiale din 16 biblioteci open-source pentru a optimiza antrenarea modelelor de limbaj de mari dimensiuni.

🕒 1 luni în urmă
AI Mellea 0.4.0 și Bibliotecile Granite: O Nouă Eră în Fluxurile de Lucru AI Structurate și Verificabile

Mellea 0.4.0 și Bibliotecile Granite: O Nouă Eră în Fluxurile de Lucru AI Structurate și Verificabile

IBM lansează Mellea 0.4.0 și bibliotecile Granite, o suită software revoluționară care transformă dezvoltarea AI enterprise. Prin înlocuirea prompting-ului probabilistic cu fluxuri de lucru structurate și utilizarea adaptoarelor specializate pentru sarcini precum RAG și detectarea halucinațiilor, noile instrumente promit sisteme AI mai sigure, verificabile și mentenabile.

🕒 1 luni în urmă
AI Construiește un Model de Embedding Specific pe Domeniu în Mai Puțin de o Zi: Ghid Complet de Optimizare și Implementare

Construiește un Model de Embedding Specific pe Domeniu în Mai Puțin de o Zi: Ghid Complet de Optimizare și Implementare

Acest ghid tehnic detaliază procesul de construire a unui model de embedding specific domeniului în mai puțin de 24 de ore, utilizând generare sintetică de date și minerit de negative dure. Soluția, validată de cazul Atlassian care a obținut o îmbunătățire de 26% a Recall-ului, democratizează accesul la modele AI de înaltă performanță, eliminând necesitatea etichetării manuale a datelor.

🕒 1 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.