Filtrează articolele

Subiect: #performanță

AI MoonMath AI lansează open-source un kernel de atenție HIP pentru AMD MI300X care depășește AITER v3 în toate formele și modurile de rotunjire

MoonMath AI lansează open-source un kernel de atenție HIP pentru AMD MI300X care depășește AITER v3 în toate formele și modurile de rotunjire

MoonMath AI a lansat open-source un kernel de atenție HIP pentru AMD MI300X care depășește AITER v3 în toate testele. Descoperiți cum această mișcare poate schimba echilibrul de putere în hardware-ul AI și ce înseamnă pentru dezvoltatori și centrele de date.

🕒 6 zile în urmă

Yandex deschide codul sursă pentru YaFF: un format de serializare zero-copy pentru Protobuf cu viteză aproape de cea a unei structuri C++

Yandex a lansat YaFF, un format de serializare zero-copy pentru Protobuf, care atinge viteze apropiate de structurile C++. Articolul explică cele patru layout-uri, benchmark-urile și impactul în sistemele de producție, inclusiv economii de 10-20% CPU în recomandări publicitare.

🕒 1 săptămâni în urmă
AI Xiaomi MiMo și TileRT: Un model cu 1 trilion de parametri depășește 1000 de tokeni pe secundă pe GPU-uri comerciale

Xiaomi MiMo și TileRT: Un model cu 1 trilion de parametri depășește 1000 de tokeni pe secundă pe GPU-uri comerciale

Xiaomi și TileRT au dezvoltat o soluție care permite unui model AI cu 1 trilion de parametri să ruleze la peste 1000 de tokeni pe secundă pe GPU-uri comerciale, democratizând accesul la inteligența artificială avansată.

🕒 2 săptămâni în urmă
AI NVIDIA lansează Dynamo Snapshot: un sistem de pornire rapidă pentru inferență AI pe Kubernetes bazat pe CRIU

NVIDIA lansează Dynamo Snapshot: un sistem de pornire rapidă pentru inferență AI pe Kubernetes bazat pe CRIU

NVIDIA a lansat Dynamo Snapshot, un sistem bazat pe CRIU care permite pornirea aproape instantanee a containerelor de inferență AI pe Kubernetes, reducând timpii de inițializare de la zeci de secunde la sub o secundă. Articolul explică tehnologia din spate, integrarea cu Kubernetes și impactul asupra costurilor și performanței.

🕒 3 săptămâni în urmă
AI mKernel: Biblioteca de kerneluri fuzionate pentru comunicare GPU multi-GPU și multi-nod

mKernel: Biblioteca de kerneluri fuzionate pentru comunicare GPU multi-GPU și multi-nod

mKernel este o bibliotecă open-source care revoluționează comunicarea între GPU-uri multiple, rulând kerneluri fuzionate direct pe placă grafică, fără a mai trece prin CPU. Rezultatul: antrenare mai rapidă a modelelor AI, latență redusă și suport nativ pentru medii multi-nod.

🕒 1 luni în urmă
AI Cum să construiești un flux de lucru pentru analiză tehnică și backtesting cu pandas-ta-classic, semnale de strategie și metrici de performanță

Cum să construiești un flux de lucru pentru analiză tehnică și backtesting cu pandas-ta-classic, semnale de strategie și metrici de performanță

Află cum poți construi un flux de lucru complet pentru analiză tehnică și backtesting folosind pandas-ta-classic, de la pregătirea datelor până la evaluarea performanței strategiilor de tranzacționare.

🕒 1 luni în urmă

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.