Perplexity AI a lansat open-source un tokenizer Unigram care oferă o latență p50 de cinci ori mai mică decât Hugging Face tokenizers, promițând să accelereze procesarea textului în modelele de limbaj.
Turbovec este un index vectorial open-source scris în Rust, cu legături Python, care folosește algoritmul TurboQuant de la Google pentru cuantizare eficientă. Oferă performanțe superioare în indexare și căutare, reducând semnificativ memoria necesară, fiind ideal pentru aplicații de căutare semantică, recomandări și RAG.
NVIDIA a lansat cuda-oxide, un backend experimental de compilare care transformă kernel-uri SIMT scrise în Rust direct în PTX, deschizând calea către programarea GPU-urilor cu siguranța și performanța oferite de Rust.
Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.