DeepSeek lansează DSpark: un cadru de decodare speculativă care accelerează generarea per utilizator cu 60–85% față de MTP-1
DeepSeek a lansat DSpark, un cadru de decodare speculativă care accelerează generarea de text per utilizator cu 57–85% față de MTP-1, fără pierderi de calitate. Folosește un draft paralel și un cap Markov pentru a reduce degradarea sufixelor, plus o verificare adaptivă în funcție de încărcarea GPU-ului. DeepSpec, setul de instrumente de antrenament, este open-source sub licență MIT.
🕒 1 zile în urmă