NVIDIA lansează Star Elastic: un singur checkpoint care conține trei modele de raționament de 30B, 23B și 12B parametri, cu tăiere zero-shot
NVIDIA a lansat Star Elastic, o metodă post-antrenare care înglobează trei modele de raționament (30B, 23B și 12B parametri) într-un singur checkpoint, reducând costurile de antrenare de 360 de ori și permițând rularea pe GPU-uri RTX. Controlul elastic al bugetului îmbunătățește acuratețea cu 16% și reduce latența de 1,9 ori.
🕒 20 ore în urmă