Google Cloud C4 și Intel Xeon 6: O revoluție în eficiența costurilor pentru modelele AI de tip MoE
Noile instanțe Google Cloud C4, echipate cu procesoare Intel Xeon 6, demonstrează o reducere de 70% a Costului Total de Proprietate (TCO) pentru inferența modelelor AI MoE, grație optimizărilor hardware și software realizate în colaborare cu Hugging Face.
🕒 1 luni în urmă