Platone Data Intelligence.
Ricerca verticale e intelligenza artificiale.

Intel prepara i chip Gaudi 3 a basso consumo per la Cina

Data:

Intel è pronta a lanciare due modelli esclusivi per la Cina del suo acceleratore AI Gaudi 3, e saranno sostanzialmente paralizzati per adattarsi alle sanzioni statunitensi.

L'esistenza di due modelli approvati per la vendita nel Medio Regno è dettagliata in Whitepaper Gaudi 3 di Intel. Chiamati HL-328 e HL-388, i processori realizzati per la Cina sono rispettivamente nei formati OAM e PCIe, con il primo lanciato a giugno e il secondo a settembre, insieme all'altro formato PCIe Gaudi 3.

Nel complesso, l'HL-328 e l'HL-388 sembrano più o meno uguali agli altri, con gli stessi 128 GB di VRAM HBM2e con 3.7 TB/s di larghezza di banda, 96 MB di cache, interfaccia PCIe 5.0 x16 e standard di decodifica.

L'unica differenza riguarda la potenza del progetto termico, che è di 450 watt sia per i modelli di schede OAM che per quelli PCIe. Si tratta di una riduzione sostanziale rispetto agli altri modelli. Il PCIe HL-338 non cinese ha un TDP di 600 watt, mentre il formato OAM HL-325L e HL-335 trasportano 900 watt. Il TDP relativamente basso sui modelli China Gaudi 3 è presumibilmente il motivo per cui non esiste una versione raffreddata a liquido.

Anche se non esplicitamente dichiarato nel white paper, apportare le modifiche è stato quasi certamente necessario per rispettare le norme I controlli sulle esportazioni del governo americano sui processori, che vietano alle aziende americane di esportare chip in Cina a seconda delle prestazioni. 

Non possiamo davvero sapere cosa abbia fatto Intel con Gaudi 3 per renderlo conforme e quanto velocemente questi chip approvati per la Cina funzioneranno con queste modifiche, ma ci sono alcuni indizi. L'HL-328 e l'HL-388 utilizzano ancora due die, come le altre varianti Gaudi 3, poiché la configurazione della memoria e della cache è invariata. L'utilizzo di due die invece di uno aiuta a ridurre la densità delle prestazioni, consentendo al chip di raggiungere il limite di esportazione più elevato di 4,800 potenza di elaborazione totale (TPP).

Ciò che significa quel limite di 4,800 TPP è che nessun chip può avere 150 TFLOPS o più di prestazioni a 16 bit e poiché Gaudi 3 può fare fino a 1,835 TFLOPS a BF16, Intel dovrebbe ridurre drasticamente le prestazioni. Ciò dovrebbe essere ottenuto con un taglio davvero massiccio del numero di core e della velocità di clock, o con qualche altro metodo che limita le prestazioni.

Abbiamo chiesto a Intel chiarimenti sui modelli Gaudi 3 esclusivi per la Cina e non abbiamo ancora ricevuto risposta. Aggiorneremo se Intel divulga informazioni.

Probabilmente possiamo aspettarci che HL-328 e HL-388 funzionino in modo simile H20 di Nvidia, la GPU più veloce del Titano di silicio approvata per la vendita in Cina. Ha 148 TFLOPS di prestazioni FB16 e FP16, appena sotto il limite di 150 TFLOPS.

Dato che le prestazioni del core saranno più o meno uguali tra il modello H20 e quello cinese del Gaudi 3, la differenza principale riguarderà la memoria, dove Intel ha più capacità ma leggermente meno larghezza di banda, e il software, che è sempre stato un punto di forza. per i chip Nvidia. ®

spot_img

L'ultima intelligenza

spot_img

Parla con noi

Ciao! Come posso aiutarla?