- Liittynyt
- 14.10.2016
- Viestejä
- 22 756
2. sukupolven Meta Training and Inference Accelerator eli MTIA on kooltaan 421 mm^2 ja se valmistetaan TSMC:n 5 nanometrin luokan prosessilla.
90 watin TDP:llä varustettu piiri tarjoaa matriisilaskuissa 177 tai 354 (sparsity) TFLOPSia FP16- ja BF16-tarkkuuksilla ja 354 tai 708 (sparsity) TOPSia INT8-tarkkuudella. Perinteisemmässä laskennassa sen vektoriprosessori yltää 2,76 TFLOPSiin FP32-tarkkuudella, 5,53 TFLOPSiin FP16/BF16-tarkkuudella ja 11,06 TOPSiin INT8-tarkkuudella, kun SIMD-puoli tarjoaa vielä samat 2,76 TFLOPSia FP32- ja 5,53 TFLOPSia FP16/BF16-suoritustykyä.
Piirillä on 384 kt muistia per prosessointiyksikkö sekä 256 Mt yhteistä muistia ja ulkoisen väylän päässä vielä 128 Gt LPDDR5-muistia.
MTIA-kiihdyttimet sisältävät kaksi piiriä yhden PCIe Gen 5 x16 -liittimen päässä (x8 per piiri) ja kortteja on tarkoitettu asennettavaksi 12 rinnakkain, jolloin yhteen standardiin räkkiin saadaan mahtumaan jopa 72 korttia eli 144 MTIA-piiriä.
Lähde: Meta Announces New MTIA AI Accelerator with Improved Performance to Ease NVIDIA's Grip
90 watin TDP:llä varustettu piiri tarjoaa matriisilaskuissa 177 tai 354 (sparsity) TFLOPSia FP16- ja BF16-tarkkuuksilla ja 354 tai 708 (sparsity) TOPSia INT8-tarkkuudella. Perinteisemmässä laskennassa sen vektoriprosessori yltää 2,76 TFLOPSiin FP32-tarkkuudella, 5,53 TFLOPSiin FP16/BF16-tarkkuudella ja 11,06 TOPSiin INT8-tarkkuudella, kun SIMD-puoli tarjoaa vielä samat 2,76 TFLOPSia FP32- ja 5,53 TFLOPSia FP16/BF16-suoritustykyä.
Piirillä on 384 kt muistia per prosessointiyksikkö sekä 256 Mt yhteistä muistia ja ulkoisen väylän päässä vielä 128 Gt LPDDR5-muistia.
MTIA-kiihdyttimet sisältävät kaksi piiriä yhden PCIe Gen 5 x16 -liittimen päässä (x8 per piiri) ja kortteja on tarkoitettu asennettavaksi 12 rinnakkain, jolloin yhteen standardiin räkkiin saadaan mahtumaan jopa 72 korttia eli 144 MTIA-piiriä.
Lähde: Meta Announces New MTIA AI Accelerator with Improved Performance to Ease NVIDIA's Grip