AMD:n CDNA2 "Aldebaran" -laskentakortissa on peräti 128 Gt HBM2e-muistia

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 663
AMD on varmistanut Linux-päivityksissään maksimissaan 128 Gt:n HBM2e-muistit Aldebaran-laskentakortteihin.
Aldebaran tulee rakentumaan kahdesta laskentasirusta, joista kummallakin on neljä muistiohjainta, jotka käsittelevät 8 kanavaa kukin. Kunkin kanavan jatkeena on 2 Gt HBM2e -muistia, jolloin yhden piirin parina on 64 ja koko kortin 128 Gt muistia.

Lähde: Linux Prepares For AMD Servers With Aldebaran GPU Nodes Sporting HBM2 - Phoronix
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 663
Nimimerkki Locuza_ on julkaissut Twitterissä blokkidiagrammiluonnoksen laskentakortista sekä joitain muita tietoja siihen liittyen

Kummassakin sirussa kerrotaan olevan 128 Compute Unit -yksikköä, eli yhteensä peräti 16 384 Stream-prosessoria. Tyypillisesti GPU:n kohdalla FP64 tuki on parhaimmillaankin puolet FP32-suorituskyvystä, mutta Aldebaranissa FP64:n kerrotaan toimivan täydellä nopeudella ja pakattuja FP32-laskuja saadaan laskettua kaksinkertaisella nopeudella.
Matrix Engine -matriisimurskainten kerrotaan tukevan nyt FP64-tarkkuutta, jonka lisäksi BFloat16 tukea on nopeutettu FP16:n tasolle.

 

IcePen

Typo Generaatroti ;-)
Tukijäsen
Liittynyt
17.10.2016
Viestejä
6 001
"Tyypillisesti GPU:n kohdalla FP64 tuki on parhaimmillaankin puolet FP32-suorituskyvystä, mutta Aldebaranissa FP64:n kerrotaan toimivan täydellä nopeudella ja pakattuja FP32-laskuja saadaan laskettua kaksinkertaisella nopeudella "

Eli Aldebaranissakin FP64 kyky on puolet FP32 kyvystä ts kokolause on +-0 :srofl:
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 663
"Tyypillisesti GPU:n kohdalla FP64 tuki on parhaimmillaankin puolet FP32-suorituskyvystä, mutta Aldebaranissa FP64:n kerrotaan toimivan täydellä nopeudella ja pakattuja FP32-laskuja saadaan laskettua kaksinkertaisella nopeudella "

Eli Aldebaranissakin FP64 kyky on puolet FP32 kyvystä ts kokolause on +-0 :srofl:
Ei ole. Vain Packed FP32 on tuplat FP64 verrattuna. Kaikkia FP32 käskyjä ei voi pakata yhteen suoritettavaksi kerralla, jolloin tuo saavutetaan. Jos suoritetaan yhtä käskyä nopeus on sama kuin FP64llä
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 663

1625501569703.png


Aussit tulee käyttämään Aldebarania / MI200:sta
 
Liittynyt
14.12.2016
Viestejä
252



Aussit tulee käyttämään Aldebarania / MI200:sta
Näin tavallisena käyttäjänä: 200000 cores? Tuo on ihan mieletön määrä ytimiä.

750+ gpus? Millainen määrä emovevyjä tarvitaan että tämä ehto täyttyy? 2 kpl/emo = 375 emoa.

Kun lasketaan 375 emoa/200000 säiettä, se tarkoittaa 533,xxx säiettä per emolevy. Kuinka monta Corea per suoritin?

540 Tb+ system memory? En edes biitsi laskea, paljonko se tekee per säie. Enemmän, kuin riittävästi?

Nörtti ihmeissään.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 663
Näin tavallisena käyttäjänä: 200000 cores? Tuo on ihan mieletön määrä ytimiä.

750+ gpus? Millainen määrä emovevyjä tarvitaan että tämä ehto täyttyy? 2 kpl/emo = 375 emoa.

Kun lasketaan 375 emoa/200000 säiettä, se tarkoittaa 533,xxx säiettä per emolevy. Kuinka monta Corea per suoritin?

540 Tb+ system memory? En edes biitsi laskea, paljonko se tekee per säie. Enemmän, kuin riittävästi?

Nörtti ihmeissään.
Ei tuo 200 000 ydintä olisi "kuin" 3125 prosessoria, todennäköisesti oikea luku on jotain 3200 prossua tms.
548+ Tt muistia taas olisi tuolla prossumäärällä about 175 Gt per prosessori, eli ei edes älyttömän paljon (toki lukema on selvästi väärä, koska prossujen ja muistien määrät on arvioita)
Nuo on palvelimia, kyllä niitä laskentakortteja menee enemmän kuin kaksi per palvelin. Esimerkiksi 4 ja 8 on aika yleisiä ulkomuistista. Tuplat jos näyttiksiä pistetään sekä riviin että perätysten. Ja Aldebaranin kohdalla jokainen laskentakortti on vielä 2 GPU:ta.
 
Toggle Sidebar

Uusimmat viestit

Statistiikka

Viestiketjut
242 392
Viestejä
4 235 673
Jäsenet
71 197
Uusin jäsen
Fomppa

Hinta.fi

Ylös Bottom