Vuoto: Intelin Diamond Rapids Xeonissa tulee olemaan jopa 192 P-ydintä

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
23 747
x86deadisback on twiitannut X:ssä väitetyn Intelin dian, jossa kuvaillaan Oak Stream -alustaa ja sen Diamond Rapids -prosessoria.

Dian mukaan Diamond Rapidsissa tulee olemaan kaksi I/O-sirua ja neljä Compute-sirua. Compute-siruissa on kussakin käytössä maksimissaan 48 eli yhteensä 192 P-ydintä. Arkkitehtuurin parannuksiksi listataan ainakin parempi AMX-suorituskyky, kiitos natiivin tuen TF32- ja FP8-tarkkuuksille.

I/O-sirut on varustettu kahdeksalla DDR-muistikanavalla, PCIe 6.0-, CXL 3-, UPI 3-väylillä sekä neljällä PCIe 4.0 -linjalla. Twiitin mukaan saataville tulee sekä 8- että 16-muistikanavaisia versioita, mutta se ei tarkenna onko versioissa muita eroja.

Prosessorin TDP-arvoksi kerrotaan maksimissaan 500 wattia ja se on tulossa saataville 1S-, 2S- ja 4S-konfiguraatioissa tarpeiden mukaan.



Lähde: Intel's Xeon 7 'Diamond Rapids' to reportedly pack 192 cores, 16 memory channels, and 500 watts of power consumption
 
192 ydintä ja 500 wattia tarkoittaa n. 2.6 wattia/ydin kun kaikki on käytössä.

.... mikä on aivan liian vähän P-ytimille; Jos on kaikki ytimet käytössä, pitää niitä ajaa niin matalilla kelloilla että E-ytimet olisi käytännössä kokonaislukuworkloadeilla nopeampia kun niitä ei tarvisi lämmön/virrankulutuksen takia ajaa niin pienellä kelloilla.

Mutta, P-ytimet on varmaan tähän valittu koska
1) E-ytimien SIMD-tuki on liian hidas eikä niissä ole tukea AMX:lle, jos halutaan hyvää numeronmurskausnopeutta, E-ytimet ei ole vaihtoehto.
2) Halutaan maksimaalinen nopeus myös tilanteessa jossa vain pieni määrä säikeitä on aktiivisena
 
192 ydintä ja 500 wattia tarkoittaa n. 2.6 wattia/ydin kun kaikki on käytössä.

.... mikä on aivan liian vähän P-ytimille; Jos on kaikki ytimet käytössä, pitää niitä ajaa niin matalilla kelloilla että E-ytimet olisi käytännössä kokonaislukuworkloadeilla nopeampia kun niitä ei tarvisi lämmön/virrankulutuksen takia ajaa niin pienellä kelloilla.

Mutta, P-ytimet on varmaan tähän valittu koska
1) E-ytimien SIMD-tuki on liian hidas eikä niissä ole tukea AMX:lle, jos halutaan hyvää numeronmurskausnopeutta, E-ytimet ei ole vaihtoehto.
2) Halutaan maksimaalinen nopeus myös tilanteessa jossa vain pieni määrä säikeitä on aktiivisena
Äkkiä laskettuna Intel® Xeon® 6787P prossusta: 350W/86 ~ 4,07 W/ydin. 18Å node on intelin mukaan noin 36% energiatehokkaampi samoilla kelloilla kuin intel 3, eli 4.07 × (1 - 0.36) = 2.60 W/ydin. Eli oisko base clock tuon 2GHz ja siitä kellot ylöspäin kuorman mukaan.
 
Mutta, P-ytimet on varmaan tähän valittu koska
1) E-ytimien SIMD-tuki on liian hidas eikä niissä ole tukea AMX:lle, jos halutaan hyvää numeronmurskausnopeutta, E-ytimet ei ole vaihtoehto.
Varmaankin haettu eroja https://www.amd.com/en/products/processors/server/epyc/9005-series/amd-epyc-9965.html joka taitaa olla 5c ytimillä. Mielenkiintoista käykö tässä AVX512 uudestaan. Kai Intel yrittää tarjota jotakin kilpailukykyistä omasta valikoimastaan kun EPYC + Instinct tyylistä ratkaisua ei ole tarjota.
 
Minkäköhän verran saataisiin suorituskykyä lisää, jos kaikki tietoturvaominaisuudet unohdettaisiin ja optimoitaisiin vain ja ainoastaan puhtaaseen suorituskykynopeuteen sekä prossu että käyttis ja ohjelmisto.. Sellainen prossu kelpaisi kuitenin hyvin suureen osaan käyttötarkoituksista..
 
Minkäköhän verran saataisiin suorituskykyä lisää, jos kaikki tietoturvaominaisuudet unohdettaisiin ja optimoitaisiin vain ja ainoastaan puhtaaseen suorituskykynopeuteen sekä prossu että käyttis ja ohjelmisto.. Sellainen prossu kelpaisi kuitenin hyvin suureen osaan käyttötarkoituksista..
Vertaa Applen M sarjan suorituskykyä vastaaviin perus ARM laitteisiin niin saa jotain suuntaviivoja.
 

Statistiikka

Viestiketjuista
281 987
Viestejä
4 847 382
Jäsenet
78 330
Uusin jäsen
Sinco

Hinta.fi

Back
Ylös Bottom