On sillä sen verran tekemistä että noin järeä IO veisi monoliittisestä sirusta aika paljon pintaalaa.
Ei merkittävästi. Tuossa kuva Skylake-SP-XCCstä:
Francois muuten omalla Intelin pelastus videollaan pohti että Intelin pitäisi alkaa tuomaan markkinoille serveri prossuja joissa AVX on tiputettu pois kun on niin paljon kaikkee missä AVX:llä ei tee mitään. Tällä hänen mukaan säästettäisiin 10% joka voitaisiin käyttää lisä coreihin.
Hänen mukaansa SIMD juna prossu puolella meni jo, että SIMD kannattaa nykyään toteuttaa GPU:lla.
Mielenkiintoinen näkemysmuutos kaverilta joka vielä hetki sitten rummutti kovin AVX-512 nimeen.
Francois on äänekäs fanipoika joka on ollut joskus töissä Intelillä lähinnä ajelemassa benchmarkkeja, ei paljoa suunnittelemassa prosessorien arkkitehtuureita.
Tuosta SIMDin siirtymisestä GPUille:
Markkinoilla ei ole tällä hetkellä
yhtään sellaista PC-järjestelmää, jossa tehokas CPU ja GPU pystyvät jakamaan dataa tehokkaasti keskenään. Ja tässä on kaksi ongelmaa, sekä kaistan puute että välimuistikoherenttiuden puute.
CPU pystyy tekemään
satoja laskutoimituksia jollekin datalle samassa ajassa kun se data siirtyy CPUlta GPUlle ja takaisin nykyisiä väyliä pitkin.
Ja mikäli CPU ja GPU eivät pysty käyttämään samaa muistia välimuistikoherentisti, vähänkään monimutkaisempien jaettujen tietorakenteiden käyttö GPUn puolelta mene hyvin hankalaksi ja tehottomaksi.
Eli, maailma on täynnä koodia, jonka
laskennan lähettämisessä ulkoiselle GPUlle ei vaan ole mitään järkeä CPUn ja GPUn välisen kommunikaation hitauden ja ongelmallisuuden takia.
Ja ei, mikään PCIe4 ei millään tavalla ratkaise tätä kun se vaan parantaa sitä nopeutta kaksinkertaiseksi samassa ajassa kun CPUiden laskentateho vaan enemmän kuin kaksinkertaistuu, eli tämä kaula vaan kasvaa.
Välimuistikoherentti linkki CPUn ja erillis-GPUn välillä taitaa IBMltä löytyä jostain POWER-sarjan koneista, ja sellaisen tulosta PC-puolelle on puhuttu, mutta tämä ei ole vielä materialisoitunut ja tämä ei ratkaise kaistapullonkaulaa.
SIMD-laskennan siirtyminen GPUlle suuressa mittakaavassa onnistuu vasta siinä vaiheessa kun se tehokas GPU on samalla piilastulla kuin se CPU tai korkeintaan samassa paketissa hyvin nopean väylän päässä, ja molemmat käyttävät yhteistä muistia päämuistinaan.
AMDltä on odoteltu jo aika pitkään niitä fuusio-piirejä/APUja joissa se GPU olisi oikeasti tehokas, tämänkin takia, mutta aina tungettu vaan melko mopo GPU sinne PC-puolelle myytäviin piireihin. Käytännössä ainoat piirit millä tämä nyt onnistuu on siis konsolien piirit.
Ja Francois valittaa myös siitä, että "leveä SIMD kuluttaa paljon sähköä".
Fakta vaan sattuu olemaan se, että leveä SIMD on
selvästi energiatehokkain tapa laskea asioita ohjelmoitavalla prosessorilla. Se, että sama suorituskyky yritetään saada kapeammalla SIMDillä suuremmalla määrällä ytimiä johtaa vaan
selvästi suurempaan tehonkulutukseen ja huonompaan suorituskykyyn niissä tilanteissa joissa se leveä SIMD kuluttaa paljon sähköä.