Kyllä se ring bus skaalautuu yli 8 ytimelle. Ongelmana on vaan, että välimuistilatenssit ytimeltä toiselle alkavat heikkenemään ja siellä alkaa ydinmäärän noustessa tulemaan suorituskykyhittiä. Tähän mennessä työpöytäprossuista 10-ytiminen 6950X on ollut ydinmäärältään isompi ringillä varustettu prosessori.
The Intel Xeon E5 v4 Review: Testing Broadwell-EP With Demanding Server Workloads
Broadwell-E Xeoneissa isoimmassa versiossaan on fyysisesti 24 ydintä (käytössä vähemmän) ja kuten yo. artikkelista näkyy, niin siellä on varsin mielenkiintoinen tupla-ring viritelmä käytössä eli kaksi toisiinsa liitettyä 12 ytimen ringiä. En muista tähän hätään onko joku ajellut koskaan latenssitestejä tuollaisella mutta voi L3-hakuajat heitellä aika villisti riippuen siitä kuinka fyysisesti etäällä välimuistista haettava data on.
Intel Announces Skylake-X: Bringing 18-Core HCC Silicon to Consumers for $1999
Meshissä käsittääkseni oli ideana saada noita hakuaikojen eroja tasaisemmaksi. Siinä hötäkässä (BW-E > SKL-X) kyllä meni kaikkea muutakin mukavaa välimuistien osalta uusiksi kuten L2 isommaksi per core, L3 pienemmäksi per core ja muutos inclusive > exclusive.
Se, miten näin iso muutos välimuisteissa näkyy onkin sitten ihan ohjelmasta kiinni. Mesh-prossujen välimuistilatenssit ovat olleet korkeammat ja peleissä SKL-X/CL-X per core suorituskyky ei ole ollut samaan aikaan markkinoilla olleiden ring bus-prossujen tasolla.