AMD:n patentti kuvailee MCM GPU:n toimintaa:
Digital Foundryn Alex kiteytti homman kommenteissa yhdellä lauseella, "checkerboard SFR returns".
Huomioita tuosta:
* Pikselit jaetaan staattisesti eri GPUiden välille pienissä tiilissä. Ekan tiilin pikselit kuuluu ekalle chipletille, tokan tiilen pikselit toiselle jne.
* Koko geometriapuoli lasketaan moneen kertaan, joka chiplet laskee samat asiat uudestaan. Tässä tehdään selvästi redundanttia työtä.
* L1- ja L2-välimuistit on chipleteillä, L3-välimuisti siltapiirillä joka kytkee varsinaiset GPU-piilastut toisiinsa. Tuon L3-välimuistin paikan olin saattanut käsittäää väärin aiemmista patenteista.
* L2 välimuistit ovat saman chipletin sisällä koherentteja, mutta eivät ole koherentteja eri chiplettien välillä. Kun pikselit on staattisesti jaettu chiplettien välillä, tämä ei framepuskureissa tuota ongelmia.
* Peruskonfiguraatiossa L3-kakku on memory-side cache, sijaitsee loogisesti crossbarin ja muistiohjaimen välissä eikä ytimen (tai L2-välimuistin) ja crossbarin välissä, tosin mainitaan myös optio siirtää L3-välimuisti toiselle puolelle crossbaria.
* Se, että L3-kakku on siltapiirillä kuitenkin käytännössä tarkoittaa, että muistiaccessit myös oman chipletin muistiohjaimeen kytkettyyn muistiin kulkee osittain siltapiirin kautta, kun pitää vähintään tehdä siellä olevalta välimuistilta osumatarkistus.
Jos miettii tämän ratkaisun vahvuuksia ja heikkouksia, niin:
1) Paljon pieniä kolmioita ja monimutkaiset geometriapuolen shaderit sisältävä rasteroitu kama toimii tällä hitaasti, koska (redundantisti moneen kertaan tehtävä) geometriapuoli tulee enemmän pullonkaulaksi kuin normaalilla monoliittipiirillä jossa geometriapuoli tehdään vain kerran ja kaikki (ison) piirin resurssit on käytettävissä tähän
2) Säteenjäljitykselle tämä toimii täydellisesti, siinä piirtäminen lähdetään kuitenkin pikseleistä (eikä kolmioista) lähtien eikä mitään työtä tarvi duplikoida.
Omaa (vähän villimpää) spekulaatiota vielä:
Mikäli siltapiirillä oleva välimuisti on SRAMia, ei saada mitään suuria hyötyjä sen valmistamisesta eri valmistusprosessilla kuin itse GPU-chiplettien, mutta:
Periaatteessa tämä rakenne voisi avata tuulahduksen menneisyyteen: Entäs jos siltapiirin tekisikin jollain vanhalla/isolla (esim. GFn "22nm" FD-SOI)-prosessilla ja sen L3-kakun toteuttaisi eDRAMina. Pienemmät valmistustekniikat siis soveltuvat huonosti eDRAMille. Tällä "22FDX"-prosessilla eDRAMina se siltapiiri voisi tulla halvemmmaksi kuin uudella valmistustekniikalla SRAMina.
En siis spekuloi että näin välttämättä olisi, vaan sanon vaan, että olisi mahdollista, kuoleva eDRAM voisi vielä tehdä yhden (hetken aikaa kestävän) paluun tämän kautta.