- Liittynyt
- 22.10.2016
- Viestejä
- 11 765
Kyllä siellä jotain viilattiin, kun luvattiin 1,5x suorituskykyä per CU niille RT-yksiköille ja kellotaajuudet eivät ole nousseet edes 10 %
edit:
Menee muuten jonkin verran tehoa tuohon datansiirtoon vaikka onkin lyhyet matkat, siinä on 2,5D-paketoinnin läpi GCD:ltä 5,3 Tt/s liikennettä
Tarkoitin tuossa vaan raakaa teoreettista törmystarkastussuorituskykyä, joka on eri asia kuin tosimaailman suorituskyky.
Mutta editoinpa tuota viestiäni että tämä tulee selvemmin ilmi.
Yksiköiden määrä 1.2-kertainen ja kellotaajuudet nousseet n.8-9 % => raaka teoreettinen törmäystarkastussuorituskyky n. 1.3-kertainen.
Ja käytännön suorituskyky tosimaailmassa kuitenkin tyypillisesti/keskimäärin n. 1.6-kertainen
Eli tosiaan siellä on keskimäärin sellaiset n. 24% saatu säteenjäljitykseen käytännön suorituskykyä lisää niillä yksiköiden arkkitehtuuriparannuksilla:
1) Jonkinlaista rautatukea puun läpikäyntiin, ei ole vielä varmuutta onko se ihan täysin raudalla vai käskyjä jotka tehostaa sen softatoteutusta
2) Siellä oli raudalla myös jotain säteiden sorttausta että saadaan samalla tavalla käyttäytyvät säteen niputettua yhteen mikä parantaa L1-välimuistien osumatarkkuutta ja vähentää penaltyä siitä että eri SIMD-linjat haluaa laskea eri koodipolkuja.
3) Suuremmat puskurit siinä, montako törmäystarkastusta voi olla kerralla menossa/yksikkö. Vähemmän stallailua puskurien tullessa täyteen.
4) Paljon suurempi shader-vääntö auttaa myös säteenjäljityksessä
Viimeksi muokattu: