finWeazel
Tukijäsen
- Liittynyt
- 15.12.2019
- Viestejä
- 11 111
Jossakin ketjussa joku väitti, että Nvidia ei pysty laskemaan RT:tä ja muuta yhtäaikaa.
Tämän mukaan varsinkin 3xxx sarja pystyy:
NVIDIA-ampere-GA102-GPU-Architecture-Whitepaper-V1.pdf
Katso sivu 20
Pystyy laskemaa yhtä aikaa, jos muistikaista riittää. Etenkin ne tensoriytimet voivat syödä kaiken muistikaistan ja muut osat piiristä eivät sitten käy täydellä kapasiteetilla. Tuon takia se iso huhuttu cache 40x0 sarjassa on mielenkiintoinen, kun muistikaistaongelmat voivat olla vähäisemmät.
Etenkin ei koherentit säteet ovat erittäin muistikaistarajotteisia, kun ne menevät "minne sattuu" ja cachettamisesta ei ole hyötyä. Tän näkee käytännössä siinä, että efektit mitkä lasketaan koherenteilla säteillä ovat paljon nopeampia kuin efektit missä säteet eivät ole koherentteja. Muistikaista on ihan aito ongelma, kun yritetään tehdä säteenseurantaa ja etenkin, jos siellä taustalla on vielä muita yksiköitä käytössä, jotka samaan aikaan myös haluaisivat hakea jotain muistista. Jos se BVH puu mitä käytetään säteenseurannan kiihdyttämiseen mahtuisi isoilta osin cacheen niin lopputulos olisi erittäin mielenkiintoinen,...
Viimeksi muokattu: