Live: io-techin kisastudio seuraa AMD:n RDNA3-näytönohjainten julkaisua kello 21:50 alkaen

Liittynyt
22.10.2016
Viestejä
11 133
Kyllä siellä jotain viilattiin, kun luvattiin 1,5x suorituskykyä per CU niille RT-yksiköille ja kellotaajuudet eivät ole nousseet edes 10 %

edit:
Menee muuten jonkin verran tehoa tuohon datansiirtoon vaikka onkin lyhyet matkat, siinä on 2,5D-paketoinnin läpi GCD:ltä 5,3 Tt/s liikennettä
Tarkoitin tuossa vaan raakaa teoreettista törmystarkastussuorituskykyä, joka on eri asia kuin tosimaailman suorituskyky.
Mutta editoinpa tuota viestiäni että tämä tulee selvemmin ilmi.

Yksiköiden määrä 1.2-kertainen ja kellotaajuudet nousseet n.8-9 % => raaka teoreettinen törmäystarkastussuorituskyky n. 1.3-kertainen.

Ja käytännön suorituskyky tosimaailmassa kuitenkin tyypillisesti/keskimäärin n. 1.6-kertainen

Eli tosiaan siellä on keskimäärin sellaiset n. 24% saatu säteenjäljitykseen käytännön suorituskykyä lisää niillä yksiköiden arkkitehtuuriparannuksilla:
1) Jonkinlaista rautatukea puun läpikäyntiin, ei ole vielä varmuutta onko se ihan täysin raudalla vai käskyjä jotka tehostaa sen softatoteutusta
2) Siellä oli raudalla myös jotain säteiden sorttausta että saadaan samalla tavalla käyttäytyvät säteen niputettua yhteen mikä parantaa L1-välimuistien osumatarkkuutta ja vähentää penaltyä siitä että eri SIMD-linjat haluaa laskea eri koodipolkuja.
3) Suuremmat puskurit siinä, montako törmäystarkastusta voi olla kerralla menossa/yksikkö. Vähemmän stallailua puskurien tullessa täyteen.
4) Paljon suurempi shader-vääntö auttaa myös säteenjäljityksessä
 
Viimeksi muokattu:

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 615
Tarkoitin tuossa vaan raakaa teoreettista törmystarkastussuorituskykyä, joka on eri asia kuin tosimaailman suorituskyky.
Mutta editoinpa tuota viestiäni että tämä tulee selvemmin ilmi.

Yksiköiden määrä 1.2-kertainen ja kellotaajuudet nousseet n.8-9 % => raaka teoreettinen törmäystarkastussuorituskyky n. 1.3-kertainen.

Ja käytännön suorituskyky tosimaailmassa kuitenkin tyypillisesti/keskimäärin n. 1.6-kertainen

Eli tosiaan siellä on keskimäärin sellaiset n. 25% saatu säteenjäljitykseen käytännön suorituskykyä lisää niillä yksiköiden arkkitehtuuriparannuksilla:
1) Jonkinlaista rautatukea puun läpikäyntiin, ei ole vielä varmuutta onko se ihan täysin raudalla vai käskyjä jotka tehostaa sen softatoteutusta
2) Siellä oli raudalla myös jotain säteiden sorttausta että saadaan samalla tavalla käyttäytyvät säteen niputettua yhteen mikä parantaa L1-välimuistien osumatarkkuutta ja vähentää penaltyä siitä että eri SIMD-linjat haluaa laskea eri koodipolkuja.
3) Suuremmat puskurit siinä, montako törmäystarkastusta voi olla kerralla menossa/yksikkö. Vähemmän stallailua puskurien tullessa täyteen.
4) Paljon suurempi shader-vääntö auttaa myös säteenjäljityksessä
Siis sanoivat tosiaan että olisi 1,5x RT-suorituskyky per CU, ei koko piirille
1667518277993.png
 
Viimeksi muokattu:
Liittynyt
22.10.2016
Viestejä
11 133
Siis sanoivat tosiaan että olisi 1,5x RT-suorituskyky per CU, ei koko piirille
Tuossa on tuo pienellä nuo oleelliset sanat "up to" eli parhaassa tapauksessa (jossa RDNA2 jäi hyvin kauaksi teoreettisesta nopeudestaan) niin.

Ja tästä se 8-9% tulee kelloista eli tässä yhdessä tapauksessa arkkitehtuuriparannukset antaa siinä parhaass tapauksessa sen nm 1.38x parannuksen.

Keskimäärin parannus niiden omienkin bechmarkkien perusteella kuitenkin n. 1.6/1.2=1.33x, josta se n. 8-9 % tulee kelloista ja loput, n. 24% tulee arkkitehtuuriparannuksista.
 
Liittynyt
20.10.2016
Viestejä
3 433
7900xt tais olla täysi piiri, eli amd pisti kaiken poislukien mahdollisesti kellotaajuuksien osalta binnatut piirit pöytään heti julkaisussa? Myöhemmin sitten päivityksenä voisi tulla parhaiten kellottuvat piirit kera nopeampien muistien ja mahdollisesti samalla annetaan kortin hörpätä enemmän virtaa. Tuo olisi hypoteettinen 7950xt?
Tai vaihtavat vain MCM chipletit isommalla cachella oleviin 2023 refreshissä.
 
Liittynyt
17.10.2016
Viestejä
2 526
Tästä julkkarista tuli kyllä vähän mieleen oliko se 2007 tjsp. kun ATI julkaisi 3870:n. Sitä ennen olivat kisailleet nvidian kanssa siitä että kummalla on isompi piiri ja leveämpi muistikaista ja piireistä oli tulossa ihan törkeän kalliita. Päättivät sitten että tehdäänpä sittenkin piiri joka on vain vähän hitaampi mutta paljon halvempi.
 

finWeazel

Chief Karpfen
Liittynyt
15.12.2019
Viestejä
8 031
Tai vaihtavat vain MCM chipletit isommalla cachella oleviin 2023 refreshissä.
Molempia huhuja on ollut ilmassa. Isompaa piiriä ja vcache versio missä tulisi 96MB lisää cachea. On ollut myös huhuja peruutuksista. Ei ole oikein selkeää trendiä huhuissa,jota uskaltaisi uskoa tässä kohtaa.
 
Toggle Sidebar

Statistiikka

Viestiketjut
241 175
Viestejä
4 214 562
Jäsenet
71 011
Uusin jäsen
Alibisyotto

Hinta.fi

Ylös Bottom