Live: io-techin kisastudio seuraa AMD:n RDNA3-näytönohjainten julkaisua kello 21:50 alkaen

Kyllä siellä jotain viilattiin, kun luvattiin 1,5x suorituskykyä per CU niille RT-yksiköille ja kellotaajuudet eivät ole nousseet edes 10 %

edit:
Menee muuten jonkin verran tehoa tuohon datansiirtoon vaikka onkin lyhyet matkat, siinä on 2,5D-paketoinnin läpi GCD:ltä 5,3 Tt/s liikennettä

Tarkoitin tuossa vaan raakaa teoreettista törmystarkastussuorituskykyä, joka on eri asia kuin tosimaailman suorituskyky.
Mutta editoinpa tuota viestiäni että tämä tulee selvemmin ilmi.

Yksiköiden määrä 1.2-kertainen ja kellotaajuudet nousseet n.8-9 % => raaka teoreettinen törmäystarkastussuorituskyky n. 1.3-kertainen.

Ja käytännön suorituskyky tosimaailmassa kuitenkin tyypillisesti/keskimäärin n. 1.6-kertainen

Eli tosiaan siellä on keskimäärin sellaiset n. 24% saatu säteenjäljitykseen käytännön suorituskykyä lisää niillä yksiköiden arkkitehtuuriparannuksilla:
1) Jonkinlaista rautatukea puun läpikäyntiin, ei ole vielä varmuutta onko se ihan täysin raudalla vai käskyjä jotka tehostaa sen softatoteutusta
2) Siellä oli raudalla myös jotain säteiden sorttausta että saadaan samalla tavalla käyttäytyvät säteen niputettua yhteen mikä parantaa L1-välimuistien osumatarkkuutta ja vähentää penaltyä siitä että eri SIMD-linjat haluaa laskea eri koodipolkuja.
3) Suuremmat puskurit siinä, montako törmäystarkastusta voi olla kerralla menossa/yksikkö. Vähemmän stallailua puskurien tullessa täyteen.
4) Paljon suurempi shader-vääntö auttaa myös säteenjäljityksessä
 
Viimeksi muokattu:
Tarkoitin tuossa vaan raakaa teoreettista törmystarkastussuorituskykyä, joka on eri asia kuin tosimaailman suorituskyky.
Mutta editoinpa tuota viestiäni että tämä tulee selvemmin ilmi.

Yksiköiden määrä 1.2-kertainen ja kellotaajuudet nousseet n.8-9 % => raaka teoreettinen törmäystarkastussuorituskyky n. 1.3-kertainen.

Ja käytännön suorituskyky tosimaailmassa kuitenkin tyypillisesti/keskimäärin n. 1.6-kertainen

Eli tosiaan siellä on keskimäärin sellaiset n. 25% saatu säteenjäljitykseen käytännön suorituskykyä lisää niillä yksiköiden arkkitehtuuriparannuksilla:
1) Jonkinlaista rautatukea puun läpikäyntiin, ei ole vielä varmuutta onko se ihan täysin raudalla vai käskyjä jotka tehostaa sen softatoteutusta
2) Siellä oli raudalla myös jotain säteiden sorttausta että saadaan samalla tavalla käyttäytyvät säteen niputettua yhteen mikä parantaa L1-välimuistien osumatarkkuutta ja vähentää penaltyä siitä että eri SIMD-linjat haluaa laskea eri koodipolkuja.
3) Suuremmat puskurit siinä, montako törmäystarkastusta voi olla kerralla menossa/yksikkö. Vähemmän stallailua puskurien tullessa täyteen.
4) Paljon suurempi shader-vääntö auttaa myös säteenjäljityksessä
Siis sanoivat tosiaan että olisi 1,5x RT-suorituskyky per CU, ei koko piirille
1667518277993.png
 
Viimeksi muokattu:
Siis sanoivat tosiaan että olisi 1,5x RT-suorituskyky per CU, ei koko piirille
1667518277993.png

Tuossa on tuo pienellä nuo oleelliset sanat "up to" eli parhaassa tapauksessa (jossa RDNA2 jäi hyvin kauaksi teoreettisesta nopeudestaan) niin.

Ja tästä se 8-9% tulee kelloista eli tässä yhdessä tapauksessa arkkitehtuuriparannukset antaa siinä parhaass tapauksessa sen nm 1.38x parannuksen.

Keskimäärin parannus niiden omienkin bechmarkkien perusteella kuitenkin n. 1.6/1.2=1.33x, josta se n. 8-9 % tulee kelloista ja loput, n. 24% tulee arkkitehtuuriparannuksista.
 
7900xt tais olla täysi piiri, eli amd pisti kaiken poislukien mahdollisesti kellotaajuuksien osalta binnatut piirit pöytään heti julkaisussa? Myöhemmin sitten päivityksenä voisi tulla parhaiten kellottuvat piirit kera nopeampien muistien ja mahdollisesti samalla annetaan kortin hörpätä enemmän virtaa. Tuo olisi hypoteettinen 7950xt?

Tai vaihtavat vain MCM chipletit isommalla cachella oleviin 2023 refreshissä.
 
Tästä julkkarista tuli kyllä vähän mieleen oliko se 2007 tjsp. kun ATI julkaisi 3870:n. Sitä ennen olivat kisailleet nvidian kanssa siitä että kummalla on isompi piiri ja leveämpi muistikaista ja piireistä oli tulossa ihan törkeän kalliita. Päättivät sitten että tehdäänpä sittenkin piiri joka on vain vähän hitaampi mutta paljon halvempi.
 
Tai vaihtavat vain MCM chipletit isommalla cachella oleviin 2023 refreshissä.
Molempia huhuja on ollut ilmassa. Isompaa piiriä ja vcache versio missä tulisi 96MB lisää cachea. On ollut myös huhuja peruutuksista. Ei ole oikein selkeää trendiä huhuissa,jota uskaltaisi uskoa tässä kohtaa.
 

Uusimmat viestit

Statistiikka

Viestiketjuista
258 637
Viestejä
4 494 416
Jäsenet
74 265
Uusin jäsen
Oranta

Hinta.fi

Back
Ylös Bottom