Live: io-techin kisastudio seuraa AMD:n RDNA3-näytönohjainten julkaisua kello 21:50 alkaen

hkultala · 04.11.2022

Kaotik sanoi:
Kyllä siellä jotain viilattiin, kun luvattiin 1,5x suorituskykyä per CU niille RT-yksiköille ja kellotaajuudet eivät ole nousseet edes 10 %

edit:
Menee muuten jonkin verran tehoa tuohon datansiirtoon vaikka onkin lyhyet matkat, siinä on 2,5D-paketoinnin läpi GCD:ltä 5,3 Tt/s liikennettä

Tarkoitin tuossa vaan raakaa teoreettista törmystarkastussuorituskykyä, joka on eri asia kuin tosimaailman suorituskyky.
Mutta editoinpa tuota viestiäni että tämä tulee selvemmin ilmi.

Yksiköiden määrä 1.2-kertainen ja kellotaajuudet nousseet n.8-9 % => raaka teoreettinen törmäystarkastussuorituskyky n. 1.3-kertainen.

Ja käytännön suorituskyky tosimaailmassa kuitenkin tyypillisesti/keskimäärin n. 1.6-kertainen

Eli tosiaan siellä on keskimäärin sellaiset n. 24% saatu säteenjäljitykseen käytännön suorituskykyä lisää niillä yksiköiden arkkitehtuuriparannuksilla:
1) Jonkinlaista rautatukea puun läpikäyntiin, ei ole vielä varmuutta onko se ihan täysin raudalla vai käskyjä jotka tehostaa sen softatoteutusta
2) Siellä oli raudalla myös jotain säteiden sorttausta että saadaan samalla tavalla käyttäytyvät säteen niputettua yhteen mikä parantaa L1-välimuistien osumatarkkuutta ja vähentää penaltyä siitä että eri SIMD-linjat haluaa laskea eri koodipolkuja.
3) Suuremmat puskurit siinä, montako törmäystarkastusta voi olla kerralla menossa/yksikkö. Vähemmän stallailua puskurien tullessa täyteen.
4) Paljon suurempi shader-vääntö auttaa myös säteenjäljityksessä

Kaotik · 04.11.2022

hkultala sanoi:
Tarkoitin tuossa vaan raakaa teoreettista törmystarkastussuorituskykyä, joka on eri asia kuin tosimaailman suorituskyky.
Mutta editoinpa tuota viestiäni että tämä tulee selvemmin ilmi.

Yksiköiden määrä 1.2-kertainen ja kellotaajuudet nousseet n.8-9 % => raaka teoreettinen törmäystarkastussuorituskyky n. 1.3-kertainen.

Ja käytännön suorituskyky tosimaailmassa kuitenkin tyypillisesti/keskimäärin n. 1.6-kertainen

Eli tosiaan siellä on keskimäärin sellaiset n. 25% saatu säteenjäljitykseen käytännön suorituskykyä lisää niillä yksiköiden arkkitehtuuriparannuksilla:
1) Jonkinlaista rautatukea puun läpikäyntiin, ei ole vielä varmuutta onko se ihan täysin raudalla vai käskyjä jotka tehostaa sen softatoteutusta
2) Siellä oli raudalla myös jotain säteiden sorttausta että saadaan samalla tavalla käyttäytyvät säteen niputettua yhteen mikä parantaa L1-välimuistien osumatarkkuutta ja vähentää penaltyä siitä että eri SIMD-linjat haluaa laskea eri koodipolkuja.
3) Suuremmat puskurit siinä, montako törmäystarkastusta voi olla kerralla menossa/yksikkö. Vähemmän stallailua puskurien tullessa täyteen.
4) Paljon suurempi shader-vääntö auttaa myös säteenjäljityksessä

Siis sanoivat tosiaan että olisi 1,5x RT-suorituskyky per CU, ei koko piirille

hkultala · 04.11.2022

Kaotik sanoi:
Siis sanoivat tosiaan että olisi 1,5x RT-suorituskyky per CU, ei koko piirille

Tuossa on tuo pienellä nuo oleelliset sanat "up to" eli parhaassa tapauksessa (jossa RDNA2 jäi hyvin kauaksi teoreettisesta nopeudestaan) niin.

Ja tästä se 8-9% tulee kelloista eli tässä yhdessä tapauksessa arkkitehtuuriparannukset antaa siinä parhaass tapauksessa sen nm 1.38x parannuksen.

Keskimäärin parannus niiden omienkin bechmarkkien perusteella kuitenkin n. 1.6/1.2=1.33x, josta se n. 8-9 % tulee kelloista ja loput, n. 24% tulee arkkitehtuuriparannuksista.

hese_e · 04.11.2022

finWeazel sanoi:
7900xt tais olla täysi piiri, eli amd pisti kaiken poislukien mahdollisesti kellotaajuuksien osalta binnatut piirit pöytään heti julkaisussa? Myöhemmin sitten päivityksenä voisi tulla parhaiten kellottuvat piirit kera nopeampien muistien ja mahdollisesti samalla annetaan kortin hörpätä enemmän virtaa. Tuo olisi hypoteettinen 7950xt?

Tai vaihtavat vain MCM chipletit isommalla cachella oleviin 2023 refreshissä.

moukula · 04.11.2022

Tästä julkkarista tuli kyllä vähän mieleen oliko se 2007 tjsp. kun ATI julkaisi 3870:n. Sitä ennen olivat kisailleet nvidian kanssa siitä että kummalla on isompi piiri ja leveämpi muistikaista ja piireistä oli tulossa ihan törkeän kalliita. Päättivät sitten että tehdäänpä sittenkin piiri joka on vain vähän hitaampi mutta paljon halvempi.

finWeazel · 04.11.2022

hese_e sanoi:
Tai vaihtavat vain MCM chipletit isommalla cachella oleviin 2023 refreshissä.

Molempia huhuja on ollut ilmassa. Isompaa piiriä ja vcache versio missä tulisi 96MB lisää cachea. On ollut myös huhuja peruutuksista. Ei ole oikein selkeää trendiä huhuissa,jota uskaltaisi uskoa tässä kohtaa.

Live: io-techin kisastudio seuraa AMD:n RDNA3-näytönohjainten julkaisua kello 21:50 alkaen

hkultala

BANNATTU

Kaotik

Banhammer

hkultala

BANNATTU

hese_e

moukula

finWeazel

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi