Aina sinä jaksat tätä samaa mantraa jauhaa että ei voi verrata. Todellisuudessa niitä voi verrata varsin hyvin. Jopa AMD CU vs nvidian SM.
RDNA-sarjassa "CU" ei ole edes ydin vaan
puolikas ydin, ja markkinointisyistä termi "CU" vaihdettiin RDNAssa laskemaan puolikkaita ytimiä, koska RDNA-ytimet (DCUt) ovat n. 2.5 kertaa suorituskykyisempiä kuin CGN-ytimet, mutta myös hiukan yli 2 kertaa isompia kuin GCN-ytimet.
GCN-ytimessä(CU) on 4*16 FMA-yksikköä, RDNA-ytimessä(DCU/WGP) 4*32 FMA-yksikköä.
Mutta AMDn markkinointi ei voinut sanoa, että vähensimme CU:iden määrää, joten keksivät sitten vaan markkinointimateriaalissaan kertoa CU-luvun kakkosella jotta saadaan lukuja, jotka korreloi lähemmin GCN:n kanssa, ja toivat uuden termiin "DCU" tarkoittamaan ydintä.
Mutta sitten kun esim. AMDn OpenCL-ajurilta kysyy, montako compute unitia piirissä on, saa vastauksen, joka on puolet siitä, mitä AMDn markkinointimateriaalissa lukee. Koska ajuri ei voi valehtella samalla tavalla kuin markkinointimateriaali, koska koodi hajoisi tai vähintään ajautuisi hitaasti, jos ajuri valehtelisi.
Meillä on esim. RX6600XT Navi 23 (32 CU) ja RX7600XT Navi 33 (32 CU)
Navi 23 tarjoaa 86% suorituskyvyn 77% kulutuksella. Eli missä se kehitys oikein on? Voisi jopa sanoa että on menty takapakkia.
Sitten kun oikeasti mitataan GPUn nopeutta ja valitaan resoluutio, joka ei ole CPU-rajoitteinen, se 6600XT tarjoaa keskimäärin vain 81% suorituskyvyn noissa testeissä.
Ja säteenjäljityksessä vain 47% suorituskyvyn.
Säteenjäljityksessä tuo 7600XT on siis yli tuplasti nopeampi kuin se 6600XT
Ja tuossa kyseisessä kortissa tuo isompi näyttömuisti myös lisää selvästi tuota sähkönkulutusta. Lisäksi tuo testattu 7600XT on joku järeämmän jäähdytyksen erikoismalli jossa voi myös jännite ja kellotaajuus olla muutamia prosentteja suurempi että saadaan pari prosenttia lisää suorituskykyä selvästi suuremmalla sähkönkulutuslisällä.
Computerbase on myös tehnyt clock for clock vertailua.
Wie profitiert AMD RDNA 2 von mehr CUs? Wie viel schneller sind 40 CUs von RDNA 2 als 40 von RDNA oder gar GCN? Der Test liefert Antworten.
www.computerbase.de
... ja näistä tulos on, että kukin RDNA2-ydin (DCU) omaa n. 2.4-kertaisen kellotaajuuskohtaisen suorituskyvyn RDNA2-ytimiiin nähden, 20 DCUta RDNA2sta antaa 39.9 FPSää ja 40 CU:ta GCN:ää 33 fps.
Todella typerää yleistää, että koska joidenkin arkkitehtuurien välillä IPC-parannukset ovat olleet hyvin pieniä, ne tulevat aina tulevaisuudessakin olemaan hyvin pieniä, ignoraten täysin vertailut niiden arkkitehtuurien välillä, joissa IPC on muuttunut suuresti.
Ja vanhempaa jossa verrattu myös nvidian sötöksiin
AMD Radeon RX 5700 (XT) im Test: Architektur-Vergleich, Preis-Leistung, Custom Designs (Update) / Navi vs. Vega vs. Turing vs. Pascal
www.computerbase.de
Tässä vertaillaan FMA-yksikkömääriä eikä ydinmääriä. Ja jos yrität tätä tulostaa yleistää, sitten saat tuloksen, että RDNA3:n pitäisi kellotaajuutta ja ydintä kohden olla 2x nopeampi kuin RDNA2, koska RDNA3ssa FMA-yksiköitä on tuplasti enemmän kuin RDNA2ssa.
Mutta rasterointiworkloadeilla se ei ole kuin hiukan nopeampi.
Mutta hienosti sekoitat täysin mielivaltaisesti FMA-yksikkömääriä, ydinmääriä, markkinointiydinmääriä ja rinnakkain suoritettavien work itemien määriä(eli kokonaislinjamääriä) keskenään.
Vertailusi menevät siis totaalisen metsään kun olet totaalisen pihalla siitä, mitä lukuja oikein vertailet. Vertailet välillä kissoja koiriin, välillä hevosia elefantteihin.