AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Nerkoon · 17.09.2020

Odotettavissa siis kohtuullinen muistimäärä uusille korteille

Kikkoman · 17.09.2020

Ainakaan itse en pety yhtään vaikka Big Navi osuisi tehoiltaan RTX3070:n luokkaan (eli vähän alle tai päälle) kunhan hinta on sopiva suhteessa kilpailijaan. Ei minusta tarvitse tulla sitä kirkkaasti parasta ja nopeinta korttia, vaan itselleni tuo tarkoittaisi vain sitä, että valinnanvaraa on enemmän. Voi sitten katsoa että kumman valmistajan kortti antaa enemmän vastinetta rahalle.

Omaan tarpeeseen paras olisi melkeimpä hinnaltaan ja tehoiltaan 3070 ja 3080:n välimaastoon sijoittuva kortti.

pomk · 17.09.2020

Nerkoon sanoi:
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Odotettavissa siis kohtuullinen muistimäärä uusille korteille

Eli 512 ja 384 bittiset muistiväylät, tai sit isompi on HBM muisteilla. Mitään järkeä ei ole16GB muistikapasiteetissa jos se on 256bittisen väylän jatkeena.

aop · 17.09.2020

pomk sanoi:
Eli 512 ja 384 bittiset muistiväylät, tai sit isompi on HBM muisteilla. Mitään järkeä ei ole16GB muistikapasiteetissa jos se on 256bittisen väylän jatkeena.

Kyseessä on AMD ja ei niiden tuotejulkaisuissa ole muutenkaan aina ollut mitään järkeä. Tuo 16GB tulee olemaan aika hyvä markkinointivaltti, vaikka olisikin 256-bit väylän jatkeena, riippumatta onko siitä hyötyä vai ei. Kuvissa ollut ES-kortti ainakin oli selkeästi 256-bit 16GB muistimäärällä (8x16Gb Samsung piirit).

exkomura · 17.09.2020

qnarkill sanoi:
Oiskohan tässä vähä sitä ajatusta että toisin kuin ennen nyt ei hypetetä liikaa (kuten esim. vegaa) ja sitten se ei tuota pettymystä.

Nvidian pöhinä alkoi striimin jälkeen kuten alkaa amdlläkin. Muutenkin kun nvidian "julkaisu" oli ihan floppi niin kellään oo noita kortteja ennen kuin amd on tuonut jo ohjaimensa näytille.

pomk · 17.09.2020

aop sanoi:
Kyseessä on AMD ja ei niiden tuotejulkaisuissa ole muutenkaan aina ollut mitään järkeä. Tuo 16GB tulee olemaan aika hyvä markkinointivaltti, vaikka olisikin 256-bit väylän jatkeena, riippumatta onko siitä hyötyä vai ei. Kuvissa ollut ES-kortti ainakin oli selkeästi 256-bit 16GB muistimäärällä (8x16Gb Samsung piirit).

Onhan kaikki toki mahdollista, mutta toivottavasti eivät ole noin pahasti kämmäilleet tuotteita speksatessa.

edit: ja toi viittaisi sitten siihen että se 12GB malli olisi vain 192 bittisellä muistiväylällä. Ei hyvä.

hese_e · 18.09.2020

pomk sanoi:
Onhan kaikki toki mahdollista, mutta toivottavasti eivät ole noin pahasti kämmäilleet tuotteita speksatessa.

edit: ja toi viittaisi sitten siihen että se 12GB malli olisi vain 192 bittisellä muistiväylällä. Ei hyvä.

Nuo 256bit huhut on kyllä sitkeitä, on tosiaan aika hankala uskoa siihen, että AMD olisi päättänyt kuristaa väylää niin rajusti. Selitys cachesta tuntuu oudolle, kun ondiessä se vie tilaa siinä missä isompi muistiväyläkin ja ei taida tuoda samaa perffilisää. Erillisenä siruna se nostaa puolestaan kasauskustannuksia ja taitaa viedä piiristä saman verran tilaa mitä gddr6 muistiohjaimet (voi varmaan tehdä pienempinä, kun ei ole niin iso jännite, mutta väylän pitäisi olla leveämpi/nopeampi).

APU:t tietysti tykkäisi jos ne saa oikeasti muistiväylää korvaavan kakun kehitettyä, joten kannettavissa se olisi kyllä murhaa erillisille näytönohjaimille. Silti xboxin leveämämpi väylä saa tuon cachen tuntumaan aika kaukaa haetulle. HBM2 kuulostaisi aika uskottavalle Navi21:lla, mutta se ei taas oikein sopisi navi22 piiriin, kun sen pitäisi olla tähdätty halvempiin hintaluokkiin. 192bit väylä navi22:ssa kuulostaa taas todella ahtaalle.

AION · 18.09.2020

hese_e sanoi:
Nuo 256bit huhut on kyllä sitkeitä, on tosiaan aika hankala uskoa siihen, että AMD olisi päättänyt kuristaa väylää niin rajusti. Selitys cachesta tuntuu oudolle, kun ondiessä se vie tilaa siinä missä isompi muistiväyläkin ja ei taida tuoda samaa perffilisää. Erillisenä siruna se nostaa puolestaan kasauskustannuksia ja taitaa viedä piiristä saman verran tilaa mitä gddr6 muistiohjaimet (voi varmaan tehdä pienempinä, kun ei ole niin iso jännite, mutta väylän pitäisi olla leveämpi/nopeampi).

Ne huhut johtuu siitä kuvasta jossa on AMD engineering sample, jossa on 16Gb GDDR6 256 bittisen väylän jatkeena. Siitä ei oikeen päästä mihinkään.

Nyt kysymys herää, että miten AMD pystyisi tai pystyykö ollenkaan kilpailemaan sellaisella väylällä. Todella vaikeaa nähdä, että olisi 16GB/256bit ja 12GB/384bit konfiguraatiot.

Olisiko joku maaginen kakku asennettu piirin kylkeen? Ehkä.

Tosin jos arkkitehtuurin hyötysuhde on noussut sen 50% ja tuo 16/256 kortti olisi vain noin 3070 tehoinen niin ~40CU pitäisi riittää, jolloin herää kysymys, että miksi siihen on pultattu 300W jäähy ja 2*8pin virtaliittimet.

Toki jos siellä on joku maaginen kakku ja vuotanut benchmarkki oli 12GB/192bit kortista niin se vähän selittäisi, silloin piiri olisi varmaan jonkin verran isompi ja tehoa pitäis olla ainakin 3080:n kintereillä. Toki tämä edellyttäisi sitä jotain maagista kakkua tai jotain muuta hämärää koska teoriassa tuo bandwidth ei pitäis riittää ...

Asmola · 18.09.2020

qnarkill sanoi:
1. En lue kaikkia ketjuja enkä aio lukeakaan.
2. Jos et jaksa 16min videoa katsoa ilman että sen sulle joku referoi niin ole katsomatta. Not my problem, sry.

Jatkossa referointi videoiden mukaan kuten säännötkin vaatii. Kiitos.

hese_e · 18.09.2020

AMD:lta tuli gpu cache patentti

"To improve GPU system performance, FIGS. 1-10 illustrate methods and systems for controlling the replication levels across GPU caches via the dynamic clustering of compute units and their associated caches. In various embodiments, by decreasing the replication level across L1s, the total effective L1 cache capacity in the GPU system is increased without increasing the per CU L1 cache size, thereby increasing the L1 hit rate and decreasing the L2 accesses. In various embodiments, a method includes determining, for a first clustering configuration of CUs, whether a current cache miss rate exceeds a miss rate threshold. Based on the current cache miss rate exceeding the miss rate threshold, the CUs are clustered into a second plurality of compute unit clusters fewer than the first plurality. By forming clusters with increased number of CUs (and therefore L1 caches) and interleaving the memory address range among the CUs within a cluster, replication levels of cache lines are decreased. This resulting CU/L1 configuration, with fewer clusters and more CUs per cluster, provides for higher hit rates and reduces pressure on LLC caches."

P c L A Y E R · 18.09.2020

pomk sanoi:
Jos sieltä tulee nvidian tavoin joku 350W kiuas, ja ne saa silläkin jonkun ihmeen kautta pidettyä kiinni tosta +50% energiatehokkuudesta, niin sieltä tulee 5700xt + 133% kortti ulos.

Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.

Se on jo upea suoritus, jo saavata tuosta big navista sen 5700XT + 100%. Silloin se on tasoissa 3080:n kanssa ja voi kilpailla esim. halvemmalla hinnalla.

Wasabrod · 18.09.2020

varakreivi de Valmont sanoi:
Pyhä lentävä spagettihirviö, anna AMD:n tuottaa kilpailukykyinen piiri, jottemme lankeaisi Nvidian riistohinnoitteluun.

Anteeksi jo etukäteen ehkä ärsyttävä kysymys: milloin on tulossa AMD:ltä mahtikortti ja sen revikat?

FlyingAntero · 18.09.2020

P c L A Y E R sanoi:
Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.

Se on jo upea suoritus, jo saavata tuosta big navista sen 5700XT + 100%. Silloin se on tasoissa 3080:n kanssa ja voi kilpailla esim. halvemmalla hinnalla.

Jos RDNA2:n energiatehokkuus on 50% parempi kuin edellisessä sukupolvessa, niin eikö kulutusta voida haarukoida seuraavasti?

Shadow of the Tomb Raider (1440p)

5700 XT (40 CU, TDP 225W): 72,2 FPS eli 1,81 FPS/CU ja 0,32 FPS/W
5700 (36 CU, TDP 180W): 64,7 FPS eli 1,80 FPS/CU ja 0,36 FPS/W
5500 XT (22 CU, 130W): 40,0 FPS eli 1,82 FPS/CU ja 0,31 FPS/W
Keskiarvot: 1,81 FPS/CU ja 0,33 FPS/W

Tulokset on poimittu io-techin artikkeleista (kaikki 8Gb kortteja)

Jos "Big Navin" kellotaajuudet ovat samalla tasolla edellisten korttien kanssa, niin 80 CU:n version TDP olisi 310W, kun huomioidaan edellisissä laskuissa heikoimmat tulokset (1,80 FPS/CU ja 0,31 FPS/W)

80 CU x1,80 FPS/CU = 144 FPS
0,31 FPS/W x 1,5 = 0,465 FPS/W (+50% perf/watt)
144 FPS / 0,465 FPS/W = 310 W

Tällöin 80 CU:n "Big Navi" vastaisi täysin RTX 3080, sillä sen TDP on 320W ja se sai Shadow of the Tomb Raider pelissä 141 FPS io-techin testissä.

Testissä NVIDIA GeForce RTX 3080 Founders Edition - io-tech.fi

Mechanical Man · 18.09.2020

Tämän mukaan pitäisi tulla korkeammat kellot, en usko kuitenkaan puhuttavan kovin suurista eroista.

AMD RDNA2 Graphics Architecture Detailed, Offers +50% Perf-per-Watt over RDNA

With its 7 nm RDNA architecture that debuted in July 2019, AMD achieved a nearly 50% gain in performance/Watt over the previous "Vega" architecture. At its 2020 Financial Analyst Day event, AMD made a big disclosure: that its upcoming RDNA2 architecture will offer a similar 50% performance/Watt...

www.techpowerup.com

Kaotik · 18.09.2020

Mechanical Man sanoi:
Tämän mukaan pitäisi tulla korkeammat kellot, en usko kuitenkaan puhuttavan kovin suurista eroista.

Korkeammat kellot ovat itsestään selvä juttu, ovat olleet viimeistään siitä lähtien kun MS julkaisi muuttumattomat 1,825 GHz:n kellot ja Sony "dynaamiset mutta lähes aina maksimit" 2,23 GHz. Ja tuo dia tietenkin siihen päälle.

Mechanical Man · 18.09.2020

Kaotik sanoi:
Korkeammat kellot ovat itsestään selvä juttu, ovat olleet viimeistään siitä lähtien kun MS julkaisi muuttumattomat 1,825 GHz:n kellot ja Sony "dynaamiset mutta lähes aina maksimit" 2,23 GHz. Ja tuo dia tietenkin siihen päälle.

1,825GHz ei ole yhtään kovempi kulku kuin 5700XT:llä.

Testissä Radeon RX 5700 XT -näytönohjaimet (Asus, Gigabyte & MSI) - io-tech.fi

Testissä Asuksen, Gigabyten ja MSI:n omaan piirilevyyn ja jäähdytysratkaisuun pohjautuvat Radeon RX 5700 XT -custom-näytönohjaimet.

www.io-tech.fi

Jos yksi 10% tulee lisää, on se hyvä, mutta ei mitenkään kovin suuri ero.

Kaotik · 18.09.2020

Mechanical Man sanoi:
1,825GHz ei ole yhtään kovempi kulku kuin 5700XT:llä.

Testissä Radeon RX 5700 XT -näytönohjaimet (Asus, Gigabyte & MSI) - io-tech.fi

Testissä Asuksen, Gigabyten ja MSI:n omaan piirilevyyn ja jäähdytysratkaisuun pohjautuvat Radeon RX 5700 XT -custom-näytönohjaimet.

www.io-tech.fi

Jos yksi 10% tulee lisää, on se hyvä, mutta ei mitenkään kovin suuri ero.

Lukittu 1,825 GHz ei ole sama kuin samoilla paikkeilla pyörivä Boost-kellotaajuus mihin vaikuttavat monet muutkin tekijät.

pomk · 18.09.2020

P c L A Y E R sanoi:
Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.

AMD on ainakin aikaisemmin testannut kyseisen luvun oikeilla tuotteilla ja oikealla pelillä. Jos ne tekee nvidiat, niin olen kyllä aika pettynyt. Nvidioilla tarkoitan sitä niiden ”90%” parannusta energiatehokkuuteen, joka ei toteudu oikeilla tuotteilla oikeassa käyttöympäristössä ja oikea luku on n. 30%.

Se on toki mahdollista että se pätee jollain muulla kuin huippukortilla, mainitsivat vain että joku RDNA2 kortti tuon täyttää.

Kaotik · 18.09.2020

P c L A Y E R sanoi:
Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.

Siinä on testipelinä Division 2 @ 1440p Ultra.
Optimitaso voi hyvinkin olla totta, en noista parista diapaketista saanut nyt 110% varmuutta onko tuossa edes GCN Vega 64 vai Vega 64 @ 40 CU, RDNA on joka tapauksessa 5700 XT. RDNA2 perustuu AMD:n arvioihin (perusteltavissa oleviin koska sijoittajille suunnattua dataa), kuten aina julkaisemattomissa tuotteissa.
Mutta kuten viime sukupolvesta tiedetään, todellisuudessa RX 5700 XT:n energiatehokkuus parani enemmän kuin luvattu 50 % vrt Vega 64.

hkultala · 18.09.2020

Kaotik sanoi:
Siinä on testipelinä Division 2 @ 1440p Ultra.
Optimitaso voi hyvinkin olla totta, en noista parista diapaketista saanut nyt 110% varmuutta onko tuossa edes GCN Vega 64 vai Vega 64 @ 40 CU, RDNA on joka tapauksessa 5700 XT. RDNA2 perustuu AMD:n arvioihin (perusteltavissa oleviin koska sijoittajille suunnattua dataa), kuten aina julkaisemattomissa tuotteissa.
Mutta kuten viime sukupolvesta tiedetään, todellisuudessa RX 5700 XT:n energiatehokkuus parani enemmän kuin luvattu 50 % vrt Vega 64.

Vega 64 => RX 5700XT oli sekä suuri arkkitehtuurimuutos että suuri valmistustekniikan muutos. "14nm" tekniikan vaihtaminen "7nm" tekniikkaan pitäisi jo yksinään antaa melkein tuplasti parempi energiatehokkuus jos ajettaisiin samoilla kelloilla, eli muut siihen vaikuttavat asiat (kellot+jännite+arkkitehtuuri) oli pikemminkin energiatehokkuutta huonontava vaikutus.

Mutta 5700XTssä tosiaan kellot oli kellot niin paljon ylempänä (ja jännite säädetty sen mukaan käyrällä suhteellisesti ylemmäs) ja arkkitehtuurimuutoksen vaikutukset energiatehokkuuteen (kumpaankaan suuntaan) jäi hyvin pieneksi ja jäätiin tuohon reilun 50% parannukseen sen takia että korkeahkot kellot huononsi sitä.

RDNA ehkä myös omaa potentiaalia parempaan energiatehokkuuteen kuin GCN, mutta paljon tästä potentiaalista jäi ehkä hyödyntämättä koska nuo ekat Navi-piirit piti ehkä saada kiireellä markkinoille ja paljon matalan tason virrankulutusoptimointeja jäi tekemättä. (näistä osa ehkä sitten ehti siihen applelle tehtyyn Navi 12 -piiriin, vaikka se onkin olevinaan rdna 1.0)

RDNA => RDNA2 on sitten paljon pienempi arkkitehtuurimuutos, ja myös paljon pienempi valmistustekniikan muutos.

Miten tässä välissä voidaan sitten realistisesti saada 50% parannus energiatehokkuudessa?

1) Valmistustekniikan viilaus N7 => joko N7P (~11%?) tai N7+ (~18%?) kellotaajuuden pysyessä samana (luvut kaivettu TSMCn pr-releaseista ja laskettu käänteisluku (10% / 15% vähennys))
2) Paljon mikroarkkitehtuurin matalan tason energiatehokkuusviilauksia joita ei RDNAhan ehditty aikataulusyistä toteuttaa (~25%) (tämä on melko optimistinen)
3) Isommilla välimuisteilla voi vähentää muistinkäyttöä ja sen kuluttamaa virta (~5% koko kortin virrankulutukseen)

Näillä oltaisiin aika lailla tasan tuossa 50%ssa.

En oikein näe edellytyksiä alkaa nostelemaan kellotaajuutta ylemmäs siten että tuo 50% aiotaan geneerisesti saavuttaa, vaan pitänee valita JOKO korkeampien kellojen TAI tuon "luvatun" energiatehokkuusparannuksen väliltä.

nVidiahan tosiaan laski hyvin epäreilusti "1.9x energiatehokkuusparannuksen" Amperelle siten että alikellotti Amperen paljon matalampiin kelloihin, matalammalle jännittelle kuin Turingin (siten että suorituskyky sama, kiitos suuremman laskentayksikkömäärän), vaikka eivät julkaisseet mitään tuotetta mikä näillä matalilla kelloilla, matalilla jännitteillä toimisi. Tähän en kuitenkaan usko AMDn sortuvan tuossa 50%ssaan.

Kaotik · 18.09.2020

hkultala sanoi:
(näistä osa ehkä sitten ehti siihen applelle tehtyyn Navi 12 -piiriin, vaikka se onkin olevinaan rdna 1.0)

"1.1", siinä on ne deep learning -käskyt mukana

1) Valmistustekniikan viilaus N7 => joko N7P (~11%?) tai N7+ (~18%?) kellotaajuuden pysyessä samana (luvut kaivettu TSMCn pr-releaseista ja laskettu käänteisluku (10% / 15% vähennys))

WikiChipin mukaan Navi10 on jo N7P eli prosessi on joko paranneltu versio N7P:stä tai N7+ (Radeon RX 5700: Navi and the RDNA Architecture)

Muuten toki hyviä pointteja, reilun kuukauden päästä ollaan rutkasti viisaampia.

FlyingAntero · 18.09.2020

AMD:llähän pitäisi riittää Compute Unittien tuplaaminen RX 5700 XT:stä (40 -> 80) vastaamaan RTX 3080 korttia suorituskyvyssä eikä kelloja tarvitsisi edes nostaa. Samoilla kelloilla lienee siis mahdollista saavuttaa se +50% energiatehokkuus, jolloin 80 CU version TDP olisi se noin 300-320W. Jos AMD haluaa lähteä haastamaan RTX 3090 korttia, niin kelloja pitäisi nostaa reilusti. RTX 3090 on kuitenkin 350W eli on siinä jonkin verran pelivaraa. En kuitenkaan usko, että RTX 3090 korttia vastaan riittää rahkeet.

k1nggg · 18.09.2020

Onko näihin tulossa HBM2e muistit viimeisten huhujen mukaan?

Kaotik · 18.09.2020

k1nggg sanoi:
Onko näihin tulossa HBM2e muistit viimeisten huhujen mukaan?

Viimeisimmät huhut ovat ristiriitaisia, yksimielisyyttä muistityypistä ei tunnu löytyvän.

Pempula · 20.09.2020

FlyingAntero sanoi:
AMD:llähän pitäisi riittää Compute Unittien tuplaaminen RX 5700 XT:stä (40 -> 80) vastaamaan RTX 3080 korttia suorituskyvyssä eikä kelloja tarvitsisi edes nostaa. Samoilla kelloilla lienee siis mahdollista saavuttaa se +50% energiatehokkuus, jolloin 80 CU version TDP olisi se noin 300-320W. Jos AMD haluaa lähteä haastamaan RTX 3090 korttia, niin kelloja pitäisi nostaa reilusti. RTX 3090 on kuitenkin 350W eli on siinä jonkin verran pelivaraa. En kuitenkaan usko, että RTX 3090 korttia vastaan riittää rahkeet.

Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.

Lopullinen, todellinen suorituskyky kortilla taitaa olla lopulta pitkälti ajureista, optimoinneista ja mahdollisesti (DLSS-tyyppisistä? AMD:kin saattaa omia kanejaan hatusta vetää...) optimoinneista kiinni ja varmasti 5700XT:stä on monellakin tapaa parannettu ja suorituskykyä optimoitu. Itse uskon, että hyvä kortti tulee joka tapauksessa, tärkeimpänä pitäisin, että ajurit jo launchissa vakaat ja toimivat ja 3080:n kanssa todennäköisesti joissain peleissä samalla viivalla ja toisissa jäädään taas (selvästi?) alle. Lisäksi näkisin hyvänä, mikäli virrankulutuksessa jäätäisiin nVidian korttien alle: Tällä kerralla vaikuttaisi aika tappiin vedetyltä nVidian kellot ja oman mielikuvani mukaan AMD (tai paremmin ATI) on historiallisesti ollut tällöin usein vahvoilla.

FlyingAntero · 20.09.2020

Pempula sanoi:
Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.

Lopullinen, todellinen suorituskyky kortilla taitaa olla lopulta pitkälti ajureista, optimoinneista ja mahdollisesti (DLSS-tyyppisistä? AMD:kin saattaa omia kanejaan hatusta vetää...) optimoinneista kiinni ja varmasti 5700XT:stä on monellakin tapaa parannettu ja suorituskykyä optimoitu. Itse uskon, että hyvä kortti tulee joka tapauksessa, tärkeimpänä pitäisin, että ajurit jo launchissa vakaat ja toimivat ja 3080:n kanssa todennäköisesti joissain peleissä samalla viivalla ja toisissa jäädään taas (selvästi?) alle. Lisäksi näkisin hyvänä, mikäli virrankulutuksessa jäätäisiin nVidian korttien alle: Tällä kerralla vaikuttaisi aika tappiin vedetyltä nVidian kellot ja oman mielikuvani mukaan AMD (tai paremmin ATI) on historiallisesti ollut tällöin usein vahvoilla.

AMD ei ole luvannut 50% teholisää vaan 50% parannusta energiatehokkuudessa. Edellisessä sukupolvessa suorituskyky näyttää skaalautuvat aikalailla lineaarisesti Compute Unittien mukaan.

FlyingAntero sanoi:
Raider pelissä aiemmat Navit skaalautuvat seuraavasti 1440p resoluutiolla (kaikki 8Gb kortteja):

5700 XT (40 CU): 72,2 FPS eli 1,81 FPS/CU

5700 (36 CU): 64,7 FPS eli 1,80 FPS/CU

5500 XT (22 CU): 40,0 FPS eli 1,82 FPS/CU

Tulokset on poimittu io-techin artikkeleista:

Testissä AMD Radeon RX 5700 & 5700 XT (Navi) - io-tech.fi

Testissä AMD Radeon RX 5500 XT (Navi 14) - io-tech.fi

Eli tämän perusteella 80 CU:ta tarkoittaisi Shadow of the Tomb Raider pelissä +140 FPS about samoilla kelloilla (1440p). Sitten jos huomioidaan energiatehokkuuden parannus niin 450W kortin sijaan puhutaan jostain 300-320W TDP:stä. Jos kellot eroavat merkittävästi RX 5700 XT:stä, niin silloin kulutus on tietenkin eri.

Pempula · 20.09.2020

FlyingAntero sanoi:
AMD ei ole luvannut 50% teholisää vaan 50% parannusta energiatehokkuudessa. Edellisessä sukupolvessa suorituskyky näyttää skaalautuvat aikalailla lineaarisesti Compute Unittien mukaan.

En 50% teholisää tuossa (RDNA1->2) tarkoittanutkaan, vaan energiatehokkuutta, mutta se (energiatehokkuus) yhdessä muiden optimointien kanssa tuo automaattisesti myös teholisää, mikäli virrankulutusta ei lähdetä laskemaan.

FlyingAntero · 20.09.2020

Pempula sanoi:
En 50% teholisää tuossa (RDNA1->2) tarkoittanutkaan, vaan energiatehokkuutta, mutta se (energiatehokkuus) yhdessä muiden optimointien kanssa tuo automaattisesti myös teholisää, mikäli virrankulutusta ei lähdetä laskemaan.

Energiatehokkuuden parantuminen ei tuo teholisää ellei kelloja nosteta samassa suhteessa tai lisätä laskentayksikköjä. Jos CU määrä tuplataan, niin suorituskyvyn pitäisi kaksinkertaistua samoilla kelloilla. Energiatehokkuuden parantaminen mahdollistaa CU tuplaamisen, kun kulutus saadaan pidettyä aisoissa (noin RTX 3080:n tasolla). Jos kelloja nostetaan samalla, niin sitten TDP karkaa ylemmäs.

Kaotik · 20.09.2020

Pempula sanoi:
Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.

Ei kannata tuijotella niitä FLOPSeja liikaa, 3080 on "30 TFLOPSin kortti" mutta ei yllä edes kaksinkertaiseen suorituskykyyn vrt. saman firman viime sukupolven "11 TFLOPSin kortti", saati sitten mihin teoreettisten FLOPSien pohjalta "pitäisi" päästä

FlyingAntero sanoi:
Energiatehokkuuden parantuminen ei tuo teholisää ellei kelloja nosteta samassa suhteessa tai lisätä laskentayksikköjä. Jos CU määrä tuplataan, niin suorituskyvyn pitäisi kaksinkertaistua samoilla kelloilla. Energiatehokkuuden parantaminen mahdollistaa CU tuplaamisen, kun kulutus saadaan pidettyä aisoissa (noin RTX 3080:n tasolla). Jos kelloja nostetaan samalla, niin sitten TDP karkaa ylemmäs.

Me emme tiedä millä kelloilla ne 50% paremmat perf/watit on luvattu

FlyingAntero · 20.09.2020

Kaotik sanoi:
Me emme tiedä millä kelloilla ne 50% paremmat perf/watit on luvattu

Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi). Eli voidaan spekuloida, että samoilla kelloilla pienempi TDP, jos laskentayksikköjä saman verran. Laskentayksikköjen määrä nostaessa TDP nousee sitten ylemmäs.

Me ei tiedetä, millainen "Big Navi" tulee olemaan, mutta laskennallisesti AMD voi lykätä pihalle RTX 3080 näytönohjainta vastaavan kortin tuplaamalla CU:t +50% energiatehokkuuden turvin. Silloin ei tarvi kellojakaan nostaa.

pomk · 20.09.2020

FlyingAntero sanoi:
Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi). Eli voidaan spekuloida, että samoilla kelloilla pienempi TDP, jos laskentayksikköjä saman verran. Laskentayksikköjen määrä nostaessa TDP nousee sitten ylemmäs.

Yleensä nämä on ilmoitettu siten että kulutus on vakioitu, tai vaihtoehtoisesti oikeilla tuotteilla. Ainoastaan nvidia sekoilee ton kanssa.

Kaotik · 20.09.2020

FlyingAntero sanoi:
Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi). Eli voidaan spekuloida, että samoilla kelloilla pienempi TDP, jos laskentayksikköjä saman verran. Laskentayksikköjen määrä nostaessa TDP nousee sitten ylemmäs.

Me ei tiedetä, millainen "Big Navi" tulee olemaan, mutta laskennallisesti AMD voi lykätä pihalle RTX 3080 näytönohjainta vastaavan kortin tuplaamalla CU:t +50% energiatehokkuuden turvin. Silloin ei tarvi kellojakaan nostaa.

En ole nyt löytänyt ihan 110% varmaa tietoa (ts. en ihan koko presentaatioarkistoa käynyt läpi), mutta AMD ilmoitti saman 50% myös RDNA1:lle, silloin vertailu oli joko Vega64 vs RX5700XT tai Vega 64 @ 40CU vs RX5700XT (missä on aina 40 CU) Division 2ssa 1440p Ultra -asetuksin, mutta siitä tapauksesta tiedetään että se oli jopa yli 50% parempi isommalla kattauksella pelejä ihan rampauttamatonta Vega 64:ää vastaan.
Koska sama vertailupohja on mukana myös RDNA2:n +50% perf/watt luvanneessa vertailussa, on se joko Vega64 @ 40 CU vs RX5700XT vs RDNA2 @ 40 CU, tai sitten Vega64 vs RX5700XT vs joku tietty RDNA2-malli

Beeti · 20.09.2020

Laitetaas nyt itsekkin omat pohdiskelut tänne.

Itsellä oli sapphiren 5700xt refu vesijäähdytettynä ja ainakin superpositionin perusteella isommalla kulutuksella suorituskyky skaalautui todella heikosti kellotaajuuksia en valitettavasti ole ottanut muistiin, mutta joku 5700xt omistaja voisi toistaa nämä(mahdollisesti kokeilla myös jossain ihan oikeassa pelissä), niin saadaan samalla validoitua minun luvut

Unigine 2 superposition 1080p Extreme:

Max 98W = 4061pts
Max 142W = 4726pts
Stock = 5200pts (monissa arvosteluissa 5700xt stock 5500 luokkaa)
Max 240W = ~5600

Sitten asiaan. 5700xt oli vain 251mm2 & 40cu joten käyrän optimikohdalta poikettu reilusti sikäli, kun siihen oli kulutuksen puolestavaraa ja lisäteholle 2070 kanssa kilpailuun myös tarvetta. Compute unitteja kun lykätään tuplat lisää voi olla jo pelivaraa mennä käyrällä alemmas suorituskyvyn silti ollessa ns. riittävä, sen lisäksi tmsc prosessin tuomat parannukset ja amd:n omat kikkailut mukaan niin +50% perf/watt voi toteutua.

Pahimman sattuessa +50% perf/w vertailukohdaksi voidaan ottaa raytracing-suorituskyky :smoke:

KognaK · 20.09.2020

FlyingAntero sanoi:
Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi).

Jos mennään noin niin RDNA1 paransi 90% keskimääräistä energiatehokkuutta ihan puolueettomissa testeissä. 180W 5700 on hieman nopeampi kuin 300W Vega64. Nvidia-tyyliin kirsikoita poimimalla saanee lisää, "Up to 100% perf/W increase!". Sitä ei tietenkään tiedetä pysyykö AMD varmasti linjallansa vai aletaanko matkimaan kilpailijaa. Se tiedetään että kirsikat jäi kakkuun viime kierroksella ja vertailu oli reilua.

125/66 = 1,893

hkultala · 20.09.2020

Pempula sanoi:
Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.

Ensinnäkin, AMD ei ole luvannut mitään" 50% suorituskykylisää" vaan 50% parannuksen energiatehokkuudessa mikä tarkoittaa esim. samaa suorituskykyä 33% pienemmällä sähkönkulutuksella.

Toisekseen, käytännössä mikään koodi mikä tekee mitään järkevää ei sisällä pelkkiä liukulukulaskuja.

Niiden lukujen tarvitsee tulla jostain, esim, muistista joko latauskäskyillä tai teksturisamplauskäskyillä, jotka pitää myös suorittaa
ja ne muisti- tai tekstuuriosoittet pitää myös jollain laskea.

Ja kun koodissa on loppi, pitää sen loopin laskuria laskea ja sen lopetusehtoa testata jne.

RDNA:lla SIMD-rakenteen takia monet osoitteen- tai indeksilaskennat on yhteisiä 32 tai 64 linjalle, ja siellä on yksi skalaariyksikkö 32 linjaa kohden, ja tätä voidaan (tietääkseni) käyttää näiden laskentaan samaan aikaan kuin lasketaan sitä varsinaista laskentaa SIMD-datapolulla.

Turing-sukupolvessa nVidialla oli jokaista SIMT-linjaa eli "CUDA curea" kohden omat kokonaislukuyksikkö sekä liukuluyksikkö. Samalla kun liukulukuyksikkö laski varsinaista laskentaa, kokonaislukuyksikkö laski osoitteita tai indeksejä ja näiden laskenta ei ollut pois varsinaisesta laskennasta.

Ampere-sukupolvessa tuota kokonaislukuyksiksikköä laajennettin siten että se pystyy laskemaan vaihtoehtoisesti myös liukulukulaskuja(mutta ei yhtä aikaa). Ja tämän jälkeen nämä kaksi yksiköä yhdessä laskettiinkin KAHDEKSI "cuda-ytimeksi".

Ja minkään muiden yksiköiden (latausyksiköt, tekstuurimappaysyksiköt jne) määrää ei myöskään tietääkseni nostettu samalla kun "cuda-ydin-määrää" nostettiin eli näiden määärä/"CUDA-ydin" putosi puoleen.

Eli siis, mikäli koodissa oli hyvin tasaisesti 50%-50% suhteessa liukuluku- ja kokonaislukulaskuja, Amperen nopeus/mainostettu CUDA-ydin tai per mainostettu terafloppi on tasan puolet Turingin nopeuteen nähden.

Käytännössä tyypillisellä koodilla (jossa liukulukulaskuja on enemmän kuin niitä kokonaislukulaskuja) hyöty siitä amperen "cuda-ytimien tuplaamisesta" on ehkä joku n. 30% suorituskykylisä, eli siis "cuda-ydintä kohden" Ampere tekee kellojaksossa tyypillisesti ehkä n. 65% siitä mitä Turing.

Apinalla Magnum45 · 21.09.2020

Jos amd:ltä tulee lähellekkään, tai tulee rtx 3080 tasoinen kortti halvemmalla, ja julkaisussa myydään paljon kortteja halukkaille, niin amd on voittanut ensimmäisen erän. Amd saa varmasti paljon paremman maineen.

Jooga · 21.09.2020

Twiitin mukaan Big Navin kellot voisivat olla luokkaa 2100 MHz mikä olisi suuremmat kuin 5700XT:n pelikäytössä olevat kellot (1900-1950MHz IO Tech arvostelu). Eli 1:1 skaalauksella 80 CU RDNA2 olisi n. 115% tehokkaampi kuin 5700XT. 80/40CU*2,1/1,95GHz

5700XT:n Boost kellot taisivat olla mallista riippuen jopa yli 2GHz, eli jos twiitin kellot ovat paketin kyljen Boost-lukema, mikä ei käytännössä toteudu, niin ero voi olla pienempi.

TPU:n summaryssä 3080 10GB on resoluutiosta riippuen 53-100% nopeampi kuin 5700 XT, 75% 1440p:llä jota itse pidän parhaimpana vertailukohtana. Tämän perusteella pidän jopa todennäköisenä, että Big Navi on 3080 10GB-malleja tehokkaampi ilman RTX/DLSS-kikkailuja.

Hieman ihmetyttää edelleen vahvana pysyvät huhut Big Navin 16GB mallin 256-bit muistiväylästä näin korkealle ennustetulla tehonlisäyksellä. Oliskohan AMD:n pimennystaktiikan osana engineering samplen käyttäminen rajusti rampautetulla muistiväylällä, jotta mahdollisten vuotojen osuvuus todelliseen korttiin saadaan pidettyä heikkona?

pelitys · 21.09.2020

PS5 gpu boost-kellot 2,23ghz joten veikkaan että pc-puolen osa kulkee 2,3ghz isomman TDP:n ansiosta.

P c L A Y E R · 21.09.2020

pelitys sanoi:
PS5 gpu boost-kellot 2,23ghz joten veikkaan että pc-puolen osa kulkee 2,3ghz isomman TDP:n ansiosta.

Niin plösössä on 36CU piiri, kun Big Navi on 80CU:n piiri. Aika epätodennäköistä, että pääsee ihan samoihin kelloihin tuo iso piiri. Itse veikkaan Big Navin kelloiksi max 2 GHz, ehkä jonkun verran alle.

pomk · 21.09.2020

P c L A Y E R sanoi:
Niin plösössä on 36CU piiri, kun Big Navi on 80CU:n piiri. Aika epätodennäköistä, että pääsee ihan samoihin kelloihin tuo iso piiri. Itse veikkaan Big Navin kelloiksi max 2 GHz, ehkä jonkun verran alle.

Plösön gpu kuluttaa kans oletettavasti vain n. 200W. Toki tuollakin luvulla ne 80CU:ta joutuu kulkemaan hieman matalemmilla kelloilla, ellei esim. muisteina ole merkittävästi vähävirtaisemmat HBM2e muistit.

hese_e · 21.09.2020

P c L A Y E R sanoi:
Niin plösössä on 36CU piiri, kun Big Navi on 80CU:n piiri. Aika epätodennäköistä, että pääsee ihan samoihin kelloihin tuo iso piiri. Itse veikkaan Big Navin kelloiksi max 2 GHz, ehkä jonkun verran alle.

Tuo 2.1Ghz lähde oli coreteks, jolla ei ole kaksinen vuotohistoria. Silti AMD:n omissa slideissä oli kyllä korkeampi kellotaajuus, mutta jossain 2-2.1Ghz lukemissa se varmaan pyörii. Ps5 kellottuu kyllä korkealle, mutta toisaalta kovat kellot laskee saanteja, kun enemmän piirejä jää speksin alle ja kellotaajuus myös laskee energiatehokkuutta kummasti. Massatuotannon kannalta kannattaa siis pitää matalammat kellot, mutta ainahan voi laittaa huipulle jonkun spessumallin, jossa on binnauksen parhaat piirit ja vähän korkeammat kellot.

weetabix · 21.09.2020

RDNA2:sta ja Big Navista on tosiaan ollut huhuja vain 256-bit muistiväylästä. Mutta etä GPU sisältäisi 16GB muistia(DDR6) ja sisältäisi 128MB InfinityCachea, jolla saadaan skaalattua muistiväylän suorituskyky samalle tasolle kuin 584 väylä nvidialla. Ja tuo suorituskykykasvu +50%-60 tehoa/wattia kohti, olisi tosiaan yhtä CU yksikköä kohti.

Lähinnä näistä voi vetää tässä vaiheessa johtopäätöksiä, että mielenkiintoinen syksy on tulossa (ovat sitten kuinka tosia nämä huhut).

Kizmo · 21.09.2020

Entäpä jos isoin navi 6950XT tmv olisikin täysi 120CU piiri 1600 MHz kelloilla...

bahis · 21.09.2020

Eikös AMD jossain vaiheessa kommentoinut että Big Navissa (vai koskiko se vain RDNA2 yleisesti) on "multiple gigahertz" kellot?

Oletettavasti on sitten yli 2GHz....

Nerkoon · 21.09.2020

Kizmo sanoi:
Entäpä jos isoin navi 6950XT tmv olisikin täysi 120CU piiri 1600 MHz kelloilla...

Missä on sanottu, että se täysi on 120cu?

Kizmo · 21.09.2020

Nerkoon sanoi:
Missä on sanottu, että se täysi on 120cu?

Ihan spekulointia kun 120dcu laksentakortti on olemassa.

Ettei tehtäisi halo tuotteeksi hbm2 muisteilla semmoista kuten tehtiin radeon VII kanssa

hese_e · 21.09.2020

Kizmo sanoi:
Ihan spekulointia kun 120dcu laksentakortti on olemassa.

Ettei tehtäisi halo tuotteeksi hbm2 muisteilla semmoista kuten tehtiin radeon VII kanssa

AMD oli kyllä eriyttämässä laskenta ja peliarkkitehtuuria toisistaan, ikäänkuin GCN laskentaan ja RDNA pelaamiseen. Joten tuo skenaario ei nyt ihan uskottavalle kuulosta, kun ne voi kierrättää datakeskuksiin kelpaamattomat piirit pro kortteihin.

Kizmo · 21.09.2020

Vaan eipä sitä Radeon VII korttia ja toteutustapaakaan kukaan ennustanut...

hese_e · 21.09.2020

Kizmo sanoi:
Vaan eipä sitä Radeon VII korttia ja toteutustapaakaan kukaan ennustanut...

Ei, mutta se piiri oli suoraan käyttökelpoinen kuluttajapuolelle. Tuo uusi laskentakortti on cdna arkkitehtuuria ja vaikka siitä yllättäen löytyisi grafiikkapuolen komponentit, niin laskentaan optimoituna se voisi hyvinkin ottaa pataan navi22 piiriltä.

Viimeisin silmiinpistänyt huhu siitä oli täällä.

"The GPU die size has not been confirmed, but it certainly is much bigger than before. The compute card based on CDNA architecture is rumored to feature the Arcturus processor. Despite the fact, that we refer to the Arcturus as GPU, the processors will not have graphics pipelines. This puts the MI100 even closer to NVIDIA’s A100 accelerator based on ‘Ampere’ architecture in terms of the capabilities. Both are expected to compete in AI, ML, and HPC markets."

nossnor · 21.09.2020

"Vuoto" jonka luotettavuudesta ei mitään tietoa. Mutta ehkä tuota vilkaisee kuitenkin.

RDNA 2 (RX 6000-Series) specification leaks : AMDInsider

www.reddit.com

Raytracing is available on all cards the cards leaked below:

[RX 6660 XT]

- 48 CUs

- 3072 stream processors

- 64 ROPs

- 1905 MHz boost clock

- 8 GB GDDR6 @ 448 GB/s

- 64 MB infinity cache

- TDP: unknown (assumably ~180W)

- ~12 TFLOPS (roughly the raw performance of the Xbox Series X GPU)

[RX 6880 XT]

- 80 CUs

- 5120 stream processors

- 96 ROPs

- 2000 MHz boost clock

- 12 GB GDDR6 @ 512.0 GB/s

- 128 MB infinity cache

- TDP: unknown (assumably ~300W)

- ~20 TFLOPS

[RX 6990 XT]

- 80 CUs

- 5120 stream processors

- 96 ROPs

- 2145 MHz boost clock

- 16 GB GDDR6 @ 720.0 GB/s

- 128 MB infinity cache

- TDP: unknown (assumably ~350W)

- ~22 TFLOPS

AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Se ainoa oikea

Molander

ɑ n d r o i d

Banhammer

Banhammer

Banhammer

BANNATTU

Banhammer

ɑ n d r o i d

Banhammer

ɑ n d r o i d

ɑ n d r o i d

Banhammer

ɑ n d r o i d

Banhammer

BANNATTU

Se ainoa oikea

Uutiset

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi