AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

1. En lue kaikkia ketjuja enkä aio lukeakaan.
2. Jos et jaksa 16min videoa katsoa ilman että sen sulle joku referoi niin ole katsomatta. Not my problem, sry.
Me kaikki huomasimme, että et viitsi lukea. Varsinkin kun tuo video on tässäkin ketjussa postattu edelliselle sivulle. Ja käytöstavat on hyvä muistaa myös netissä
 
2. Jos et jaksa 16min videoa katsoa ilman että sen sulle joku referoi niin ole katsomatta. Not my problem, sry.
No jos itse katsoit videon, niin ei varmaan liikaa pyydetty ole että hieman avaat sitä?

Itseäni ei ainakaan kiinnosta tuhlata 16 minuuttia videoon, jossa kiinnostava osuus kerrotaan alle minuutissa.
 
No jos itse katsoit videon, niin ei varmaan liikaa pyydetty ole että hieman avaat sitä?

Itseäni ei ainakaan kiinnosta tuhlata 16 minuuttia videoon, jossa kiinnostava osuus kerrotaan alle minuutissa.
Jos amd "spekuasiat" ei kiinnosta miksi luet koko ketjua.
 
Jos amd "spekuasiat" ei kiinnosta miksi luet koko ketjua.
Nimenomaan ne asiat kiinnostaa, ei turha paskanjauhanta jota jokainen Youtube video on täynnä. Tuossakin on ensimmäiset kaksi minuuttia täynnä löpinää ties mistä turhasta, jonka jälkeen ainakin kaksi minuuttia analysoi yhtä valokuvaa. Juu ei kiitos, pitäydyn sen asiasisällön lukemisessa.

/OT
 
Mitä seuraillut keskustelua tulevan 6000 sarjan tehoista eri foorumeilta, niin aika monelta tuntuu unohtuvan että 5700 sarjan piiri on vain 251 mm2. Sitten heitetään läppää ettei AMD millään pysty tuplaamaan 5700XT tehoja ottaakseen 3080 kiinni. Jo pelkästään 50% performance per watt parannus nostaisi tuon 5700XT:n tehot heittämällä ohi 2080Ti:n. 3080 on n. 30% nopeampi mitä 2080Ti niin ei siihen enää paljoa parannettavaa jää. AMD kuitenkin luvannut koko sarjan kortteja pohjalta high endiin ja viimeiseksi tällainen on nähty vuonna 2015 jolloin oli 300 sarja ja huipulla Fury X. Piirien koot vaihtelivat 90 mm2 aina 596 mm2.

Se kuinka iso tuo AMD:n suurin piiri tulee olemaan määrittää sen kuinka paljon 3080:sta jäädään tai mennään ohi, mutta en epäile hetkeäkään etteikö AMD pystyisi vastaamaan Nvidialle koko tuote sarjassa. Nvidia on kuitenkin aika jumissa tuon Samsungin 8nm prosessin kanssa. 3080 performance per watt parannus jäi vain noin 10% versus 2080 ja 2080Ti. Riippuen kuormituksesta voi olla parempi tai huonompi kuin tuo 10%.

Kaikki data kuitenkin puhuu sen puolesta että AMD voi aika vapaasti säädellä korttejaan Nvidaa vastaan. Olen varma että Nvidia olisi alunperin halunnut julkaista 3070 kortin 3080 korttina ja sitten tuo nyt oleva 3080 olisi ollut 3080Ti jolla olisi lypsetty se 1000$+. Samsungin valmistus prosessi ei vaan ollut riittävän hyvä ja oli pakko nostaa 3080 tuonne isoimpaan siruun. Varmaan sieltä tulee sitten se 3070Ti tuosta samasta piiristä. Jotain kertoo myös sekin että 3080:sta revitään 320w vakiona ja siten vesitetään performance per watt missä Nvidia on viime vuosina ollut kuningas. Jotain siellä selkeästi pelätään.
Toisessa ketjussa vähän laskeskelin, että 80 CU:n "Big Navi" voisi olla suorituskyvyltään tasoissa RTX 3080:n kanssa. Jos RDNA2:n energiatehokkuus on 50% parempi kuin edellisessä sukupolvessa, niin tämä tarkoittaisi vastaavilla kelloilla 5700 XT:n kanssa noin 320W TDP:n korttia. Käytännön tasolla tilanne voi kuitenkin olla ihan eri.
1. En lue kaikkia ketjuja enkä aio lukeakaan.
2. Jos et jaksa 16min videoa katsoa ilman että sen sulle joku referoi niin ole katsomatta. Not my problem, sry.
Foorumin ylläpitäjät ovat aiemmin linjanneet, että videon saatteeksi olisi hyvä muutamalla sanalla avata videon sisältöä. Muiden on helpompi osallistua keskusteluun, kun tietää, miksi video on ketjuun laitettu. Kts. lisää linjauksesta alta:
 
Mitä jos säteenseuranta olisi alkanut kiinnostamaan? Sori mun tietämättömyys asiasta, oon ollut hyvin tyytyväinen muin 5700xt:hen, mutta nyt on vihdoin ulkona sellaista korttia, jolla voi saada järkevästi toimivaa säteenseurantaa järkevällä hinnalla.
 
Säteenseuranta tulee 6000 sarjalaisiin (sama rauta pohjana kuin konsoleissa mihin myös tulee).
Mulla oli siis yhtä painallusta vaille rtx 3080 tilattuna mutta maltoin mieleni viime hetkelläxD. Jos vaan nyt malttais odottaa. Miksei AMD:ltä kuulu mitään?
 
Mulla oli siis yhtä painallusta vaille rtx 3080 tilattuna mutta maltoin mieleni viime hetkelläxD. Jos vaan nyt malttais odottaa. Miksei AMD:ltä kuulu mitään?
Kuuluuhan, kertoivat milloin julkaistaan tai ainakin julkistetaan. AMD:n aikatalut ovat koko ajan puhuneet loppuvuodesta, mihin tuo osuukiin.
Miksi ne kertoisivat sen enempää? Ei tuolla ole mikään rajattu massa joka kutistuu sitä mukaa kun porukka ostaa NVIDIAn näytönohjaimia, vaan uusia ostajia tulee lisää sitä mukaa kun vanhat ostavat uuden.
 
Mulla oli siis yhtä painallusta vaille rtx 3080 tilattuna mutta maltoin mieleni viime hetkelläxD. Jos vaan nyt malttais odottaa. Miksei AMD:ltä kuulu mitään?
Oiskohan tässä vähä sitä ajatusta että toisin kuin ennen nyt ei hypetetä liikaa (kuten esim. vegaa) ja sitten se ei tuota pettymystä.
 
Ainakaan itse en pety yhtään vaikka Big Navi osuisi tehoiltaan RTX3070:n luokkaan (eli vähän alle tai päälle) kunhan hinta on sopiva suhteessa kilpailijaan. Ei minusta tarvitse tulla sitä kirkkaasti parasta ja nopeinta korttia, vaan itselleni tuo tarkoittaisi vain sitä, että valinnanvaraa on enemmän. Voi sitten katsoa että kumman valmistajan kortti antaa enemmän vastinetta rahalle.

Omaan tarpeeseen paras olisi melkeimpä hinnaltaan ja tehoiltaan 3070 ja 3080:n välimaastoon sijoittuva kortti.
 
Eli 512 ja 384 bittiset muistiväylät, tai sit isompi on HBM muisteilla. Mitään järkeä ei ole16GB muistikapasiteetissa jos se on 256bittisen väylän jatkeena.
Kyseessä on AMD ja ei niiden tuotejulkaisuissa ole muutenkaan aina ollut mitään järkeä. Tuo 16GB tulee olemaan aika hyvä markkinointivaltti, vaikka olisikin 256-bit väylän jatkeena, riippumatta onko siitä hyötyä vai ei. Kuvissa ollut ES-kortti ainakin oli selkeästi 256-bit 16GB muistimäärällä (8x16Gb Samsung piirit).
 
Oiskohan tässä vähä sitä ajatusta että toisin kuin ennen nyt ei hypetetä liikaa (kuten esim. vegaa) ja sitten se ei tuota pettymystä.
Nvidian pöhinä alkoi striimin jälkeen kuten alkaa amdlläkin. Muutenkin kun nvidian "julkaisu" oli ihan floppi niin kellään oo noita kortteja ennen kuin amd on tuonut jo ohjaimensa näytille.
 
Kyseessä on AMD ja ei niiden tuotejulkaisuissa ole muutenkaan aina ollut mitään järkeä. Tuo 16GB tulee olemaan aika hyvä markkinointivaltti, vaikka olisikin 256-bit väylän jatkeena, riippumatta onko siitä hyötyä vai ei. Kuvissa ollut ES-kortti ainakin oli selkeästi 256-bit 16GB muistimäärällä (8x16Gb Samsung piirit).
Onhan kaikki toki mahdollista, mutta toivottavasti eivät ole noin pahasti kämmäilleet tuotteita speksatessa.

edit: ja toi viittaisi sitten siihen että se 12GB malli olisi vain 192 bittisellä muistiväylällä. Ei hyvä.
 
Onhan kaikki toki mahdollista, mutta toivottavasti eivät ole noin pahasti kämmäilleet tuotteita speksatessa.

edit: ja toi viittaisi sitten siihen että se 12GB malli olisi vain 192 bittisellä muistiväylällä. Ei hyvä.

Nuo 256bit huhut on kyllä sitkeitä, on tosiaan aika hankala uskoa siihen, että AMD olisi päättänyt kuristaa väylää niin rajusti. Selitys cachesta tuntuu oudolle, kun ondiessä se vie tilaa siinä missä isompi muistiväyläkin ja ei taida tuoda samaa perffilisää. Erillisenä siruna se nostaa puolestaan kasauskustannuksia ja taitaa viedä piiristä saman verran tilaa mitä gddr6 muistiohjaimet (voi varmaan tehdä pienempinä, kun ei ole niin iso jännite, mutta väylän pitäisi olla leveämpi/nopeampi).

APU:t tietysti tykkäisi jos ne saa oikeasti muistiväylää korvaavan kakun kehitettyä, joten kannettavissa se olisi kyllä murhaa erillisille näytönohjaimille. Silti xboxin leveämämpi väylä saa tuon cachen tuntumaan aika kaukaa haetulle. HBM2 kuulostaisi aika uskottavalle Navi21:lla, mutta se ei taas oikein sopisi navi22 piiriin, kun sen pitäisi olla tähdätty halvempiin hintaluokkiin. 192bit väylä navi22:ssa kuulostaa taas todella ahtaalle.
 
Nuo 256bit huhut on kyllä sitkeitä, on tosiaan aika hankala uskoa siihen, että AMD olisi päättänyt kuristaa väylää niin rajusti. Selitys cachesta tuntuu oudolle, kun ondiessä se vie tilaa siinä missä isompi muistiväyläkin ja ei taida tuoda samaa perffilisää. Erillisenä siruna se nostaa puolestaan kasauskustannuksia ja taitaa viedä piiristä saman verran tilaa mitä gddr6 muistiohjaimet (voi varmaan tehdä pienempinä, kun ei ole niin iso jännite, mutta väylän pitäisi olla leveämpi/nopeampi).


Ne huhut johtuu siitä kuvasta jossa on AMD engineering sample, jossa on 16Gb GDDR6 256 bittisen väylän jatkeena. Siitä ei oikeen päästä mihinkään.

Nyt kysymys herää, että miten AMD pystyisi tai pystyykö ollenkaan kilpailemaan sellaisella väylällä. Todella vaikeaa nähdä, että olisi 16GB/256bit ja 12GB/384bit konfiguraatiot.

Olisiko joku maaginen kakku asennettu piirin kylkeen? Ehkä.

Tosin jos arkkitehtuurin hyötysuhde on noussut sen 50% ja tuo 16/256 kortti olisi vain noin 3070 tehoinen niin ~40CU pitäisi riittää, jolloin herää kysymys, että miksi siihen on pultattu 300W jäähy ja 2*8pin virtaliittimet.

Toki jos siellä on joku maaginen kakku ja vuotanut benchmarkki oli 12GB/192bit kortista niin se vähän selittäisi, silloin piiri olisi varmaan jonkin verran isompi ja tehoa pitäis olla ainakin 3080:n kintereillä. Toki tämä edellyttäisi sitä jotain maagista kakkua tai jotain muuta hämärää koska teoriassa tuo bandwidth ei pitäis riittää ...
 
AMD:lta tuli gpu cache patentti

"To improve GPU system performance, FIGS. 1-10 illustrate methods and systems for controlling the replication levels across GPU caches via the dynamic clustering of compute units and their associated caches. In various embodiments, by decreasing the replication level across L1s, the total effective L1 cache capacity in the GPU system is increased without increasing the per CU L1 cache size, thereby increasing the L1 hit rate and decreasing the L2 accesses. In various embodiments, a method includes determining, for a first clustering configuration of CUs, whether a current cache miss rate exceeds a miss rate threshold. Based on the current cache miss rate exceeding the miss rate threshold, the CUs are clustered into a second plurality of compute unit clusters fewer than the first plurality. By forming clusters with increased number of CUs (and therefore L1 caches) and interleaving the memory address range among the CUs within a cluster, replication levels of cache lines are decreased. This resulting CU/L1 configuration, with fewer clusters and more CUs per cluster, provides for higher hit rates and reduces pressure on LLC caches."
 
Jos sieltä tulee nvidian tavoin joku 350W kiuas, ja ne saa silläkin jonkun ihmeen kautta pidettyä kiinni tosta +50% energiatehokkuudesta, niin sieltä tulee 5700xt + 133% kortti ulos.

Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.

Se on jo upea suoritus, jo saavata tuosta big navista sen 5700XT + 100%. Silloin se on tasoissa 3080:n kanssa ja voi kilpailla esim. halvemmalla hinnalla.
 
Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.

Se on jo upea suoritus, jo saavata tuosta big navista sen 5700XT + 100%. Silloin se on tasoissa 3080:n kanssa ja voi kilpailla esim. halvemmalla hinnalla.
Jos RDNA2:n energiatehokkuus on 50% parempi kuin edellisessä sukupolvessa, niin eikö kulutusta voida haarukoida seuraavasti?

Shadow of the Tomb Raider (1440p)
  • 5700 XT (40 CU, TDP 225W): 72,2 FPS eli 1,81 FPS/CU ja 0,32 FPS/W
  • 5700 (36 CU, TDP 180W): 64,7 FPS eli 1,80 FPS/CU ja 0,36 FPS/W
  • 5500 XT (22 CU, 130W): 40,0 FPS eli 1,82 FPS/CU ja 0,31 FPS/W
  • Keskiarvot: 1,81 FPS/CU ja 0,33 FPS/W
Tulokset on poimittu io-techin artikkeleista (kaikki 8Gb kortteja)
Jos "Big Navin" kellotaajuudet ovat samalla tasolla edellisten korttien kanssa, niin 80 CU:n version TDP olisi 310W, kun huomioidaan edellisissä laskuissa heikoimmat tulokset (1,80 FPS/CU ja 0,31 FPS/W)
  • 80 CU x1,80 FPS/CU = 144 FPS
  • 0,31 FPS/W x 1,5 = 0,465 FPS/W (+50% perf/watt)
  • 144 FPS / 0,465 FPS/W = 310 W
Tällöin 80 CU:n "Big Navi" vastaisi täysin RTX 3080, sillä sen TDP on 320W ja se sai Shadow of the Tomb Raider pelissä 141 FPS io-techin testissä.
 
Tämän mukaan pitäisi tulla korkeammat kellot, en usko kuitenkaan puhuttavan kovin suurista eroista.


1600418373145.png
 
Tämän mukaan pitäisi tulla korkeammat kellot, en usko kuitenkaan puhuttavan kovin suurista eroista.
Korkeammat kellot ovat itsestään selvä juttu, ovat olleet viimeistään siitä lähtien kun MS julkaisi muuttumattomat 1,825 GHz:n kellot ja Sony "dynaamiset mutta lähes aina maksimit" 2,23 GHz. Ja tuo dia tietenkin siihen päälle.
 
Korkeammat kellot ovat itsestään selvä juttu, ovat olleet viimeistään siitä lähtien kun MS julkaisi muuttumattomat 1,825 GHz:n kellot ja Sony "dynaamiset mutta lähes aina maksimit" 2,23 GHz. Ja tuo dia tietenkin siihen päälle.

1,825GHz ei ole yhtään kovempi kulku kuin 5700XT:llä.

1600419250800.png



Jos yksi 10% tulee lisää, on se hyvä, mutta ei mitenkään kovin suuri ero.
 
1,825GHz ei ole yhtään kovempi kulku kuin 5700XT:llä.

1600419250800.png



Jos yksi 10% tulee lisää, on se hyvä, mutta ei mitenkään kovin suuri ero.
Lukittu 1,825 GHz ei ole sama kuin samoilla paikkeilla pyörivä Boost-kellotaajuus mihin vaikuttavat monet muutkin tekijät.
 
Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.
AMD on ainakin aikaisemmin testannut kyseisen luvun oikeilla tuotteilla ja oikealla pelillä. Jos ne tekee nvidiat, niin olen kyllä aika pettynyt. Nvidioilla tarkoitan sitä niiden ”90%” parannusta energiatehokkuuteen, joka ei toteudu oikeilla tuotteilla oikeassa käyttöympäristössä ja oikea luku on n. 30%.

Se on toki mahdollista että se pätee jollain muulla kuin huippukortilla, mainitsivat vain että joku RDNA2 kortti tuon täyttää.
 
Kuten itsekkin varsin hyvin tiedät, niin tuota ei tule todellakaan tapahtumaan. Tuo energiatehokkuus on laskettu jollain optimitasolla ja huononee ihan fysiikan lajkeja noudatellen, kun aletaan jänöjä nostella.
Siinä on testipelinä Division 2 @ 1440p Ultra.
Optimitaso voi hyvinkin olla totta, en noista parista diapaketista saanut nyt 110% varmuutta onko tuossa edes GCN Vega 64 vai Vega 64 @ 40 CU, RDNA on joka tapauksessa 5700 XT. RDNA2 perustuu AMD:n arvioihin (perusteltavissa oleviin koska sijoittajille suunnattua dataa), kuten aina julkaisemattomissa tuotteissa.
Mutta kuten viime sukupolvesta tiedetään, todellisuudessa RX 5700 XT:n energiatehokkuus parani enemmän kuin luvattu 50 % vrt Vega 64.
 
Siinä on testipelinä Division 2 @ 1440p Ultra.
Optimitaso voi hyvinkin olla totta, en noista parista diapaketista saanut nyt 110% varmuutta onko tuossa edes GCN Vega 64 vai Vega 64 @ 40 CU, RDNA on joka tapauksessa 5700 XT. RDNA2 perustuu AMD:n arvioihin (perusteltavissa oleviin koska sijoittajille suunnattua dataa), kuten aina julkaisemattomissa tuotteissa.
Mutta kuten viime sukupolvesta tiedetään, todellisuudessa RX 5700 XT:n energiatehokkuus parani enemmän kuin luvattu 50 % vrt Vega 64.

Vega 64 => RX 5700XT oli sekä suuri arkkitehtuurimuutos että suuri valmistustekniikan muutos. "14nm" tekniikan vaihtaminen "7nm" tekniikkaan pitäisi jo yksinään antaa melkein tuplasti parempi energiatehokkuus jos ajettaisiin samoilla kelloilla, eli muut siihen vaikuttavat asiat (kellot+jännite+arkkitehtuuri) oli pikemminkin energiatehokkuutta huonontava vaikutus.

Mutta 5700XTssä tosiaan kellot oli kellot niin paljon ylempänä (ja jännite säädetty sen mukaan käyrällä suhteellisesti ylemmäs) ja arkkitehtuurimuutoksen vaikutukset energiatehokkuuteen (kumpaankaan suuntaan) jäi hyvin pieneksi ja jäätiin tuohon reilun 50% parannukseen sen takia että korkeahkot kellot huononsi sitä.

RDNA ehkä myös omaa potentiaalia parempaan energiatehokkuuteen kuin GCN, mutta paljon tästä potentiaalista jäi ehkä hyödyntämättä koska nuo ekat Navi-piirit piti ehkä saada kiireellä markkinoille ja paljon matalan tason virrankulutusoptimointeja jäi tekemättä. (näistä osa ehkä sitten ehti siihen applelle tehtyyn Navi 12 -piiriin, vaikka se onkin olevinaan rdna 1.0)



RDNA => RDNA2 on sitten paljon pienempi arkkitehtuurimuutos, ja myös paljon pienempi valmistustekniikan muutos.

Miten tässä välissä voidaan sitten realistisesti saada 50% parannus energiatehokkuudessa?

1) Valmistustekniikan viilaus N7 => joko N7P (~11%?) tai N7+ (~18%?) kellotaajuuden pysyessä samana (luvut kaivettu TSMCn pr-releaseista ja laskettu käänteisluku (10% / 15% vähennys))
2) Paljon mikroarkkitehtuurin matalan tason energiatehokkuusviilauksia joita ei RDNAhan ehditty aikataulusyistä toteuttaa (~25%) (tämä on melko optimistinen)
3) Isommilla välimuisteilla voi vähentää muistinkäyttöä ja sen kuluttamaa virta (~5% koko kortin virrankulutukseen)

Näillä oltaisiin aika lailla tasan tuossa 50%ssa.

En oikein näe edellytyksiä alkaa nostelemaan kellotaajuutta ylemmäs siten että tuo 50% aiotaan geneerisesti saavuttaa, vaan pitänee valita JOKO korkeampien kellojen TAI tuon "luvatun" energiatehokkuusparannuksen väliltä.


nVidiahan tosiaan laski hyvin epäreilusti "1.9x energiatehokkuusparannuksen" Amperelle siten että alikellotti Amperen paljon matalampiin kelloihin, matalammalle jännittelle kuin Turingin (siten että suorituskyky sama, kiitos suuremman laskentayksikkömäärän), vaikka eivät julkaisseet mitään tuotetta mikä näillä matalilla kelloilla, matalilla jännitteillä toimisi. Tähän en kuitenkaan usko AMDn sortuvan tuossa 50%ssaan.
 
(näistä osa ehkä sitten ehti siihen applelle tehtyyn Navi 12 -piiriin, vaikka se onkin olevinaan rdna 1.0)
"1.1", siinä on ne deep learning -käskyt mukana

1) Valmistustekniikan viilaus N7 => joko N7P (~11%?) tai N7+ (~18%?) kellotaajuuden pysyessä samana (luvut kaivettu TSMCn pr-releaseista ja laskettu käänteisluku (10% / 15% vähennys))
WikiChipin mukaan Navi10 on jo N7P eli prosessi on joko paranneltu versio N7P:stä tai N7+ (Radeon RX 5700: Navi and the RDNA Architecture)

Muuten toki hyviä pointteja, reilun kuukauden päästä ollaan rutkasti viisaampia.
 
AMD:llähän pitäisi riittää Compute Unittien tuplaaminen RX 5700 XT:stä (40 -> 80) vastaamaan RTX 3080 korttia suorituskyvyssä eikä kelloja tarvitsisi edes nostaa. Samoilla kelloilla lienee siis mahdollista saavuttaa se +50% energiatehokkuus, jolloin 80 CU version TDP olisi se noin 300-320W. Jos AMD haluaa lähteä haastamaan RTX 3090 korttia, niin kelloja pitäisi nostaa reilusti. RTX 3090 on kuitenkin 350W eli on siinä jonkin verran pelivaraa. En kuitenkaan usko, että RTX 3090 korttia vastaan riittää rahkeet.
 
AMD:llähän pitäisi riittää Compute Unittien tuplaaminen RX 5700 XT:stä (40 -> 80) vastaamaan RTX 3080 korttia suorituskyvyssä eikä kelloja tarvitsisi edes nostaa. Samoilla kelloilla lienee siis mahdollista saavuttaa se +50% energiatehokkuus, jolloin 80 CU version TDP olisi se noin 300-320W. Jos AMD haluaa lähteä haastamaan RTX 3090 korttia, niin kelloja pitäisi nostaa reilusti. RTX 3090 on kuitenkin 350W eli on siinä jonkin verran pelivaraa. En kuitenkaan usko, että RTX 3090 korttia vastaan riittää rahkeet.

Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.

Lopullinen, todellinen suorituskyky kortilla taitaa olla lopulta pitkälti ajureista, optimoinneista ja mahdollisesti (DLSS-tyyppisistä? AMD:kin saattaa omia kanejaan hatusta vetää...) optimoinneista kiinni ja varmasti 5700XT:stä on monellakin tapaa parannettu ja suorituskykyä optimoitu. Itse uskon, että hyvä kortti tulee joka tapauksessa, tärkeimpänä pitäisin, että ajurit jo launchissa vakaat ja toimivat ja 3080:n kanssa todennäköisesti joissain peleissä samalla viivalla ja toisissa jäädään taas (selvästi?) alle. Lisäksi näkisin hyvänä, mikäli virrankulutuksessa jäätäisiin nVidian korttien alle: Tällä kerralla vaikuttaisi aika tappiin vedetyltä nVidian kellot ja oman mielikuvani mukaan AMD (tai paremmin ATI) on historiallisesti ollut tällöin usein vahvoilla.
 
Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.

Lopullinen, todellinen suorituskyky kortilla taitaa olla lopulta pitkälti ajureista, optimoinneista ja mahdollisesti (DLSS-tyyppisistä? AMD:kin saattaa omia kanejaan hatusta vetää...) optimoinneista kiinni ja varmasti 5700XT:stä on monellakin tapaa parannettu ja suorituskykyä optimoitu. Itse uskon, että hyvä kortti tulee joka tapauksessa, tärkeimpänä pitäisin, että ajurit jo launchissa vakaat ja toimivat ja 3080:n kanssa todennäköisesti joissain peleissä samalla viivalla ja toisissa jäädään taas (selvästi?) alle. Lisäksi näkisin hyvänä, mikäli virrankulutuksessa jäätäisiin nVidian korttien alle: Tällä kerralla vaikuttaisi aika tappiin vedetyltä nVidian kellot ja oman mielikuvani mukaan AMD (tai paremmin ATI) on historiallisesti ollut tällöin usein vahvoilla.
AMD ei ole luvannut 50% teholisää vaan 50% parannusta energiatehokkuudessa. Edellisessä sukupolvessa suorituskyky näyttää skaalautuvat aikalailla lineaarisesti Compute Unittien mukaan.
Raider pelissä aiemmat Navit skaalautuvat seuraavasti 1440p resoluutiolla (kaikki 8Gb kortteja):
  • 5700 XT (40 CU): 72,2 FPS eli 1,81 FPS/CU
  • 5700 (36 CU): 64,7 FPS eli 1,80 FPS/CU
  • 5500 XT (22 CU): 40,0 FPS eli 1,82 FPS/CU
Tulokset on poimittu io-techin artikkeleista:
Eli tämän perusteella 80 CU:ta tarkoittaisi Shadow of the Tomb Raider pelissä +140 FPS about samoilla kelloilla (1440p). Sitten jos huomioidaan energiatehokkuuden parannus niin 450W kortin sijaan puhutaan jostain 300-320W TDP:stä. Jos kellot eroavat merkittävästi RX 5700 XT:stä, niin silloin kulutus on tietenkin eri.
 
AMD ei ole luvannut 50% teholisää vaan 50% parannusta energiatehokkuudessa. Edellisessä sukupolvessa suorituskyky näyttää skaalautuvat aikalailla lineaarisesti Compute Unittien mukaan.

En 50% teholisää tuossa (RDNA1->2) tarkoittanutkaan, vaan energiatehokkuutta, mutta se (energiatehokkuus) yhdessä muiden optimointien kanssa tuo automaattisesti myös teholisää, mikäli virrankulutusta ei lähdetä laskemaan.
 
En 50% teholisää tuossa (RDNA1->2) tarkoittanutkaan, vaan energiatehokkuutta, mutta se (energiatehokkuus) yhdessä muiden optimointien kanssa tuo automaattisesti myös teholisää, mikäli virrankulutusta ei lähdetä laskemaan.
Energiatehokkuuden parantuminen ei tuo teholisää ellei kelloja nosteta samassa suhteessa tai lisätä laskentayksikköjä. Jos CU määrä tuplataan, niin suorituskyvyn pitäisi kaksinkertaistua samoilla kelloilla. Energiatehokkuuden parantaminen mahdollistaa CU tuplaamisen, kun kulutus saadaan pidettyä aisoissa (noin RTX 3080:n tasolla). Jos kelloja nostetaan samalla, niin sitten TDP karkaa ylemmäs.
 
Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.
Ei kannata tuijotella niitä FLOPSeja liikaa, 3080 on "30 TFLOPSin kortti" mutta ei yllä edes kaksinkertaiseen suorituskykyyn vrt. saman firman viime sukupolven "11 TFLOPSin kortti", saati sitten mihin teoreettisten FLOPSien pohjalta "pitäisi" päästä
Energiatehokkuuden parantuminen ei tuo teholisää ellei kelloja nosteta samassa suhteessa tai lisätä laskentayksikköjä. Jos CU määrä tuplataan, niin suorituskyvyn pitäisi kaksinkertaistua samoilla kelloilla. Energiatehokkuuden parantaminen mahdollistaa CU tuplaamisen, kun kulutus saadaan pidettyä aisoissa (noin RTX 3080:n tasolla). Jos kelloja nostetaan samalla, niin sitten TDP karkaa ylemmäs.
Me emme tiedä millä kelloilla ne 50% paremmat perf/watit on luvattu ;)
 
Me emme tiedä millä kelloilla ne 50% paremmat perf/watit on luvattu ;)
Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi). Eli voidaan spekuloida, että samoilla kelloilla pienempi TDP, jos laskentayksikköjä saman verran. Laskentayksikköjen määrä nostaessa TDP nousee sitten ylemmäs.

Me ei tiedetä, millainen "Big Navi" tulee olemaan, mutta laskennallisesti AMD voi lykätä pihalle RTX 3080 näytönohjainta vastaavan kortin tuplaamalla CU:t +50% energiatehokkuuden turvin. Silloin ei tarvi kellojakaan nostaa.
 
Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi). Eli voidaan spekuloida, että samoilla kelloilla pienempi TDP, jos laskentayksikköjä saman verran. Laskentayksikköjen määrä nostaessa TDP nousee sitten ylemmäs.
Yleensä nämä on ilmoitettu siten että kulutus on vakioitu, tai vaihtoehtoisesti oikeilla tuotteilla. Ainoastaan nvidia sekoilee ton kanssa.
 
Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi). Eli voidaan spekuloida, että samoilla kelloilla pienempi TDP, jos laskentayksikköjä saman verran. Laskentayksikköjen määrä nostaessa TDP nousee sitten ylemmäs.

Me ei tiedetä, millainen "Big Navi" tulee olemaan, mutta laskennallisesti AMD voi lykätä pihalle RTX 3080 näytönohjainta vastaavan kortin tuplaamalla CU:t +50% energiatehokkuuden turvin. Silloin ei tarvi kellojakaan nostaa.
En ole nyt löytänyt ihan 110% varmaa tietoa (ts. en ihan koko presentaatioarkistoa käynyt läpi), mutta AMD ilmoitti saman 50% myös RDNA1:lle, silloin vertailu oli joko Vega64 vs RX5700XT tai Vega 64 @ 40CU vs RX5700XT (missä on aina 40 CU) Division 2ssa 1440p Ultra -asetuksin, mutta siitä tapauksesta tiedetään että se oli jopa yli 50% parempi isommalla kattauksella pelejä ihan rampauttamatonta Vega 64:ää vastaan.
Koska sama vertailupohja on mukana myös RDNA2:n +50% perf/watt luvanneessa vertailussa, on se joko Vega64 @ 40 CU vs RX5700XT vs RDNA2 @ 40 CU, tai sitten Vega64 vs RX5700XT vs joku tietty RDNA2-malli
 
Laitetaas nyt itsekkin omat pohdiskelut tänne.

Itsellä oli sapphiren 5700xt refu vesijäähdytettynä ja ainakin superpositionin perusteella isommalla kulutuksella suorituskyky skaalautui todella heikosti kellotaajuuksia en valitettavasti ole ottanut muistiin, mutta joku 5700xt omistaja voisi toistaa nämä(mahdollisesti kokeilla myös jossain ihan oikeassa pelissä), niin saadaan samalla validoitua minun luvut :tup:

Unigine 2 superposition 1080p Extreme:

Max 98W = 4061pts
Max 142W = 4726pts
Stock = 5200pts (monissa arvosteluissa 5700xt stock 5500 luokkaa)
Max 240W = ~5600

Sitten asiaan. 5700xt oli vain 251mm2 & 40cu joten käyrän optimikohdalta poikettu reilusti sikäli, kun siihen oli kulutuksen puolestavaraa ja lisäteholle 2070 kanssa kilpailuun myös tarvetta. Compute unitteja kun lykätään tuplat lisää voi olla jo pelivaraa mennä käyrällä alemmas suorituskyvyn silti ollessa ns. riittävä, sen lisäksi tmsc prosessin tuomat parannukset ja amd:n omat kikkailut mukaan niin +50% perf/watt voi toteutua.

Pahimman sattuessa +50% perf/w vertailukohdaksi voidaan ottaa raytracing-suorituskyky :smoke:
 
Ei tiedetäkkään mutta yleensä nämä on ilmoitettu, että sama suorituskyky on saavutettu alhaisemalla kulutuksella (jolloin perf/watt on sen 50% parempi).
Jos mennään noin niin RDNA1 paransi 90% keskimääräistä energiatehokkuutta ihan puolueettomissa testeissä. 180W 5700 on hieman nopeampi kuin 300W Vega64. Nvidia-tyyliin kirsikoita poimimalla saanee lisää, "Up to 100% perf/W increase!". Sitä ei tietenkään tiedetä pysyykö AMD varmasti linjallansa vai aletaanko matkimaan kilpailijaa. Se tiedetään että kirsikat jäi kakkuun viime kierroksella ja vertailu oli reilua.
125/66 = 1,893
performance-per-watt_3840-2160.png
 
Jos 5700XT:n laskennalliset (FP32) teraflopsit jäivät sinne alle 10 teraflopsin, niin eikö tuolla päästäisi (CUiden tuplaus + pieni kellolisä?) vasta vähän yli 20 teraflopsin. Tuolloin on toki aika lailla luvatun mukainen 50% laskennallinen teholisä 2080Tihin myös saavutettu (2080Ti n. 13.5Tflopsia eli se kertaa 1.5= 20.25). Laskennallisesti 3080 taitaa olla kuitenkin 30Tflops, joten siitä reilusti vielä jäädään. Tuo laskentakaava jättää joka tapauksessa tilaa RDNA1->2 optimoinneille ja jos 50% pitää lähellekään paikkaansa, niin silloin ollaan jo 3080 maastossa.

Ensinnäkin, AMD ei ole luvannut mitään" 50% suorituskykylisää" vaan 50% parannuksen energiatehokkuudessa mikä tarkoittaa esim. samaa suorituskykyä 33% pienemmällä sähkönkulutuksella.

Toisekseen, käytännössä mikään koodi mikä tekee mitään järkevää ei sisällä pelkkiä liukulukulaskuja.

Niiden lukujen tarvitsee tulla jostain, esim, muistista joko latauskäskyillä tai teksturisamplauskäskyillä, jotka pitää myös suorittaa
ja ne muisti- tai tekstuuriosoittet pitää myös jollain laskea.

Ja kun koodissa on loppi, pitää sen loopin laskuria laskea ja sen lopetusehtoa testata jne.

RDNA:lla SIMD-rakenteen takia monet osoitteen- tai indeksilaskennat on yhteisiä 32 tai 64 linjalle, ja siellä on yksi skalaariyksikkö 32 linjaa kohden, ja tätä voidaan (tietääkseni) käyttää näiden laskentaan samaan aikaan kuin lasketaan sitä varsinaista laskentaa SIMD-datapolulla.

Turing-sukupolvessa nVidialla oli jokaista SIMT-linjaa eli "CUDA curea" kohden omat kokonaislukuyksikkö sekä liukuluyksikkö. Samalla kun liukulukuyksikkö laski varsinaista laskentaa, kokonaislukuyksikkö laski osoitteita tai indeksejä ja näiden laskenta ei ollut pois varsinaisesta laskennasta.

Ampere-sukupolvessa tuota kokonaislukuyksiksikköä laajennettin siten että se pystyy laskemaan vaihtoehtoisesti myös liukulukulaskuja(mutta ei yhtä aikaa). Ja tämän jälkeen nämä kaksi yksiköä yhdessä laskettiinkin KAHDEKSI "cuda-ytimeksi".

Ja minkään muiden yksiköiden (latausyksiköt, tekstuurimappaysyksiköt jne) määrää ei myöskään tietääkseni nostettu samalla kun "cuda-ydin-määrää" nostettiin eli näiden määärä/"CUDA-ydin" putosi puoleen.

Eli siis, mikäli koodissa oli hyvin tasaisesti 50%-50% suhteessa liukuluku- ja kokonaislukulaskuja, Amperen nopeus/mainostettu CUDA-ydin tai per mainostettu terafloppi on tasan puolet Turingin nopeuteen nähden.

Käytännössä tyypillisellä koodilla (jossa liukulukulaskuja on enemmän kuin niitä kokonaislukulaskuja) hyöty siitä amperen "cuda-ytimien tuplaamisesta" on ehkä joku n. 30% suorituskykylisä, eli siis "cuda-ydintä kohden" Ampere tekee kellojaksossa tyypillisesti ehkä n. 65% siitä mitä Turing.
 
Viimeksi muokattu:
Jos amd:ltä tulee lähellekkään, tai tulee rtx 3080 tasoinen kortti halvemmalla, ja julkaisussa myydään paljon kortteja halukkaille, niin amd on voittanut ensimmäisen erän. Amd saa varmasti paljon paremman maineen.
 
Twiitin mukaan Big Navin kellot voisivat olla luokkaa 2100 MHz mikä olisi suuremmat kuin 5700XT:n pelikäytössä olevat kellot (1900-1950MHz IO Tech arvostelu). Eli 1:1 skaalauksella 80 CU RDNA2 olisi n. 115% tehokkaampi kuin 5700XT. 80/40CU*2,1/1,95GHz

5700XT:n Boost kellot taisivat olla mallista riippuen jopa yli 2GHz, eli jos twiitin kellot ovat paketin kyljen Boost-lukema, mikä ei käytännössä toteudu, niin ero voi olla pienempi.

TPU:n summaryssä 3080 10GB on resoluutiosta riippuen 53-100% nopeampi kuin 5700 XT, 75% 1440p:llä jota itse pidän parhaimpana vertailukohtana. Tämän perusteella pidän jopa todennäköisenä, että Big Navi on 3080 10GB-malleja tehokkaampi ilman RTX/DLSS-kikkailuja.

Hieman ihmetyttää edelleen vahvana pysyvät huhut Big Navin 16GB mallin 256-bit muistiväylästä näin korkealle ennustetulla tehonlisäyksellä. Oliskohan AMD:n pimennystaktiikan osana engineering samplen käyttäminen rajusti rampautetulla muistiväylällä, jotta mahdollisten vuotojen osuvuus todelliseen korttiin saadaan pidettyä heikkona?
 
PS5 gpu boost-kellot 2,23ghz joten veikkaan että pc-puolen osa kulkee 2,3ghz isomman TDP:n ansiosta.
 
PS5 gpu boost-kellot 2,23ghz joten veikkaan että pc-puolen osa kulkee 2,3ghz isomman TDP:n ansiosta.

Niin plösössä on 36CU piiri, kun Big Navi on 80CU:n piiri. Aika epätodennäköistä, että pääsee ihan samoihin kelloihin tuo iso piiri. Itse veikkaan Big Navin kelloiksi max 2 GHz, ehkä jonkun verran alle.
 

Statistiikka

Viestiketjuista
258 314
Viestejä
4 491 389
Jäsenet
74 194
Uusin jäsen
Juhisti

Hinta.fi

Back
Ylös Bottom