AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Huomatkaa mikä ero on energiatehokkuudessa Turingin ja Pascalin välillä, kun Pascalista puuttui rautakäskyttäjä, mikä eittämättä tekee Pascalista tehottomamman DX12-rajapinnan kanssa.

Pascalissa ei ole RT-ytimiä DXR:ää varten eikä VRS tukea niin miten näitä voi verrata keskenään? Eikö tuo energiatehokkuus tulisi mitata sellaisessa rajapinnassa missä molemmilla samat käskykannat käytössä?

kilpailijan saman tehoinen tuote vie vain noin 20 W vähemmän virtaa (RTX 2070 Super vastaan RX 5700 XT)

5700XT ei nyt kuitenkaan taida olla saman "tehoinen" kuin 2070S, parempi näytönohjain 5700XT varmaankin €/fps suhteella mitattuna.

Sen mitä AMD pystyy RDNA2:lla nokittamaan tehokkainta kohtuullisesti kuluttavaa malliaan vielä tehokkaammaksi, Nvidia tulee esittelemään hyvin varmasti vielä himpun tehokkaamman näyttiksen, eli puhutaan jo yli RTX 2080 Ti:n tehoisesta toki.

Onhan tuo RTX Titan ollut jo hetken markkinoilla ja seuraavassa sukupolvessa tuskin hitaampia "lippulaiva" näytönohjaimia odotettavissa.


Yhteenvetona en nyt ihan ymmärrä miten näytönohjaimia (GPU) myytäisiin/markkinoitaisiin nyt tai edes lähitulevaisuudessa energiatehokkuudella?
 
Yhteenvetona en nyt ihan ymmärrä miten näytönohjaimia (GPU) myytäisiin/markkinoitaisiin nyt tai edes lähitulevaisuudessa energiatehokkuudella?
Mielummin sen vähemmän kuluttavan viileän ohjaimen ostaa kuin saman suorituskyvyn omaavan ohjaimen jonka kulutus reilusti enemmän, tietysti hinta yksi ratkaiseva tekijä tässäkin yhtälössä mutta energiatehokkuus näyttelee usein aika isoakin roolia.

Energiatehokkuus myös mahdollistaa sen HighEnd ohjaimen esim 270w kulutuksella reilusti kovemman kortin julkaisun kuin heikomman energiatehokkuuden omaavalla arkitehtuurilla.

Esim.
RX590 kulutuksella on mahdollista saada Gtx1080Ti/Rtx2080S suorituskyky.
Ja RX590 kanssa suunnilleen yhtänopea ohjain kuluttaakin vain n.100w

power-gaming-average.png
 
Mielummin sen vähemmän kuluttavan viileän ohjaimen ostaa kuin saman suorituskyvyn omaavan ohjaimen jonka kulutus reilusti enemmän, tietysti hinta yksi ratkaiseva tekijä tässäkin yhtälössä mutta energiatehokkuus näyttelee usein aika isoakin roolia.

Energiatehokkuus myös mahdollistaa sen HighEnd ohjaimen esim 270w kulutuksella reilusti kovemman kortin julkaisun kuin heikomman energiatehokkuuden omaavalla arkitehtuurilla.

Esim.
RX590 kulutuksella on mahdollista saada Gtx1080Ti/Rtx2080S suorituskyky.
Ja RX590 kanssa suunnilleen yhtänopea ohjain kuluttaakin vain n.100w

power-gaming-average.png
RX 590 on kolme sukupolvea vanhaa arkkitehtuuria. Saman ajan NVIDIAn arkkitehtuurilla (Maxwell) eroa ei ole nimeksikään, 980 Ti on 3-4% nopeampi ja kuluttaa ~yhtä paljon (average ero 7W, peak ero 1W)
Tietenkin uudemmat saman tehoiset kuluttavat vähemmän.
 
RX 590 on kolme sukupolvea vanhaa arkkitehtuuria. Saman ajan NVIDIAn arkkitehtuurilla (Maxwell) eroa ei ole nimeksikään, 980 Ti on 3-4% nopeampi ja kuluttaa ~yhtä paljon (average ero 7W, peak ero 1W)
Tietenkin uudemmat saman tehoiset kuluttavat vähemmän.
Tietysti nyt haluat vertailla vuoden 2018 Amd ohjainta Nvidian vuoden 2015 ohjaimeen eli täysin typerää.
RX590 julkaisu 2018 lopulla (vieläkin uutena myynnissä)
Gtx980Ti julkaisu 2015
Gtx1080Ti julkaistu 2017

Mutta kyse oli kuitenkin enemmän energiatehokkuuden merkityksestä kuin Nvidia vs Amd asetelmasta.
 
Tietysti nyt haluat vertailla vuoden 2018 Amd ohjainta Nvidian vuoden 2015 ohjaimeen eli täysin typerää.
RX590 julkaisu 2018 lopulla (vieläkin uutena myynnissä)
Gtx980Ti julkaisu 2015
Gtx1080Ti julkaistu 2017

Mutta kyse oli kuitenkin enemmän energiatehokkuuden merkityksestä kuin Nvidia vs Amd asetelmasta.
Arkkitehtuurista minä puhuin, Polaris se RX 590 on vaikka se olisi julkaistu milloin ja olisi myynnissä miten pitkään tahansa. Ei se arkkitehtuuri ole muuttunut sen energiatehokkaammaksi, jotain pientä hyötyä saattoi saada 14>12nm vaihdosta mutta se tapahtui jo ennen RX 590:iä.
 
Arkkitehtuurista minä puhuin, Polaris se RX 590 on vaikka se olisi julkaistu milloin ja olisi myynnissä miten pitkään tahansa. Ei se arkkitehtuuri ole muuttunut sen energiatehokkaammaksi, jotain pientä hyötyä saattoi saada 14>12nm vaihdosta mutta se tapahtui jo ennen RX 590:iä.
Tää on nyt vähän sama kuin sanoisi, ettei Intelin uusia prosessoreja saa haukkua, kun ihan hyviä ne on Skylaken AMD-aikalaisiin verrattuna.
 
Mutta kyse oli kuitenkin enemmän energiatehokkuuden merkityksestä kuin Nvidia vs Amd asetelmasta.

Tuo on pallon toinen puoli, itselleni syy miksi hankin talouteen Vega 56 ja 64 kortit oli ihan hinta/laatusuhde. Toki jos samaan hintaan olisi saanut kilpailevasta leiristä parempaa/yhtähyvää niin miksi ei. Toki se on fakta että esim. 1080TI vaatii vähemmän virtaa mutta sitä ei silloin saanut alle 400€ (tai 1080 korttia uutena noin 250€) joten...

Eli itse katson ainakin hintaa, tehoa, ääntä sekä paljonko se vie sitä virtaa (mikä helposti heijastuu lämmöiksi).

Tämä siis ihan yleinen postaus, ei ole tarkoitus erikseen pohtia juuri Navia mutta niinhän moni muukin on kertonut jopa ihan kilpailevista korteistakin eri valmistajalta joka ei ikinä tule edes Navia tekemään.
 
Tää on nyt vähän sama kuin sanoisi, ettei Intelin uusia prosessoreja saa haukkua, kun ihan hyviä ne on Skylaken AMD-aikalaisiin verrattuna.
No ei se kyllä ole, RX 590 on ihan sama siru kuin 570/580 mikä on ihan sama siru kuin 470/480 toteutettuna "12nm":llä "14nm":n sijaan (12nm ei ollut varsinainen uusi prosessi vaan viritelty 14nm, vrt TSMC:n 16/12nm).
Vaikka Intelin nykyisetkin 14nm:t pohjautuu Skylakeen, ne eivät ole samoja siruja (ei edes vaikka jätettäisiin huomioitta ydinmäärän kasvu)
 
Nykyisellä RDNA:lla ei voida saavuttaa RTX 2080 Ti:n tehoista korttia minkään sortin järkevällä kulutuksella.

Väärin. AMD saisi 2080Ti:n tehoja vastaavan kortin kyllä halutessaan ulos RDNA:lla. Tarkastellaan vaikka 32 ja 64-core rippereitä. Niillä on sama TDP mutta toinen kykenee sillä samalla energialla tekemään 50% enemmän työtä koska omaa 100% enemmän coreja.
Mitä luulet että tapahtuu jos otetaan 5700XT, tuplataan CU määrä ja tiputetaan kelloja niin että saadaan 50% lisää suorituskykyä? Ollaan 2080Ti:n tehoissa ja jopa ohikin, todennäköisesti kulutus pysyttelee aika samoissa kuin 5700XT:llä. reilu 20% kellojen tiputus vaan tekee ihmeitä energiatehokkuudelle silloin kun lähtökohta on jo piiskattu kovin ylös. (3990X base clock 2,9 vs 3970X base clock 3,7)

Syy miksei AMD ole tätä tehnyt on melkovarmasti 7nm valmistuskapasiteetti, kunhan tuolle nykyiselle prosessille tulee tilaa, eli apple sun muut hyppää seuraavaan prosessiin, niin eiköhän noita isoja RDNA piirejä ala tulla tai sitten mennään suoraan RDNA2.
Ja toinen syy on varmaankin se että AMD selkeästi panostaa nyt CPU puolelle paukkuja ja siellähän menee varsin hyvin. Pienen firman olisi varsin työlästä sotia kahdella rintamalla yhtäaikaa, sen takia ei CPU puolellakaan lähteny heti kisaamaan joka paikkaan, vaan ensin serverit ja desktopit, nyt aletaan valloittaa myös läpytin puolta.
 
Syy miksei AMD ole tätä tehnyt on melkovarmasti 7nm valmistuskapasiteetti, kunhan tuolle nykyiselle prosessille tulee tilaa, eli apple sun muut hyppää seuraavaan prosessiin, niin eiköhän noita isoja RDNA piirejä ala tulla tai sitten mennään suoraan RDNA2.
Suoraan RDNA2
 
Väärin. AMD saisi 2080Ti:n tehoja vastaavan kortin kyllä halutessaan ulos RDNA:lla. Tarkastellaan vaikka 32 ja 64-core rippereitä. Niillä on sama TDP mutta toinen kykenee sillä samalla energialla tekemään 50% enemmän työtä koska omaa 100% enemmän coreja.
Mitä luulet että tapahtuu jos otetaan 5700XT, tuplataan CU määrä ja tiputetaan kelloja niin että saadaan 50% lisää suorituskykyä?

Tapahtuu se, että tämän jälkeen ollaan pahasti muistikaista- ja ROP-rajoittuneita, ja suorituskyky pudonneen pikselinpiirtonopeuden takia joissain softissa jopa huonompi. ROPien määrä pitäisi myös tuplata, ja muistikaistaa pitäisi myös saada jostain lisää.

Mutta ROPien määrän tuplaamisen voi tosiaan laskea asiaksi joka kuuluu kuvioon joten tältä osin voi todeta minun nipottaneen turhia.

Ollaan 2080Ti:n tehoissa ja jopa ohikin, todennäköisesti kulutus pysyttelee aika samoissa kuin 5700XT:llä. reilu 20% kellojen tiputus vaan tekee ihmeitä energiatehokkuudelle silloin kun lähtökohta on jo piiskattu kovin ylös. (3990X base clock 2,9 vs 3970X base clock 3,7)

Se, että ytimen kelloja pudotetaan ei myöskään tee mitään muistin kuluttamalle sähkölle. Näyttiksissä muistin kuluttama sähkömäärä ei ole merkityksetön asia.

Syy miksei AMD ole tätä tehnyt on melkovarmasti 7nm valmistuskapasiteetti, kunhan tuolle nykyiselle prosessille tulee tilaa, eli apple sun muut hyppää seuraavaan prosessiin, niin eiköhän noita isoja RDNA piirejä ala tulla tai sitten mennään suoraan RDNA2.

Ja toinen syy on varmaankin se että AMD selkeästi panostaa nyt CPU puolelle paukkuja ja siellähän menee varsin hyvin. Pienen firman olisi varsin työlästä sotia kahdella rintamalla yhtäaikaa, sen takia ei CPU puolellakaan lähteny heti kisaamaan joka paikkaan, vaan ensin serverit ja desktopit, nyt aletaan valloittaa myös läpytin puolta.

Mennään suoraan RDNA2een (jossa oleellinen lisäys on säteenjäljityksen törmäystarkastusten rautakiihdytys).

Lähinnä AMDllä on rajoitettu määrä resursseja eri piirien layouttaamiseen. Viime vuodelle tuli ainakin pari navi-näyttistä, zen2-ccd-chiplet, pari eri zen2-io-piiriä.

Seuraavaa high-end-piiriä ei myöskään haluta tuoda markkinoille ilman säteenjäljityksen rautakiihdytystä, ja suuren piirin layouttaaminen vie muutenkin enemmän resursseja kuin pienen. Ja tuollainen piiri olisi myös melko kallis valmistaa; Ei riitä, että tuote voidaan tehdä, vaan siitä pitäisi myös saada voittoa. Jos tehdään jättipiiri matalilla kelloilla, ei siitä saa niin hyvää katetta kuin tekemällä saman suorituskyvyn pienemmällä piirillä.
 
Viimeksi muokattu:
Mielummin sen vähemmän kuluttavan viileän ohjaimen ostaa kuin saman suorituskyvyn omaavan ohjaimen jonka kulutus reilusti enemmän, tietysti hinta yksi ratkaiseva tekijä tässäkin yhtälössä mutta energiatehokkuus näyttelee usein aika isoakin roolia.

Epäilen kuitenkin että näytönohjaimen hankitahinnalla on kuitenkin se suurin vaikutus keskimääräisen kuluttajan ostopäätökseen, eli kuinka paljon raakaa laskentatehoa (esim FPS) saa per €, ei se kuinka paljon watteja töpselistä menee per FPS. Vähemmän kuluttava näytönohjain ei myöskään välttämättä ole yhtään sen viileämpi koska siihen vaikuttaa kuitenkin kokonaisuudessaan koko järjestelmän jäähdytyksen toteutus.

Jos olisi mahdollisuus valita kahden samanaikaisesti myynnissä olevan ja saman suorituskyvyn omaavan näytönohjaimen välillä niin silloin tuo energiatehokkuus varmasti olisikin erittäin oleellista, tällaista tilannetta markkinoilla vaan ei ole uskoakseni/tietääkseni koskaan ollut ja saapa nähdä tuleeko olemaankaan.
 
Tapahtuu se, että tämän jälkeen ollaan pahasti muistikaista- ja ROP-rajoittuneita, ja suorituskyky pudonneen pikselinpiirtonopeuden takia joissain softissa jopa huonompi. ROPien määrä pitäisi myös tuplata, ja muistikaistaa pitäisi myös saada jostain lisää.

Niin tottakai esim 384-bittiseksi muistikaista tai miksei 512? Tai HBM2. Ja tietenkin ROP tuplautuisi samalla.

Se, että ytimen kelloja pudotetaan ei myöskään tee mitään muistin kuluttamalle sähkölle. Näyttiksissä muistin kuluttama sähkömäärä ei ole merkityksetön asia.

Eiköhän siihenkin vaikuta se että miten piiskatut ne muistit on. Ja tietenkin sekin vaikuttaa että mitä muistia käytetään. HBM2 taitaa olla huomattavasti hillitympi tuon kulutuksen suhteen.
Taisi joku laskeskella että "isoon naviin" saataisiin 71% muistikaistaa lisää 384-bit väylällä ja korkeammalle kellottuvilla muisteilla. Tuohan riittäisi ihan kivasti jos 50% tulisi tehoja lisää itse GPU:lle.

Jos nyt ajatusleikkiä leikitään lisää niin eihän tuollainen navi 10 tuplana olisi vielä edes kovin suuri piiri. Siellä on jotakin tuplana jotka voisi jättää pois niin päästäisiin varmaan alle Vegan lukemia lastun koossa.

Vaikka tuolla varmaan päästäisiin 2080Ti:n lukemiin ja ehkä jopa ohitte, niin AMD ei vaan ole nähnyt järkeväksi alkaa tuota tuomaan markkinoille varmaankin sen takia että RDNA2 on jo niin lähellä.

Toivottavasti AMD olisi tuomassa myös uudistuksia pakkaukseen ettei kortit olisi niin muistikaista riippuvaisia, käsittääkseni tässä nvidia on aika paljon vielä edellä. RDNA ei tainnut tuohon juurikaan parannusta tuoda.
 
Jos nyt ajatusleikkiä leikitään lisää niin eihän tuollainen navi 10 tuplana olisi vielä edes kovin suuri piiri. Siellä on jotakin tuplana jotka voisi jättää pois niin päästäisiin varmaan alle Vegan lukemia lastun koossa.
Kaikki on suhteellista, "ei olisi vielä edes kovin suuri piiri" olisi maailman toiseksi suurin GPU tähän asti, vain GV100 olisi isompi (transistoreissa laskettuna)
 
Kaikki on suhteellista, "ei olisi vielä edes kovin suuri piiri" olisi maailman toiseksi suurin GPU tähän asti, vain GV100 olisi isompi (transistoreissa laskettuna)

Niin sie meinasit jotta ilman transistorien lisäämistä saadaan lisää laskentatehoa vaan nodea pienentämällä?



Se nyt vaan menee niin jotta transistoreja tulee lisää. Onhan tuossa 2080Ti:ssä jo aika hitonmoinen kasa niitä. :)

EDIT: Ja jos mooren lain hengessä jatketaan niin kyllähän se tänävuonna pitäis 40 paukkua rikki komeasti joltain taholta.
 
Viimeksi muokattu:
Jos nyt ajatusleikkiä leikitään lisää niin eihän tuollainen navi 10 tuplana olisi vielä edes kovin suuri piiri. Siellä on jotakin tuplana jotka voisi jättää pois niin päästäisiin varmaan alle Vegan lukemia lastun koossa.

Siellä olis lähinnä videokoodekit ja 2D-graffapuoli jotka olisi "turhaan" tuplana, siten että niillä ei vaikutusta 3d-suorituskykyyn.

Niiden osuus yhdessä ehkä parikymmentä neliömillimetriä. Olisi tosiaan varmaan lastun koossa luokkaa karvan verran alle alkuperäisen Vega 10n, mutta millimetriä kohden "7nm" valmistustekniikka on fundamentaalisesti selvästi kalliimpi kuin "14nm" tekniikka oli johtuen paljon moninkertaisemmasta valotuksesta. Fundamentaalisesti kalliimmalla siis tarkoitan sitä, että tämä hintaero ei johdu prosessien "kypsyyserosta ja kermankuorintahinoittelusta", vaikka molempien kehityskustannukset kuinka kuoletetaan ja prosessit saadaan viilattua erittäin hyvin toimiviksi, tämä hintaero pysyy, koska "7nm" piirin valmistamiseen vaan tarvii tehdä tehtaalla enemmän vaiheita.

Eli siis, Vega 10ä pienempi piiri tosiaan pinta-alaltaan, mutta valmistuskustannuksiltaan itse piilastun osalta silti suurempi.

Toisaalta, mikäli ei tulisi HBM2sta ja jäisi interposer pois, siinä voitaisiin valmistuskustannuksissa säästää osa siitä, mitä tuohon kalliimpaan valmistusprosessiin menetettäisiin.

Vaikka tuolla varmaan päästäisiin 2080Ti:n lukemiin ja ehkä jopa ohitte, niin AMD ei vaan ole nähnyt järkeväksi alkaa tuota tuomaan markkinoille varmaankin sen takia että RDNA2 on jo niin lähellä.

Ja piiriä kehittämään. Uuden piirin layouttaaminen vaatii selvästi työtä, laskentatehoa ja maksaa selvästi, ja AMDn rajallisilla resursseilla olisi ollut pois jostain muualta, joku muu piiri olisi pitänyt perua/viivästää tämän tieltä.

Toivottavasti AMD olisi tuomassa myös uudistuksia pakkaukseen ettei kortit olisi niin muistikaista riippuvaisia, käsittääkseni tässä nvidia on aika paljon vielä edellä. RDNA ei tainnut tuohon juurikaan parannusta tuoda.

Kyllä RDNA jonkin verran paransi tässä.

Käytännössä ainakin sen kautta, että kun RDNA-ytimet saadaan työllistettyä selvästi pienemmällä aktiivisella work item-määrällä kuin GCN-ytimet, siellä on vähemmän work itemeita kilpailemassa välimuistitilasta, ja välimuisteille saadaan paremmat osumatarkkuudet.
 
Viimeksi muokattu:
Tuo Game Clock on kai se "perustaajuus" ja boost on sitten maksimit jos olosuhteet sallii.
Periaatteessa noin. Game clock on nimensä mukaan tyypillinen (todellinen) kellotaajuus pelatessa, vaihtelee pelien välillä. Omassa jää yleensä vajaat 100 MHz alle boost taajuuden vaikka mikään ei tietääkseni rajoita.
 
AMD 'Big Navi' Radeon RX GPUs To Disrupt 4K Gaming Like Ryzen CPUs

pari mielenkiintoista pointtia:

* rdna2-piirit valmistetaan"7nm+"-valmistusprosessilla(euv)

* mix of gddr6 and hbm2. Eli järein malli varmaan hbm2
7nm+ on tiedetty jo ennen kuin tiedettiin että siitä tulee RDNA2 (ts kun roadmapeissa näkyi vain Vega, Navi ja Next gen)
Itse olen skeptinen että tulisi HBM-versiota. HBM:stä on käsittääkseni eniten hyötyä palvelinpuolen hommissa ja sinne on kuitenkin tulossa extra-järeää GCN:ää vielä, niin en jotenkin näe tilausta HBM-Navi2:lle sillä puolen. Toki jos ovat todenneet että sillä saa GDDR6:tta helpommin tietyn määrän kaistaa mikä tarvitaan pelipuolelle niin onhan se mahdollista, mutta epäilen itse.
 
Sitten suoraan AMD:n suusta, eikä huhupajoilta:

"In 2019, we launched our new architecture in GPUs, it's the RDNA architecture, and that was the Navi based products. You should expect that those will be refreshed in 2020 - and we'll have a next generation RDNA architecture that will be part of our 2020 lineup. So we're pretty excited about that, and we'll talk more about that at our financial analyst day. On the data centre GPU side, you should also expect that we'll have some new products in the second half of this year."

Anandtech teki tuosta tulkinnan, että 2020 tulee Navi refresh ja RDNA2:

"All told, it looks like AMD is setting themselves up for a Vega-like release process, launching new silicon to replace their oldest existing silicon, and minting new products based on existing and/or modestly revised silicon for other parts of their product stack. This would be very similar to what AMD did in 2017, where the company launched Vega at the high-end, and refreshed the rest of their lineup with the Polaris based Radeon RX 500 series."
 
Sitten suoraan AMD:n suusta, eikä huhupajoilta:

"In 2019, we launched our new architecture in GPUs, it's the RDNA architecture, and that was the Navi based products. You should expect that those will be refreshed in 2020 - and we'll have a next generation RDNA architecture that will be part of our 2020 lineup. So we're pretty excited about that, and we'll talk more about that at our financial analyst day. On the data centre GPU side, you should also expect that we'll have some new products in the second half of this year."

Anandtech teki tuosta tulkinnan, että 2020 tulee Navi refresh ja RDNA2:

"All told, it looks like AMD is setting themselves up for a Vega-like release process, launching new silicon to replace their oldest existing silicon, and minting new products based on existing and/or modestly revised silicon for other parts of their product stack. This would be very similar to what AMD did in 2017, where the company launched Vega at the high-end, and refreshed the rest of their lineup with the Polaris based Radeon RX 500 series."
Tässä kohtaa on oleellinen kysymys onko AnandTechiin postattu lainaus täysin oikein vai ei. Seeking Alpha (joka julkaisee transkriptejä noista) meinaan on kirjoittanut eri tavalla: https://seekingalpha.com/article/43...-results-earnings-call-transcript?part=single
Yes. So, in 2019, we launched our new architecture in GPUs, it’s the RDNA architecture and that was the Navi based products. You should expect that those will be refreshed in 2020 and will have next generation RDNA architecture that will be part of our 2020 lineup.
Tuossa on pieniä mutta merkittäviä eroja. AnandTechin lauseen mukaan voidaan tulkita että refreshejä muut ja yksi RDNA2:sta (vaikka senkin voi tulkita myös niin että kaikki on RDNA2:sta). Seeking Alphan transkriptin mukaan taas annetaan ymmärtää että refreshit on RDNA2:sta. AMD:n koodinimet siruille tukisi Seeking Alphan kantaa (koska on epätodennäköistä että Navi2x-sirut olisivat eri arkkitehtuuria keskenään)
 
Tässä kohtaa on oleellinen kysymys onko AnandTechiin postattu lainaus täysin oikein vai ei. Seeking Alpha (joka julkaisee transkriptejä noista) meinaan on kirjoittanut eri tavalla: https://seekingalpha.com/article/43...-results-earnings-call-transcript?part=single

Tuossa on pieniä mutta merkittäviä eroja. AnandTechin lauseen mukaan voidaan tulkita että refreshejä muut ja yksi RDNA2:sta (vaikka senkin voi tulkita myös niin että kaikki on RDNA2:sta). Seeking Alphan transkriptin mukaan taas annetaan ymmärtää että refreshit on RDNA2:sta. AMD:n koodinimet siruille tukisi Seeking Alphan kantaa (koska on epätodennäköistä että Navi2x-sirut olisivat eri arkkitehtuuria keskenään)

Tuon voi tulkita useammalla tapaa, kun tuossa lauseessa ei niin selkeästi ilmaista mitä tarkoitetaan. Voisi myös tarkoittaa samantyyppistä jakoa kuin nvidialla on tällä hetkellä. Edullisimman pään kortit olisi vaan refreshejä 7nm+:lle (tehot ei riitä RT:lle) ja kalliimmat mallit RDNA2. Voihan siellä myös silti olla jotain optimointia/viilailuja noissa refresh malleissakin. Mutta tämä nyt on vaan pelkkää mutuilua omalta osalta.
 
Tuon voi tulkita useammalla tapaa, kun tuossa lauseessa ei niin selkeästi ilmaista mitä tarkoitetaan. Voisi myös tarkoittaa samantyyppistä jakoa kuin nvidialla on tällä hetkellä. Edullisimman pään kortit olisi vaan refreshejä 7nm+:lle (tehot ei riitä RT:lle) ja kalliimmat mallit RDNA2. Voihan siellä myös silti olla jotain optimointia/viilailuja noissa refresh malleissakin. Mutta tämä nyt on vaan pelkkää mutuilua omalta osalta.

Tuon voi tulkita monella tapaa, mutta seekingalpha on tuttu ja sen lainaus vaikuttaa loogisemmalle. AMD patentin mukaan shaderit hoitaisi myös raytracing hommia. Siten RT tehoa saa nostettua vain ytimiä lisäämällä, joten kansanmallit voi todellakin olla liian pieniä ja mopoja RT käyttöön. Ehkä feature on niissä silti päällä, tai ajureilla kytketty vain XXXX sarjasta ylöspäin asentoon.
 
Tuon voi tulkita monella tapaa, mutta seekingalpha on tuttu ja sen lainaus vaikuttaa loogisemmalle. AMD patentin mukaan shaderit hoitaisi myös raytracing hommia. Siten RT tehoa saa nostettua vain ytimiä lisäämällä, joten kansanmallit voi todellakin olla liian pieniä ja mopoja RT käyttöön. Ehkä feature on niissä silti päällä, tai ajureilla kytketty vain XXXX sarjasta ylöspäin asentoon.

Ilmeisesti siellä on raudassa oma palikka sitä hoitamassa, mutta ne on sijoitettu noihin shadereihin. Jos tuo pitää paikkansa, niin edullisemmissa malleissa säästyisi kuitenkin transistoreja jos ne jätetään pois. Ilmeisesti nuo vie kuitenkin vaan vähän tilaa, joten voi olla edullisempi olla suunnittelematta erillistä piiriä sen takia. Mutta tuo selvinnee vasta sitten kun noita tulee saataville tai tulee tarkempaa tietoa AMD:lta itseltään.
 
Ilmeisesti siellä on raudassa oma palikka sitä hoitamassa, mutta ne on sijoitettu noihin shadereihin. Jos tuo pitää paikkansa, niin edullisemmissa malleissa säästyisi kuitenkin transistoreja jos ne jätetään pois. Ilmeisesti nuo vie kuitenkin vaan vähän tilaa, joten voi olla edullisempi olla suunnittelematta erillistä piiriä sen takia. Mutta tuo selvinnee vasta sitten kun noita tulee saataville tai tulee tarkempaa tietoa AMD:lta itseltään.
Tällä hetkellä oletus on, että AMD:n ratkaisu noudattaa sitä yhtä nähtyä patenttia. Mikäli näin on, RT-kiihdytys tapahtuu osittain päivitetyissä TMU-yksiköissä ja osittain streamprosessoreissa. TMU-yksiköiden ja streamprosessoreiden määrä on sidottu toisiinsa, joten suorituskykyä tulee lisää sitä mukaa kun lisätään rautaa rajalle.
 
Mitähän sitä edes mahdetaan tarkoittaa ”RT-kiihdytyksellä”? Oletettavasti ainakin se BVH-puun selaus on oltava, sillä se on varmaankin suhteessa transistorimäärään eniten suorituskykyä lisäävä feature. Tuskin Nvidia sitä muuten olisi ekana lisännyt.

Se, että mihin yksikköön se fixed-function hardis integroidaan on varmaan aika yhdentekevää. Tai eiköhän kumpikin valmistaja osaa arvioida, että missä muistia ja cacheja voidaan hyödyntää optimaalisimmin yms.

Osumien löytymisen jälkeen tarvitaan tietty vielä reilusti shader-tehoa, jotta niillä osumilla saadaan jotain tehtyäkin. Ehkä jotain sekundäärisäteiden kimpoamiskulmien laskentaa jne. voisi myös kiihdyttää?
 
Mitähän sitä edes mahdetaan tarkoittaa ”RT-kiihdytyksellä”? Oletettavasti ainakin se BVH-puun selaus on oltava, sillä se on varmaankin suhteessa transistorimäärään eniten suorituskykyä lisäävä feature. Tuskin Nvidia sitä muuten olisi ekana lisännyt.

Törmäystarkasteluita, ensin BVH-puun laatikoihin ja viimeisenä itse kolmioihin. Molemmat on riittävän samanlaista hommaa että on helppo tehdä rauta joka pystyy tekemään törmäystarkstelut molempiin.

BVH-puun rakentaminen olisi seuraava asia, mutta sitä todennäköisesti ei nähdä vielä, ilmankin selviää; Kunhan pelissä ei ole hirveää määrää dynaamisesti muuttuvaa geometriaa, kun dynaamisesti muuttuvan geometrian määrä on pieni, sen puun rakentaa niiden osalta softallakin. (ja staattisen geometrian puuhaaran voi tehdä kertaalleen kun scene ladataan)

Se, että mihin yksikköön se fixed-function hardis integroidaan on varmaan aika yhdentekevää. Tai eiköhän kumpikin valmistaja osaa arvioida, että missä muistia ja cacheja voidaan hyödyntää optimaalisimmin yms.

Osumien löytymisen jälkeen tarvitaan tietty vielä reilusti shader-tehoa, jotta niillä osumilla saadaan jotain tehtyäkin. Ehkä jotain sekundäärisäteiden kimpoamiskulmien laskentaa jne. voisi myös kiihdyttää?

Nämä on liian softaspesifisiä, ettei oikein. Eri softat haluaa tehdä nämä eri tavalla riippuen siitä, mitä ollaan tekemässä. Että nämä voisi rautakiihdyttää, pitäisi olla joku kiinteä rajapinta, ja se rajapinta olisi käytännössä liian jäykkä ettei se taipuisi kaikkeen siihen mitä kaikki softat haluaa tehdä.
 
Törmäystarkasteluita, ensin BVH-puun laatikoihin ja viimeisenä itse kolmioihin. Molemmat on riittävän samanlaista hommaa että on helppo tehdä rauta joka pystyy tekemään törmäystarkstelut molempiin.

BVH-puun rakentaminen olisi seuraava asia, mutta sitä todennäköisesti ei nähdä vielä, ilmankin selviää; Kunhan pelissä ei ole hirveää määrää dynaamisesti muuttuvaa geometriaa, kun dynaamisesti muuttuvan geometrian määrä on pieni, sen puun rakentaa niiden osalta softallakin. (ja staattisen geometrian puuhaaran voi tehdä kertaalleen kun scene ladataan)



Nämä on liian softaspesifisiä, ettei oikein. Eri softat haluaa tehdä nämä eri tavalla riippuen siitä, mitä ollaan tekemässä. Että nämä voisi rautakiihdyttää, pitäisi olla joku kiinteä rajapinta, ja se rajapinta olisi käytännössä liian jäykkä ettei se taipuisi kaikkeen siihen mitä kaikki softat haluaa tehdä.
Eikö BVH pidä luoda sijaintihierarkian, eikä pelkän dynaaminen-staattinen jaon perusteella? Miten muuten voisi tietää, että osutaanko etualalla liikkuvaan objektiin vai taka-alan kiinteään geometriaan?

Vai meinaatko, että ajetaan efektiivisesti kaksi törmäystarkistusta erillisissä BVH:issa ja valitaan lähempi?
 
Eikö BVH pidä luoda sijaintihierarkian, eikä pelkän dynaaminen-staattinen jaon perusteella?

Miten muuten voisi tietää, että osutaanko etualalla liikkuvaan objektiin vai taka-alan kiinteään geometriaan?

Vai meinaatko, että ajetaan efektiivisesti kaksi törmäystarkistusta erillisissä BVH:issa ja valitaan lähempi?

BVHsta saa tehdä ihan millaisen tahansa, kunhan vaan kaikki mitä BVHssa on määritelty laatikon sisälle myös oikeasti on sen laatikon sisällä.

Se, kuinka optimaalinen se rakenne on vaikuttaa vain siihen, paljonko niitä törmäystarkastuksia tehdään. Jos BVH-puu on "huono", siitä on vaan vähemmän hyötyä ja törmäystarkastuksia joudutaan tekemään enemmän.

Eli, BVH on puurakenne, sinne voidaan juuritasolle laittaa kaksi päähaaraa, toinen staatisille ja toinen dynaamisille objekteille. Näiden sisllä kaikki alihaarat pyritään sitten tekemään niiden paikan mukaan.

Staattisen haaran ylimmän tason laatikon kooksi tulee yleensä koko pelikentän koko.

Dynaamisen haaran ylimmän laatikon kooksi tulee käytännössä se alue, minkä sisällä kentässä on mitään dynaamista geometriaa, eli esim. pelihahmoja tai tuhottavia asioita.

Nämä menevät suurelta osin päällekkäin, ja suurin osa säteistä osuu molempiin korkean bokseihin ja käy sitten läpi näiden molempien boksien sisällä olevia alihaaroja, mutta sen itse törmäystarkasteluja tekevän koodin (tai raudan) ei tarvi tietää mitään tästä jaottelusta, sille ne on vaan saman puun haaroja, se puu on vaan vähän isompi ja "epäoptimaalinen" törmäystarkastelujen määrän suhteen.

Käytännössä tämä jaottelusta johtuva puun epäoptimaalisuus tarkoittaa usein ehkä muutamaa törmäystarkastusta lisää per säde, mutta niitä pitää muutenkin tehdä ~30, joten muutama lisää ei ole paha. Toki se, kuinka epätasaisesti se dynaaminen kama on sijoiteltuna ja paljonko sitä on, vaikuttaa paljon tähän overheadiin. Jos sitä on paljon ja tasaisesti ympäri kenttää, overhead on suurempi. Mutta jos siellä on vaikka vain pelihahmot eikä mitään muuta, muutamalla tarkastuksella saadaan yleensä todettua, että säde ei osu pelihahmojen bokseihin.

Siinä tapauksessa, että geometriaa on enemän ja ripoteltuna joka puolelle kenttää kannattaa jako tehdä siten alemmalla tasolla; Jokainen tuhottava tai muuttuva/liikkuva objekti saa oman (dynaamisen) BVH-haaransa siten että siitä ylemmän tason (staattinen) boksi sisältää kaiken sen alueen missä se voi olla. Ja sitten joka frame generoidaan nämä alihaarat uudestaan(mikäli objekti on tuhottu/muuttuntu/liikkunut). ELi esim. aukeavaa ovea varten olisi staattinen boksi joka kattaisi koko sen alueen, minkä ovi kattaa missä tahansa asennossa, ja sen sisällä sitten dynaamisesti generoituna BVH-puuhaara sen paikan mukaan missä se ovi oikeasti sillä hetkellä on. Tämä vaatii kuitenkin selvästi enemmän vaivaa koodarilta ja kenttäsuunnittelulta, pitää ottaa huomioon nämä "missä kaikkialla tämä objekti voi olla"-boksit.
 
Viimeksi muokattu:
Onko selvää että tuo on nimenomaan uutta sukupolvea eikä esim. ekan sukupolven läppäripiirejä tms?

Ei toki mutta spekulaatioketjuhan tämä on. Tuossa artikkelissahan viitattiin tuohon 5600 XT:n mallinumeroon joka on korkeampi kuin tämä uusin rekisteröinti joka saattaa vihjata siihen että tämä uusi kortti olisi jokin jo pidempään työn alla ollut.
 


macOS:n tuore beeta ilmeisesti varmistanut Variable Rate Shading -tuen ainakin Navi2x-piireille
 

No niin, nyt alkaa palaset loksahtelemaan kohdalleen Navi 12:nkin kanssa. Se on siis Navi "1.5" samassa mielessä missä Vega 20 oli "Vega 1.5".
Eroa Navi 10:iin on tuki DeepLearning-käskyille ja HBM2-muisti (2048-bit väylä eli 2 pinoa).
(huomionarvoista on myös että tuolla(kin) on edelleen käytössä GCN-tunniste Naveillekin (GCN1.5 eli "GCN6" ja nyt DL-versiossa GCN1.5.1 eli "GCN6.1" vrt GCN1.4/1.4.1 GCN5/5.1)
 
Viimeksi muokattu:
Mikähän tästä Navi 12:sta on siis tulossa? Vega 20 ( Radeon VII) oli huomattavasti tehokkaampi kun Vega 10, joten voiko odottaa jotain kovaakin tehonlisäystä. Tosin edelleen pysytään 7nm:ssä, joten tuskin kovin suurta boostia on luvassa.
 
Mikähän tästä Navi 12:sta on siis tulossa? Vega 20 ( Radeon VII) oli huomattavasti tehokkaampi kun Vega 10, joten voiko odottaa jotain kovaakin tehonlisäystä. Tosin edelleen pysytään 7nm:ssä, joten tuskin kovin suurta boostia on luvassa.
Todennäköisesti Radeon Instinct- ja/tai Radeon Pro -sarjaan lisäystä, tai jopa jollekin tietylle valmistajalle tehty siru samaan tapaan kuin Vega 12 tehtiin Applen tarpeisiin
Vega 20 tuplasi muistikaistan vrt Vega 10, tästä on kehityslaudoissa bongattu 2 ja 2,4 Gbps:n muistit mikä ei riitä tuplaamaan kaistaa vrt Navi 10:n GDDR6, vaan 2048-bit väylällä muistikaistaa olisi 500 tai ~615 Gt/s vrt Navi 10:n 448 Gt/s
 
Voisiko Iso Navi olla vihdoinkin tulossa (5950 XT)?

Riippuu montako siellä on "jonossa", tod.näk. kuitenkin Navi 12 tulee mihin ikinä sitten tuleekaan ennen Navi 2x / RDNA2 -siruja mihin se iso Navi kuuluu
 
Tällänen löytyi:




EDIT: Mitenkähän tämä kuvan liittäminen oikein toimii uudella foorumilla :|

Tuossa on vain se ongelma, ettei noin nopeita HBM-muisteja ole vielä, pitäisi olla 4 Gbps että luvut täsmää. Samsung aikoo saada tämän vuoden ekalla puoliskolla 3,2 Gbps:n HBM2e-musitit ulos, SK Hynix on kyllä julkistanut 3,6 Gbps:n HBM2e-muistit mutta nekään ei riitä (ja niidenkin saatavuuden pitäisi alkaa vasta joskus tänä vuonna, mutta ei ole tainnut siitäkään vielä kuulua mitään uutta)
 
Tuossa on vain se ongelma, ettei noin nopeita HBM-muisteja ole vielä, pitäisi olla 4 Gbps että luvut täsmää. Samsung aikoo saada tämän vuoden ekalla puoliskolla 3,2 Gbps:n HBM2e-musitit ulos, SK Hynix on kyllä julkistanut 3,6 Gbps:n HBM2e-muistit mutta nekään ei riitä (ja niidenkin saatavuuden pitäisi alkaa vasta joskus tänä vuonna, mutta ei ole tainnut siitäkään vielä kuulua mitään uutta)
Hyvä pointti. Taitaapa siis olla humpuukia. Toisaalta tuossa olisi myös muistikaistan ja laskentayksiköiden suhde yli kaksinkertainen vrt. RX 5700 XT, missä ei taida olla hirveästi järkeä.
 
Myöskään 4096bit väylä ja 24GB muistia ei täsmää. 6GB pinoja ei ole olemassa eikä tule.
 
Myöskään 4096bit väylä ja 24GB muistia ei täsmää. 6GB pinoja ei ole olemassa eikä tule.
Itseasiassa mikäli HBM2e-speksi ei kiellä käyttämästä pienempiä muistisiruja tuo onnistuisi kyllä, HBM2e-päivityksessä kun lisättiin mahdollisuus tehdä 12-kerroksisia siruja, niin siinä jos käyttäisi 4 Gbitin siruja 8 tai 16 Gbitin sijasta saisi 6 Gt:n pinoja (vai olisiko myös 6-Hi nykyään sallittu 12-Hin myötä? ei käryä kyllä)
 
AMD anto hieman lisätietoja tuleva Financial Analyst Day 2020 tapahtumassa, tässä pikasia poimintoja näyttispuolelta:

-Infinity Fabric vaihtuu Infinity Architectureks Zen4:n myötä, lisää kaistaa ja pienemmät latenssit tulossa, David Wang jutteli myös CPU-GPU välimuistikoherenttiudesta presiksen aikana
-Erilliset GPU-arkkitehtuurit datakeskuksiin ja pelinäyttiksille, eli rinnakkain tulee oleen RDNA pelipuolelle ja CDNA laskentapuolelle
-RDNA2 lupailee 50% perf/W parannusta RDNA1:een verrattuna
-7nm Navi2 tulossa tän vuoden loppuunmennessä, rautatason raytracing confirmed
-Navi3:sta mainittu vaan se että tulee käyttään "advanced nodee", eivät Q&A:n aikana suostuneet tarkentaan et mistä nodesta kyse, varmistivat kuitenkin ton presiksen aikana että Zen4 Genoa tulee oleen TSMC 5nm palikka. Navi3 julkasu kuitenkin ilmeisesti samoihin aikoihin Zen4:n kanssa ens vuoden loppupuolella

EDIT: AMD mainitti myös että ovat Mikkisoftan kanssa kehittänyt DXR 1.1 raytracing rajapintaa, itellä ei oo tuon taivaallisenkaan käryä näistä eri rajapinnoista mut jos molemmat konsolit on täynnä AMD:n rautaa ja sille raudalle väännettyä softaa, voidaanko olettaa että next-gen pelit tulis RT:n osalta pyöriin paremmin AMD:n kun nVidian romuilla myös PC-puolella? Jos ei muuta ni PC-porttaukset konsoleilta pitäis olla ainakin hitusen helpompi toteuttaa.

Täältä tarkemmin:
AMD Unveils CDNA GPU Architecture: A Dedicated GPU Architecture for Data Centers


Edit 2: Blower-coolerit on historiaa Navi2:n myötä. And there was much rejoicing. Joskohan nyt tän myötä saisivat refukorteillaki lämmöt/melun aisoihin
 

Liitteet

  • reference design.jpg
    reference design.jpg
    132,3 KB · Luettu: 102
Viimeksi muokattu:

Statistiikka

Viestiketjuista
258 438
Viestejä
4 496 044
Jäsenet
74 206
Uusin jäsen
Taru.nen

Hinta.fi

Back
Ylös Bottom