AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Muistiväylä/kaista ei liity mitenkään siihen miten monta piiriä siellä on.
Joo, mutta liittyy tärkeästi suorituskykyyn peleissä jne. Tottakai jos on multi-chip niin tärkeää on myös sen piirien välisen kommunikaation nopeuden lisäksi se muistiväylän/kaistan nopeus GDDR muistipiireille vaikka olisi kuinka paljon välimuistia laitettu väliin.

Saa nähdä sitten että miten AMD on tämän toteuttanut
 
Viimeksi muokattu:
Ja kuulemma 2x 6900XT @ 4K, 3,5x 6900XT RT.
Ja todennäköisesti huomenna tai viimeistään ylihuomenna taas jotain muuta uutta. Siellä on sellainen silly season meneillään että huhupajat kattaa kaikki mahdolliset vaihtoehdot että pääsee toteamaan olleensa taas oikeassa
Näinhän se luultavasti on. Uskoisin kuitenkin että muistiväylän koko on sellainen asia mikä pitää lyödä lukkoon ennen kuin piirit menevät tuotantoon. Korjatkoon joku jos olen väärässä.
 
Näinhän se luultavasti on. Uskoisin kuitenkin että muistiväylän koko on sellainen asia mikä pitää lyödä lukkoon ennen kuin piirit menevät tuotantoon. Korjatkoon joku jos olen väärässä.
Tietenkin ne on lyöty lukkoon jo ajat sitten. Pointti oli nimenomaan väitettyjen vuotojen luotettavuus. Samat kaverit "vuotaa" 'uutta speksiä' viikosta toiseen vaikka todellisuudessa siellä on ollut jo iät ja ajat lyöty lukkoon mitä piirissä tulee olemaan.
 
2x olis kyllä kova... 1,5x myös olisi jo todella hyvä. Tässähän melkein tarvii jo alkaa pukemaan ostohousuja jalkaan.
 
2x olis kyllä kova... 1,5x myös olisi jo todella hyvä. Tässähän melkein tarvii jo alkaa pukemaan ostohousuja jalkaan.

Kannattaa muistaa mitä kaikkea ne ovat huhunneet. Eli hinta on ns. "naurettava". Niillä molemmilla aluksi tulevilla tuplakorteilla (arvio 7900XT ja 7800XT). Ja sitten niillä "huonommilla" korteilla eli 7700XT tehot olisivat luokkaa nykyinen 6900XT ja päälle (ainakin säteenseuranta parempaa) mutta "vain" yksi kortti eikä tupla. Ilmeisesti ja toivottavasti hinta olisi sitten lähempänä 500€ edes tuolla kortilla vaikka ne parhaimmat kortit olisivatkin luokkaa 2500€ ja 1300€ tms.

Se huono puoli näissä huhuissa on että jos ne pitävät edes osittain paikkansa herää kysymys miten monta välimallin korttia tulee? Koska jos oikeasti se "titaanien tinaani" kortti on päälle 2000€ (vaikka sen arvioidun 2500) ja suurin osa kansaa haluaa alle 500€ kortteja niin väliin pitäisi saada mahtumaan melkoisesti tai Nvidia voi syödä vielä lisää markkinoita (sekä tietysti Intel).

Eli jos joku 7950XT olisi 2500€, 2000 olisi vaikka 7900XT, 1500€ 7850XT ja 1000€ 7800XT niin siltikin siinä olisi melkoisia hintarakoja, puhumattakaan siitä että moniko olisi valmis makselemaan tuollaisia hintoja vaikka kuinka olisi tuplakortteja? Ihan täysin välittämättä siitä miten järjettömän tehokkaita ne kortit ovat. Koska en minäkään mitään 3995WX esim. edes harkitse vaikka kuinka olisi 64-ydintä ja 128 säiettä kun hinta menee Suomessa lähemmäs 7000€.

Ei sillä, jos nyt katsoo hintoja niin joku noin vuosi sitten julkaistu 3090 kortti (ei siis TI versio edes) on päälle 2000€ Suomessa. Tässä on ollut noin 1½ vuotta aikaa hintojen laskea mutta ei.. ..joten ehkä se 2500€ on jopa liian vähän seuraavan sukupolven parhaasta kortista. (Edit: julkaistu ja tullut myyntiin näköjään 24.9.2020 eli kohta 2 vuotta myynnissä ollut kortti)

Mitä yritän tässä sanoa on se että kannattaa muistaa noiden olevan vielä huhuja. Voi olla että esim. säteenseuranta on se mikä on tuplasti parempi 6900XT versioon verrattuna tai jokin muu asia. Samaten noita huhuja on tullut todella reippaasti. Olisihan se hyvä jos oikeasti saisi noin 500€ tai alle yhtä tehokasta näyttistä kuin 6900XT ja se olisi "keskitason" näytönohjain. Mutta epäilen että vaikka sellainen tulisikin sen julkaisuun ja kauppoihin ehtimiseen mennään ensivuoden puolelle. Ne parhaat (ja kalleimmat) mallit julkaistaan ensin ja jos AMD on oikeasti nyt se paras mitä näytönohjaimissa löytyy se hinta voi olla oikeasti aika korkea varsinkin koska niitä kortteja on siinä 2kpl liimattuna yhteen (niissä ensimmäisissä ja kalleimmissa malleissa mitä julkaistaan).
 
Viimeksi muokattu:
esim. säteenseuranta on se mikä on tuplasti parempi 6900XT versioon verrattuna

Tupla RT teho olisi kyllä pettymys kun pahimmillaan nvidia on jo nykyisellä genilä noin tuplasti tehokkaampi RT:ssä. Joten tuplatehoilla saataisiin ainoastaan nyky geni kiinni ja on täysin selvää että nvidia tulee kasvattamaan omaa RT suorituskykyään.. Vähintään tripla tehoja vaatii lisää jotta edes jotenkin pysytään pykälässä.

Ja on tosiaan sellanen sillyseason nyt menossa että ei maksa vaivaa edes seurata. Yhtenä päivänä navi 31 on on jumalpiiri ja toisena pettymys.
 
Tupla RT teho olisi kyllä pettymys kun pahimmillaan nvidia on jo nykyisellä genilä noin tuplasti tehokkaampi RT:ssä. Joten tuplatehoilla saataisiin ainoastaan nyky geni kiinni ja on täysin selvää että nvidia tulee kasvattamaan omaa RT suorituskykyään.. Vähintään tripla tehoja vaatii lisää jotta edes jotenkin pysytään pykälässä.

Ja on tosiaan sellanen sillyseason nyt menossa että ei maksa vaivaa edes seurata. Yhtenä päivänä navi 31 on on jumalpiiri ja toisena pettymys.

Voihan se olla että rt suorituskyky kasvaa 2x / rt-yksikkö ja jos niiden määrää kasvatetaan samalla niin todellinen suorituskyky voi kasvaa hyvinkin sen 3.5x niinkuin @Kaotik taisi mainita että joku uusin huhu mainitsi...
 
Säteenjäljityksen nopeudesta:

Teoreettisessa säteenjäljitysväännössä AMD ei ole kovin paljoa nVidiaa jäljessä, mutta tosimaailman nopeudessa ero on huomattava, koska

1) AMDllä säteenjäljityksen törmäystarkastukset ja teksturointi jakaa rautaa keskenään, eli samalla ytimellä ei voida tehdä molempia yhtä aikaa.
2) AMDllä pitää suurempi osa säteenjäljitystyöstä (puun läpikäynti) tehdä shadereilla softalla, vain törmäystarkastukset tehdään raudalla, kun taas nVidialla puun läpikäynti tehdään myös raudalla.
3) nVidian ajurit on säteenjäljitykseen aika paljon paremmin optimoituja.

Tuo raudan jakaminen teksturoinnin kanssa on piirin pinta-alan kannalta ihan järkevältä vaikuttava kompromissi (ja sinänsä mahdollistaa suuremman määrän raakaa tehoa), mutta se myös ajaa tuohon suuntaan että puun läpikäyntiä on vaikeampi tehdä raudalla.

Että odotan tosiaan mielenkiinnolla mitä RDNA3ssa on säteenjäljityksen nopeuttamiseksi tehty. Eli että
1)Tyydytäänkö vaan pikkuoptimointeihin ja luotetaan siihen, että ajureita saadaan optimoitua ja ytimien määrän lisääminen tuo tarpeeksi vääntöä lisää, vai
2) muutetaan arkkitehtuuria merkittävämmin, että saadaan enemmän (käytännössä puun läpikäynti) tehtyä raudalla?
3) Tehdäänkö joku enemmän brute-force-ratkaisu, että törmäystarkastusyksiköiden (ja samalla teksturointiyksiköiden määrä) per ydin tuplataan kuitenkaan niiden ominaisuuksia merkittävästi parahtamatta, että puun läpikäynti tehdään edelleen softalla?
 
Viimeksi muokattu:
Säteenjäljityksen nopeudesta:

Teoreettisessa säteenjäljitysväännössä AMD ei ole kovin paljoa nVidiaa jäljessä, mutta tosimaailman nopeudessa ero on huomattava, koska

1) AMDllä säteenjäljityksen törmäystarkastukset ja teksturointi jakaa rautaa keskenään, eli samalla ytimellä ei voida tehdä molempia yhtä aikaa.
2) AMDllä pitää suurempi osa säteenjäljitystyöstä (puun läpikäynti) tehdä shadereilla softalla, vain törmäystarkastukset tehdään raudalla, kun taas nVidialla puun läpikäynti tehdään myös raudalla.
3) nVidian ajurit on säteenjäljitykseen aika paljon paremmin optimoituja.

Tuo raudan jakaminen teksturoinnin kanssa on piirin pinta-alan kannalta ihan järkevältä vaikuttava kompromissi (ja sinänsä mahdollistaa suuremman määrän raakaa tehoa), mutta se myös ajaa tuohon suuntaan että puun läpikäyntiä on vaikeampi tehdä raudalla.

Että odotan tosiaan mielenkiinnolla mitä RDNA3ssa on säteenjäljityksen nopeuttamiseksi tehty. Eli että
1)Tyydytäänkö vaan pikkuoptimointeihin ja luotetaan siihen, että ajureita saadaan optimoitua ja ytimien määrän lisääminen tuo tarpeeksi vääntöä lisää, vai
2) muutetaan arkkitehtuuria merkittävämmin, että saadaan enemmän (käytännössä puun läpikäynti) tehtyä raudalla?
3) Tehdäänkö joku enemmän brute-force-ratkaisu, että törmäystarkastusyksiköiden (ja samalla teksturointiyksiköiden määrä) per ydin tuplataan kuitenkaan niiden ominaisuuksia merkittävästi parahtamatta, että puun läpikäynti tehdään edelleen softalla?
Toinen helpottava tekijä AMD:lle on se, että sillä on nyt tarjolla kilpailukykyinen upscaling-mentelmä, joka vähentää selkeästi suorituskykyvaatimuksia, kun esim. 1440p tai 4K natiivisti rendatun RT:n sijaan tehdään oikeasti pykälää tai paria alemmalla resoluutiolla ja upskaalataan.

Aikaisemmin vertailu oli käytännössä Nvidia RTX + DLSS vs. AMD hitaampi RT ja ilman kunnon upscaling algoritmia -> melkoinen käytännön suorituskykyero, vaikka tietystikään kyseessä ei ollut apples-to-apples vertailu.
 
Minua kiinnostaa paljon amd:n huhuttu chiplet ratkaisu. Miten on saatu ratkaistua chiplettien kesken kuorman jakaminen ja siitä tuleva "ylimääräinen" piirienvälinen kaistantarve/työnjakaminen? Tai toisin sanoen miten chipletin virrankulutus/lämmöntuotto on saatu huhujen mukaan erittäin virtatehokkaaksi. Sekin kiinnostaa onko chiplet ratkaisu täysin monoliitin näköinen pelikehittäjän näkökulmasta vai löytyykö jotain extrahyvin tai huonosti toimivia kuormia?

Applella on yhdenlainen ratkaisu useamman piirin yhteen niittaamiseen. Mulle on epäselvää, että onko applen ratkaisu universaalisti hyvä vai lähinnä hyvä laskentakuormille.
 
Viimeksi muokattu:
Yksi ö-luokan huhu vaikutti sille, että itse piiri on monoliitti, mutta chipletit olisi nopeaa cachea itse piirin ympärillä.

Ö-luokan, kun tässä vaiheessa vuotta on vielä silly season menossa kummankin valmistajan suhteen. Rdna3 konfiguraatiot ovat muuttuneet huhuissa muutamia kertoja ja varmaan muuttuvat yhä. Lovelacekin taisi olla ensin kesällä tulossa, nyt sitä huhutaan jouluksi.
 
Yksi ö-luokan huhu vaikutti sille, että itse piiri on monoliitti, mutta chipletit olisi nopeaa cachea itse piirin ympärillä.

Ö-luokan, kun tässä vaiheessa vuotta on vielä silly season menossa kummankin valmistajan suhteen. Rdna3 konfiguraatiot ovat muuttuneet huhuissa muutamia kertoja ja varmaan muuttuvat yhä. Lovelacekin taisi olla ensin kesällä tulossa, nyt sitä huhutaan jouluksi.
Kyllä tuo huhukenttä on käynyt läpi molempien kohdalla jo varmaan kaikki mahdolliset ja mahdottomatkin konfiguraatiot, eli joku pääsee huutelemaan "sanoinhan" unohtaen samalla ne tusina muuta omaa twiittiään jossa sanoi jotain muuta
 
Ja ne kaikkihan voi olla täysin totta sinänsä, riippuen että mistä vaiheesta tuotekehitystä se vuoto on tullut. Rinnakkaisia konfiguraatioita voi olla protoilussa lukuisia joistai vain yksi päätyy tuotteeksi.
 
Ja ne kaikkihan voi olla täysin totta sinänsä, riippuen että mistä vaiheesta tuotekehitystä se vuoto on tullut. Rinnakkaisia konfiguraatioita voi olla protoilussa lukuisia joistai vain yksi päätyy tuotteeksi.
Kyllä ne määrät lyödään lukkoon ennen kuin yhtä ainutta piirilayouttia suunnitellaan. Lopullista konfiguraatiota voidaan viilata tietenkin kytkemällä yksiköitä pois jne, mutta kukaan ei lähde suunnittelemaan tusinaa "entä jos" piirilayouttia.
 
Iso osa viimeaikojen huhuissa vaihtuvista jutuista(xpea, kopite7kimi) on ollut nimenomaan niitä lopussa konffattavia asioita eli miten piirit leikotaan, kellotetaan ja lämmöntuotto. Vanhemmille huhuille en paljoa laittaisi painoa, mutta uudet oem-lähteistä vuotaneet tiedot on imho. uskottavia. amd ilmeisesti alkoi ensin kertomaan jotain oem:lle ja nvidia seurasi perästä. OEM Lähteistä se 600W huhu 4090ti:lle tuli kuten myös noi uudet kellotaajuushuhut ja amd vs. nvidia suorituskykyhuhut.
 
Kyllä ne määrät lyödään lukkoon ennen kuin yhtä ainutta piirilayouttia suunnitellaan. Lopullista konfiguraatiota voidaan viilata tietenkin kytkemällä yksiköitä pois jne, mutta kukaan ei lähde suunnittelemaan tusinaa "entä jos" piirilayouttia.
Minä olen aina kuvitellut että juuri GPUt on aika hyvin soveltuvia ctrl+c, ctrl+v laajennoksiin vielä layout vaiheessakin
 
Minä olen aina kuvitellut että juuri GPUt on aika hyvin soveltuvia ctrl+c, ctrl+v laajennoksiin vielä layout vaiheessakin
Siellä on paljon identtistä toistettavaa, eli sikäli "helppo", mutta se miten ne sinne sovitat ja miten se vaikuttaa kaikkeen muuhun tarkoittaa ainakin minun käsitykseni mukaan että kyllä se on tiedettävä millainen tehdään ennen kuin tehdään.

Iso osa viimeaikojen huhuissa vaihtuvista jutuista(xpea, kopite7kimi) on ollut nimenomaan niitä lopussa konffattavia asioita eli miten piirit leikotaan, kellotetaan ja lämmöntuotto. Vanhemmille huhuille en paljoa laittaisi painoa, mutta uudet oem-lähteistä vuotaneet tiedot on imho. uskottavia. amd ilmeisesti alkoi ensin kertomaan jotain oem:lle ja nvidia seurasi perästä. OEM Lähteistä se 600W huhu 4090ti:lle tuli kuten myös noi uudet kellotaajuushuhut ja amd vs. nvidia suorituskykyhuhut.
Samojen kavereiden (+kumppaneiden) "vuodot" ovat heittäneet tuhansilla yksiköillä ulkomuistista tässä kevään ja kesän varrella, mikä ei mene enää tuon piikkiin.
 
Samojen kavereiden (+kumppaneiden) "vuodot" ovat heittäneet tuhansilla yksiköillä ulkomuistista tässä kevään ja kesän varrella, mikä ei mene enää tuon piikkiin.

Voihan ne heitellä paljonkin riippuen siitä miten piiriä päätetään leikellä. Mä en niille kevään spekseille laittaisi juurikaan arvoa toisin kuin näille uusille oem lähteistä tulleille vuodoille. Jos mä olen oikein käsittänyt niin 4090 tulee olemaan leikatulla piirillä oleva tuote. Jää varaa tehdä 4090ti, jota on leikattu vähemmän ja kellotaajuutta nostettu(virrankulutus tappiin). 4090ti oletettavasti se 600W piiri, josta oem:lle oli mainittu. Se tuleeko 600W hirviötä riippunee ihan siitä mitä amd julkaisee. 4090 julkaistaan ensin ja 4090ti tulee sitten joskus myöhemmin(jos tulee).
 
Voihan ne heitellä paljonkin riippuen siitä miten piiriä päätetään leikellä. Mä en niille kevään spekseille laittaisi juurikaan arvoa toisin kuin näille uusille oem lähteistä tulleille vuodoille. Jos mä olen oikein käsittänyt niin 4090 tulee olemaan leikelty piiri ja siellä on varaa tehdä 4090ti, jota on leikattu vähemmän ja kellotaajuutta nostettu(virrankulutus tappiin). 4090ti oletettavasti se 600W piiri, josta oem:lle oli mainittu. Se tuleeko 600W hirviötä riippunee ihan siitä mitä amd julkaisee. 4090 julkaistaan ensin ja 4090ti tulee sitten joskus myöhemmin(jos tulee).
Pointti oli että ne tulee ihan samoilta kavereilta, yksi noista "vuotajista" on jopa tainnut tunnustaa että ainakin hänen "vuodot" on valistuneita arvauksia eikä mitään oikeita vuotoja, miksi se että yhtäkkiä väitetään OEM-lähtöisiksi tekisi niistä sen luotettavampia?
Oli kyse sitten AMD:n tai NVIDIAn piireistä lähelle pääsee varmasti kun veikkaa kyllin monesti ja vaikka viime kierroksella track record näytti muutaman vuotajan kohdalla ihan kivalle, on tässä sukupolvessa tullut niin monta erilaista vuotoa jo että katotaan kun on konkreettisempaa.
 
Pointti oli että ne tulee ihan samoilta kavereilta, yksi noista "vuotajista" on jopa tainnut tunnustaa että ainakin hänen "vuodot" on valistuneita arvauksia eikä mitään oikeita vuotoja, miksi se että yhtäkkiä väitetään OEM-lähtöisiksi tekisi niistä sen luotettavampia?
Oli kyse sitten AMD:n tai NVIDIAn piireistä lähelle pääsee varmasti kun veikkaa kyllin monesti ja vaikka viime kierroksella track record näytti muutaman vuotajan kohdalla ihan kivalle, on tässä sukupolvessa tullut niin monta erilaista vuotoa jo että katotaan kun on konkreettisempaa.

Elämä olisi tylsää, jos ei saisi huhuista puhua/spekuloida. Jos niitä kortteja tulee myyntiin q3 lopussa/q4 alussa niin aikalailla nyt alkaa tulemaan vuotoja oem:lta. rdna3 taitaa tulla hieman myöhemmin kuin ada myyntiin. Uskoisin että ada huhut alkavat olemaan aika konkreettisia kellotaajuuksien, virrankulutuksen ja piirien koon osalta. Suorituskyky lienee kysymysmerkki, kun ei sitä oem:lle tarkasti kerrota vuotojen pelossa. Piirien koot, virrankulutuksen jne joutuu kertomaan, jos aikoo että joku muukin kuin nvidia voi valmistaa kortteja.

Se sun mainitsema huhumyllyäjä ei sanonut, että kaikki sen jutut olisivat keksittyjä, sanoi että osa niistä on valistuneita arvauksia.
 
Viimeksi muokattu:
Elämä olisi tylsää, jos ei saisi huhuista puhua/spekuloida. Jos niitä kortteja tulee myyntiin q3 lopussa/q4 alussa niin aikalailla nyt alkaa tulemaan vuotoja oem:lta. rdna3 taitaa tulla hieman myöhemmin kuin ada myyntiin. Uskoisin että ada huhut alkavat olemaan aika konkreettisia kellotaajuuksien, virrankulutuksen ja piirien koon osalta. Suorituskyky lienee kysymysmerkki, kun ei sitä oem:lle tarkasti kerrota vuotojen pelossa. Piirien koot, virrankulutuksen jne joutuu kertomaan, jos aikoo että joku muukin kuin nvidia voi valmistaa kortteja.

Se sun mainitsema huhumyllyäjä ei sanonut, että kaikki sen jutut olisivat keksittyjä, sanoi että osa niistä on valistuneita arvauksia.
Saa niistä puhua, mutta itse näen oleellisena tuoda esiin lukujen epäluotettavuuden vielä tässä kohtaa, myös niille väitetyille OEM-lähtöisille
 
Saa niistä puhua, mutta itse näen oleellisena tuoda esiin lukujen epäluotettavuuden vielä tässä kohtaa, myös niille väitetyille OEM-lähtöisille
Eikö se hauskin homma ole juuri, että kun piirit tulevat virallisiksi ja julkisiksi, niin päästään katsomaan minkä vuotajan nopanheitto osui lähimmäksi?
 
Eikö se hauskin homma ole juuri, että kun piirit tulevat virallisiksi ja julkisiksi, niin päästään katsomaan minkä vuotajan nopanheitto osui lähimmäksi?

Vielä kun jaksetaan seurata historiaa niin voi muistaa kenellä vuotajalla oli edes joskus oikeata tietoa. Se kopite7kimin ampere speksit twitterissä osui oikeaan vuotta ennen julkaisua. Siinä oli oikeat yksikkömäärät ja tuplattu fp32 mukana. Tais olla myös se ga103 piiri vuodossa vaikka se julkaistiin sitten paljon myöhemmin. Uskon kyllä, että nvidia ja amd tukkivat vuotoja ja vuotajien on vaikeampi ja vaikeampi saada tietoa. OEM:t taitavat kuitenkin edelleen vuotaa. OEM vuotoja yrittävät sitten tukkia antamalla oem:lle tiedot mahdollisimman myöhään, ajurit jotka ei anna täyttä perffiä/toimivat vain tietyissä softissa jne.
 
Vielä kun jaksetaan seurata historiaa niin voi muistaa kenellä vuotajalla oli edes joskus oikeata tietoa. Se kopite7kimin ampere speksit twitterissä osui oikeaan vuotta ennen julkaisua. Siinä oli oikeat yksikkömäärät ja tuplattu fp32 mukana. Tais olla myös se ga103 piiri vuodossa vaikka se julkaistiin sitten paljon myöhemmin. Uskon kyllä, että nvidia ja amd tukkivat vuotoja ja vuotajien on vaikeampi ja vaikeampi saada tietoa. OEM:t taitavat kuitenkin edelleen vuotaa. OEM vuotoja yrittävät sitten tukkia antamalla oem:lle tiedot mahdollisimman myöhään, ajurit jotka ei anna täyttä perffiä/toimivat vain tietyissä softissa jne.
Juuri näin.

Toki käytännön (ei cherrypickattu) suorituskyky tulee esille vasta mm. Sampsan ym. testeissä julkkarissa.

Mä olen huono innostumaan hypestä, vaikka rauta kiinnostaa paljon. Tärkeitä asioita ovat myös värien bittimäärät, DLSS&FSR -muutokset, yms. Rauta ja softa ovat käsi kädessä, ja AMD:llä on kirittävää tällä osa-alueella.
 
Eikö se hauskin homma ole juuri, että kun piirit tulevat virallisiksi ja julkisiksi, niin päästään katsomaan minkä vuotajan nopanheitto osui lähimmäksi?
Kun jokainen vuotaja arvaa sataa eri asiaa, niin kaikki ovat lopulta oikeassa. Menee koko pointti tuosta:D
 
RDNA3 huhua pukkaa. Otetaan toki normaalin suolan jne. kera. Voi olla totta tai tarua. En tiedä onko tuossa speksien osalta uutta, mutta toteutuksesta on aika konkreettisia väitteitä

One of the features in the RDNA 3 graphics pipeline is OREO: Opaque Random Export Order, which is just one of the many area saving techniques. With gfx10, the pixel shaders run out-of-order, where the outputs go into a Re-Order Buffer before moving to the rest of the pipeline in-order. With OREO, the next step (blend) can now receive and execute operations in any order and export to the next stage in-order. Thus, the ROB can be replaced with a much smaller skid buffer, saving area.

Infinity cachea 96MB navi31:ssa. Navi21:ssa cachea oli 128MB. Tulossa myöhemmin variantti jossa on tuplattu cachen koko. Jos oikein ymmärrän niin "grafiikkalaskenta" on yhdellä fyysisellä piirillä. Se missä erotaan perinteisestä gpu:sta on, että muistiohjaimet+cache siirretty grafiikkapiirin ulkopuolelle omiin piireihinsä. Tuo on varmaan aika fiksu juttu, kun vältetään ongelma, jossa pitäisi ratkaista useamman grafiikkapiirin välinen kommunikaatio-ongelma. Voi toki olla, että olen ymmärtänyt väärin. Kommunikaatio-ongelmalla tarkoitan sitä, että kehittäjän kannalta suorituskyky olisi täysin sama kuin monoliitissa eikä tarvisi erikseen vältellä suorituskyky sudenkuoppia, kun laskentaa jaetaan/synkronoidaan piirien välillä.

The world’s first chiplet GPU, Navi31 makes use of TSMC’s fanout technology (InFo_OS) to lower costs, surrounding a central 48 WGP Graphics Chiplet Die (GCD) with 6 Memory Chiplet Dies (MCD), each containing 16MB of Infinity Cache and the GDDR6 controllers with 64-bit wide PHYs. The organic fanout layer has a 35-micron bump pitch, the densest available in the industry. There is a 3D stacked MCD also being productized (1-hi) using TSMC’s SoIC. While this doubles the Infinity Cache available, the performance benefit is limited given the cost increase. Thus, the main Navi31 SKU will have 96MB of Infinity Cache (0-hi). This is lower than the 128MB in Navi21.

Navi 31
  • gfx1100 (Plum Bonito)
  • Chiplet - 1x GCD + 6x MCD (0-hi or 1-hi)
  • 48 WGP (96 legacy CUs, 12288 ALUs)
  • 6 Shader Engines / 12 Shader Arrays
  • Infinity Cache 96MB (0-hi), 192MB (1-hi)
  • 384-bit GDDR6
  • GCD on TSMC N5, ~308 mm²
  • MCD on TSMC N6, ~37.5 mm²

Lähdelinkin päässä enemmänkin juttua + muista navi3? piireistä asiaa.
 
Viimeksi muokattu:
Minä olen aina kuvitellut että juuri GPUt on aika hyvin soveltuvia ctrl+c, ctrl+v laajennoksiin vielä layout vaiheessakin

Ei enää koko piirin layout-vaiheessa.

Vaikka luokkaa 99.9% logiikasta olisikin sellaista jonka voi copypasteta (jopa hierarkisen layoutin joiden tasojen jälkeen) niin se jäljelle jäävä ~promille voi tarkoittaa kuitenkin miljoonia transistoreita.

Väylät ja kuormanjakomekanismit pitää kuitenkin skaalata sille ydinmäärälle joka piiristä löytyy, muistiosoitteet pitää jakaa eri muistibankeille ja muistin interleavaustapa muuttuu sen mukaan paljonko muistibankkeja on (toki useinhan kyllä samalla piirillä on tuettuna useampi interleavaustapa että voidaan tehdä karsittuja kokoonpanoja jossa osa muistiväylästä ei ole käytössä),
jne.

Ja vaikka ihmistyömäärä olisi hyvin pieni suhteessa koko arkkitehtuurin kehityksen käytettyyn työmäärään, ei tätä kuitenkaan tee ihan hetkessä jos uusi kokoonpano on sellainen että siihen ei ole aiemmin varustauduttu. Kun kaikki pitää verifioida perusteellisesti ja niissä simulaatioissa mitä verifioinnin yhteydessä tehdään voi mennä hyvin pitkään.

Mutta jos tuotelinjasto alunperinkin suunnitellaan siten että jo heti tehdään ylimääräistä työtä ja kehitetään ziljoona eri konfiguraatiota(mikä sitten voi tarkoittaa esim ylimääräisiä muistiviiveitä sen takia että interleavauslogiikka on monimutkaisempaa), ja tuhlataan kymmeniä tai satojatuhansia tunteja cpu-aikaa niiden "varakonfiguraatioden" verifikaatiotestien ajamiseen, ja sitten vaan osasta näistä tehdään fyysinen layout, niin toki silloin ne layoutit niistä muista konfiguraatiosta saadaan tehtyä melko nopeasti.

Mutta omat kokemukseni ovat aika kaukana tästä loppupäästä kun teen nimenomaan ytimien arkkitehtuurisuunnittelua ja lähinnä toivon, että tässä loppupään verifioinnissa (jonka tekee ihan muut tyypit) ei löydy mitään pahempia ongelmia ;)
Ja kun itse teen siis vain niitä osia jotka todellakin voi copypasteta, minun suunnitelemaani (mikro)arkkitehtuuriin ei oikeastaan vaikuta se, montako niitä ytimiä piirille tarkkaanottaen tulee
 
Viimeksi muokattu:
Aika iso suorituskykyhyppy sieltä on tulossa. AMD vahvisti että 50% perf/W parannus RDNA2 vs. RDNA3. Ja jos myös huhut 450W kortista pitää paikkaansa niin ei se 2 x 6900 XT suorituskyky ole mahdotonta.
 
Aika iso suorituskykyhyppy sieltä on tulossa. AMD vahvisti että 50% perf/W parannus RDNA2 vs. RDNA3. Ja jos myös huhut 450W kortista pitää paikkaansa niin ei se 2 x 6900 XT suorituskyky ole mahdotonta.

Mielenkiinnolla odotan että näkyykö toi Zen 4:ssa nähty kelloloikka myös GPU puolella. En enää yhtään ihmettelisi jos GPU puolella pistettäisiin 3GHz rikki. Zen 4:lta odotin yli 5GHz, mutta kun AMD demosi silloin keväällä 5,5GHz niin silloin alkoi kyllä realisoitumaan että lopputuotteessa voidaan mennä jonkin verran ylikin. Tosin se nyt jää nähtäväksi että pysyykö ne kellot siellä 5,7GHz vai onko se sellainen hetki siellä käydään ja sitten tiputaan mutta joka tapauksessa varsin kunnioitettava loikka tuli.
 
Ai että kun ois 2x 6900XT tehot yhdessä kortissa, se olisi aika passeli 4k120hz näytölle, en usko että on kovin utopistinen ajatus, jäähdytys varmaan ilmalla alkaa muodostua ongelmaksi kyllä, ellei sitten ole jokin 6-slotin noctua edition.
 
Ai että kun ois 2x 6900XT tehot yhdessä kortissa, se olisi aika passeli 4k120hz näytölle, en usko että on kovin utopistinen ajatus, jäähdytys varmaan ilmalla alkaa muodostua ongelmaksi kyllä, ellei sitten ole jokin 6-slotin noctua edition.

Ilmeisesti se sähkö ei kuitenkaan ole vielä tarpeeksi kallista kun tällaisista haaveillaan ;)
 
Ai että kun ois 2x 6900XT tehot yhdessä kortissa, se olisi aika passeli 4k120hz näytölle, en usko että on kovin utopistinen ajatus, jäähdytys varmaan ilmalla alkaa muodostua ongelmaksi kyllä, ellei sitten ole jokin 6-slotin noctua edition.

Muistanko väärin vai eikös RTX 3090 ti kortit ole 450W ja ihan ilmalla jäähtyvät?
 
Onko ollut mitään huhuja paljon AMD:n korteissa olisi muistia?
Navi31:ssä huhujen mukaan 384-bittinen muistiväylä eli 24 Gt (tai teoriassa vain 12 Gt) muistia tai 320-bittiseksi leikattuna 20 Gt.

Navi32:ssa puolestaan 256-bittinen.

Tuolla melko yksityiskohtaista infoa näistä, voi olla totta tai sitten ei (samat muistiväylät olleet muissakin huhuissa kyllä):

 
Onko ollut mitään huhuja paljon AMD:n korteissa olisi muistia?

Tän vuoden highend rdna3 korttiin on huhuttu 384bit muistiväylää, 24GB muistia ja 96MB infinity cachea. Ensi vuodelle huhuttu 3d vcache versiota missä infinity cachen koko olisi 96MB+96MB=192MB.

Muut järkevimmät muistinmäärät tuolle väyläleveydelle gddr6:en kanssa ovat 12GB ja 48GB. 24GB tuntuu järkevimmältä konfiguraatiolta kalliille highend kortilla.
 
Muut järkevimmät muistinmäärät tuolle väyläleveydelle gddr6:en kanssa ovat 12GB ja 48GB. 24GB tuntuu järkevimmältä konfiguraatiolta kalliille highend kortilla.

Muistanko väärin jos sanon että niitä 24Gbps GDDR6 lastuja ei pienemmällä kapasiteetilla olla valmistamassa jolloin 24 ja 48 jää käytännössä vaihtoehdoiksi? Ja eiköhän noihin AMD läpysköihin 99% varmuudella tule noi 24Gbps lastut kun nVidia on jatkamassa ilmeiseti GDDR6X:n kanssa.
 
Igor postasi vähän vuotohuhuja 7900XT piirilevystä.


Let’s summarize what I noticed about all of the designs, which is based on CAD drawings, photos, and text descriptions:
  • The Navi31 GPU of the RX 7900XT relies on a total of 6 chiplets (I’ll leave the detailed data to the Twitter kings here, but they were quite good lately)
  • 12 GDDR6 modules are used, which suggests a memory expansion of up to 24 GB
  • There are (besides the usual low and partial voltages) 21 large voltage converters installed in my example, which could be divided as follows if AMD keeps the usual supply scheme: 16 voltage converters (from 8 phases running in parallel) for VDDC_GFX, 2x memory, 2x VDD_SOC and 1x VDDCI. The card would therefore be supplied with 8 phases, which is in line with the general trend (also at NVIDIA). By the way, this is not a speculation, but a real circuit design, but I do not want to go into detail.
  • In the left third there are the various voltage transformers for the partial voltages and below the voltage transformer row also the input filtering for the slot (12 volts and 3.3 volts), which I also left out for the reasons already mentioned.
  • We recognize 1x HDMI and 3x Displayport, USB-C is not on board
  • A total of three tracks on the external PCIe power supply supply the card’s voltage converters and each of the tracks has an LC combination of coil and upstream polymer caps as output filtering against high-frequency load peaks
  • In the presumed board design, we see three 6+2 sockets instead of the 12VHPWR. I’ll leave it open whether this PCIe 5.0 connector will make it onto the final cards.
  • However, this also limits the maximum board power of the card to 450 watts, whereby the actual TBP should be far below that.

As I wrote before, everything is in flow and can change almost daily. What I have included in the drawing is constant for a long time. It’s not quite complete yet, but it’s already somewhat meaningful.
 
Navi31:ssä huhujen mukaan 384-bittinen muistiväylä eli 24 Gt (tai teoriassa vain 12 Gt) muistia tai 320-bittiseksi leikattuna 20 Gt.

Navi32:ssa puolestaan 256-bittinen.

Tuolla melko yksityiskohtaista infoa näistä, voi olla totta tai sitten ei (samat muistiväylät olleet muissakin huhuissa kyllä):


Tuolla vaan ei laskentayksikkömäärät ja ydinmäärät täsmää.

AMDn markkinoinnille "CU" on tarkoittanut
* CGN-pohjaisissa piireissä yhtä ydintä eli 64 FMA-yksikköä,
* RDNA/RDNA2-piireissä puolikasta ydintä eli edelleen 64 FMA-yksikköä. "WGP" ja "DCU" tarkoittavat näissä yhtä ydintä (näissä 128 FMA-yksikköä)

"96 legacy CUs" olisi siis vain 64*96 = 6144 FMA-yksikköä, ei 12288.

Joten suhtaudun vähän kriittisesti tuohon väitteeseen 12288 laskentayksikköstä, tosin en varmuudella sano ettei pidä paikkaansa.
"CUn koon tuplaaminen" voi tarkoittaa ihan vaan sitä että AMDn markkinointi alkaa vihdoin lasketa termillä "CU" oikeita ytimiä eikä puolikkaita.

Ja tuolla on kyllä vähän propagandapuppua, mm.

angstronomics.com sanoi:
" The world’s first chiplet GPU, Navi31 "

ATI:lla oli mobiilinäyttiksissään samassa paketissa näyttispiiri ja muistit jo joskus n. 15 vuotta sitten.
 
ATI:lla oli mobiilinäyttiksissään samassa paketissa näyttispiiri ja muistit jo joskus n. 15 vuotta sitten.
Tässä varmaan tarkoitettiin sitä että on ensimmäinen GPU missä se itse näyttispiiri on useammalla sirulla...
 
Tässä varmaan tarkoitettiin sitä että on ensimmäinen GPU missä se itse näyttispiiri on useammalla sirulla...

Voodoo1 tuli n. 25 vuotta sitten, siinä oli itse näyttispiiri useammalla sirulla. Toki ne sirut olivat siinä eri paketeissa.

Instinct MI200 (tuli viime vuonna) oli myös kahden piirin MCM, toki se oli enemmän optimoitu tieteelliseen laskentaan ja tekoälyjuttuihin kuin grafiikkaworkloadeihin. Ja se oli symmetrinen eikä asymmetrinen design.

Ja xBox360n graffapiiri Xenos oli asymmetrinen MCM, n. 17 vuotta sitten. Siihen verrattuna näissä uusissa "chipleteissä" ei ole teknisesti tasan mitään uutta sen suhteen miten näyttis jaetaan kahteen samassa paketissa olevaan piilastuun. Ainoa asia mikä on muuttunut että AMDn markkinointi on keksinyt hienon "Chiplet"-termin tässä välillä.

Ic-photo-ATI--%28X-BOX_360-GPU%29.jpg
 
Viimeksi muokattu:
Voodoo1 tuli n. 25 vuotta sitten, siinä oli itse näyttispiiri useammalla sirulla. Toki ne sirut olivat siinä eri paketeissa.

Joo eli puhutaan omenoista ja appelsiineista.

Instinct MI200 (tuli viime vuonna) oli myös kahden piirin MCM, toki se oli enemmän optimoitu tieteelliseen laskentaan ja tekoälyjuttuihin kuin grafiikkaworkloadeihin. Ja se oli symmetrinen eikä asymmetrinen design.

Tämäkin on nyt taas varsin huono vertaus koska MI200 ei kuvaa saa ulos. Vaikka noista edelleen GPU nimitystä käytetään, niin eipä niillä kyllä GPU:n virkaa hoideta. Taitaa tuosta itseasissa puuttua muutakin kuin fyysiset portit, koko media engine vai mikä se nyt olikaan.

Xbox vertauskin on varsin ontuva kun ei niitä xboxin MCM "näyttiksiä" kyllä kuluttajien PC myllyisin koskaan myyty.

Aika turhaa lillukanvarpujen tallomista taas ja mielensä pahoittamista siitä että AMD on "keksinyt" uuden termin.
 
Onko tuo joku virstanpylväs, että tekniikka hyväksytään "todelliseksi" vasta kun se pääsee kuluttajien tietokoneisiin?

Kysehän on integraation asteesta tai sen puutteesta. Perinteisesti PC puoli on tullut perässä ja tuollaisissa laitteissa kuten konsoli on yleensä sitä integraatiota lisätty ennen PC puolta.
Silti aina kun PC puolelle on jotain integroitu niin kyllä sitä on muistettu mainostaa. Nyt jostain syystä tämä AMD:n chiplet mainostus koetaan erään käyttäjän taholta jotenkin virheelliseksi ja sitten jaksetaan kiukutella asiasta joka paikassa missä siihen vähänkin viitataan.

Nythän tilanne on se että esim PS5:ssa on APU johon on integroitu käytännössä kaikki. Kohta AMD julkaisee ns. Datacenter APU:n ja aivan varmasti tulee mainostamaan sitä world first jne. Eikä siinä ole mielestäni mitään väärää koska sitähän se on sinne datacenter puolelle.
 
Komeeta suorittamista amd:lta, jos/kun menee lähelle 4GHz kellotaajuus.
 
Tämä on kova huhu jos pitää paikkaansa:


Niin jos toi pitää paikkaansa niin ei tartte CU määrää edes tuplata niin saadaan jo 2x suorituskyky verrattuna 6900xt.

6950XT boost kelloksi ilmoitetaan 2300, jos navi 31 boostaisi 3300 ja siinä olisi 120CU:ta niin tuolla tulisi 2,15 kertainen suorituskyky noin karkeasti.
En jaksa uskoa että kaikki SKU:t tuolle lähelle 4 yltää.
 
Tämä on kova huhu jos pitää paikkaansa:

" [...] AMD RDNA 3 is on track to deliver an estimated >50 percent better performance per watt than AMD RDNA 2 architecture [...] "

Saisi Nvidia ottaa oppia ja panostaa myös korttien tehokkuuteen, sen sijaan että watteja nostamalla hankitaan tehokkuutta nopeimman kortin virtuaalipip..tittelin hankkimiseksi.


E: Ja ennen kuin joku tulee kertomaan Nvidian ottaneen asiassa edistysaskeleita, lainaan itseäni. Tätä ei ainakaan toisessa ketjussa kukaan tullut lyttäämään, joten ehkä katsoin artikkelin tulokset oikein.
Tom's Hardwarelta löytyy aika kattava vertailu (jota en lukenut läpi, kunhan skippasin tuloksiin).

Eipä tuo parantunut oikein millään mittapuulla, jos nyt oikein katsoin. Ainut parannus tapahtui X070 kortilla.

KorttiFPSWattFPS/W
207081.0196.10.41
208095.5219.00.44
2080 Ti118.2259.40.45
3070116.6219.30.53
3080142.1333.00.43
3090152.7361.00.42

 
Varmasti on Nvidiankin uus piiri energiatehokkaampi kuin vanha.
Mutta luultavasti Amd:n korttien teholoikkapelko ajaa käyttämään enempi virtaa -> Amd:kin nostaa korttien kulutusta, muuten kortit jää kaupan hyllylle jos ei pysty kilpailemaan fps-pelissä.

Toki kortin ostaja sit voi itse rajoittaa tehon käyttöä, jos ei tarki kaikkea fps-kilpailun tuomia freimejä.

Toisaalta on sekin hieman hölmöä kun jäähdytykseen, virransyöttöön ym on pakko käyttää euroja ja ajaa sitä sitten puolitehoilla -> miksi ostaa huippukorttia sit lainkaan, jos haluaa säästää sähköä. Paitsi jos tavoitteena on mahdollisimman paljon freimejä, mahdollisimman vähällä sähköllä :D
 
Sinänsä tuo on OEM valmistajien kohdalla kyllä ongelma, jos tehorajat ovat suunnittelulle kovinkin väljässä haarukassa. Sinne saa virransyöttöön tunkea turhan tukevasti komponenttia ja katteet pienenee entisestään kun ei tiedä minkä verran tehoja se lopullinen piiri lopulta tarvitsee tai kuinka tarkasti virtaa pitää optimoida.

Sinänsä käsittääkseni AMD:lla on ollut paremmat komponentit käytössä korteillaan keskimäärin, joten tuon perusteella voisi ajatella että katteet ovat siellä OEM valmistajilla hivenen paremmat jos voidaan käyttää kalliimpia komponentteja.
 

Uusimmat viestit

Statistiikka

Viestiketjuista
262 450
Viestejä
4 551 583
Jäsenet
74 986
Uusin jäsen
jujo15

Hinta.fi

Back
Ylös Bottom