Onhan tämä nyt aivan käsittämätöntä miten osa porukasta ei edelleen pysty uskomaan että AMD kykenee valmistamaan kilpailukykyisen näytönohjaimen. Ei homma ole mitään rakettitiedettä.
Siellä on kyllä parikin osa-aluetta jotka on hyvinkin verrannollisia "rakettitieteeseen" vaikeudeltaan.
Esim. ajureissa olevassa shader-kääntäjässään nVidia on käytännössä onnistunut asioissa, joita Intel ja HP yrittivät tehdä Itanium-kääntäjässään yli 10 vuotta epäonnistuen.
6900XT vs 5700XT
- Shaders 5120 vs 2560 = 2x
- FP32 TFLOPS 23,04 vs 9,754 = 2,36x
- Muistikaista GB/s 512 vs 448 = 1,14x
- Relative perf 100% vs 49% = 2.04x
7900XT vs 6900XT (Huhujen spekseillä)
- Shaders 12288 vs 5120 = 2,4x
- FP32 TFLOPS 66,36 vs 23,04 = 2,88x
- Muistikaista GB/s 864 vs 512 = 1,68x
- Relative perf ???% vs 100%
Onko tuosta kovin hankalaa mieltää että sieltä on tulossa vähintään 2x teholisäys jälleen ja mikäli skaalautuu shaderien mukaan toi relative niin mennään selvästi yli 2x. Jos ei tule niin sitten ollaan jossain kustu hommat ja pahasti oletuksena että noi huhutut speksit pitää paikkaansa.
Ainut kysymysmerkki oikeestaan on että miten muistikaista riittää koska sitä ei ole huhujen mukaan tulossa tuplasti lisää ja cache kortti pelattiin jo 6000 sarjassa jolla saatiin hirmu hyöty muistikaistan suhteen.
Tosin onhan ne samsungin 24Gbps muistilastut, jos AMD tuo kortin niillä niin sitten muistikaistaa tulee 2,25x
Rasteroinnissa ongelmaksi tulee nimenomaan se muistikaista.
5700XT => 6900XT -välillä se ei ollut ongelma, koska sinne tuli 128 megaa lisää L3-välimuistia.
Mutta huhujen mukaan se L3-välimuisti olisi 7000-sarjassa
pienenemässä. Mikä taas haittaa nimenomaan isommilla resoilla, koska sinne välimuistiin pitäisi mahtua sekä backbuffer että z-buffer, ja 96 megaa alkaa käymään tiukaksi.
Lisäksi huhujen mukaan nuo shaderit eivät olisi identtiset tuplamäärällä ytimiä, vaan siellä olisi tuplamäärä shader-linjoja/ydin, ja ytimien määrä lisääntynyt vain hiukan. Tämä voi vaikuttaa esim siten, että pieniä kolmioita piirrettäessä kaikille linjoille ei hetkellisesti löydy tekemistä, ja kun shader-koodissa on if-else-haarautumistilanteita, harvemmin tulee tilanne että kaikki linjat ottaa saman haarautumispolun ja voidaan hyödyntää optimointia, joka skippaa toisen puolen kokonaan.
Ja jos tuo tosiaan on suora SIMD-linjojen määrän tuplaantuminen 32=>64, tuo myös helposti vaatinee ylimääräsen kellojakson viivettä shuffle-käskyille jotka siirtelee dataa SIMD-linjojen välillä. Tosin tällaisia käskyjä käytetään lähinnä vain ajurien sisäisessä toiminnallisuudessa, koska ne ei oikein porttaannu eri arkkitehtuurien välillä eikä nuo yleisemmät APIt taida niitä edes kunnolla antaa käyttöön (*)
AMD muistaakseni jossain esityksessään sanoi selvästi tyyliin, että 7000-sarjassa on keskittynyt viilaamaan shadereitaan pienemmiksi että saa niitä piirille enemmän. Tämä optimointi ei ole ilmaista. Tämä tarkoittaa sitä, että tehdään ratkaisuita, joissa niiden shaderien utilisaatio huononee; Esim. FMA-yksiköt tuplattu mutta joidenkin erikoisyksiköiden määrää ei ole tuplattu ja niitä käyttäessä useammin joudutan odottelemaan kun en onkin varattuja, pidempiä viiveitä käskyillä kun joko pinta-alan puolesta kallis nopeusoptimointi vaihdetaan pinta-ala-optimointiin jne.
Ja lisäksi teksturointinopeudesta ei ole taidettu mainita mitään. On myös sellainen mahdollisuus(joskin pitäin tätä epätodennäköisenä), että kun shader-linjojen määrä/ydin on tuplattu, tekstuuriyksiköiden määrää ei olisikaan tuplattu, ja teksturointinopeus olisi vain inasen nopeampi kuin 6000-sarjassa.
Samoin ROP-määrästä (eli varsinaisen rasterointispesifisen raudan väännöstä) ei ole taidettu mainita mitään. Ihan mahdollista, että se on ennallaan.
Kyllähän sieltä varmasti paljon suorituskykyä lisää on tulossa, mutta ei tehdä liian hätäisiä päätelmiä suurelta vaikuttavien huhunumeroiden perusteella, ennen kuin tiedetään mitä ne numerot
oikeasti tarkoittaa ja nähdään se muu relevantti data mitä huhuissa ei mainittu. Ja ylipäätään varmistutaan edes niiden huhuissa mainittujen numeroiden oikeellisuudesta.
Ja henkilökohtaisesti en oikein juurikaan kaipaa tätä 3070M:ää enempää rasterontitehoa. Kaikki rasterointikama mitä olen tällä pelannut pyörii 4k-resolla erinomaisesti. Cyberpunk 2060 säteenjäljitys päällä ei pyöri erinomaisesti, mutta siinä ongelmana ei ole rasterointiteho.
Näyttis, joka loppuvuodesta 2022 olisi rasterointinopeudessa tasoissa tai inasen edellä mutta jäisi pahasti säteenjäljitysnopeudessa ei mielestäni olisi kunnolla kilpailukykyinen. Se, että saadaan ziljoona turhaa FPSää vanhoissa peleissä mutta sukataan uusilla peleillä ei olisi kovin järkevä ostos, ellei se ole selvästi halvempi, että pystyy kilpailemaan sen alempana samassa hintaluokassa olevan nVidian näyttiksen kanssa. Rasterointinopeuden tuijottaminen alkaa pikkuhiljaa olla käymässä turhaksi kuin huippunopeuden tuijottaminen valitessa autoa joka tulee suomen tieliikenteeseen.
Mutta onneksi tuo shader-linjojen tuplaaminen
todennäköisesti tarkoittaa sitä TMUiden tuplaamista ja sen myötä sitä että
todennäköisesti se raaka törmäystarkastusnopeus kasvaa samassa suhteessa, jolloin nVidian etumatka säteenjäljityksessä olisi todennäköisesti hiukan kutistumassa.
(*) Esim. OpenCL:ssä on kyllä shuffle/shuffle2-kirjastofunktiot mutta tyypillisesti koodi rinnakkaistetaan näyttiksellä tavalla, että sen vektoriominaisuutta ja sen myötä shuffle-käskyä ei voi tehokkaasti hyödyntää leveille vektoreille.