NVIDIAn seuraavan sukupolven näytönohjaimet ensimmäisessä Geekbench-vuodossa

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 620
nvidia-next-gen-geekbench-1-20200228.jpg


Kaotik kirjoitti uutisen/artikkelin:
NVIDIAn odotetaan julkaisevan tänä vuonna uuteen Ampere-arkkitehtuuriin perustuvat näytönohjaimet. Näytönohjaimista ei tiedetä vielä käytännössä mitään, mutta spekulaatioa ja huhuja niistä riittää.

Nyt Twitterissä kunnostautunut vuotaja _rogame on twiitannut kaksi mielenkiintoista tulosta Geekbench 5:n tulostietokannasta. Tuloksissa esiintyy kaksi NVIDIAn nimetöntä näytönohjainta, jotka ovat merkittävästi nykytarjontaa järeämpiä ainakin muistimäärän ja SM-yksiköiden suhteen. Molempien tulokset on ajettu OpenCL-rajapinnalla Windows-alustalla. Tuloksia lukiessa on syytä muistaa, että sovellukset saattavat tulkita julkaisemattomia näytönohjaimia ja niiden ominaisuuksia väärin.

Geekbenchin mukaan kaksikon tehokkaampi näytönohjain on varustettu 24 gigatavun muistilla, 1,11 GHz:n kellotaajuudella ja 118 SM-yksiköllä. Mikäli grafiikkapiirissä on yhtä monta CUDA-ydintä per SM-yksikkö kuin Turing-arkkitehtuurissa, se tarkoittaisi 7552 CUDA-ydintä. Näytönohjain saa OpenCL-rajapinnalla tuloksekseen 184 096 pistettä.



Heikomman mutta edelleen kovan 141 654 pisteen tuloksen saanut näytönohjain on varustettu puolestaan 1,01 GHz:n kellotaajuudella toimivalla 108 SM-yksikön (6912 CUDA-ydintä mikäli suhdeluvut pysyvät ennallaan) grafiikkapiirillä. Muistia näytönohjaimessa on kuitenkin peräti 47 Gt, tai todennäköisemmin 48 Gt, josta näkyy syystä tai toisesta hieman vähemmän Geekbenchille.

Näytönohjainten SM-yksiköiden ja muistin määrästä voidaan tulkita käytännössä varmasti, että kyseessä on oltava NVIDIAn seuraavan sukupolven datakeskuksiin tarkoitetuista näytönohjaimista ja Volta-arkkitehtuurin GV100:n korvaavasta grafiikkapiiristä. Testit on ladattu Geekbench-palveluun viime vuoden loka- ja marraskuussa, eli kyse lienee NVIDIAn sisäisitä testikokoonpanoista. Verrokiksi tunnistamattomien näytönohjainten 184 096 ja 141 654 pisteen tuloksille _rogame mainitsee Quadro GV100:n nettoavan OpenCL-rajapinnalla 142 837 pistettä, Tesla V100:n 154 606 pistettä ja Titan RTX:n 132 804 pistettä.

Lähde: _rogame @ Twitter

Linkki alkuperäiseen juttuun
 
Tesla V100Tesla A100 118CUTesla A100 108CU
CUDA -ytimet
5120​
7552​
6912​
Kellotaajuus (max/turbo)
1370​
1110​
1010​
Geekbench OpenCL
154606​
184096​
141654​
Normalisoidaan kellotaajuudet*
Geekbench OpenCL
154606​
227218​
192145​
Normalisoidaan CUDA -ytimien määrät**
Geekbench OpenCL
154606​
154046​
142329​
* Geekbench-tulos, kun oletetaan korttien kellotaajuuksien olevan sama 1370MHz: 1370 / 1110 x 184096 = 227218
** Geekbench-tulos, kun oletetaan korttien kellojen ja CUDA-ytimien määrien olevan sama 5120kpl: 5120 / 7552 x 227218 = 154046

Jos oletetaan että vuodossa kerrotut ja taulukossa käytetyt arvot pitävät paikkansa, uusien näytönohjainten CUDA-ytimet tekevät samoilla kellotaajuuksilla täsmälleen saman verran työtä kuin GV100-grafiikkapiirissä. Eli Ampere ei olisi tuomassa mitään arkkitehtuurillisia muutoksia CUDA-ytimiin suorituskyvyn saralla, vaan korkeampi suorituskyky saavutetaan suuremmalla määrällä CUDA-ytimiä ja mahdollisesti korkeammilla kellotaajuuksilla, jos sellaisiin voidaan 7nm prosessilla päästä.

Pisteiden skaalautuminen CUDA-ytimien määrän ja kellotaajuuden mukaan on tässä kyllä niin täydellistä, että alkaa mietityttää onko vuotaja tai vuotajalle tiedot välittänyt taho laskeskellut samoja asioita ja lätkinyt sen mukaan CUDA-ytimiä ja kellotaajuutta itse keksimälleen tekaistulle "vuodolle". Käytetty testialusta ja näytönohjainten muistien nopeudet kuitenkin yleensä vaikuttaa tuloksiin ihan jonkin verran.

EDIT: Jaa nämä tosiaan löytyy ihan tuolta Geekbenchin tulossivuilta. Lisäsin taulukkoon myös tuon pienemmällä CUDA-ydinmäärällä varustetun kortin samoilla laskutoimituksilla. 108CU:n näytönohjaimen normalisoitu tulos jää matalammaksi kuin isommalla piirillä varustetulla kortilla. Ehkä siinä on hitaampaa muistia?
 
Viimeksi muokattu:
Jos testit on ladattu tuonne 10-11 2019, niin miten ne huomattiin vasta nyt?
 
Jos testit on ladattu tuonne 10-11 2019, niin miten ne huomattiin vasta nyt?
Jos et ole siellä 247 päivittämässä Recent results -listaa näiden nimettömien löytäminen on kuin etsisi neulaa heinäsuovasta, joskus joku bongaa, joskus ei. Siellä tietokannassa on aika taatusti muitakin julkaisemattomien näyttisten tuloksia mitä ei ole bongattu.
 
Eli Ampere ei olisi tuomassa mitään arkkitehtuurillisia muutoksia CUDA-ytimiin suorituskyvyn saralla, vaan korkeampi suorituskyky saavutetaan suuremmalla määrällä CUDA-ytimiä ja mahdollisesti korkeammilla kellotaajuuksilla, jos sellaisiin voidaan 7nm prosessilla päästä.
Jos en kovasti väärin muista niin Gtx1080Ti päästään lähelle samoja pisteitä kuin 2080Ti
Mutta 2080Ti silti tuntuvasti nopeampi peleissä.

Joten millaisia johtopäätöksiä voisi siis vetää tälläisestä testistä Amperen/Turingin välillä kun kyse on pelisuorituskyvystä.

7nm ilmeisesti vähintäänkin mahdollistaa enemmän cuda ytimiä,ehkä kovemmat kellot ilman että wKulutus nousee Turingiin verrattuna.
Energiatehokkuus yleensä sanelee kuinka kova siitä huippu ohjaimestakin tulee koska TDP
 
Viimeksi muokannut ylläpidon jäsen:
Jos en kovasti väärin muista niin Gtx1080Ti päästään lähelle samoja pisteitä kuin 2080Ti
Mutta 2080Ti silti tuntuvasti nopeampi peleissä.

Joten millaisia johtopäätöksiä voisi siis vetää tälläisestä testistä Amperen/Turingin välillä kun kyse on pelisuorituskyvystä.
Muistisi taitaa nyt pettää sinut pahemman kerran: OpenCL Benchmarks - Geekbench Browser
GTX 1080 Ti saa tuon listauksen mukaan vajaat 60 000 pistettä ja on esim Vega 64:n takana. Toki tuosta puuttuu yksittäisiä parhaita tuloksia, mutta ei tuollaista 90 000 eroa kaavita kokoon kuin iskemällä koneeseen useampi 1080 Ti
(edit: nämä ovat siis nimenomaan Geekbench 5 tuloksia, 4-versioissa tulokset oli ihan erilaisia)
 
[
Muistisi taitaa nyt pettää sinut pahemman kerran: OpenCL Benchmarks - Geekbench Browser
GTX 1080 Ti saa tuon listauksen mukaan vajaat 60 000 pistettä ja on esim Vega 64:n takana. Toki tuosta puuttuu yksittäisiä parhaita tuloksia, mutta ei tuollaista 90 000 eroa kaavita kokoon kuin iskemällä koneeseen useampi 1080 Ti
(edit: nämä ovat siis nimenomaan Geekbench 5 tuloksia, 4-versioissa tulokset oli ihan erilaisia)
Juu meni sekasin taisi olla Vulkan pisteet noi +80k

Mutta Vega64 saa +80k

"cuda pisteet" on 1080Ti n.60k ja 2080Ti about 170k
 
OpenCL testi nyt kyllä välttämättä kerro nvidian arkkitehtuuriparannuksista paljoakaan. Eli pelkkiä TFlopseja kattomalla olisivat juuri tuossa järjesteksessä nuo kortit.
 
OpenCL testi nyt kyllä välttämättä kerro nvidian arkkitehtuuriparannuksista paljoakaan. Eli pelkkiä TFlopseja kattomalla olisivat juuri tuossa järjesteksessä nuo kortit.
Ei tuo mitään FLOPSeja mittaa, Geekbench 5:n OpenCL-testissä esimerkiksi Turingiin perustuva GTX 1660 Ti on ~yhtä nopea kuin GTX 1080 Ti, vaikka jälkimmäisessä on TFLOPSeissa laskettuna suorituskykyä ~tuplat ja peleissäkin yli 50 % nopeampi.
 


Sieltä on löytynyt vielä isompi, ilmeisesti 128 SM-yksikköä olisi täydessä paketissa.
 
Alkaa noi cuda määrät oleen melko överiä.
Kelpais kyllä jos tulisi Desktop Gpu tuollaiset määrät. 2080Ti 4352 alkaa näyttämään hieman vaisulta.
 
Saattaisipa hinta karata vielä hurjemmin laukalle kuin 2080Ti:n kanssa jos ihan deskaritasolle tuollaisia tuotaisiin.

Tosin eihän 4k€ ole nykyään "deskariCPU":sta hinta eikä mikkään että miksei sitten kolmen tonnin näyttiskin niille jotka ei sitä tarvitse mutta haluavat kuitenkin? :lol:
 

Statistiikka

Viestiketjuista
261 387
Viestejä
4 536 643
Jäsenet
74 794
Uusin jäsen
kurrexd

Hinta.fi

Back
Ylös Bottom