NVIDIA-spekulaatioketju (Lovelace ja tulevat sukupolvet)

Unohdat nyt sen että Amperessa on tuplat fp32 laskentaa per SM. Vaikka Ampere ei välttämättä saakkaan irti sitä mitä Turing Tflopseistaan, niin en usko että 80CU:ta vielä riittäisi "selvästi" päihittämään 68SM:n Amperen. Se että riittääkö tuo edes AMD:lle, riippuu miten korkealle se saa kellonsa ja miten paljon Amperen laskentanopeus peleissä jää teoreettisesta(Paljon liukulukuja koodissa -> lähellä maksimia, skalaaria -> lähellä minimiä).

Vaan kovin huonosti se tupla fp32 tuntuu realisoituvan kun nyt on jo jotain OpenCL testejäkin tullut julki eikä niissäkään päästä lähimainkaan hyödyntämään sitä kaikkea potentiaalia niin on aika selvää että siellä muistikaista tai jokin muu on pullonkaulana. Muistikaistaahan esim. ei ole suhteessa mitenkään järisyttävästi tullut lisää.
Toinen vaihtoehto on että alkaa hakata powerlimittiin. Ei se tupla FP32 meinaan ilmaiseksi tule niin voi hyvinkin olla että sitä ei vaan voida käyttää niin tehokkaasti.
 
Vaan kovin huonosti se tupla fp32 tuntuu realisoituvan kun nyt on jo jotain OpenCL testejäkin tullut julki eikä niissäkään päästä lähimainkaan hyödyntämään sitä kaikkea potentiaalia niin on aika selvää että siellä muistikaista tai jokin muu on pullonkaulana. Muistikaistaahan esim. ei ole suhteessa mitenkään järisyttävästi tullut lisää.
Toinen vaihtoehto on että alkaa hakata powerlimittiin. Ei se tupla FP32 meinaan ilmaiseksi tule niin voi hyvinkin olla että sitä ei vaan voida käyttää niin tehokkaasti.
no en sanoisi huonosti, mutta toki 70% ei ole 100%.
 
3080:ssä on miltei kolminkertaisesti FP32 laskentaan kykeneviä CUDA ytimiä verrattuna 2080 (8704 vs 2944), joten pikemminkin teoreettisesti 70% ei ole 195%.
Minusta tämä vain johtuu siitä kun sovellukset erilailla käyttävät fp32 ja int laskentaa, fp32 laskentaa enemmän käyttävä saa ison boostin nyt.
 
Minusta tämä vain johtuu siitä kun sovellukset erilailla käyttävät fp32 ja int laskentaa, fp32 laskentaa enemmän käyttävä saa ison boostin nyt.
@JiiPee viittasikin tuossa noihin CUDA / OpenCL testeihin, joissa ei pitäisi INT32 laskennalla olla merkitystä, vaan ajetaan puhdasta FP32

Edit: Videocardzin datat viittaavat CompuBenchiin CompuBench - performance benchmark for various compute APIs (OpenCL, RenderScript)
 
Viimeksi muokattu:
Tuosta oli Nvidiallakin lyhyt artikkeli viime viikolla:

  • Easy to use PCIe graphics card power measurement
  • Works with any GPU vendor (does not rely on private API calls)
  • Direct measurement of total board power (no more guessing and extrapolating)
  • Accurate to within one-thousandth of a watt (assuming reasonable voltages)
  • No soldering required
 
Nvidia sitten mokasi tuon 3080 FE kortin kanssa... Numero 8 on kortissa ylösalaisin :facepalm:

3728716-desktopscreenshot2020.09.01-09.28.13.62.png



Miten tuommonen voi päästä läpi laatukontrollista?
Eihän kukaan nyt tarkoituksella laita yhtä numeroa väärinpäin? Eihän?
Mitä jos se 8 olikin väärinpäin 2000-sarjassa ja se korjattiin nyt? :D
 
Nvidia sitten mokasi tuon 3080 FE kortin kanssa... Numero 8 on kortissa ylösalaisin :facepalm:

3728716-desktopscreenshot2020.09.01-09.28.13.62.png



Miten tuommonen voi päästä läpi laatukontrollista?
Eihän kukaan nyt tarkoituksella laita yhtä numeroa väärinpäin? Eihän?

Mitä jos se 8 olikin väärinpäin 2000-sarjassa ja se korjattiin nyt? :D

Nvidian omilta tuotesivuilta:
Capture.PNG


Kumpi onkaan siis oikea kahdeksikon asento? Tämä täytyy selvittää, nyt on oikeasti SOS tilanne.
 
Nvidian omilta tuotesivuilta:
Capture.PNG


Kumpi onkaan siis oikea kahdeksikon asento? Tämä täytyy selvittää, nyt on oikeasti SOS tilanne.

Sivuilla on oikein, kortissa väärin. Nyt putosi ainakin 3080FE harkittavien korttien listalta... Tämän luokan virhe on katastrofi.
 
Vaikuttaa fyysisissä kopioissa kyllä olevan oikein, en tiedä miksi renderöinnit kusevat.
 


olettaen että tuo on oikea kortti, 8 oikeinpäin tuossa jos tuhrusta saa selvää.

EDIT: nyt kun katsoin uusiksi en kyllä ole varma, kumminpäin se 8 tuossa on :D

Se on eripäin. Samoin kuin nollatkin näyttää olevan.
 
Julkaisua pitäisi siirtää ja polttaa nuo kaikki virheelliset tulessa....
 
TLDR: mikään peli ei tule toimimaan 4k resolla koska kaikki konsoleilta portatut pelit vaatii sen 16k vram, ja parempi ostaa 3080 TI joka tulee 3kk sisällä.

Näissä toki unohdetaan aina kätevästi se, että konsoleissa ei ole erillistä keskusmuistia. Mulla on tässä Metro Exodus auki, mikä on varannut n. 6 gigaa näyttömuistia (Afterburnerin mukaan) sekä lisäksi 8,65 gigaa keskusmuistia.
 
Järkevää ja hyödyllistä keskustelua pojat.

Reviewer kit näyttää ihan asialliselta, toivottavasti on sitä myös käytännössä. Helpompi mitata kuinka kauas jäädään siitä 1,9x perf/W:sta.
 


Paha valinta näiden kahden ja FE välillä. Onko hyvää arvausta mikä noista kolmesta hanskaisi jäähydytyksen parhaiten ja pienimmällä metelillä :hmm:
 


Paha valinta näiden kahden ja FE välillä. Onko hyvää arvausta mikä noista kolmesta hanskaisi jäähydytyksen parhaiten ja pienimmällä metelillä :hmm:

Jos pitää näistä veikata niin arvaisin MSI:tä. Ilmeisesti sama jäähy kuin Gaming X -mallissa, mutta eri tuulettimet ja ei joulukuusen valoja. :D
 


Paha valinta näiden kahden ja FE välillä. Onko hyvää arvausta mikä noista kolmesta hanskaisi jäähydytyksen parhaiten ja pienimmällä metelillä :hmm:
msi ventus ja vesille :tup:
 
Itsekin tuota MSI-mallia arvelin parhaaksi noista. Ollut pitkään MSI Gaming X 1080ti koneessa ja tuo ei ainakaan kovin pahaa ääntä pidä.

Vesihommat jätän muille :)
 
Joutuu kyl varmaan omassa tapauksessa unohtamaan FE:n. Syynä se et siinä on vaan yks HDMI 2.1 portti, kun taas Asuksen TUFissa ja Gigabyten malleissa näytöstäis olevan kaks kappaletta noita portteja. Telkkari ja VR-headset vie molemmat yhden paikan, eikä huvittais tehdä kompromissia siinä mielessä et noita täytyis olla nyppimässä ja laittamassa takas.
 
Jos pitää näistä veikata niin arvaisin MSI:tä. Ilmeisesti sama jäähy kuin Gaming X -mallissa, mutta eri tuulettimet ja ei joulukuusen valoja. :D
On noissa kokoeroa Gamingin eduksi jonkun verran. Ventus 200g hoikempi kuin 20- ja 30-sarjojen Triot.

msi ventus ja vesille :tup:
Custom PCB, eli sopiva blokkia ei välttämättä heti löydä(?)
 
MSI:ssä näyttäis olevan aavistuksen verran isommat ropellit ja enemmän pinta-alaa jäähdytinrivastossa.
 
FE:n testit tulee julki vähän ennen kuin näiden muiden mallien. Siinä on pari päivää aikaa funtsia onko Nvidian jäähy jytky vai ei ja toimia sitten sen mukaan. Tänne kyllä tulee varmaankin jo pelkästään ulkonäön vuoksi FE, mikäli nyt ei aivan surkea ole.
 
Unohdat nyt sen että Amperessa on tuplat fp32 laskentaa per SM.

Siellä on tuplamäärä fp32-kelpoisia ALUja.
Mutta ALUjen kokonaismäärä on aivan sama, mitään muuta siellä ei sitten tietääkseni olekaan enempää ja silloin kun kokonaislukuoperaatioihin kykenevät ALUt laskevat FP32-laskuja, ne eivät laske samaan aikaan kokonaislukuoperaatioita (joita tarvitaan esim. looppien indeksien ja muistiosoitteiden yms. laskemiseen)

Kun siellä joku säie haluaa tehdä normaalia muistioperaatiota, joku lukea tekstuurisamplea, joku laskea indeksejä, ja vain yksi näistä neljästä laskea FP32-tarkkuudella jotain laskuja, ei se uusi ole sillä hetkellä yhtään sen nopeampi, kun pullonkaulat on muualla kuin niissä FP32-yksiköissä.

Käytännössä tuo "FP32-yksiköiden tuplaaminen" antaa ehkä n. 20% nopeutuksen shadereille useimmilla workloadeilla.

Vaikka Ampere ei välttämättä saakkaan irti sitä mitä Turing Tflopseistaan, niin en usko että 80CU:ta vielä riittäisi "selvästi" päihittämään 68SM:n Amperen. Se että riittääkö tuo edes AMD:lle, riippuu miten korkealle se saa kellonsa ja miten paljon Amperen laskentanopeus peleissä jää teoreettisesta(Paljon liukulukuja koodissa -> lähellä maksimia, skalaaria -> lähellä minimiä).

Kelloista tosiaan riippuu paljon. TSMCn "7nm" tekniikka antaa tässä AMDlle selvän edun nVidian käyttämään Samsungin "8nm" tekniikkaan verrattuna.
 
Tänne kyllä tulee varmaankin jo pelkästään ulkonäön vuoksi FE, mikäli nyt ei aivan surkea ole.

Mutta ulkonäön takia sitä ei voi ostaa... Siinä on kasi nurinpäin. :sad:

Jää ainakin minulla kauppaan...
Ei anna kovin vahvaa laatuvaikutelmaa tuollainen moka...

Tosin vesille menee joks tapauksessa.
 
löytääkö millekään?

FE:lle ainakin:
 
3080
Mutta ulkonäön takia sitä ei voi ostaa... Siinä on kasi nurinpäin. :sad:

Jää ainakin minulla kauppaan...
Ei anna kovin vahvaa laatuvaikutelmaa tuollainen moka...

Tosin vesille menee joks tapauksessa.
Itellä ei kans ulkonäöllä niin väliä kun vesille menee. En kyllä tiiä tuosta FE kortista, kun pcb on tuollainen vammainen niin onkohan blokki myös lyhyt.
EDIT: tuo bykski on omaan makuun turhan lyhkäinen, jää liikaa tilaa koppaan :D
 
Itellä ei kans ulkonäöllä niin väliä kun vesille menee. En kyllä tiiä tuosta FE kortista, kun pcb on tuollainen vammainen niin onkohan blokki myös lyhyt.
Tsekkaa ylempi linkki missä Bykskin blokit. Blokki itessään on yhtä lyhyt ku PCB, eli pientä korttia ois tarjolla.
 
Nvidian omilta tuotesivuilta:
Capture.PNG


Kumpi onkaan siis oikea kahdeksikon asento? Tämä täytyy selvittää, nyt on oikeasti SOS tilanne.
Kenties jonkun huhun mukaan nopeasti näiden perään julkaistava ti tuleekin vain korjaamaan tämän epäkohdan? Lisätehot eivät tulekkaan lisättyjen cuda ytimien vaan kasin kääntämisen kautta...
 
MSI:n 3080:t on kyllä hinnoitelultaan aika hyvän oloisia. Ventus on edullinen mutta jäähy silti aika iso ja hyvät tuulettimet, ulkonäkökin suht ok. Ja jopa Gaming X Trio on hinnaltaan vielä ihan siedettävä, eli sekin päällisin puolin houkutteleva. Aorukset olisi kivoja, mutta mahtaa mennä hinta turhan korkealle, kun tuo GB:n Gaming-mallikin on jo 800.

Mä veikkaa, että Ventus on se entry-tason ykköskortti.
 
Lupaavia kuvia Kiinasta saatavuusmielessä:


Ilmeisesti kyse on hamstraamisesta louhintakäyttöön.


Saattaa hyvinkin olla ettei näitä pian saa mistään, kiitos hamstrauksen. Toivottavasti hinnoille ei käy samoin mitä kävi GTX 1080 Ti:lle.
 
Ja mitäs sitten kun otat ja kellotat myös sitä tonnin Ti:tä. Tai jos tilanne on se, että muisti loppuu.
Nämä Ti- mallit on kyllä olleet kovin kintereillä seuraavaa, aiemmin. Oma 1070ti saa kellotettuna paremmat 3dmark scoret kuin vakio 1080. Toki se 1080 kellottuisi myös karkuun, mutta kuitenkin omalla tavallaan plussaa että voi savuttaa kalliimman (vakiokortin). Samoin aikoinaan omistamani Gtx560ti 448, eipä se Gtx570:lle vakionakaan muistaakseni montaa prosenttia jäänyt. Gtx560 ti:hän hämmennettiin lisäksi sillä "448"- julkkarilla, mulla oli noita 2kpl sli:ssä :geek:.
 

Statistiikka

Viestiketjuista
259 337
Viestejä
4 504 900
Jäsenet
74 383
Uusin jäsen
pskrn

Hinta.fi

Back
Ylös Bottom