NVIDIA-spekulaatioketju (Lovelace ja tulevat sukupolvet)

Paitsi että ei oikeasti. Ei kannata uskoa kaikkea, mitä markkinamiehet sanoo;

Tuossa on kyse vertailusta jossa verrataan omenoita ja applelsiineja toisiinsa suunnassa joka on täysin vinossa todelliseen tilanteeseen nähden.

Jos meillä on satunnainen esikoulutettu neuroverkko, joka vaatii vähintään 8-bittiset kokonaisluvut, niin:

Voltalla se voidaan laskea tuolla "mixed"-tarkkuudella ja saada sille 125 teraflops nopeus. Suurempaa datanleveyttä saa aina käyttää; Se että verrataan Voltan ilman tensoriytimiä olevaan nopeuteen on hyvin epäreilu vertailu kun tosiasiassa niitä tensoriytimiä voisi käyttää suuremmalla laskentatarkkuudella.
Amperella se voidaan laskea tuolla natiivista 8-bittisillä inteillä 624 terops/s nopeudella.

Ero on tässä 5x, ei 20x.

Mikäli saadaan kouluttaa se neuroverkko uusiksi ja voidaan hyödyntää sparsifyä (jonka hyödyntäminen taas lisää selvästi vaivaa siihen koulutukseen ja vaatinee, että se pitää tehdä nVidian työkaluja käyttäen yms.) (optimaalinen tilanne sille Amperelle), silloin sen avulla saadaan melkein yhtä hyvä tulos tuplasti suuremmalla nopeudella. Tällöin ero on 10x, ei 20x.
Nvidia käyttää tuossa UpTo termiä mutta pakko kai se 20x josain toteuduttava ei tuollaisia numeroita tiemmä muuten voisi julkaista.

"TF32 running on Tensor Cores in A100 GPUs can provide up to 10x speedups compared to single-precision floating-point math (FP32) on Volta GPUs. Combining TF32 with structured sparsityon the A100 enables performance gains over Volta of up to 20x."

Viitataan tähän.
"TensorFloat-32 (TF32), a precision format, accelerating AI training and certain HPC jobs up to 20x.
 
Itseasiassa kaiken järjen mukaan tuon sparsityn käyttöönotto esikoulutetuille verkoille ei pitäisi olla mikään ihmeellinen temppu. Pitäisi olla suhteellisen suoraviivaista poistaa verkoista lähes nollapainoiset osat myös jälkikäteen, ei sitä tarvitse välttämättä juuri sen koulutuksen aikaan tehdä. Toki se on yksi lisästeppi tuon esikoulutetun verkon käyttöönottoon, mutta ei varsinaisesti mikään ameriikan temppu.

Ei ne ole mitä tahansa nollapainoisia, vaan siellä on sparsityssä aina kaksi "viereistä" (ei välttämättä suoraan viereiset vaan saattoi olla jonkun interleavausssäännön mukaan "viereiset") joista toisella pitää olla aina nollapaino. Kun sparsityä ei huomioida jo koulutusvaiheessa, ne "nollapainoiset" kertoimet menee helposti vääriin paikkoihin, että niitä ei voida sparsityllä jälkikäteen "poistaa" kun tuo sääntö niiden paikasta ei toteudu.

eli esim, jos menisi suoraan alimman indeksibitin mukaan niin sparsity-ystävälliset kertoimet voisi olla esim [1.5 , 0.01, -0.01, 3.0, 2.7, 0.03], mutta esim. [1.5, 3.0, 2.5, 0.01, -0.01, 0.03] ei olisi sparsity-ystävälliset kertoimet koska ekassa parissa on kaksi merkitsevää numeroa joita ei saa poistaa.
 
Viimeksi muokattu:
Nvidia käyttää tuossa UpTo termiä mutta pakko kai se 20x josain toteuduttava ei tuollaisia numeroita tiemmä muuten voisi julkaista.

:facepalm:

Hienoa on merkkiuskollisen usko oman tiimin markkinointipropagandaan.

Se, ei toteudu missään suorassa vertailussa koska Volta ei tue 8-bitin tarkkuutta tensoriyksiköillä, eli suoraa vertailua näiden tensoriyksiköiden välillä ei voida tehdä. ja normaaleilla shader-ytimillä (joilla voidaan 8-bittisen tarkkuuden laskentaa tehdä molemmissa) nopeusero on todella pieni.

Eikä se (epäsuorana) toteudu missään todellisessa järkevässä tilanteessa.

Se toteutuu ainoastaan tilanteessa jossa Voltaa rampautetaan sillä, että sille jätetään optimoimatta aivan triviaali pikkuoptimointi (tai oikeastaan: että tehdään Voltalle haitallinen pessimointi, eli tarkkuuden pudottaminen sellaiseen, joka on Voltalla hitaampi), mutta nähdään todella paljon vaivaa Amperelle optimointiin.

Se, että tehdään tällainen vertailu on todella typerää ja vääristävää propagandaa.
 
Viimeksi muokattu:
Mistä muuten TechpowerUp on saanut 7552 core GA 102 full die specsin?
Siellä on gpu database listattuna nämä tiedot.
 
Mistä muuten TechpowerUp on saanut 7552 core GA 102 full die specsin?
Siellä on gpu database listattuna nämä tiedot.
Se tietokanta perustuu pelkkiin huhuihin ja spekulaatioon julkaisemattomien mallien osalta, muistaakseni siellä mainitaan kyllä asiasta
 
:facepalm:

Hienoa on merkkiuskollisen usko oman tiimin markkinointipropagandaan.

Se, ei toteudu missään suorassa vertailussa koska Volta ei tue 8-bitin tarkkuutta tensoriyksiköillä, eli suoraa vertailua näiden tensoriyksiköiden välillä ei voida tehdä. ja normaaleilla shader-ytimillä (joilla voidaan 8-bittisen tarkkuuden laskentaa tehdä molemmissa) nopeusero on todella pieni.

Eikä se (epäsuorana) toteudu missään todellisessa järkevässä tilanteessa.

Se toteutuu ainoastaan tilanteessa jossa Voltaa rampautetaan sillä, että sille jätetään optimoimatta aivan triviaali pikkuoptimointi (tai oikeastaan: että tehdään Voltalle haitallinen pessimointi, eli tarkkuuden pudottaminen sellaiseen, joka on Voltalla hitaampi), mutta nähdään todella paljon vaivaa Amperelle optimointiin.

Se, että tehdään tällainen vertailu on todella typerää ja vääristävää propagandaa.
Meekkiuskollisuus ei liity mitenkään tähän vaan se kun on ilmoitettu UpTo 20x niin mistäs hel*** mä voin tietää ja kyseenalaistaa pitääkö se prkl paikkaa kun ei henk.kohtaisesti pätkääkään nämä laskenta kortit ole aikaisemmin kiinnostanut, ellei sitten kyseessä Titan ja pelikäyttö.
Sama mulle onko se 2x 10x vaiko 20x nopeampi koska en hyödy siittä mitenkään, kunhan otti silmään kyseiset isot lukemat.

E
Jos Amperesta tulee materiaalia jossa väitetään UpTo 10x nopeampi kuin Turing Tms. niin osaan melkoisella varmuudella todeta että ei pidäpaikkaa ja hahmotan millä kys.lukema ollaan saatu jotta sitä voidaan markkinoida näin.
Tämäkään ei liity siis merkkiuskollisuuteen vaan siihen että tietää/ymmärtää mitä ja miten vertaillaan.

Eivät hekään ole merkkiuskollisia jotka uskoo johonkin 1ms VA paneelin vasteaika kusetuksiin,vaan pelkästään tietämättömiä kyseisestä kusetuksesta/tavasta jolla siihen päästään että voitaisiin näin markkinoida.

Ja kyllä ostan mielelläni Nvidian ohjaimia
A.koska nopeampi.
B. Mulla paljon vähemmän ongelmia niiden kanssa.
Amd voi tehdä nopeamman niin ostan sen varmasti, joten se siittä uskollisuudesta siinä vaiheessa.
 
Viimeksi muokattu:
Meekkiuskollisuus ei liity mitenkään tähän vaan se kun on ilmoitettu UpTo 20x niin mistäs hel*** mä voin tietää ja kyseenalaistaa pitääkö se prkl paikkaa kun ei henk.kohtaisesti pätkääkään nämä laskenta kortit ole aikaisemmin kiinnostanut, ellei sitten kyseessä Titan ja pelikäyttö.
Sama mulle onko se 2x 10x vaiko 20x nopeampi koska en hyödy siittä mitenkään, kunhan otti silmään kyseiset isot lukemat.

E
Jos Amperesta tulee materiaalia jossa väitetään UpTo 10x nopeampi kuin Turing Tms. niin osaan melkoisella varmuudella todeta että ei pidäpaikkaa ja hahmotan millä kys.lukema ollaan saatu jotta sitä voidaan markkinoida näin.
Mistä sen voit tietää? Jos vaikka tutustuisit siihen materiaaliin mitä itse linkkaat ja lainaat noin ihan aluksi, niin pääsee jo pitkälle.
Ihan vaikka tuo lause johon puutuin:
"INT8 Tensor Core operations with sparsity deliver unprecedented processing power for DL inference, running 20x faster than V100 INT8 operations."
Ei pitäisi olla ylivoimainen tehtävä huomata, että tuossa puhutaan "INT8 Tensor Core operations (with sparsity)" ja "INT8 operations", eli kaksi eri asiaa. Tämän kun yhdistää siihen, että siinä taulukossa, minkä muistaakseni juuri sinä postasit, on tyhjää pitkät rivit Voltalle, mukaanlukien tuo INT8 Tensor Core, niin pitäisi viimeistään olla selvää että A100 on x kertaa nopeampi asiassa mitä V100 ei voi ajaa lainkaan tensoreilla sellaisenaan, vaan joutuu käyttämään siihen CUDA-ytimiä (tai sitten oikean maailman tapaan se ajettaisiin FP16-tarkkuudella tensoreilla V100:lla kuten hkultala tuolla mainitsi aiemmin)
 
Mistä sen voit tietää? Jos vaikka tutustuisit siihen materiaaliin mitä itse linkkaat ja lainaat noin ihan aluksi, niin pääsee jo pitkälle.
Ihan vaikka tuo lause johon puutuin:
"INT8 Tensor Core operations with sparsity deliver unprecedented processing power for DL inference, running 20x faster than V100 INT8 operations."
Ei pitäisi olla ylivoimainen tehtävä huomata, että tuossa puhutaan "INT8 Tensor Core operations (with sparsity)" ja "INT8 operations", eli kaksi eri asiaa. Tämän kun yhdistää siihen, että siinä taulukossa, minkä muistaakseni juuri sinä postasit, on tyhjää pitkät rivit Voltalle, mukaanlukien tuo INT8 Tensor Core.
Kyllä joka viittaa että UpTo 20x on mahdollista varmaankin tämän takia.

On RTX kortitkin säteenjäljityksessä merkittävästi nopeampia kuin GTX kortit..
Joten taas voidaan pistää UpTo ja iso lukema.
 
Kyllä joka viittaa että UpTo 20x on mahdollista varmaankin tämän takia.
:facepalm:
Samaa logiikkaa käyttäen saataisiin vaikka ääretönkertainen parannus sirujen välille kun otetaan koodinpätkä mitä toinen ei kykene suorittamaan millään tavalla.

ps. Korjasin kesken jääneen lauseen kokonaiseksi
 
:facepalm:
Samaa logiikkaa käyttäen saataisiin vaikka ääretönkertainen parannus sirujen välille kun otetaan koodinpätkä mitä toinen ei kykene suorittamaan millään tavalla.

ps. Korjasin kesken jääneen lauseen kokonaiseksi
Voit mennä Nvidialle näyttämään tätä :facepalm:
He ovat nämä 20x lukemansa julkaisseet.

Kuten tomppa kirjoittaa

"The Nvidia A100 isn't just a huge GPU, it's the fastest GPU Nvidia has ever created, and then some. The third generation Tensor cores in A100 provide a new hybrid FP32 format called TF32 (Tensor Float 32, which is basically like Google's bfloat16 format, with three extra bits of significant digits) that aims to provide a balanced option with the precision of FP16 and exponent sizes of FP32. For workloads that use TF32, the A100 can provide 312 TFLOPS of compute power in a single chip. That's up to 20X faster than the V100's 15.7 TFLOPS of FP32 performance, but that's not an entirely fair comparison since TF32 isn't quite the same as FP32."

Eli jotenkin näin se 20x tulee, mun kimppuun turha lähteä hyökkäilemään jos asia jotenkin ketuttaa.
 
Viimeksi muokattu:
Voit mennä Nvidialle näyttämään tätä :facepalm:
He ovat nämä 20x lukemansa julkaisseet.
Kyllä, he ovat sen julkaisseet ja aiheuttaneet sillä facepalmeja. Se ei kuitenkaan muuta sitä, että sinä sen tänne pastesit ilman mitään kritiikkiä, vaikka hälytyskellojen olisi pitänyt soida heti kun luit mitä olit viestiisi liittämässä ja lähdit vielä väittämään vastaan, kun asiasta huomautettiin.
Ihan sama juttu tuossa toisessa lainaamassasi lauseessa, millä viestissäsi väitettyjä lukuja yritit puolustaa. Siinä sanotaan ihan suoraan, että verrataan eri asioita (TF32 ja FP32) keskenään.

Edit:
Olit näemmä lisännyt tompalta lainauksen missä puututaan ihan samaan asiaan mistä aiempia lainauksiasi kritisoitiin: verrataan eri asioita keskenään. Samalla periaatteella saadaan vaikka se ääretönkertainen ero kun pistetään tehtäväksi jotain, mitä toinen ei voi laskea lainkaan.
 
Viimeksi muokattu:
Kyllä, he ovat sen julkaisseet ja aiheuttaneet sillä facepalmeja. Se ei kuitenkaan muuta sitä, että sinä sen tänne pastesit ilman mitään kritiikkiä, vaikka hälytyskellojen olisi pitänyt soida heti kun luit mitä olit viestiisi liittämässä ja lähdit vielä väittämään vastaan, kun asiasta huomautettiin.
Ihan sama juttu tuossa toisessa lainaamassasi lauseessa, millä viestissäsi väitettyjä lukuja yritit puolustaa. Siinä sanotaan ihan suoraan, että verrataan eri asioita (TF32 ja FP32) keskenään.

Edit:
Olit näemmä lisännyt tompalta lainauksen missä puututaan ihan samaan asiaan mistä aiempia lainauksiasi kritisoitiin: verrataan eri asioita keskenään. Samalla periaatteella saadaan vaikka se ääretönkertainen ero kun pistetään tehtäväksi jotain, mitä toinen ei voi laskea lainkaan.
No voi kauheeta että postasin tänne.
Anteeksi mutta en tiennyt että siitä tälläinen nalkutus alkaa.
 
Törmäsin tälläseen renderöintiin ja kun spekulointiketju on kyseessä, niin laitetaan näytille. Ilmeisesti saman tyypin tekemä, kuin renderöinnit jäähystäkin.

edit. Ei ole mikään leakki tämä vaan ihan spekulaatio. Toisaalta jos PCB on noin lyhyt, niin jokin ratkaisua siellä täytyy olla, että se pystytään toteuttamaan.
 

Liitteet

  • 94A45E12-5CC6-4B1E-BC48-18F4EAF8E5BE.jpeg
    94A45E12-5CC6-4B1E-BC48-18F4EAF8E5BE.jpeg
    704,8 KB · Luettu: 110
Viimeksi muokattu:
Törmäsin tälläseen renderöintiin ja kun spekulointiketju on kyseessä, niin laitetaan näytille. Ilmeisesti saman tyypin tekemä, kuin renderöinnit jäähystäkin.

Oikeasti lienee melko varmaa, että 3080ssä (GA104?) ei tule olemaan HBM(2)-muisteja; Tulisi liian kalliiksi eikä tarvetta ole kun GDDR6 antaa nyt aika mukavasti kaistaa.
3080ti:ssä/uudessa titanissa (GA102?) sitten voisikin jo olla.


Mutta näillä näiden "intoa on hirveästi mutta ymmärrystä ei"-tyyppien "spekulaatioilla" tosiaan kohinan määrä vaan kasvaa ja signaali hukkuu helpommin.
 
Viimeksi muokattu:
Samassa kuvassa sekä paketissa HBM(2)-muistit että piirilevyllä olevia muisteja :D

Vai onko noi PCBllä olevat asiat olevinaan VRMiä eikä muistipiirejä?

Oikeasti lienee melko varmaa, että 3080ssä ei tule olemaan HBM(2)-muisteja.



Mutta näillä näiden "intoa on hirveästi mutta ymmärrystä ei"-tyyppien "spekulaatioilla" tosiaan kohinan määrä vaan kasvaa ja signaali hukkuu helpommin.
Eiköhän ne ole hieman huonosti visualisoituja MOSFETtejä kumminkin. Kai.
 
Oikeasti lienee melko varmaa, että 3080ssä (GA104?) ei tule olemaan HBM(2)-muisteja; Tulisi liian kalliiksi eikä tarvetta ole kun GDDR6 antaa nyt aika mukavasti kaistaa.
3080ti:ssä/uudessa titanissa (GA102?) sitten voisikin jo olla.


Mutta näillä näiden "intoa on hirveästi mutta ymmärrystä ei"-tyyppien "spekulaatioilla" tosiaan kohinan määrä vaan kasvaa ja signaali hukkuu helpommin.
Hassuahan se olisi, mutta ei tolle piirilevylle oikein mahdu niitä GDDR6 muistipiirejä. Jos vaikka 2080ti:n levyn ottaa malliksi, niin virransyöttö ei mahdu mukaan ollenkaan, vaan koko pinta-ala menisi prossulle, näyttöliittimille ja muistipiireille. Noiden jäähdytysrivaston kuvien perusteella siellä ei olisi tilaa millekkään lisäpiirilevylle. Voihan toki sekin olla mahdollista että ovat keksineet miten noi GDDR6 muistit voi signaloida merkittävästi lähemmäs prossua, tai miten prossu pyörisi suoraan 12 voltilla ;)
 
Se kyllä tiedetään jo, että NVIDIAlla on vähintään kaksi HBM-muisteja käyttävää Amperea, kysymys on vain onko kumpikaan yhdessäkään peli-GeForcessa
 
Mutta näillä näiden "intoa on hirveästi mutta ymmärrystä ei"-tyyppien "spekulaatioilla" tosiaan kohinan määrä vaan kasvaa ja signaali hukkuu helpommin.

Nuo piirrokset lähti siitä vuodetusta piirilevystä ja ihmettelystä miten sinne saisi muka kaikki kamat mahtumaan. No se on oma lukunsa, mutta osaatko heittää voisiko siinä osassa huhua olla mitään perää/järkeä/tai edes teknistä mahdollisuutta, että muistit olisi piirilevyn molemmin puolin? (3090:ssa piti muka olla noin)

Singaloinnin luulisi onnistuvan lisäkerroksilla pcb:lle, mutta koko ajatus tuntuu vähän järjettömälle. Väkisin yritettäisiin tehdä pieni pcb, jotta jäähyn päässä yksi propelli pääsee puhaltamaan läpi. Samalla pakataan paljon lämpöä puskevat muistit entistä tiheämpään, jäähdytystä pitäisi olla molemmin puolin korttia ja wanhat tutut suunnittelut menee uusiksi. Eikä kortin väärälle puolelle mahdu kauheasti tavaraa, ennenkuin on menty kortille varatusta tilasta yli.

Ainut järkevä syy minkä tuolle viritykselle keksisin olisi se, ettei AIB:it ei oikein voi hyödyntää refulautaa julkaisussa, kun sille pitäisi suunnitella jäähyt uudestaan. Jolloin Nvidia voi rahastaa kauemmin Founders Edition korteilla.
 
Se kyllä tiedetään jo, että NVIDIAlla on vähintään kaksi HBM-muisteja käyttävää Amperea, kysymys on vain onko kumpikaan yhdessäkään peli-GeForcessa
Ottaen huomioon, että tuo vuodettu jäähy oli nimenomaan 3080:n ei TI:n ja siinä hyvin todennäköisesti oli lyhyt pcb niin voi olla että 3080 ja 3080 Ti tulee HBM-muisteilla ja perustuu samaan piiriin. Toinen vaihtoehto on, että jäähyratkaisu on tuollainen sämpylämallinen, jotta muistit (tai virransyötön komponentit) on saatu toiselle puolelle piirilevyä ja niiltä menee lämpöputket tuohon läpipuhaltavalle jäähylle.

Toki on myös mahdollista, että vuodettua kuvat on vain feikkejä

edit. Sieltä tuli heseltä samoja ajatuksia juuri
 
Nuo piirrokset lähti siitä vuodetusta piirilevystä ja ihmettelystä miten sinne saisi muka kaikki kamat mahtumaan. No se on oma lukunsa, mutta osaatko heittää voisiko siinä osassa huhua olla mitään perää/järkeä/tai edes teknistä mahdollisuutta, että muistit olisi piirilevyn molemmin puolin? (3090:ssa piti muka olla noin)

IMHO voi olla perää.

Tosin se "3090" jos sellaisella nimellä tulee GA102, voi sitten jo ollakin HBM2lla, tuossa kuvassa luki 3080 jonka kanssa HBM2 on mielestäni epärealistinen.

Singaloinnin luulisi onnistuvan lisäkerroksilla pcb:lle, mutta koko ajatus tuntuu vähän järjettömälle. Väkisin yritettäisiin tehdä pieni pcb, jotta jäähyn päässä yksi propelli pääsee puhaltamaan läpi. Samalla pakataan paljon lämpöä puskevat muistit entistä tiheämpään, jäähdytystä pitäisi olla molemmin puolin korttia ja wanhat tutut suunnittelut menee uusiksi. Eikä kortin väärälle puolelle mahdu kauheasti tavaraa, ennenkuin on menty kortille varatusta tilasta yli.

Ainut järkevä syy minkä tuolle viritykselle keksisin olisi se, ettei AIB:it ei oikein voi hyödyntää refulautaa julkaisussa, kun sille pitäisi suunnitella jäähyt uudestaan. Jolloin Nvidia voi rahastaa kauemmin Founders Edition korteilla.

Itse muistipiirit on hyvin ohuita, millin luokkaa. Ainoa mikä sitä tilaa niissä käytännössä vie on se niiden jäähdytys.

Eikä ne muistit hirveän paljoa lämpöä tuota, ja kun ne on ympäri PCBtä paljon harvemmassa kuin itse graffapiiri, niin niiden kokonaislämpö tulee vielä selvästi suuremmalle alueelle kuin itse graffapiirin;; Väittäisin, että toisella puolella olevien muistipiirien jäähdyttämiseen riittäisi joko
1) ihan passiivinen jäähdytys hyvin matalilla siileillä kunhan siinä ei ole heti viereisessä slotissa parin millin päässä toista korttia
2) lämmön tuominen toiselle puolelle lämpöputkilla.

Mutta jäähdytys ei ole erikoisalaani, siitä tietää enemmän nuo enemmän käytännön kellotusta harrastavat tyypit.

Ja toisaalta, jos siellä kerran olisi se koko kortin läpi menevä puhallin, niin sitten siitä olisi varmaan hellpo ohjata osa ilmasta myös niiden muistipiirin ohi.
 
Viimeksi muokattu:
IMHO voi olla perää.

Tosin se "3090" jos sellaisella nimellä tulee GA102, voi sitten jo ollakin HBM2lla, tuossa kuvassa luku 3080 jonka kanssa HBM2 on mielestäni epärealistinen.



Itse muistipiirit on hyvin ohuita, millin luokkaa. Ainoa mikä sitä tilaa niissä käytännössä vie on se niiden jäähdytys.

Eikä ne muistit hirveän paljoa lämpöä tuota, ja kun ne on ympäri PCBtä paljon harvemmassa kuin itse graffapiiri, niin niiden kokonaislämpö tulee vielä selvästi suuremmalle alueelle kuin itse graffapiirin;; Väittäisin, että toisella puolella olevien muistipiirien jäähdyttämiseen riittäisi joko
1) ihan passiivinen jäähdytys hyvin matalilla siileillä kunhan siinä ei ole heti viereisessä slotissa parin millin päässä toista korttia
2) lämmön tuominen toiselle puolelle lämpöputkilla.

Mutta jäähdytys ei ole erikoisalaani, siitä tietää enemmän nuo enemmän käytännön kellotusta harrastavat tyypit.

Ja toisaalta, jos siellä kerran olisi se koko kortin läpi menevä puhallin, niin sitten siitä olisi varmaan hellpo ohjata osa ilmasta myös niiden muistipiirin ohi.
Muistipiireistä voidaan käsittääkseni johtaa lämpö pois ihan piirilevyä pitkin, riittävän paksut kuparitasot vaan. Tuolloin tosin backplatesta saattaa olla jopa haittaa, kun lämpö ei pääse piirilevyltä pois mihinkään.
 
Muistipiireistä voidaan käsittääkseni johtaa lämpö pois ihan piirilevyä pitkin, riittävän paksut kuparitasot vaan. Tuolloin tosin backplatesta saattaa olla jopa haittaa, kun lämpö ei pääse piirilevyltä pois mihinkään.

Isot jäähyt, kuten vaikka todella suorittu NH-D15 on vain jo fyysisesti todella lähellä ensimmäistä pci-e slotia. Yritin vähän googlailla, mutta ei tuo takapuolen pci-e standardin tarjoama tila ei osunut silmiiin. Siksi tuo kaksipuoleiset muistit tuntuu niin oudolle huhulle, kun tilaa tuskin on nykyistä backplatea enempää ja entistä kovemmille kelloille vedetyt gddr6:t ei nyt käy yhtään sen viileämpinä.

Kulutus on toisaalta sarjaa watteja, muistelisin jotain 2.5-4W per piiri tasoa. Kyllä sen pitäisi teoriassa passiivisena pienellä heatsinkillä jäähtyä, jos ei ole kiuaskomponentteja vieressä. Epäilyttää vain silti, kun nykyisillä korteilla nuo muistit on vain heatsinkin alla ja tuulettimet puhaltaa niihin ja lämmöt on silti speksin maksimin nurkilla. Esim 5700XT pulse menee pahimmillaan 98c asti ja Nvidialla ei muistaakseni ole lämpösensoreita muistipiireissä, joten on vain lämpökamerakuvia backplatesta.
 
Onhan noita kortteja ollut tiukkaan pakatuissa MXM-formaatissa jo iät ja ajat, joten ei tuosta koosta pysty suoraan päättelemään, että kortissa olisi HBM:t. Itse pidän tuota erittäin epätodennäköisenä, koska kompleksisuus ja siten hinta.

1591948621953.png
 
Onhan noita kortteja ollut tiukkaan pakatuissa MXM-formaatissa jo iät ja ajat, joten ei tuosta koosta pysty suoraan päättelemään, että kortissa olisi HBM:t. Itse pidän tuota erittäin epätodennäköisenä, koska kompleksisuus ja siten hinta.

1591948621953.png
Niin no, vähän luulen että tuollaisella 150 watilla ei hirvittävän korkealle nykypäivän kahinoissa kiivetä, tuohon ei juuri järeämpää virransyöttöä taideta saada enää mahtumaan
 
Onhan noita kortteja ollut tiukkaan pakatuissa MXM-formaatissa jo iät ja ajat, joten ei tuosta koosta pysty suoraan päättelemään, että kortissa olisi HBM:t. Itse pidän tuota erittäin epätodennäköisenä, koska kompleksisuus ja siten hinta.

1591948621953.png
Tuplaa virransyöttö ja lisää näyttöliittimet, niin ei enää mahdu annettuihin mittoihin. (n. 100x115mm)
 
Epäilyttää vain silti, kun nykyisillä korteilla nuo muistit on vain heatsinkin alla ja tuulettimet puhaltaa niihin ja lämmöt on silti speksin maksimin nurkilla. Esim 5700XT pulse menee pahimmillaan 98c asti ja Nvidialla ei muistaakseni ole lämpösensoreita muistipiireissä, joten on vain lämpökamerakuvia backplatesta.

Kun tuon korttivuodon ekan kerran näin niin tuli heti mieleen että nyt on tehty kunnon sämpylä ja muistit on kortin nurjalla puolella.
Voi toki olla että pelkkä backplate riittää muistien jäähdytykseen, normaalissa rakenteessa niitä muisteja saatetaan peräti lämmittää kun jäähdytys on samaa palaa. eli coren ja VRM:n lämpö voi itseasiassa nostaa muistien lämpöä.
 
Kun tuon korttivuodon ekan kerran näin niin tuli heti mieleen että nyt on tehty kunnon sämpylä ja muistit on kortin nurjalla puolella.
Voi toki olla että pelkkä backplate riittää muistien jäähdytykseen, normaalissa rakenteessa niitä muisteja saatetaan peräti lämmittää kun jäähdytys on samaa palaa. eli coren ja VRM:n lämpö voi itseasiassa nostaa muistien lämpöä.
Muistit tulevat lämpenemään ihan huolella jos siellä on suoraan toisella puolella virransyötön komponentit tai toinen muistipiiri. Etenkin jos huhut korkeammalla käyttöjännitteellä toimivista GDDR6 muisteista pitää paikkansa.

Oma veikkaus on HBM, sillä muuten kyseinen rakenne on täysin älyvapaa mm. jäähdytyksen osalta. Ei ne nvidialla niin tyhmiä ole, vai onko?
 
Kun tuon korttivuodon ekan kerran näin niin tuli heti mieleen että nyt on tehty kunnon sämpylä ja muistit on kortin nurjalla puolella.
Voi toki olla että pelkkä backplate riittää muistien jäähdytykseen, normaalissa rakenteessa niitä muisteja saatetaan peräti lämmittää kun jäähdytys on samaa palaa. eli coren ja VRM:n lämpö voi itseasiassa nostaa muistien lämpöä.
Onkohan se valmistusteknisesti kovin hankalaa, kun PGA piirejä on molemmalla puolella levyä?
 
Onkohan se valmistusteknisesti kovin hankalaa, kun PGA piirejä on molemmalla puolella levyä?
Hankalaa ehkä, mutta ei mahdotonta. Onhan noita näyttiksiä ollut vaikka ja miten missä on muistit molemmilla puolin, viimeksi vissiin Maxwell-sukupolvessa.
Sellaisia en muista, että olisi ollut vain takapuolella.
 
Muistit tulevat lämpenemään ihan huolella jos siellä on suoraan toisella puolella virransyötön komponentit tai toinen muistipiiri. Etenkin jos huhut korkeammalla käyttöjännitteellä toimivista GDDR6 muisteista pitää paikkansa.

Oma veikkaus on HBM, sillä muuten kyseinen rakenne on täysin älyvapaa mm. jäähdytyksen osalta. Ei ne nvidialla niin tyhmiä ole, vai onko?
Lukitaan tämä, mutta voiko 3080 olla HBM-muisteilla muuta ku sen tonnin kortti.
 
Nuo piirrokset lähti siitä vuodetusta piirilevystä ja ihmettelystä miten sinne saisi muka kaikki kamat mahtumaan. No se on oma lukunsa, mutta osaatko heittää voisiko siinä osassa huhua olla mitään perää/järkeä/tai edes teknistä mahdollisuutta, että muistit olisi piirilevyn molemmin puolin? (3090:ssa piti muka olla noin)
48GB Quadro RTX 8000:ssa on molemmilla puolin PCB:tä muistipiirejä eikä siinä ole edes backplatea. Takapuolelle tosin ei kannata piirejä sijoittaa ellei ole pakko mutta teknisesti täysin mahdollista.
NVIDIA-Quadro-RTX-8000-Back.jpg
 
Toisaalta tuo 3080:n oletettu pcb on paljon isompi kuin 100x115mm, eli kyllähän sinne tarvittaessa mahtuu vaikka mitä.
Kerro toki että minkä kokoinen se sitten on. Toi neliskanttinen alue on melko tarkkaan 100x115mm.
(Clarenzin viestissä kuva, josta tiedetään että ulkomitat on suht tarkasti selvillä)
 
Lukitaan tämä, mutta voiko 3080 olla HBM-muisteilla muuta ku sen tonnin kortti.

Voi jos se pohjautuu oletettuun GA102 piiriin ja jos oletetaan että Ti ja huhuttu 3090 on HBM2 muisteilla niin en silloin näkisi mitään syytä olla laittamatta HBM2 muisteja myös tuolle 3080:lle. Näin toimimalla se GA102 piiri ei tartte GDDR ohjainta.
 
Voi jos se pohjautuu oletettuun GA102 piiriin ja jos oletetaan että Ti ja huhuttu 3090 on HBM2 muisteilla niin en silloin näkisi mitään syytä olla laittamatta HBM2 muisteja myös tuolle 3080:lle. Näin toimimalla se GA102 piiri ei tartte GDDR ohjainta.
Se nyt on ihan selvä että jos 3080 ja 3080 Ti käyttää samaa piiriä ne käyttää myös samaa muistia, ei kukaan lähde tekemään turhaan mitään tuplamuistiohjaimia yhtään mihinkään
 
Yksi 2cent jay mutuilee hinnoista... no huh huh

3080- 999 dollaria
3080ti- 1400dollaria
3090--2000dollaria vai yli--lopetin katselun kesken...
 
Kerro toki että minkä kokoinen se sitten on. Toi neliskanttinen alue on melko tarkkaan 100x115mm.
(Clarenzin viestissä kuva, josta tiedetään että ulkomitat on suht tarkasti selvillä)

No mitä nyt äkkiseltään katsoin samasta kuvasta niin on se nyt ainakin 150mm pitkä kun käytin pci-e liittimen pituutta referenssinä.
 
3080:n coolerista voi päätellä, että verrattuna MXM-formaattiin on sivuttaissuunnassa vielä tilaa. Toki vasemmalla olevat näyttöliittimet vievät hieman tilaan. Mutta kun katsoo 2080 RTX:n PCB:tä, niin aika harvaan pakatulta vaikuttaa. Joten jos katsoo 2080 RTX MXM PCB:tä niin kyllä tuossa 3080:n väitettyssä PCB:ssä (coolerin mittoihin perustuen) on tilaa vielä liittimille + VRM:lle sivuttaissuunnassa. Veikkaan siis, että PCB on vain pakattu komponenttien suhteen tiuhempaan, mutta muistit ovat perinteiset GDDR:t.

1591986354664.png
 
3080:n coolerista voi päätellä, että verrattuna MXM-formaattiin on sivuttaissuunnassa vielä tilaa. Toki vasemmalla olevat näyttöliittimet vievät hieman tilaan. Mutta kun katsoo 2080 RTX:n PCB:tä, niin aika harvaan pakatulta vaikuttaa. Joten jos katsoo 2080 RTX MXM PCB:tä niin kyllä tuossa 3080:n väitettyssä PCB:ssä (coolerin mittoihin perustuen) on tilaa vielä liittimille + VRM:lle sivuttaissuunnassa. Veikkaan siis, että PCB on vain pakattu komponenttien suhteen tiuhempaan, mutta muistit ovat perinteiset GDDR:t.

1591986354664.png

Ei tuossa kyllä miun mielestä ole kovin paljoa löysää. Vasen yläkulma näyttää tyhjältä mutta siellä on nvlinkin vedot ihan samoin kuin tuolla pci-e slotin yllä oleva tyhjä tila niin siellä on slotin vedot.
Varmaan sinnekin rojua saa kerroksia lisäämällä mutta sitten alkaa taas piirilevylle tulla hintaa. Nää on aina jonkin suhteen kompromissejä.
 
Esim. 1660 TI:tä saa 256 bittisellä muistijohdotuksella hyvinkin lyhyellä PCB:llä.

1591987965288.png


3080:n tapauksessa tuohon pitää lisätä lisäliittimet ja VRM:t. 2080 FE:n VRM:t ovat kohtuu overkill, koska mahdollistavat ~480 ampeerin virran (vakiona tarvii vain ~200 A). Toki lisävaiheiden käyttö johtuu myös paljon hyötysuhteesta, joka mahdollistaa enemmän watteja GPU:lle ja muisteille. Mutta anyways pointti on, että ei pinta-alassa säästä niin paljoa, jos käyttää HBM:ää vs. GDDR:ää, että tuosta coolerista voisi suoraan päätellä, että käytössä on HBM:t. Pidän paljon todennäköisempänä, että NVIDIA lisää bittejä muistiväylään, jos kellotaajuuksia ei saada nostettua tarpeeksi.
 
Olenko nyt ymmärtänyt kuinka väärin tuon uuden 3080 jäähyn puhalluksen:
- Haluan seuraavaksi rakentaa Sandwhich-tyylisen itx-koneen. Jos tuo tuuttaa kortin "läpi" sen ilman, niin silloinhan tuollainen ratkaisu ei toimi mitenkään sandwhich-tyyppisessä itx-kotelossa, kun kortin kuumailma osuu suoraan emolevyn takapuolelle keskellä koteloa eikä pääse pois mitään järkevää reittiä?
 
Olenko nyt ymmärtänyt kuinka väärin tuon uuden 3080 jäähyn puhalluksen:
- Haluan seuraavaksi rakentaa Sandwhich-tyylisen itx-koneen. Jos tuo tuuttaa kortin "läpi" sen ilman, niin silloinhan tuollainen ratkaisu ei toimi mitenkään sandwhich-tyyppisessä itx-kotelossa, kun kortin kuumailma osuu suoraan emolevyn takapuolelle keskellä koteloa eikä pääse pois mitään järkevää reittiä?
näiden viimeisten kuvien perusteella se läpi puhaltava tuuletin puhaltaisi emolevyn ja näyttiksen välistä ilmaa kohti kotelon kylkeä, eli normikotelossa poikkeuksellisesti ylhäältä alaspäin, eikä toisinpäin niinkuin tähän asti jotakuinkin kaikki aiemmat ratkaisut.
 
Esim. 1660 TI:tä saa 256 bittisellä muistijohdotuksella hyvinkin lyhyellä PCB:llä.

1591987965288.png


3080:n tapauksessa tuohon pitää lisätä lisäliittimet ja VRM:t. 2080 FE:n VRM:t ovat kohtuu overkill, koska mahdollistavat ~480 ampeerin virran (vakiona tarvii vain ~200 A). Toki lisävaiheiden käyttö johtuu myös paljon hyötysuhteesta, joka mahdollistaa enemmän watteja GPU:lle ja muisteille. Mutta anyways pointti on, että ei pinta-alassa säästä niin paljoa, jos käyttää HBM:ää vs. GDDR:ää, että tuosta coolerista voisi suoraan päätellä, että käytössä on HBM:t. Pidän paljon todennäköisempänä, että NVIDIA lisää bittejä muistiväylään, jos kellotaajuuksia ei saada nostettua tarpeeksi.
1660 Ti:n vtehonkulutus on tosiaan "vähän" eri sarjaa kuin huippunäyttisten. Oli VRM:t "overkilliä" tällä hetkellä tai en, en usko että niitä ainakaan heikentämään lähdetään.
Ja kyllä sillä HBM:llä säästää tilaa, tuon sirun paketoinnin ei tarvitsisi olla juurikaan jos lainkaan isompi että siihen mahtuisi HBM-muistit mukaan interposerin kera ja olisi heti pari senttiä lisää tilaa pituussuunnassa VRM:lle, puhumattakaan ylä ja alapuolelle jäävästä tilasta
 
HBM muisteilla mahtuisi helposti. Tässä esim Vega Nano PCB:

[Image]
 
Njoo kyllä siihen mahtumaan saa. Huhuista huolimatta en usko että 3080:nen on muutakuin 180W tdp:n kortti yhdellä 8-pinnisellä. Enkä usko että tuolla piirilevyllä on paikkaa 8-pinniselle virtaliittimelle tai DVI littimelle sen puoleen. Nvlink vedot kyllä onnistuu lähemmäs gputakin(gv100, teslat).
 
Njoo kyllä siihen mahtumaan saa. Huhuista huolimatta en usko että 3080:nen on muutakuin 180W tdp:n kortti yhdellä 8-pinnisellä. Enkä usko että tuolla piirilevyllä on paikkaa 8-pinniselle virtaliittimelle tai DVI littimelle sen puoleen. Nvlink vedot kyllä onnistuu lähemmäs gputakin(gv100, teslat).
Virtaliittimet löytynevät sieltä kortin perästä tähän tapaan johdotettuina:
1592039375816.png
 

Tää ei viel ollukkaan täällä. Johan on taas spekulointia.
 

Tää ei viel ollukkaan täällä. Johan on taas spekulointia.
Paras kohta on se kun sitä takapuolen tuuletinta perustellaan tolla. Millä ihmeellä tuuletin, jonka ylälaita olisi samalla tasolla kuin ko. siru, jäähdyttäisi sitä sirua mikä on toisessa päässä korttia backplaten alla? :D
 

Statistiikka

Viestiketjuista
258 182
Viestejä
4 485 135
Jäsenet
74 179
Uusin jäsen
Flere-Imsaho

Hinta.fi

Back
Ylös Bottom