AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Sampsa

Sysop
Ylläpidon jäsen
Team Tesla
Liittynyt
13.10.2016
Viestejä
12 529
Pressille toimitetut NÄKÖIS GPUt eivät siis olekaan oikeita GPUita, vaan "näköiskappaleita" (Ainankin noiden pressi GPU)
Meidän Vega 64 on sama gpu kuin näköiskappale. Todellisuudessa grafiikkapiirit tulee kahdesta eri pakkaamosta ja näytönohjainvalmistajat eivät tiedä kumpia tulee jos niitä tilataan vaikka 1000 kpl ennen kuin saapuvat
 

Nerkoon

Se ainoa oikea
Platinum-jäsen
Liittynyt
18.10.2016
Viestejä
5 625
Meidän Vega 64 on sama gpu kuin näköiskappale. Todellisuudessa grafiikkapiirit tulee kahdesta eri pakkaamosta ja näytönohjainvalmistajat eivät tiedä kumpia tulee jos niitä tilataan vaikka 1000 kpl ennen kuin saapuvat
Nimenomaan ja ilmeisesti molemmat firmat viimeistelevät piirit hiukan eri tavalla. Tuolla liikkui spekulaatiota, että "moulded" versio Vegasta olisi kestävämpi, joten siihen olisi turvallisempi vaihtaa oma jäähy.
 
Liittynyt
16.10.2016
Viestejä
12 044
Meidän Vega 64 on sama gpu kuin näköiskappale. Todellisuudessa grafiikkapiirit tulee kahdesta eri pakkaamosta ja näytönohjainvalmistajat eivät tiedä kumpia tulee jos niitä tilataan vaikka 1000 kpl ennen kuin saapuvat
No, eipä kaksi lähes samaa korkeutta, jos asiasta on tiedotettu mikään iso ongelma ole. Joustavat siilin kiinikkeet on keksitty, eikä sen siilin tarvitse yhtenäinen mönttikään olla tai vaihtoehtoisesti tilataan vai kahdella eri koneistuksella siilit.
 
Liittynyt
31.10.2016
Viestejä
454
No, eipä kaksi lähes samaa korkeutta, jos asiasta on tiedotettu mikään iso ongelma ole. Joustavat siilin kiinikkeet on keksitty, eikä sen siilin tarvitse yhtenäinen mönttikään olla tai vaihtoehtoisesti tilataan vai kahdella eri koneistuksella siilit.
Esim. Vesijäähyblockeissa?
 
Liittynyt
03.12.2016
Viestejä
613
Tämän perusteella taisi olla oikea ratkaisu tarttua tuohon mindfactoryn 509e hintaan julkaisun yhteydessä. :cigar2:
Jaa niitäkö irtos tuohon hintaan? Ite koitin vähän olla hereillä noiden suhteen mut halvin mitä omaan silmään osu oli joku 609€ casekingillä.
 

varakreivi de Valmont

cunning linguist
Liittynyt
16.10.2016
Viestejä
1 301
Hinta-asiaa on selvitetty kulisseissa ja vähän huonolta näyttää sen suhteen että hinnat enää 499€ tasolle tulisi. Seurataan tilannetta ja uutisoidaan io-techissä
MSRP oli toisin sanoen kaikella todennäköisyydellä markkinointitempaus tai toisella nimellä kusetus.
 
Liittynyt
05.11.2016
Viestejä
23
Jaa niitäkö irtos tuohon hintaan? Ite koitin vähän olla hereillä noiden suhteen mut halvin mitä omaan silmään osu oli joku 609€ casekingillä.
Maanantaina tosiaan tuli tuolla hyvät tarjoukset -ketjussa vastaan tuo mindstar -tarjous. Silloin 509e joitakin kappaleita. ;)
 

E.T

Liittynyt
27.02.2017
Viestejä
6 254
No, eipä kaksi lähes samaa korkeutta, jos asiasta on tiedotettu mikään iso ongelma ole. Joustavat siilin kiinikkeet on keksitty, eikä sen siilin tarvitse yhtenäinen mönttikään olla tai vaihtoehtoisesti tilataan vai kahdella eri koneistuksella siilit.
Riippuu ihan eron suuruudesta ja siitä minkä verran HBM pinot kaipaavat jäähdytystä.
Jos rako on suurempi niin sitten voi käydä kuin Intelin prossuissa "hammastahnalla" heatspreaderin ja piilastun välissä.


Hinta-asiaa on selvitetty kulisseissa ja vähän huonolta näyttää sen suhteen että hinnat enää 499€ tasolle tulisi. Seurataan tilannetta ja uutisoidaan io-techissä
Olisikos tuosta selvinnyt mitään mikä on syynä että AMD:llä ei ole idlelukemat täysin modernilla tasolla korkeine GPU-kelloineen?
Yleensähän tietokone viettää suurimman osan päälläoloajastaan siinä tilassa.
Single-monitor idle power consumption seems surprisingly high, especially when considering that cards like the RX 580 managed to go below the 10 W mark, making them competitive with NVIDIA's designs which run single digit numbers in this test. One reason for this seems to be the relatively high idle GPU clock of 852 MHz, while memory goes down all the way to 167 MHz.
AMD Radeon RX Vega 64 8 GB Review

Tietenkin (muodikkaat) ei-referenssi Pascalitkin osaavat ottaa idlenä referenssiä enemmän.
 
Liittynyt
05.02.2017
Viestejä
5 124
Olisikos tuosta selvinnyt mitään mikä on syynä että AMD:llä ei ole idlelukemat täysin modernilla tasolla korkeine GPU-kelloineen?
Eikös tuo ole melko kohtuullinen, kun muistaa, että Vegassa on enemmän transistoreja kuin Geforce 1080 Ti:ssä?
 
Liittynyt
22.10.2016
Viestejä
11 030
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.



edit: väärässä olin tässä, sitä kaistaa tarvitaan vain parin gigan kokoiseen DAGiin joka mahtuu näyttiksen muistiin
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
1 935
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.
Eihän tuo sitä voi tarkoittaa kun nvidia vetää ihan samoilla pci-e väylillä omilla luvuillaan.
 
Liittynyt
09.11.2016
Viestejä
1 330
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.
PCI Express -väylän nopeudella ei pitäisi olla merkitystä Ethereumin kohdalla, kun tuo mainausohjelmalta GPU:lle ja takaisin siirrettävä datamäärä on lähes olematonta. Eli kaikki laskenta tapahtuu näytönohjaimella, ja sieltä palautuu takaisinpäin vain ns. hyviä osumia.
 
Liittynyt
21.06.2017
Viestejä
6 984
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.
Jaa. Itse en ole kyllä lukenut että PCI-E väylän nopeudella olisi mitään merkitystä mainauksessa. PCI-E x1 väylällähän noi kaikki mainarit niitä kortteja ajelee jotta saavat mahollisimman monta kortti lautaan kiinni. Se mainaus data dumpataan kerran sinne kortin muistiin ja kortti jyystää sen valmiiksi jonka jälkeen sama toistetaan. Ei siinä mainauksessa ole jatkuvaa datavirtaa.
 

Torz

Premium-jäsen
Liittynyt
17.02.2017
Viestejä
331
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.
Ei ole tuosta kyse, vaan näytönohjaimen muistiominaisuudet ovat se pullonkaula Ethereumissa. Sieltä muistista pitää saada nopeastit pienehkö(?) määrä tavaraa haettua, ja latenssi on tässä tärkeää, mutta myös väylän leveys. GTX 1080 ei pärjää Ethereum mainauksessa hitaan latenssin takia, 1080 Ti pärjää kohtuuhyvin leveän väylän ansiosta.
 

E.T

Liittynyt
27.02.2017
Viestejä
6 254
Eikös tuo ole melko kohtuullinen, kun muistaa, että Vegassa on enemmän transistoreja kuin Geforce 1080 Ti:ssä?
Aiemmin AMD:n yläpään kortteihin nähden on kohtuullinen, mutta ei tuon pitäisi mikään paras mahdollinen olla.
Idle-tilassahan suurin osa piiristä on toimeton ja nämä toimettomat osat pitäisi pystyä käytännössä sammuttamaan.
Ja transistorimäärässä ero GP102:en on vain puoli miljardia transistoria.
 
Liittynyt
21.10.2016
Viestejä
1 161
Maksimissaan 1% luokkaa pcie väylän kuormitus ethereumin mainauksessa. Datakin(~2,2GB tällähetkellä) generoidaan suoraan näyttiksen muistiin niin sitä ei edes tarvitse ladata mistään.
 
Liittynyt
22.10.2016
Viestejä
11 030
Ei ole tuosta kyse, vaan näytönohjaimen muistiominaisuudet ovat se pullonkaula Ethereumissa. Sieltä muistista pitää saada nopeastit pienehkö(?) määrä tavaraa haettua, ja latenssi on tässä tärkeää, mutta myös väylän leveys. GTX 1080 ei pärjää Ethereum mainauksessa hitaan latenssin takia, 1080 Ti pärjää kohtuuhyvin leveän väylän ansiosta.
Näyttiksillä lasketaan aina tuhansia work itemeita rinnakkain(tai jos ei lasketa, sitten sitä workloadia ei ole mitään järkeä laskea näyttiksellä, ja kannattaa laskea se perinteisellä prossulla).

Ja sillä välin kun yhden wavefrontin work itemit odottelee dataa muistista, samoilla laskentayksilöillä lasketaan toisen wavefrontin work itemeitä.

(yksi GCN-ydin laskee yhtä aikaa neljää 64:n work itemin wavefronttia ja 36 wavefrontia(2304 work itemia) on odottamassa, kokonaisuudessaan siis Vega 56:lla voi olla suortuksessa/valmiina suoritukseen 35840 work itemia ja vega 64:lla 40960 work itemia, ja tämä on optimaalinen määrä syöttää niille jos halutaan täysi suorituskyky)

Vega 56ssä ytimiä ja siten yhtä aikaa laskettavia work itemeita on vähemmän kuin Vega 64ssa, jolloin throughput-nopeuden pitäisi jäädä pienemmäksi, kun samassa ajassa lasketaan vähemmän work itemeita.

Vai onko tilanne sitten se, että tuo ethereum ei rinnakkaistu kunnolla kymmenille tuhansille work itemeille vaan vain tuhansille, jolloin osa laskentayksiköistä jää osan ajasta hyödyntämättä?
 
Liittynyt
16.10.2016
Viestejä
12 044
Riippuu ihan eron suuruudesta ja siitä minkä verran HBM pinot kaipaavat jäähdytystä.
Jos rako on suurempi niin sitten voi käydä kuin Intelin prossuissa "hammastahnalla" heatspreaderin ja piilastun välissä.
Kuten totesin, ongelma ei ole, kuin ja ainoastaan koneistuskysymys.
Intelin Prossuissa se HS on lätkäisty ja liimattu siihen päälle. Sitä ei paineta kiinni esim jousikuormitteisesti. Kyseessä on täysin eriasia.
 
Liittynyt
16.10.2016
Viestejä
12 044
Voi olla myöskin, että VEGA 64 throthlailee urakalla, joten suorituskyky hiipuu 56:n tasolle..
 
Liittynyt
21.10.2016
Viestejä
1 161
Vai onko tilanne sitten se, että tuo ethereum ei rinnakkaistu kunnolla kymmenille tuhansille work itemeille vaan vain tuhansille, jolloin osa laskentayksiköistä jää osan ajasta hyödyntämättä?
Voit tuolta vilkasta mitä mainausalgoritmi tekee.
Ethash · ethereum/wiki Wiki · GitHub

Oma maallikon käsitys on että algoritmistä on tahallisesti tehty muistiriippuvainen niin ettei ASIC:ien kehittely ole kannattavaa.
 
Liittynyt
21.06.2017
Viestejä
6 984
Ei voi selittää tätä, koska 56ssa on selvästi alhaisempi TDP kuin 64ssa, 56 alkaa throttlaamaan selvästi aiemmin.
Miksi alkaisi? 56 on leikattu kortti ja kellotkin on pienemmät, eli 56 voi hyvinkin toimia koko ajan sillä maksimi kellolla koska ei kuumene liikaa kun taas 64 kuumentaa ittensä siihe tilaan että alkaa rotlaamaan huolella jolloin suorituskyky kärsii kun jojottaa jatkuvasti.
 
Liittynyt
16.10.2016
Viestejä
12 044
Ei voi selittää tätä, koska 56ssa on selvästi alhaisempi TDP kuin 64ssa, 56 alkaa throttlaamaan selvästi aiemmin.
Eikös nuo "näytä" samalta.
Jos jäähy on sama, niin 56:sessa on silloin suhteessa 56/64=> 1/8 enempi jäädytystä (Jos osa piiristä on virraton, jottei tule staattista tehokuormaa..)
 
Liittynyt
04.11.2016
Viestejä
1 589
Njoo, 8k$ Tesla P100:sen hash ratet on 69MH/s, joten kyllä se hbm2:nen ihan mainaushommiinkin on pätevää muistia. Tosin tossahan isompi muistikaista kuin Vegoissa, kun siinä on neljä pinoa hbm2:sta.

Ja varsinkin muistilatenssi riippuvainen.

AMD Radeon Vega RX 64: Ethereum Mining
Kuis alas ton saa coren osalta alivoltitettua ja alikellotettua ennen kuin sen sweet spotin löytää. Ei kait sitä ethreumia mainatessa kovin kelloja muulle tarvitsekko muisteille, core on parempi alikellottaa huippuunsa. Tai kuten nvidian korteilla tehdään alentamalla tdp niin pieneksi kuin mahdollista ilman vaikutuksta hash rateen.
 
Viimeksi muokattu:
Liittynyt
22.10.2016
Viestejä
11 030
Njoo, 8k$ Tesla P100:sen hash ratet on 69MH/s, joten kyllä se hbm2:nen ihan mainaushommiinkin on pätevää muistia. Tosin tossahan isompi muistikaista kuin Vegoissa, kun siinä on neljä pinoa hbm2:sta.
Tuossa taitaa olla prossujen ja näyttispiirin välillä NVLink eikä pci express, eli kaistaa prossun ja näyttiksen välillä n. viisinkertaisesti verrattuna normaaleihin pc(ie)-näyttiksiin.

edit: tosin tällä ei olekaan mitään väliä, sitä kaistaa tarvitaan vain parin gigan kokoiseen DAGiin joka mahtuu näyttiksen muistiin
 
Viimeksi muokattu:
Liittynyt
21.06.2017
Viestejä
6 984
Tuossa taitaa olla prossujen ja näyttispiirin välillä NVLink eikä pci express, eli kaistaa prossun ja näyttiksen välillä n. viisinkertaisesti verrattuna normaaleihin pc(ie)-näyttiksiin.
Oli mikä linkki tahansa niin Etherium louhinta ei tarvi kaistaa GPU <-> CPU välillä. Tästä syystä esim. löytyy tämmöinen kummajainen
ASRock > H110 Pro BTC+

Kuten huomaat laudassa on 12 kpl PCI-E gen2 x1 jolloin tuohon lautaan saa kaikkiaan 13 korttia kiinni.

Täällä on nyt jo aika moneen kertaan koitettu sanoa että Etherium louhinta on hyvin riippuvainen näytönohjaimen muistilatensseista.
Esim. GTX1080 on huonompi tuohon touhuun kuin 1070 koska GDDR5X vs GDDR5, Ti ja XP taasw paikkaa tuota GDDR5X huonoutta leveämmämmillä muistiväylillään, kuten linkkaamastani tompan jutusta voit lukea jos viitsisit.
 
Liittynyt
22.10.2016
Viestejä
11 030
Täällä on nyt jo aika moneen kertaan koitettu sanoa että Etherium louhinta on hyvin riippuvainen näytönohjaimen muistilatensseista.
.. eli sitten joko

1) Softa on optimoitu perseelleen, näyttikselle annetaan liian vähän rinnakkaisia workgrouppeja laskettavaksi kerrallaan.

2) Tuo siis tekee niin järkyttävän määrän niitä muistiaccesseja että kaikkien latensseja ei saada peitettyä edes sillä että GCN:llä on neljäkymmentä wavefronttia(rautasäiettä) per ydin. Tosin tällöin pitäisi kyllä kaistankin tulla pullonkaulaksi ennen viivettä.

3) Softa käyttää liikaa paikallista(__local) muistia tai rekistereitä(paikallisia muuttujia) että workgrouppeja/wavfrontteja ei saada mahtumaan kullekin ytimelle tarpeeksi, ei olekaan sitä kolmatta(tai kymmenettä) wavefronttia joka laitetaan ajoon kun kaksi(tai yhdeksän) ekaa stallaa muistihakuun


Pitäisi varmaan imuroida tuo koodi, ja katsoa mitä se on syönyt. Ja kokeilla optimoida sitä vähän, jos jaksaisi.
 
Liittynyt
21.06.2017
Viestejä
6 984
Pitäisi varmaan imuroida tuo koodi, ja katsoa mitä se on syönyt. Ja kokeilla optimoida sitä vähän, jos jaksaisi.
Ei kannata koska tuo Etherium on tahallaan suunniteltu tuollaiseksi ettei ASIC härveleillä aleta louhimaan. Ilmeisesti tuolle suunniteltu ASIC tulisi liian kalliiksi.
 
Liittynyt
22.10.2016
Viestejä
11 030
Ei kannata koska tuo Etherium on tahallaan suunniteltu tuollaiseksi ettei ASIC härveleillä aleta louhimaan. Ilmeisesti tuolle suunniteltu ASIC tulisi liian kalliiksi.
"tuollaiseksi"?.

En ole missään ASICia väsäämässäkään.

Vaan vain ihmettelen, miksei tuo saa käytettyä koko GPUn kaistaa. Koska sen koko GPUn kaistan pitäisi kyllä aina olla käytettävissä jos softa rinnakkaistuu eikä sitä ole optimoitu päin persettä, eikä ethereumin algoritmin tätä pitäisi haitata.


Mutta näköjään tuon näissä testeissä käytetyn softan(claymors dual miner) lähdekoodia ei pikaisesti löytynyt. Lisää todennäköisyyttä, että se on optimoitu päin persettä, kun muut ei ole päässeet katsomaan, että siellä ei ole jotian tyhmää. ;)

Avoimen lähdekoodin ethminer:in lähdekoodi sen sijaan näytti ainakin workgrouppien määrän suhteen järkevältä.

GitHub - ethereum-mining/ethminer: Ethereum miner with OpenCL, CUDA and stratum support
 
Liittynyt
22.10.2016
Viestejä
11 030
Se algoritmi on suunniteltu tahallaan tuollaiseksi muistivammaiseksi ettei ASIC härveleillä aleta louhimaan.
Et sitten vieläkään ymmärtänyt.

Kun lasketaan useampaa blokkia tms. rinnakkain, ei kokonaissuorituskyvyn kannalta haittaa vaikka sen yhden blokin laskentaa hidastaa ne viiveet. Sen aikaa kun yhden blokin tms. laskenta odottelee muistista dataa, lasketaan toista.
Rajoittavan tekijän pitäisi olla muistiKAISTA, ei muistin viive.

(ellei sitten kortin muistimäärä rajoita sitä, montaako blokkia voidaan laskea rinnakkain, mutta tällöin 16 gigan kortin pitäisi päästä huomattavasti suurempaan nopeuteen kuin 8 gigan kortin, koska blokkimäärä voidaan tuplata)

ASIC-härveleillä louhinta on estetty sillä, että sitä muistia tarvitaan paljon, ja siihen tehdään paljon accesseja (tarvii paljon KAISTAA).
 
Viimeksi muokattu:
Liittynyt
21.06.2017
Viestejä
6 984
Et sitten vieläkään ymmärtänyt.

Kun lasketaan useampaa blokkia tms. rinnakkain, ei kokonaissuorituskyvyn kannalta haittaa vaikka sen yhden blokin laskentaa hidastaa ne latenssit. Sen aikaa kun yhden blokin tms. laskenta odottelee muistista dataa, lasketaan toista.

(ellei sitten kortin muistimäärä rajoita sitä, montaako blokkia voidaan laskea rinnakkain, mutta tällöin 16 gigan kortin pitäisi päästä huomattavasti suurempaan nopeuteen kuin 8 gigan kortin, koska blokkimäärä voidaan tuplata)

ASIC-härveleillä louhinta on estetty sillä, että sitä muistia tarvitaan paljon.
No sanotaanko suoraan että ei vois vähempi kiinnostaa. Olen ainoastaan koittanut selittää sinulle että se mainaus on muistiriippuvaista, mitä nopeampaa muistia pienillä latenseilla, sen parempi.
Sinä aloit vänkyttää että homma olisi PCIE väylästä riippuvainen, jota se ei ole. Sitten alat vänkyttää että se koodi on paskaa, jota se tuskin on koska se on todellakin SUUNNITELTU toimivaksi noin.
Alkaa suoraansanottuna vituttaa tämmöinen offtopic vatulointi kun ihan sama mitä sinulle esittää niin aina koitat vänkyttää sen asian päälaelleen.

Päätän tämän tähän:
Another interesting thing that doesn't seem pointed out in the white paper is that the memory has to be FAST. Excessively fast. So standard DRAM isn't really up to the challenge, which is why the RAM on GPUs take the brunt of the work in most mining today.
 
Liittynyt
22.10.2016
Viestejä
11 030
No sanotaanko suoraan että ei vois vähempi kiinnostaa. Olen ainoastaan koittanut selittää sinulle että se mainaus on muistiriippuvaista, mitä nopeampaa muistia pienillä latenseilla, sen parempi.
Sinä aloit vänkyttää että homma olisi PCIE väylästä riippuvainen, jota se ei ole.
EPÄILIN sitä, en "vänkyttänyt". Ja opin jo muutama viesti sitten, että se ei ole kyse kaistasta CPUlle.

Sitten alat vänkyttää että se koodi on paskaa, jota se tuskin on koska se on todellakin SUUNNITELTU toimivaksi noin.
Se on suunniteltu siten että sitä voi laskea rinnakkain miljoonilla tietokoneilla ympäri maailmaa, se on makrotasolla täysin "ebrasassingly parallel"-ongelma, mutta se myös tarvii paljon muisiKAISTAA ja paljon MUISTIKAPASITEETTIA.

Nämä ovat eri asioita kuin muistin VIIVE.

Tällainen embrassingly parallel-algoritmi pitäisi rinnakkaistua myös yhden tietokoneen sisällä sillai että latenssin viiveen merkitys katoaa, kun vaan rinnakkaistetaan ongelmaa enemmän. Raja voi tällöin tulla vastaan vain muistin koossa, että useampaa instanssia ongelmasta ei mahdu yhtä aikaa muistiin.

Ja se, että täysin embrassingly parallel ohgelma ei rinnakkaistu eikä hyödy suuresta muistimäärästä kyllä selvästi vihjaisi siihen suuntaan, että sitä ei ole rinnakkaistettu kunnolla.

Alkaa suoraansanottuna vituttaa tämmöinen offtopic vatulointi kun ihan sama mitä sinulle esittää niin aina koitat vänkyttää sen asian päälaelleen.
Ei, vaan yritän selvittää mistä tässä OIKEASTI on kyse. Minun pcie-kaistateoriani osoittautui vääräksi, myönnän sen. Nyt vallalla on "viiveteoria" joka ei sellaisenaan "algoritmin ominaisuutena" ole uskottava teoria vaan käytännössä vaatii toimiakseen sen, että softa on optimoitu huonosti, tai jonkun muun vielä mainitsemattoman seikan.



hmm, nyt kun mietin tätä asiaa eteenpäin:

Ongelma liittynee siihen, että se tekee täysin satunnaisia muistiaccesseja, joiden kanssa välimuistista ei hyödytä yhtään, ja välimuistilohkoista on pelkkää haittaa; Kun halutaan lukea muistista vain pieni luku, pitää silti hakea koko välimuistilinja. Ja vaikka sieltä yritettäisin hakea vähemmän, uusilla muistityypeillä muistista pitää kuitenkin hakea paljon kerrallaan jotta siltä saataisiin hyvä kaistanleveys ulos. Eli rajoittavana tekijänä on käytännössä se, kuinka monta muistiaccessia voidaan tehdä aikayksikköä kohden.

Tämä voisi selittää sen miksi GDDR5lla varustettu 1070 voittaa GDDR5X:llä varustetun 1080n, mutta tämä ei vielä selitä sitä miksi fury 56 pärjää fury 64lle;
korkeammilla muistikelloilla varustetun fury 56n pitäisi kuitenkin pystyä suurempaan määrään muistiaccesseja kuin fury 64 aikayksikköä kohden.
 
Viimeksi muokattu:
Liittynyt
21.12.2016
Viestejä
229
hmm, nyt kun mietin tätä asiaa eteenpäin:

Ongelma liittynee siihen, että se tekee täysin satunnaisia muistiaccesseja, joiden kanssa välimuistista ei hyödytä yhtään, ja välimuistilohkoista on pelkkää haittaa; Kun halutaan lukea muistista vain pieni luku, pitää silti hakea koko välimuistilinja. Ja vaikka sieltä yritettäisin hakea vähemmän, uusilla muistityypeillä muistista pitää kuitenkin hakea paljon kerrallaan jotta siltä saataisiin hyvä kaistanleveys ulos. Eli rajoittavana tekijänä on käytännössä se, kuinka monta muistiaccessia voidaan tehdä aikayksikköä kohden.

Tämä voisi selittää sen miksi GDDR5lla varustettu 1070 voittaa GDDR5X:llä varustetun 1080n, mutta tämä ei vielä selitä sitä miksi fury 56 pärjää fury 64lle;
korkeammilla muistikelloilla varustetun fury 56n pitäisi kuitenkin pystyä suurempaan määrään muistiaccesseja kuin fury 64 aikayksikköä kohden.
:sidea:

Melko tuuheaa mietintää! Tapauksessa kuitenkin accessit on erittäin mukavasti cache-line aligned ja vieläpä 2 kokonaista sellaista! Välimuistikin auttaa, ei tarvitse tuhrata niin paljoa regs noihin loads, ts minimit! Viiveteoria on siltä osin totta, että piirin regs ei riitä kuin 8 wavefrontin ajamiseen kerralla, ja tämäkin "pienellä" reg spill, eli niitä dataa odottavia säikeitä on rajallinen määrä. "pienin" mem access hbm muistilla on 1024bit/8ch * 2n prefetch = 32byte ja MAD käyttää noita 8ch lomitettuna, 256byte ja hbm2+pseudo channel ena. 16byte, 8-way lomituksella 128byte (jippii juuri se mikä tässä skenaariossa on toivottu!), mikä voisi olla nopeampi!! Ehkä pseudot ei ole käytössä vielä ja MAD räjäyttää pankin ajuripäivityksellä?!?!?!
 
Viimeksi muokattu:
Liittynyt
09.07.2017
Viestejä
1 403
Ohessa GamersNexus sähkönkulutusvertailu Vega 56 (vakio) vs GTX 1070 (vakio?). Eli sähkön kulutus 4t päivittäisessä (max kuormalla) 7-päivää viikossa:



Itse videossa on myös muita käyttöaikavertailuja.



Itse katsoin nopeasti, että Helsingin alueella järkevän 2v sopparin + sähkönsiirron saa karkeasti n. ~ 10-11c/kWh. [kiitos Spedelle, Urpola77:lla ja muille korjauksesta]
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
1 543
Ohessa GamersNexus sähkönkulutusvertailu Vega 56 (vakio) vs GTX 1070 (vakio?).
Jossain Australiassa tms. tuo vertailu tosiaan olisi ihan validi, kun sähkö on siellä niin kallista (puhumattakaan oikeasti hirveän kuumista kesistä). Suomessa taitaa olla EU:n keskiarvoa halvempaa sähköä? Halvemmallakin hinnalla Vega 64 vs GTX 1080 voisi jo kolmessa vuodessa tehdä selvää eroa. Olisi kiva nähdä GN:n testaavan näitä kahta stockina ja kellotettuna :)
 
Liittynyt
29.10.2016
Viestejä
509
Ohessa GamersNexus sähkönkulutusvertailu Vega 56 (vakio) vs GTX 1070 (vakio?). Eli sähkön kulutus 4t päivittäisessä (max kuormalla) 7-päivää viikossa:



Itse videossa on myös muita käyttöaikavertailuja.



Itse katsoin nopeasti, että Helsingin alueella järkevän 2v sopparin + sähkönsiirron saa karkeasti n. ~ 8c/kWh.
Kyllä itselle merkkaa jo kulutus, kun tuosiirto on tänä vuonna 7,5 centtiä ja ensi vuonna +25% seuraavana taas +25% etc.
Viimesin sähkölasku kuukaudelta 18€ ja siirto maksoi 31€ :shifty:
 
Toggle Sidebar

Statistiikka

Viestiketjut
237 365
Viestejä
4 158 508
Jäsenet
70 411
Uusin jäsen
allun90

Hinta.fi

Ylös Bottom