AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Sampsa · 16.08.2017

Griffin sanoi:
Pressille toimitetut NÄKÖIS GPUt eivät siis olekaan oikeita GPUita, vaan "näköiskappaleita" (Ainankin noiden pressi GPU)

Meidän Vega 64 on sama gpu kuin näköiskappale. Todellisuudessa grafiikkapiirit tulee kahdesta eri pakkaamosta ja näytönohjainvalmistajat eivät tiedä kumpia tulee jos niitä tilataan vaikka 1000 kpl ennen kuin saapuvat

Nerkoon · 16.08.2017

Sampsa sanoi:
Meidän Vega 64 on sama gpu kuin näköiskappale. Todellisuudessa grafiikkapiirit tulee kahdesta eri pakkaamosta ja näytönohjainvalmistajat eivät tiedä kumpia tulee jos niitä tilataan vaikka 1000 kpl ennen kuin saapuvat

Nimenomaan ja ilmeisesti molemmat firmat viimeistelevät piirit hiukan eri tavalla. Tuolla liikkui spekulaatiota, että "moulded" versio Vegasta olisi kestävämpi, joten siihen olisi turvallisempi vaihtaa oma jäähy.

Sampsa · 16.08.2017

Hinta-asiaa on selvitetty kulisseissa ja vähän huonolta näyttää sen suhteen että hinnat enää 499€ tasolle tulisi. Seurataan tilannetta ja uutisoidaan io-techissä

Griffin · 16.08.2017

Sampsa sanoi:
Meidän Vega 64 on sama gpu kuin näköiskappale. Todellisuudessa grafiikkapiirit tulee kahdesta eri pakkaamosta ja näytönohjainvalmistajat eivät tiedä kumpia tulee jos niitä tilataan vaikka 1000 kpl ennen kuin saapuvat

No, eipä kaksi lähes samaa korkeutta, jos asiasta on tiedotettu mikään iso ongelma ole. Joustavat siilin kiinikkeet on keksitty, eikä sen siilin tarvitse yhtenäinen mönttikään olla tai vaihtoehtoisesti tilataan vai kahdella eri koneistuksella siilit.

speks · 16.08.2017

Griffin sanoi:
No, eipä kaksi lähes samaa korkeutta, jos asiasta on tiedotettu mikään iso ongelma ole. Joustavat siilin kiinikkeet on keksitty, eikä sen siilin tarvitse yhtenäinen mönttikään olla tai vaihtoehtoisesti tilataan vai kahdella eri koneistuksella siilit.

Esim. Vesijäähyblockeissa?

puukko8 · 16.08.2017

Sampsa sanoi:
Hinta-asiaa on selvitetty kulisseissa ja vähän huonolta näyttää sen suhteen että hinnat enää 499€ tasolle tulisi. Seurataan tilannetta ja uutisoidaan io-techissä

Tämän perusteella taisi olla oikea ratkaisu tarttua tuohon mindfactoryn 509e hintaan julkaisun yhteydessä. :cigar2:

Sampsa · 16.08.2017

puukko8 sanoi:
Tämän perusteella taisi olla oikea ratkaisu tarttua tuohon mindfactoryn 509e hintaan julkaisun yhteydessä.

Kyllä, onneksi olkoon

jussidin · 16.08.2017

puukko8 sanoi:
Tämän perusteella taisi olla oikea ratkaisu tarttua tuohon mindfactoryn 509e hintaan julkaisun yhteydessä.

Jaa niitäkö irtos tuohon hintaan? Ite koitin vähän olla hereillä noiden suhteen mut halvin mitä omaan silmään osu oli joku 609€ casekingillä.

Griffin · 16.08.2017

speks sanoi:
Esim. Vesijäähyblockeissa?

Esim niissä ei ole mitään estettä joko pohjan koneistukselle tai erilaiselle kiinnitykselle.
Ei noissa se korkeusero kuitenkaan esim viittäkään milliä ole..

varakreivi de Valmont · 16.08.2017

Sampsa sanoi:
Hinta-asiaa on selvitetty kulisseissa ja vähän huonolta näyttää sen suhteen että hinnat enää 499€ tasolle tulisi. Seurataan tilannetta ja uutisoidaan io-techissä

MSRP oli toisin sanoen kaikella todennäköisyydellä markkinointitempaus tai toisella nimellä kusetus.

jussidin · 16.08.2017

Mindfactoryllakin "MindStar" tarjouksena nyt Vegaa 609€..
https://www.mindfactory.de/product_...lack-Aktiv-PCIe-3-0-x16--Retail-_1186799.html

Sampsa · 16.08.2017

varakreivi de Valmont sanoi:
MSRP oli toisin sanoen kaikella todennäköisyydellä markkinointitempaus tai toisella nimellä kusetus.

Juurikin näin, siksi en lähtenyt vielä tekemään Vega 64 -artikkeliin syvällisempää € / FPS -analyysiä..

Spartacus · 16.08.2017

jussidin sanoi:
Mindfactoryllakin "MindStar" tarjouksena nyt Vegaa 609€..
https://www.mindfactory.de/product_...lack-Aktiv-PCIe-3-0-x16--Retail-_1186799.html

On kyllä aika kiero tuo paikka. Klikkasin linkkiäsi ja ihmettelin kun hinta oli 649. Olin aiemmin päivällä käynyt siellä niin hinta oli silloin tuo ja oli vieläkin. Sammutin selaimen ja menin uudestaan niin nyt hinta oli tuo 609e.

puukko8 · 16.08.2017

jussidin sanoi:
Jaa niitäkö irtos tuohon hintaan? Ite koitin vähän olla hereillä noiden suhteen mut halvin mitä omaan silmään osu oli joku 609€ casekingillä.

Maanantaina tosiaan tuli tuolla hyvät tarjoukset -ketjussa vastaan tuo mindstar -tarjous. Silloin 509e joitakin kappaleita.

E.T · 16.08.2017

Griffin sanoi:
No, eipä kaksi lähes samaa korkeutta, jos asiasta on tiedotettu mikään iso ongelma ole. Joustavat siilin kiinikkeet on keksitty, eikä sen siilin tarvitse yhtenäinen mönttikään olla tai vaihtoehtoisesti tilataan vai kahdella eri koneistuksella siilit.

Riippuu ihan eron suuruudesta ja siitä minkä verran HBM pinot kaipaavat jäähdytystä.
Jos rako on suurempi niin sitten voi käydä kuin Intelin prossuissa "hammastahnalla" heatspreaderin ja piilastun välissä.

Sampsa sanoi:
Hinta-asiaa on selvitetty kulisseissa ja vähän huonolta näyttää sen suhteen että hinnat enää 499€ tasolle tulisi. Seurataan tilannetta ja uutisoidaan io-techissä

Olisikos tuosta selvinnyt mitään mikä on syynä että AMD:llä ei ole idlelukemat täysin modernilla tasolla korkeine GPU-kelloineen?
Yleensähän tietokone viettää suurimman osan päälläoloajastaan siinä tilassa.
Single-monitor idle power consumption seems surprisingly high, especially when considering that cards like the RX 580 managed to go below the 10 W mark, making them competitive with NVIDIA's designs which run single digit numbers in this test. One reason for this seems to be the relatively high idle GPU clock of 852 MHz, while memory goes down all the way to 167 MHz.
AMD Radeon RX Vega 64 8 GB Review

Tietenkin (muodikkaat) ei-referenssi Pascalitkin osaavat ottaa idlenä referenssiä enemmän.

vemkki · 16.08.2017

E.T sanoi:
Olisikos tuosta selvinnyt mitään mikä on syynä että AMD:llä ei ole idlelukemat täysin modernilla tasolla korkeine GPU-kelloineen?

Eikös tuo ole melko kohtuullinen, kun muistaa, että Vegassa on enemmän transistoreja kuin Geforce 1080 Ti:ssä?

speks · 16.08.2017

Vega sai lisää louhintatehoa AMD:n uusilla ajureilla.

AMD's New Mining Block Chain Optimized Driver Tested - Legit Reviews

Nerkoon · 16.08.2017

speks sanoi:
Vega sai lisää louhintatehoa AMD:n uusilla ajureilla.

AMD's New Mining Block Chain Optimized Driver Tested - Legit Reviews

Johan tuo on tänne postattu jo ainakin kahdesti

hkultala · 16.08.2017

speks sanoi:
Vega sai lisää louhintatehoa AMD:n uusilla ajureilla.

AMD's New Mining Block Chain Optimized Driver Tested - Legit Reviews

Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.

edit: väärässä olin tässä, sitä kaistaa tarvitaan vain parin gigan kokoiseen DAGiin joka mahtuu näyttiksen muistiin

Mechanical Man · 16.08.2017

hkultala sanoi:
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.

Eihän tuo sitä voi tarkoittaa kun nvidia vetää ihan samoilla pci-e väylillä omilla luvuillaan.

Agent_007 · 16.08.2017

hkultala sanoi:
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.

PCI Express -väylän nopeudella ei pitäisi olla merkitystä Ethereumin kohdalla, kun tuo mainausohjelmalta GPU:lle ja takaisin siirrettävä datamäärä on lähes olematonta. Eli kaikki laskenta tapahtuu näytönohjaimella, ja sieltä palautuu takaisinpäin vain ns. hyviä osumia.

JiiPee · 16.08.2017

hkultala sanoi:
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.

Jaa. Itse en ole kyllä lukenut että PCI-E väylän nopeudella olisi mitään merkitystä mainauksessa. PCI-E x1 väylällähän noi kaikki mainarit niitä kortteja ajelee jotta saavat mahollisimman monta kortti lautaan kiinni. Se mainaus data dumpataan kerran sinne kortin muistiin ja kortti jyystää sen valmiiksi jonka jälkeen sama toistetaan. Ei siinä mainauksessa ole jatkuvaa datavirtaa.

Torz · 16.08.2017

hkultala sanoi:
Se, että Vega 56 ja Vega 64 käytännössä yhtä nopeita, ja RX 580 on vain puolitoista kertaa hitaampi, vihjaisi siihen, että pcie-väylä on tuossa paha pullonkaula. Dataa ei saada siirrettyä CPUlta GPUlle niin nopeasti, kuin se ehtisi laskea.

Ei ole tuosta kyse, vaan näytönohjaimen muistiominaisuudet ovat se pullonkaula Ethereumissa. Sieltä muistista pitää saada nopeastit pienehkö(?) määrä tavaraa haettua, ja latenssi on tässä tärkeää, mutta myös väylän leveys. GTX 1080 ei pärjää Ethereum mainauksessa hitaan latenssin takia, 1080 Ti pärjää kohtuuhyvin leveän väylän ansiosta.

E.T · 16.08.2017

vemkki sanoi:
Eikös tuo ole melko kohtuullinen, kun muistaa, että Vegassa on enemmän transistoreja kuin Geforce 1080 Ti:ssä?

Aiemmin AMD:n yläpään kortteihin nähden on kohtuullinen, mutta ei tuon pitäisi mikään paras mahdollinen olla.
Idle-tilassahan suurin osa piiristä on toimeton ja nämä toimettomat osat pitäisi pystyä käytännössä sammuttamaan.
Ja transistorimäärässä ero GP102:en on vain puoli miljardia transistoria.

KognaK · 16.08.2017

Maksimissaan 1% luokkaa pcie väylän kuormitus ethereumin mainauksessa. Datakin(~2,2GB tällähetkellä) generoidaan suoraan näyttiksen muistiin niin sitä ei edes tarvitse ladata mistään.

Deussu · 16.08.2017

hkultala taisi puhua väylän nopeudesta, ei leveydestä.

hkultala · 16.08.2017

Torz sanoi:
Ei ole tuosta kyse, vaan näytönohjaimen muistiominaisuudet ovat se pullonkaula Ethereumissa. Sieltä muistista pitää saada nopeastit pienehkö(?) määrä tavaraa haettua, ja latenssi on tässä tärkeää, mutta myös väylän leveys. GTX 1080 ei pärjää Ethereum mainauksessa hitaan latenssin takia, 1080 Ti pärjää kohtuuhyvin leveän väylän ansiosta.

Näyttiksillä lasketaan aina tuhansia work itemeita rinnakkain(tai jos ei lasketa, sitten sitä workloadia ei ole mitään järkeä laskea näyttiksellä, ja kannattaa laskea se perinteisellä prossulla).

Ja sillä välin kun yhden wavefrontin work itemit odottelee dataa muistista, samoilla laskentayksilöillä lasketaan toisen wavefrontin work itemeitä.

(yksi GCN-ydin laskee yhtä aikaa neljää 64:n work itemin wavefronttia ja 36 wavefrontia(2304 work itemia) on odottamassa, kokonaisuudessaan siis Vega 56:lla voi olla suortuksessa/valmiina suoritukseen 35840 work itemia ja vega 64:lla 40960 work itemia, ja tämä on optimaalinen määrä syöttää niille jos halutaan täysi suorituskyky)

Vega 56ssä ytimiä ja siten yhtä aikaa laskettavia work itemeita on vähemmän kuin Vega 64ssa, jolloin throughput-nopeuden pitäisi jäädä pienemmäksi, kun samassa ajassa lasketaan vähemmän work itemeita.

Vai onko tilanne sitten se, että tuo ethereum ei rinnakkaistu kunnolla kymmenille tuhansille work itemeille vaan vain tuhansille, jolloin osa laskentayksiköistä jää osan ajasta hyödyntämättä?

Griffin · 16.08.2017

E.T sanoi:
Riippuu ihan eron suuruudesta ja siitä minkä verran HBM pinot kaipaavat jäähdytystä.
Jos rako on suurempi niin sitten voi käydä kuin Intelin prossuissa "hammastahnalla" heatspreaderin ja piilastun välissä.

Kuten totesin, ongelma ei ole, kuin ja ainoastaan koneistuskysymys.
Intelin Prossuissa se HS on lätkäisty ja liimattu siihen päälle. Sitä ei paineta kiinni esim jousikuormitteisesti. Kyseessä on täysin eriasia.

Griffin · 16.08.2017

Voi olla myöskin, että VEGA 64 throthlailee urakalla, joten suorituskyky hiipuu 56:n tasolle..

hkultala · 17.08.2017

Griffin sanoi:
Voi olla myöskin, että VEGA 64 throthlailee urakalla, joten suorituskyky hiipuu 56:n tasolle..

Ei voi selittää tätä, koska 56ssa on selvästi alhaisempi TDP kuin 64ssa, 56 alkaa throttlaamaan selvästi aiemmin.

KognaK · 17.08.2017

hkultala sanoi:
Vai onko tilanne sitten se, että tuo ethereum ei rinnakkaistu kunnolla kymmenille tuhansille work itemeille vaan vain tuhansille, jolloin osa laskentayksiköistä jää osan ajasta hyödyntämättä?

Voit tuolta vilkasta mitä mainausalgoritmi tekee.
Ethash · ethereum/wiki Wiki · GitHub

Oma maallikon käsitys on että algoritmistä on tahallisesti tehty muistiriippuvainen niin ettei ASIC:ien kehittely ole kannattavaa.

JiiPee · 17.08.2017

hkultala sanoi:
Ei voi selittää tätä, koska 56ssa on selvästi alhaisempi TDP kuin 64ssa, 56 alkaa throttlaamaan selvästi aiemmin.

Miksi alkaisi? 56 on leikattu kortti ja kellotkin on pienemmät, eli 56 voi hyvinkin toimia koko ajan sillä maksimi kellolla koska ei kuumene liikaa kun taas 64 kuumentaa ittensä siihe tilaan että alkaa rotlaamaan huolella jolloin suorituskyky kärsii kun jojottaa jatkuvasti.

JiiPee · 17.08.2017

KognaK sanoi:
Voit tuolta vilkasta mitä mainausalgoritmi tekee.
Ethash · ethereum/wiki Wiki · GitHub

Oma maallikon käsitys on että algoritmistä on tahallisesti tehty muistiriippuvainen niin ettei ASIC:ien kehittely ole kannattavaa.

Ja varsinkin muistilatenssi riippuvainen.

AMD Radeon Vega RX 64: Ethereum Mining

Griffin · 17.08.2017

hkultala sanoi:
Ei voi selittää tätä, koska 56ssa on selvästi alhaisempi TDP kuin 64ssa, 56 alkaa throttlaamaan selvästi aiemmin.

Eikös nuo "näytä" samalta.
Jos jäähy on sama, niin 56:sessa on silloin suhteessa 56/64=> 1/8 enempi jäädytystä (Jos osa piiristä on virraton, jottei tule staattista tehokuormaa..)

jabbadap · 17.08.2017

Njoo, 8k$ Tesla P100:sen hash ratet on 69MH/s, joten kyllä se hbm2:nen ihan mainaushommiinkin on pätevää muistia. Tosin tossahan isompi muistikaista kuin Vegoissa, kun siinä on neljä pinoa hbm2:sta.

JiiPee sanoi:
Ja varsinkin muistilatenssi riippuvainen.

AMD Radeon Vega RX 64: Ethereum Mining

Kuis alas ton saa coren osalta alivoltitettua ja alikellotettua ennen kuin sen sweet spotin löytää. Ei kait sitä ethreumia mainatessa kovin kelloja muulle tarvitsekko muisteille, core on parempi alikellottaa huippuunsa. Tai kuten nvidian korteilla tehdään alentamalla tdp niin pieneksi kuin mahdollista ilman vaikutuksta hash rateen.

KognaK · 17.08.2017

jabbadap sanoi:
Njoo, 8k$ Tesla P100:sen hash ratet on 69MH/s, joten kyllä se hbm2:nen ihan mainaushommiinkin on pätevää muistia. Tosin tossahan isompi muistikaista kuin Vegoissa, kun siinä on neljä pinoa hbm2:sta.

No tuossa onkin muistikaistaa ja leveyttä kahden vegan edestä niin pitääkin tulla kaksinkertaiset tulokset.

hkultala · 17.08.2017

jabbadap sanoi:
Njoo, 8k$ Tesla P100:sen hash ratet on 69MH/s, joten kyllä se hbm2:nen ihan mainaushommiinkin on pätevää muistia. Tosin tossahan isompi muistikaista kuin Vegoissa, kun siinä on neljä pinoa hbm2:sta.

Tuossa taitaa olla prossujen ja näyttispiirin välillä NVLink eikä pci express, eli kaistaa prossun ja näyttiksen välillä n. viisinkertaisesti verrattuna normaaleihin pc(ie)-näyttiksiin.

edit: tosin tällä ei olekaan mitään väliä, sitä kaistaa tarvitaan vain parin gigan kokoiseen DAGiin joka mahtuu näyttiksen muistiin

JiiPee · 17.08.2017

hkultala sanoi:
Tuossa taitaa olla prossujen ja näyttispiirin välillä NVLink eikä pci express, eli kaistaa prossun ja näyttiksen välillä n. viisinkertaisesti verrattuna normaaleihin pc(ie)-näyttiksiin.

Oli mikä linkki tahansa niin Etherium louhinta ei tarvi kaistaa GPU <-> CPU välillä. Tästä syystä esim. löytyy tämmöinen kummajainen
ASRock > H110 Pro BTC+

Kuten huomaat laudassa on 12 kpl PCI-E gen2 x1 jolloin tuohon lautaan saa kaikkiaan 13 korttia kiinni.

Täällä on nyt jo aika moneen kertaan koitettu sanoa että Etherium louhinta on hyvin riippuvainen näytönohjaimen muistilatensseista.
Esim. GTX1080 on huonompi tuohon touhuun kuin 1070 koska GDDR5X vs GDDR5, Ti ja XP taasw paikkaa tuota GDDR5X huonoutta leveämmämmillä muistiväylillään, kuten linkkaamastani tompan jutusta voit lukea jos viitsisit.

hkultala · 17.08.2017

JiiPee sanoi:
Täällä on nyt jo aika moneen kertaan koitettu sanoa että Etherium louhinta on hyvin riippuvainen näytönohjaimen muistilatensseista.

.. eli sitten joko

1) Softa on optimoitu perseelleen, näyttikselle annetaan liian vähän rinnakkaisia workgrouppeja laskettavaksi kerrallaan.

2) Tuo siis tekee niin järkyttävän määrän niitä muistiaccesseja että kaikkien latensseja ei saada peitettyä edes sillä että GCN:llä on neljäkymmentä wavefronttia(rautasäiettä) per ydin. Tosin tällöin pitäisi kyllä kaistankin tulla pullonkaulaksi ennen viivettä.

3) Softa käyttää liikaa paikallista(__local) muistia tai rekistereitä(paikallisia muuttujia) että workgrouppeja/wavfrontteja ei saada mahtumaan kullekin ytimelle tarpeeksi, ei olekaan sitä kolmatta(tai kymmenettä) wavefronttia joka laitetaan ajoon kun kaksi(tai yhdeksän) ekaa stallaa muistihakuun

Pitäisi varmaan imuroida tuo koodi, ja katsoa mitä se on syönyt. Ja kokeilla optimoida sitä vähän, jos jaksaisi.

JiiPee · 17.08.2017

hkultala sanoi:
Pitäisi varmaan imuroida tuo koodi, ja katsoa mitä se on syönyt. Ja kokeilla optimoida sitä vähän, jos jaksaisi.

Ei kannata koska tuo Etherium on tahallaan suunniteltu tuollaiseksi ettei ASIC härveleillä aleta louhimaan. Ilmeisesti tuolle suunniteltu ASIC tulisi liian kalliiksi.

hkultala · 17.08.2017

JiiPee sanoi:
Ei kannata koska tuo Etherium on tahallaan suunniteltu tuollaiseksi ettei ASIC härveleillä aleta louhimaan. Ilmeisesti tuolle suunniteltu ASIC tulisi liian kalliiksi.

"tuollaiseksi"?.

En ole missään ASICia väsäämässäkään.

Vaan vain ihmettelen, miksei tuo saa käytettyä koko GPUn kaistaa. Koska sen koko GPUn kaistan pitäisi kyllä aina olla käytettävissä jos softa rinnakkaistuu eikä sitä ole optimoitu päin persettä, eikä ethereumin algoritmin tätä pitäisi haitata.

Mutta näköjään tuon näissä testeissä käytetyn softan(claymors dual miner) lähdekoodia ei pikaisesti löytynyt. Lisää todennäköisyyttä, että se on optimoitu päin persettä, kun muut ei ole päässeet katsomaan, että siellä ei ole jotian tyhmää.

Avoimen lähdekoodin ethminer:in lähdekoodi sen sijaan näytti ainakin workgrouppien määrän suhteen järkevältä.

GitHub - ethereum-mining/ethminer: Ethereum miner with OpenCL, CUDA and stratum support

JiiPee · 17.08.2017

hkultala sanoi:
"tuollaiseksi"?.

Se algoritmi on suunniteltu tahallaan tuollaiseksi muistivammaiseksi ettei ASIC härveleillä aleta louhimaan.

EDIT: Tuosta vielä pureskeltavaa
Is Ethereum ASIC resistant?

hkultala · 17.08.2017

JiiPee sanoi:
Se algoritmi on suunniteltu tahallaan tuollaiseksi muistivammaiseksi ettei ASIC härveleillä aleta louhimaan.

Et sitten vieläkään ymmärtänyt.

Kun lasketaan useampaa blokkia tms. rinnakkain, ei kokonaissuorituskyvyn kannalta haittaa vaikka sen yhden blokin laskentaa hidastaa ne viiveet. Sen aikaa kun yhden blokin tms. laskenta odottelee muistista dataa, lasketaan toista.
Rajoittavan tekijän pitäisi olla muistiKAISTA, ei muistin viive.

(ellei sitten kortin muistimäärä rajoita sitä, montaako blokkia voidaan laskea rinnakkain, mutta tällöin 16 gigan kortin pitäisi päästä huomattavasti suurempaan nopeuteen kuin 8 gigan kortin, koska blokkimäärä voidaan tuplata)

ASIC-härveleillä louhinta on estetty sillä, että sitä muistia tarvitaan paljon, ja siihen tehdään paljon accesseja (tarvii paljon KAISTAA).

JiiPee · 17.08.2017

hkultala sanoi:
Et sitten vieläkään ymmärtänyt.

Kun lasketaan useampaa blokkia tms. rinnakkain, ei kokonaissuorituskyvyn kannalta haittaa vaikka sen yhden blokin laskentaa hidastaa ne latenssit. Sen aikaa kun yhden blokin tms. laskenta odottelee muistista dataa, lasketaan toista.

(ellei sitten kortin muistimäärä rajoita sitä, montaako blokkia voidaan laskea rinnakkain, mutta tällöin 16 gigan kortin pitäisi päästä huomattavasti suurempaan nopeuteen kuin 8 gigan kortin, koska blokkimäärä voidaan tuplata)

ASIC-härveleillä louhinta on estetty sillä, että sitä muistia tarvitaan paljon.

No sanotaanko suoraan että ei vois vähempi kiinnostaa. Olen ainoastaan koittanut selittää sinulle että se mainaus on muistiriippuvaista, mitä nopeampaa muistia pienillä latenseilla, sen parempi.
Sinä aloit vänkyttää että homma olisi PCIE väylästä riippuvainen, jota se ei ole. Sitten alat vänkyttää että se koodi on paskaa, jota se tuskin on koska se on todellakin SUUNNITELTU toimivaksi noin.
Alkaa suoraansanottuna vituttaa tämmöinen offtopic vatulointi kun ihan sama mitä sinulle esittää niin aina koitat vänkyttää sen asian päälaelleen.

Päätän tämän tähän:

Another interesting thing that doesn't seem pointed out in the white paper is that the memory has to be FAST. Excessively fast. So standard DRAM isn't really up to the challenge, which is why the RAM on GPUs take the brunt of the work in most mining today.

hkultala · 17.08.2017

JiiPee sanoi:
No sanotaanko suoraan että ei vois vähempi kiinnostaa. Olen ainoastaan koittanut selittää sinulle että se mainaus on muistiriippuvaista, mitä nopeampaa muistia pienillä latenseilla, sen parempi.
Sinä aloit vänkyttää että homma olisi PCIE väylästä riippuvainen, jota se ei ole.

EPÄILIN sitä, en "vänkyttänyt". Ja opin jo muutama viesti sitten, että se ei ole kyse kaistasta CPUlle.

Sitten alat vänkyttää että se koodi on paskaa, jota se tuskin on koska se on todellakin SUUNNITELTU toimivaksi noin.

Se on suunniteltu siten että sitä voi laskea rinnakkain miljoonilla tietokoneilla ympäri maailmaa, se on makrotasolla täysin "ebrasassingly parallel"-ongelma, mutta se myös tarvii paljon muisiKAISTAA ja paljon MUISTIKAPASITEETTIA.

Nämä ovat eri asioita kuin muistin VIIVE.

Tällainen embrassingly parallel-algoritmi pitäisi rinnakkaistua myös yhden tietokoneen sisällä sillai että latenssin viiveen merkitys katoaa, kun vaan rinnakkaistetaan ongelmaa enemmän. Raja voi tällöin tulla vastaan vain muistin koossa, että useampaa instanssia ongelmasta ei mahdu yhtä aikaa muistiin.

Ja se, että täysin embrassingly parallel ohgelma ei rinnakkaistu eikä hyödy suuresta muistimäärästä kyllä selvästi vihjaisi siihen suuntaan, että sitä ei ole rinnakkaistettu kunnolla.

Alkaa suoraansanottuna vituttaa tämmöinen offtopic vatulointi kun ihan sama mitä sinulle esittää niin aina koitat vänkyttää sen asian päälaelleen.

Ei, vaan yritän selvittää mistä tässä OIKEASTI on kyse. Minun pcie-kaistateoriani osoittautui vääräksi, myönnän sen. Nyt vallalla on "viiveteoria" joka ei sellaisenaan "algoritmin ominaisuutena" ole uskottava teoria vaan käytännössä vaatii toimiakseen sen, että softa on optimoitu huonosti, tai jonkun muun vielä mainitsemattoman seikan.

hmm, nyt kun mietin tätä asiaa eteenpäin:

Ongelma liittynee siihen, että se tekee täysin satunnaisia muistiaccesseja, joiden kanssa välimuistista ei hyödytä yhtään, ja välimuistilohkoista on pelkkää haittaa; Kun halutaan lukea muistista vain pieni luku, pitää silti hakea koko välimuistilinja. Ja vaikka sieltä yritettäisin hakea vähemmän, uusilla muistityypeillä muistista pitää kuitenkin hakea paljon kerrallaan jotta siltä saataisiin hyvä kaistanleveys ulos. Eli rajoittavana tekijänä on käytännössä se, kuinka monta muistiaccessia voidaan tehdä aikayksikköä kohden.

Tämä voisi selittää sen miksi GDDR5lla varustettu 1070 voittaa GDDR5X:llä varustetun 1080n, mutta tämä ei vielä selitä sitä miksi fury 56 pärjää fury 64lle;
korkeammilla muistikelloilla varustetun fury 56n pitäisi kuitenkin pystyä suurempaan määrään muistiaccesseja kuin fury 64 aikayksikköä kohden.

speks · 17.08.2017

Alphacool Intros Eiswolf GPX-Pro ATI RX Vega and the NexXxoS GPX for RX Vega

Vega sai hyvän jäähyratkaisun!

okrasit · 17.08.2017

hkultala sanoi:
hmm, nyt kun mietin tätä asiaa eteenpäin:

Ongelma liittynee siihen, että se tekee täysin satunnaisia muistiaccesseja, joiden kanssa välimuistista ei hyödytä yhtään, ja välimuistilohkoista on pelkkää haittaa; Kun halutaan lukea muistista vain pieni luku, pitää silti hakea koko välimuistilinja. Ja vaikka sieltä yritettäisin hakea vähemmän, uusilla muistityypeillä muistista pitää kuitenkin hakea paljon kerrallaan jotta siltä saataisiin hyvä kaistanleveys ulos. Eli rajoittavana tekijänä on käytännössä se, kuinka monta muistiaccessia voidaan tehdä aikayksikköä kohden.

Tämä voisi selittää sen miksi GDDR5lla varustettu 1070 voittaa GDDR5X:llä varustetun 1080n, mutta tämä ei vielä selitä sitä miksi fury 56 pärjää fury 64lle;
korkeammilla muistikelloilla varustetun fury 56n pitäisi kuitenkin pystyä suurempaan määrään muistiaccesseja kuin fury 64 aikayksikköä kohden.

Melko tuuheaa mietintää! Tapauksessa kuitenkin accessit on erittäin mukavasti cache-line aligned ja vieläpä 2 kokonaista sellaista! Välimuistikin auttaa, ei tarvitse tuhrata niin paljoa regs noihin loads, ts minimit! Viiveteoria on siltä osin totta, että piirin regs ei riitä kuin 8 wavefrontin ajamiseen kerralla, ja tämäkin "pienellä" reg spill, eli niitä dataa odottavia säikeitä on rajallinen määrä. "pienin" mem access hbm muistilla on 1024bit/8ch * 2n prefetch = 32byte ja MAD käyttää noita 8ch lomitettuna, 256byte ja hbm2+pseudo channel ena. 16byte, 8-way lomituksella 128byte (jippii juuri se mikä tässä skenaariossa on toivottu!), mikä voisi olla nopeampi!! Ehkä pseudot ei ole käytössä vielä ja MAD räjäyttää pankin ajuripäivityksellä?!?!?!

halcyon · 17.08.2017

Ohessa GamersNexus sähkönkulutusvertailu Vega 56 (vakio) vs GTX 1070 (vakio?). Eli sähkön kulutus 4t päivittäisessä (max kuormalla) 7-päivää viikossa:

Itse videossa on myös muita käyttöaikavertailuja.

Itse katsoin nopeasti, että Helsingin alueella järkevän 2v sopparin + sähkönsiirron saa karkeasti n. ~ 10-11c/kWh. [kiitos Spedelle, Urpola77:lla ja muille korjauksesta]

aleksejjj · 17.08.2017

halcyon sanoi:
Ohessa GamersNexus sähkönkulutusvertailu Vega 56 (vakio) vs GTX 1070 (vakio?).

Jossain Australiassa tms. tuo vertailu tosiaan olisi ihan validi, kun sähkö on siellä niin kallista (puhumattakaan oikeasti hirveän kuumista kesistä). Suomessa taitaa olla EU:n keskiarvoa halvempaa sähköä? Halvemmallakin hinnalla Vega 64 vs GTX 1080 voisi jo kolmessa vuodessa tehdä selvää eroa. Olisi kiva nähdä GN:n testaavan näitä kahta stockina ja kellotettuna

Urpola77 · 17.08.2017

halcyon sanoi:
Ohessa GamersNexus sähkönkulutusvertailu Vega 56 (vakio) vs GTX 1070 (vakio?). Eli sähkön kulutus 4t päivittäisessä (max kuormalla) 7-päivää viikossa:

Itse videossa on myös muita käyttöaikavertailuja.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Itse katsoin nopeasti, että Helsingin alueella järkevän 2v sopparin + sähkönsiirron saa karkeasti n. ~ 8c/kWh.

Kyllä itselle merkkaa jo kulutus, kun tuosiirto on tänä vuonna 7,5 centtiä ja ensi vuonna +25% seuraavana taas +25% etc.
Viimesin sähkölasku kuukaudelta 18€ ja siirto maksoi 31€ :shifty:

AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Sysop

Se ainoa oikea

Sysop

Sysop

cunning linguist

Sysop

Se ainoa oikea

Uutiset

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi