AMD Zen

Tuo on täysin merkityksetöntä. Epycin ytimissä on kinni VAIN samanverran muistia (/ydin), kuin Ryzenissä.
Sitä muistia kun ei lueta koko tuon kanavan leveydeltä. Lisäksi yksittäisen ytimen näkökulmasta 3/4 osaa muistista on "hidasta".

8-ytimisessä Ryzenissä on yhtä CCX:a kohden 2 muistikanavaa, jolloin yhtä ydintä kohden on "neljännes muistikanavaa".

8-ytimisessä Epycissä on myöskin yhtä CCX:a kohden 2 muistikanavaa mutta niitä CCX:a on 4 kappaletta jolloin ydintä kohden on "yksi muistikanava". Eli kyllä siinä Epycissä on se 4 kertaa enemmän muistikaistaa per ydin. Tältä pohjalta Epyc olisi aika monessakin muistikaistaan liittyvässä asiassa nopeampi mikäli Ryzen olsii muistikaistarajoitteinen. Ei ole eikä myöskään Intelin puolella 4 muistikanavaa auta juuri ollenkaan kahteen nähden.
 
Mulla on lähipiirissä mennyt monta Toyotaa lyhyen ajan sisällä huoltoon erinäisten vikojen takia. Tarkoittaako tämä sitä, että Toyotat ovat kaikki erittäin epäluotettavia?

Ei kannata yleistää omaa empiiristä kokemusta faktaksi.

Jatkoin autovertausta, mutta sitten totesin jälleenkerran: Tietokone ei ole auto, joten ei toimi.

Anyways.. Määrät merkitsevät, siitä ei pääse yli eikä ympäri, vaikka onkin ihan vain asiakkaiden ja lähipiirin koneet kyseessä. Tämä on ns nähty juttu, en tarvitse kaivaa netistä, todistaakseni sitä itselleni ja muille taas en viitsi nähdä selvässä asiassa vaivaa.
 
8-ytimisessä Ryzenissä on yhtä CCX:a kohden 2 muistikanavaa, jolloin yhtä ydintä kohden on "neljännes muistikanavaa".

8-ytimisessä Epycissä on myöskin yhtä CCX:a kohden 2 muistikanavaa mutta niitä CCX:a on 4 kappaletta jolloin ydintä kohden on "yksi muistikanava". Eli kyllä siinä Epycissä on se 4 kertaa enemmän muistikaistaa per ydin. Tältä pohjalta Epyc olisi aika monessakin muistikaistaan liittyvässä asiassa nopeampi mikäli Ryzen olsii muistikaistarajoitteinen. Ei ole eikä myöskään Intelin puolella 4 muistikanavaa auta juuri ollenkaan kahteen nähden.

Ongelma tulee siitä, jos se data ei olekaan siellä muistissa "rinnakkaisesti kaikki kanavat", vaan esim cache fill otetaan vain kahden kanavan kautta.

Nyt kun 3/4:stä kanavista on hitaita, niin ei kait tuo lue, kun kahdesta kanavasta kerrallaan, muuten se hitaus söisi helposti sen hyödyn.

EPYCi:n tapauksessa suuresta muistikanavamäärästä on lähinnä se hyöty, että siihen saa paljon muistikampoja kiinni ja piirejä tulee vähän /kanava.. (kun threadeja on vähän tai ohjelma / käyttis "ei käyttäydy sopivasti")

Koko kaista saadaan käyttöön, jos ja vain jos.

1. Ongelma säikeistyy, s.e. jokaiselle muistiohjaimelle tulee vähintään 1 threadi.
2. Käyttis / ohjelma hoitaa asian s.e. käsiteltävä data on aina ko ytimen "lähimuistissa"

Sizing Up Servers: Intel's Skylake-SP Xeon versus AMD's EPYC 7000 - The Server CPU Battle of the Decade?

Saman tyylisiä ongelmia näyttäisi olevan xeoninkin kanssa, tosin Intelillä % tuaaliset häviöt näyttäisivät olevan yleensä hieman pienemmät.

Yhdellä säikeellähän nuo ovat melkoisen "paskoja" molemmat, mitä muistikaistaan tulee..

Kuormasta riippuen jompikumpi voittaa, mutta kuten olen jauhanut: Molempien kannattaisi nyt panostaa tuohon muistisysteemiinsä, todenteolla.
 
Ongelma tulee siitä, jos se data ei olekaan siellä muistissa "rinnakkaisesti kaikki kanavat", vaan esim cache fill otetaan vain kahden kanavan kautta.

Nyt kun 3/4:stä kanavista on hitaita, niin ei kait tuo lue, kun kahdesta kanavasta kerrallaan, muuten se hitaus söisi helposti sen hyödyn.

EPYCi:n tapauksessa suuresta muistikanavamäärästä on lähinnä se hyöty, että siihen saa paljon muistikampoja kiinni ja piirejä tulee vähän /kanava.. (kun threadeja on vähän tai ohjelma / käyttis "ei käyttäydy sopivasti")

Koko kaista saadaan käyttöön, jos ja vain jos.

1. Ongelma säikeistyy, s.e. jokaiselle muistiohjaimelle tulee vähintään 1 threadi.
2. Käyttis / ohjelma hoitaa asian s.e. käsiteltävä data on aina ko ytimen "lähimuistissa"

Sizing Up Servers: Intel's Skylake-SP Xeon versus AMD's EPYC 7000 - The Server CPU Battle of the Decade?

Saman tyylisiä ongelmia näyttäisi olevan xeoninkin kanssa, tosin Intelillä % tuaaliset häviöt näyttäisivät olevan yleensä hieman pienemmät.

Yhdellä säikeellähän nuo ovat melkoisen "paskoja" molemmat, mitä muistikaistaan tulee..

Kuormasta riippuen jompikumpi voittaa, mutta kuten olen jauhanut: Molempien kannattaisi nyt panostaa tuohon muistisysteemiinsä, todenteolla.

Tuossa pitää huomioida myös Xeonin suurempi L3 välimuisti.

Tuostakaan ei tosin näy onko useammasta muistikanavasta oikeasti mitään hyötyä, vai päästäisiinkö kahdella kanavalla samoihin tuloksiin, pl. testit joissa vain muistikaista ratkaisee. Sen Epycin pitäisi olla selvästi Ryzeniä nopeampi best case scenariossa jos Ryzen olisi muistikaistarajoitteinen. Oikeastaan mikään ei tähän viittaa, kun verrokiksi otetaan Threadripper.

Onhan tästä muistikaistan merkityksestä jauhettu ihan RDRAM:n ajoista saakka mutta suoraan sanottuna ei tule yhtäkään esimerkkiä tosielämästä mieleen, jossa muistikaistan lisäyksestä olisi todellista hyötyä. Esimerkiksi seuraavissa tapauksissa hyöty oli lähellä nollaa vaikka muistin kaistanleveys kasvoi selvästi:

DDR -> DDR dual channel (AthlonXP ja Pentium 4)
DDR integroidulla muistiohjaimella -> DDR dual channel integroidulla muistiohjaimella (Athlon64)
DDR -> DDR2 (AMD ja Intel)
DDR2 -> DDR3 (AMD ja Intel)
DDR3 dual channel -> DDR3 triple channel (LGA1156 vs LGA1366)
DDR3 dual/triple channel -> DDR3 quad channel (LGA2011)
DDR4 dual channel -> DDR4 quad channel (LGA2011-3, Threadripper)
 
Tuossa pitää huomioida myös Xeonin suurempi L3 välimuisti.

Tuostakaan ei tosin näy onko useammasta muistikanavasta oikeasti mitään hyötyä, vai päästäisiinkö kahdella kanavalla samoihin tuloksiin, pl. testit joissa vain muistikaista ratkaisee. Sen Epycin pitäisi olla selvästi Ryzeniä nopeampi best case scenariossa jos Ryzen olisi muistikaistarajoitteinen. Oikeastaan mikään ei tähän viittaa, kun verrokiksi otetaan Threadripper.

Onhan tästä muistikaistan merkityksestä jauhettu ihan RDRAM:n ajoista saakka mutta suoraan sanottuna ei tule yhtäkään esimerkkiä tosielämästä mieleen, jossa muistikaistan lisäyksestä olisi todellista hyötyä. Esimerkiksi seuraavissa tapauksissa hyöty oli lähellä nollaa vaikka muistin kaistanleveys kasvoi selvästi:

DDR -> DDR dual channel (AthlonXP ja Pentium 4)
DDR integroidulla muistiohjaimella -> DDR dual channel integroidulla muistiohjaimella (Athlon64)
DDR -> DDR2 (AMD ja Intel)
DDR2 -> DDR3 (AMD ja Intel)
DDR3 dual channel -> DDR3 triple channel (LGA1156 vs LGA1366)
DDR3 dual/triple channel -> DDR3 quad channel (LGA2011)
DDR4 dual channel -> DDR4 quad channel (LGA2011-3, Threadripper)

Höpöhöpö:
Jo GTX1070 : lla ja vanhemmilla (nykymittapuulla) prossuilla ero näkyy selkeästi:
http://i.imgur.com/qHdgOLg.png

Tuohon jos oltaisiin isketty joku 1080Ti, niin ero olis näkynyt vielä paremmin..
Jos esim näyttis on pullonkaula, niin ei se esim 20% ero CPU:n suorituskyvyssä juurikaan näy..
 
Höpöhöpö:
Jo GTX1070 : lla ja vanhemmilla (nykymittapuulla) prossuilla ero näkyy selkeästi:
http://i.imgur.com/qHdgOLg.png

Tuohon jos oltaisiin isketty joku 1080Ti, niin ero olis näkynyt vielä paremmin..
Jos esim näyttis on pullonkaula, niin ei se esim 20% ero CPU:n suorituskyvyssä juurikaan näy..

En nähnyt tuolla vertailua DDR4 dual channel vs DDR4 triple/quad channel.

Se on tiedetty pitkään ettei single channel riitä mutta dual channelin jälkeen hyödyt ovat minimaaliset.
 
En nähnyt tuolla vertailua DDR4 dual channel vs DDR4 triple/quad channel.

Se on tiedetty pitkään ettei single channel riitä mutta dual channelin jälkeen hyödyt ovat minimaaliset.

Sehän riippuu ihan siitä, montako corea on hakemassa sitä tietoa sieltä muistista. Usempi core tarvitsee enemmän keskimääräistä datavirtaa. Esim 8C16T on ehdottomasti liikaa 2 kanavaiselle DDR4:lle.
 
Sehän riippuu ihan siitä, montako corea on hakemassa sitä tietoa sieltä muistista. Usempi core tarvitsee enemmän keskimääräistä datavirtaa. Esim 8C16T on ehdottomasti liikaa 2 kanavaiselle DDR4:lle.

Kun vastauksesta päätellen olet enempikin asiaa tutkinut onko sitten esim. 1 kanavaiselle 1-ydin, 1-ydin/2-säiettä tai 2 ydintä vielä OK?
Mikäli näin voidaanko sanoa että 2-kanavaiselle olisi sitten sopiva määrä vuorostaan 2-ydin, 3-ydin, sekä 2-ydin/4-säiettä tai 4-ydintä?
Eli onko esim. 4-ydintä ja 8-säiettä jo hieman liikaa 2-kanavaiselle kuten myös 6-ydintä ja 6-ydintä/12-säiettä tai 8-ydintä olisi jo ehdottomasti liikaa?

Löytyisikö jotain linkkiä tarkempaan tutkimukseen aiheesta?

Edit: nopeasti miettien, kun löytyy kuitenkin huomattavan montaa ydintä palvelinpuolelta mikä on tällä hetkellä se maksimi kanavien määrä? Esim. 32-ytimellinen prosessori mikä sille on riittävä määrä nykyisin?
 
Sehän riippuu ihan siitä, montako corea on hakemassa sitä tietoa sieltä muistista. Usempi core tarvitsee enemmän keskimääräistä datavirtaa. Esim 8C16T on ehdottomasti liikaa 2 kanavaiselle DDR4:lle.
Kaista loppuu Ryzen 7:llä varmasti joissain tapauksissa kesken, mutta en pitäisi sitä mitenkään ongelmallisena asiana. Loppupeleissä pii on halpaa ja liitännät kalliita, joten tuollainen prosessointiteho-muistikaistasuhde nyt vain sattuu olemaan kustannustehokas useimpiin käyttötarkoituksiin. Ja jos tietää, että muistikaista rajoittava tekijä omaan käyttöön, niin sitä varten on olemassa vielä halvemmat leikatut piirit.
 
Kun vastauksesta päätellen olet enempikin asiaa tutkinut onko sitten esim. 1 kanavaiselle 1-ydin, 1-ydin/2-säiettä tai 2 ydintä vielä OK?
Mikäli näin voidaanko sanoa että 2-kanavaiselle olisi sitten sopiva määrä vuorostaan 2-ydin, 3-ydin, sekä 2-ydin/4-säiettä tai 4-ydintä?
Eli onko esim. 4-ydintä ja 8-säiettä jo hieman liikaa 2-kanavaiselle kuten myös 6-ydintä ja 6-ydintä/12-säiettä tai 8-ydintä olisi jo ehdottomasti liikaa?

Löytyisikö jotain linkkiä tarkempaan tutkimukseen aiheesta?

Edit: nopeasti miettien, kun löytyy kuitenkin huomattavan montaa ydintä palvelinpuolelta mikä on tällä hetkellä se maksimi kanavien määrä? Esim. 32-ytimellinen prosessori mikä sille on riittävä määrä nykyisin?

Jospa vaikka ottaisit googlen ja kirjoittaisit sinne esim:
Ryzen 1 channel
Tai muita vastaavia, niin löytynee niitä testejä edelleen.
Sikäli, kun näyttis ei rajoita, niin ryzen hyytyy 10% - yli 30%, kun toinen kanava otetaan pois käytöstä.
Jos taas näyttis on täysi romu tai reso niin suuri, että näyttis ei vain kykene, niin silloin esim 30% voi kutistuakkin alle 5%:iin, mutta sehän on selvä, että hitaimman ehdolla tuossa tapauksessa mennään.
Samoin jos softa ei säikeisty (niinkuin pelit nykyään yleensä eivät yli 4C), niin eipä siitä kaistasta juurikaan ole hyötyä. sitten kun ja jos joskus säikeistyvät kunnolla, niin ryzenin muistikaistapullonkaula tulee olemaan entistä pahemmin se rajoittava tekijä.

Tuotahan voisi testata tekemällä assyllä tms nopealla kielellä ohjelman, joka siirtäisi dataa eripaikoista muisteja ristiinrastiin eri threadimäärillä ja ilmoittaisi yhteistuloksen.
Jos muistikaista ei jarruta, kukin lisäthreadi (kunnes coret on täynnä) lisää tulosta suurinpiirtein samanverran.
 
Sikäli, kun näyttis ei rajoita, niin ryzen hyytyy 10% - yli 30%, kun toinen kanava otetaan pois käytöstä.

Noilla lukemilla osaat varmaan itsekin laskea että reserviin jää vielä aika hyvin kaistaa, eli eipä tuo dual channel ole mikään ongelma vielä eikä todennäköisesti vielä pitkään aikaan.
 
Noilla lukemilla osaat varmaan itsekin laskea että reserviin jää vielä aika hyvin kaistaa, eli eipä tuo dual channel ole mikään ongelma vielä eikä todennäköisesti vielä pitkään aikaan.

Kuten totesin, ryzen on 8C prossu, ei 4C prossu, mutta nykyiset pelitestit rasittavat sitä, kuin korkeintaan 4C prossua, joten kyllä sitä kaistaa on siellä ihan liian niukasti, jos sitä suorituskykyä yritetään joskus ulosmitata oikeasti 8C:n voimin.
 
@Griffin et nyt vastannut kysymykseeni:

Tuotahan voisi testata tekemällä assyllä tms nopealla kielellä ohjelman, joka siirtäisi dataa eripaikoista muisteja ristiinrastiin eri threadimäärillä ja ilmoittaisi yhteistuloksen.
Jos muistikaista ei jarruta, kukin lisäthreadi (kunnes coret on täynnä) lisää tulosta suurinpiirtein samanverran.

Kuten totesin, ryzen on 8C prossu, ei 4C prossu, mutta nykyiset pelitestit rasittavat sitä, kuin korkeintaan 4C prossua, joten kyllä sitä kaistaa on siellä ihan liian niukasti, jos sitä suorituskykyä yritetään joskus ulosmitata oikeasti 8C:n voimin.

Eli tuota juuri kyselin.
Voidaanko siis vetää ihan raaka raja että 4-ydin/8-säie prosessorille 2-kaistainen muisti on vielä OK, juuri ja juuri.
Siitä voidaan siis vetää johtopäätös että ohjelma mikä ei esim. vaadi näytönohjaimelta ns. "mitään" mutta käyttää hyvin ytimiä toimisi seuraavasti:
Mikä tahansa prosessori jos ytimiä on käytössä:
1-2+ tuplasti säikeitä vaatii vähintään 1-kaistaisen muistin
2-4+ tuplasti säikeitä vaatii vähintään 2-kaistaisen muistin
4-8+ tuplasti säikeitä vaatii vähintään 4-kaistaisen muistin
8-16+ tuplasti säikeitä vaatii vähintään 8-kaistaisen muistin
16-32+ tuplasti säikeitä vaatii vähintään 16-kaistaisen muistin

Tätäkö hait? Eli jos ostaa vaikka 32-ytimellisen palvelin prosessorin siinä tarvisi olla vähintään 16-kaistainen muistikanavien määrä tai kaistaa ei riitä tarpeeksi jos löytyy ohjelma mikä oikeasti osaa käyttää 32-ydintä/64-säiettä? (Kuten ehkä olet kuullut monissa niissä EI vaadita näytönohjainta vaan ajetaan ihan erilaisia, hyvinkin säikeistyviä, ohjelmia)

Vai voisiko olla että Intelin ja AMD:n prosessoreissa ehkä jopa naurettavan vähäinen 4-kaistainen muistiväylä ehkä vielä voisi riittää 16-32 ytimelle ja 32-64 säikeelle ilman että ohjelma kuristuisi tuosta todella paljon? :comp:
 
@Griffin et nyt vastannut kysymykseeni:





Eli tuota juuri kyselin.
Voidaanko siis vetää ihan raaka raja että 4-ydin/8-säie prosessorille 2-kaistainen muisti on vielä OK, juuri ja juuri.
Siitä voidaan siis vetää johtopäätös että ohjelma mikä ei esim. vaadi näytönohjaimelta ns. "mitään" mutta käyttää hyvin ytimiä toimisi seuraavasti:
Mikä tahansa prosessori jos ytimiä on käytössä:
1-2+ tuplasti säikeitä vaatii vähintään 1-kaistaisen muistin
2-4+ tuplasti säikeitä vaatii vähintään 2-kaistaisen muistin
4-8+ tuplasti säikeitä vaatii vähintään 4-kaistaisen muistin
8-16+ tuplasti säikeitä vaatii vähintään 8-kaistaisen muistin
16-32+ tuplasti säikeitä vaatii vähintään 16-kaistaisen muistin

Tätäkö hait? Eli jos ostaa vaikka 32-ytimellisen palvelin prosessorin siinä tarvisi olla vähintään 16-kaistainen muistikanavien määrä tai kaistaa ei riitä tarpeeksi jos löytyy ohjelma mikä oikeasti osaa käyttää 32-ydintä/64-säiettä? (Kuten ehkä olet kuullut monissa niissä EI vaadita näytönohjainta vaan ajetaan ihan erilaisia, hyvinkin säikeistyviä, ohjelmia)

Vai voisiko olla että Intelin ja AMD:n prosessoreissa ehkä jopa naurettavan vähäinen 4-kaistainen muistiväylä ehkä vielä voisi riittää 16-32 ytimelle ja 32-64 säikeelle ilman että ohjelma kuristuisi tuosta todella paljon? :comp:
Näissä sinun esimerkeissä ohjelma vaatii triviaalia laskentatehoa ja valtavasti dataa muistista jota ei käytetä uudelleen vaan tallennetaan muistiin ja taas haetaan uusi data muistista. Millainen ohjelma aiheuttaa tällaista kuormaa?
 
@Griffin et nyt vastannut kysymykseeni:





Eli tuota juuri kyselin.
Voidaanko siis vetää ihan raaka raja että 4-ydin/8-säie prosessorille 2-kaistainen muisti on vielä OK, juuri ja juuri.
Siitä voidaan siis vetää johtopäätös että ohjelma mikä ei esim. vaadi näytönohjaimelta ns. "mitään" mutta käyttää hyvin ytimiä toimisi seuraavasti:
Mikä tahansa prosessori jos ytimiä on käytössä:
1-2+ tuplasti säikeitä vaatii vähintään 1-kaistaisen muistin
2-4+ tuplasti säikeitä vaatii vähintään 2-kaistaisen muistin
4-8+ tuplasti säikeitä vaatii vähintään 4-kaistaisen muistin
8-16+ tuplasti säikeitä vaatii vähintään 8-kaistaisen muistin
16-32+ tuplasti säikeitä vaatii vähintään 16-kaistaisen muistin

Tätäkö hait? Eli jos ostaa vaikka 32-ytimellisen palvelin prosessorin siinä tarvisi olla vähintään 16-kaistainen muistikanavien määrä tai kaistaa ei riitä tarpeeksi jos löytyy ohjelma mikä oikeasti osaa käyttää 32-ydintä/64-säiettä? (Kuten ehkä olet kuullut monissa niissä EI vaadita näytönohjainta vaan ajetaan ihan erilaisia, hyvinkin säikeistyviä, ohjelmia)
Vähän tuonnepäin todella muistinkäsittely raskailla kuormilla, tosin jos prossussa on iGPU, joka on käytössä, niin kaistantarve räjähtää käsiin...(jos siinä iGPU:ssa on yhtään suorituskykyä).

Vai voisiko olla että Intelin ja AMD:n prosessoreissa ehkä jopa naurettavan vähäinen 4-kaistainen muistiväylä ehkä vielä voisi riittää 16-32 ytimelle ja 32-64 säikeelle ilman että ohjelma kuristuisi tuosta todella paljon? :comp:
 
Näissä sinun esimerkeissä ohjelma vaatii triviaalia laskentatehoa ja valtavasti dataa muistista jota ei käytetä uudelleen vaan tallennetaan muistiin ja taas haetaan uusi data muistista. Millainen ohjelma aiheuttaa tällaista kuormaa?

Monenlaiset säikeistyvät laskentasoftat, esim isojen karttojen liimailu (osa vaiheista) osa kuvankäsittelystä ja uskoisin myös esim säikeistetyn videokonversion hyötyvän muistikaistasta. AVX-512 laajennusta käyttävät ohjelmat hyötyvät varmasti entistä useammin kanssa.
Edit:
Se nyt on ainankin täysin selkeää, että nykyiset pelit eivät saikeisty tarpeeksi, että ne hyötisivät yleensä (muutamia poikkeuksia lukuunottamatta) yli 4C prossuista, joten ne eivät myökään voi syödä muistikaistaa sen enemmän..
 
Viimeksi muokattu:
Aika päätöntä keskustelua taas. Muistikaistan riittävyys riippuu täysin suoritettavasta koodista ja tehtävistä mitä se suorittaa. Tuskin voidaan suoraan vetää jotain per core muistikaistan tarvetta koska asia riippuu aina käyttötarpeista ja minkälainen kompromissi on asian suhteen tehty. Ehkä joku absoluuttinen minimi tämän hetkisen muistikaistan tarpeesta voidaan määrittää mutta mikä on tulevaisuudessa riittävä niin tuskin.
 
AVX-512 laajennusta käyttävät ohjelmat hyötyvät varmasti entistä useammin kanssa.
Paitsi että jo AVX-256 pyörii Zenillä vain ~½ nopeudella verrattuna Inteliin, joten täten sinun tulisi olla enemmän huolissaan Coffee Laken muistikaistasta kuin Summit Ridgen.

Yksityiskohtia voi toki kritisoida, mutta AMD tilanteen & resurssit huomioonottaen, Zen ja Summit Ridge vaikuttavat jopa harvinaisen onnistuneelta & tasapainoiselta tuotteelta. Varsinaisia suunnitelumokia siitä on vaikea löytää, vaan kyse vain tavallisista kompromisseista. Onneksi AMD:n markkinaosuudella kaikilla osa-alueilla sen ei tarvitsekaan olla paras, vaan tarpeeksi hyvä kokonaisuus tavallisimpiin käyttötarkoituksiin riittää.
 
Tulipa vilkaistua gather-käskyn nopeuksia Agner Fogin taulukoista.

Jo intelin Well-sarjojen aikaan tämän käskyn käyttö usein aiheutti hidastumista, koska se oli melko hidas ja usein saman asian sai tehtyä muutamalla normaalilla luodilla ja pienellä shufflaamisella. (Welleissä sen throughput oli 1 käsky/(7-12 kellojaksoa). Lake-sarjassa intel yli tuplasi tämän käskyn throughputin yhteen käskyyn/(2..5 kellojaksoa).

Ryzenillä tämä on 1/(9..20) kellojaksoa, eli vielä selvästi hitaampi kuin Welleillä. Todennäköisesti tämän toteutus on tehty ryzenissä täysin mikrokoodilla eikä prosessorin datapolulla ole sille mitään varsinaista rautatukea.


Gather-käskyiltä ainakin voi odottaa huomattavaa nopeutusta zen2ssa. Tuohon alkuvuodesta tulevaan "zen+aan" sen sijaan en vielä odota mitään muutosta näiden osalta; Näiden nopea toteutus vaatii kuitenkin selvästi muutoksia prosessorin osoitteenlaskenta- ja lataus-tallennus-yksiköihin enkä pidä todennäköisenä että joko

1) Näin suuria muutoksia tuohon malliin tehtäisiin tai
2) Rautatuki näille olisi jo nykyisissä mallissa mutta kytketty pois päältä ja tehty mikrokoodilla niissä olevan bugin takia.
 
Viimeksi muokattu:


Nyt ovat kovat jutut Canard PC:llä: seuraavan generaation EPYC prosessoreihin povataan 64 corea, 256 Megaa L3 cachea, 8 x DDR4-3200 ja 128 PCIe 4 väylää. Vaatinee sen 7nm prosessin jos edes ajattelee haaveilla tuosta oikeasti?
 


Nyt ovat kovat jutut Canard PC:llä: seuraavan generaation EPYC prosessoreihin povataan 64 corea, 256 Megaa L3 cachea, 8 x DDR4-3200 ja 128 PCIe 4 väylää. Vaatinee sen 7nm prosessin jos edes ajattelee haaveilla tuosta oikeasti?


Ei, vaatii vaan isomman MCM-paketin jossa 8 piilastua uudessa järeämmässä soketissa.

256 megan L3-kakkua lukuunottamatta onnistuisi jo nykyisillä zeppelin-piilastuilla, kun se kokoonpano mikä nyt on kahdessa soketissa tungettaisiin vaan yhteen isompaan MCMään. (tosin tästä ei sitten varmaan enää saisi kahden soketin konfiguraatiota aikaiseksi)
 
Ei, vaatii vaan isomman MCM-paketin jossa 8 piilastua uudessa järeämmässä soketissa.

256 megan L3-kakkua lukuunottamatta onnistuisi jo nykyisillä zeppelin-piilastuilla, kun se kokoonpano mikä nyt on kahdessa soketissa tungettaisiin vaan yhteen isompaan MCMään. (tosin tästä ei sitten varmaan enää saisi kahden soketin konfiguraatiota aikaiseksi)
Varmaan, mutta mietin sitä 7nm prosessia siltä kannalta, että noissa palvelimissa on ilmeisesti jokin maksimi lämpökuorma jota ei pitäisi ylittää. 64 corea nykyisellä prosessilla vaatisi tosi matalat kellot, että se raja ei ylity.

EDIT: Canard oli pistänyt toisenkin tweetin, että prosessori veisi 225W ja maksimissaankin 240W. Ei paha, jossa siinä oikeasti tulee olemaan 64 corea:
 
Viimeksi muokattu:
@Griffin et nyt vastannut kysymykseeni:

Eli tuota juuri kyselin.
Voidaanko siis vetää ihan raaka raja että 4-ydin/8-säie prosessorille 2-kaistainen muisti on vielä OK, juuri ja juuri.
Siitä voidaan siis vetää johtopäätös että ohjelma mikä ei esim. vaadi näytönohjaimelta ns. "mitään" mutta käyttää hyvin ytimiä toimisi seuraavasti:
Mikä tahansa prosessori jos ytimiä on käytössä:
1-2+ tuplasti säikeitä vaatii vähintään 1-kaistaisen muistin
2-4+ tuplasti säikeitä vaatii vähintään 2-kaistaisen muistin
4-8+ tuplasti säikeitä vaatii vähintään 4-kaistaisen muistin
8-16+ tuplasti säikeitä vaatii vähintään 8-kaistaisen muistin
16-32+ tuplasti säikeitä vaatii vähintään 16-kaistaisen muistin

Tätäkö hait? Eli jos ostaa vaikka 32-ytimellisen palvelin prosessorin siinä tarvisi olla vähintään 16-kaistainen muistikanavien määrä tai kaistaa ei riitä tarpeeksi jos löytyy ohjelma mikä oikeasti osaa käyttää 32-ydintä/64-säiettä? (Kuten ehkä olet kuullut monissa niissä EI vaadita näytönohjainta vaan ajetaan ihan erilaisia, hyvinkin säikeistyviä, ohjelmia)

Vai voisiko olla että Intelin ja AMD:n prosessoreissa ehkä jopa naurettavan vähäinen 4-kaistainen muistiväylä ehkä vielä voisi riittää 16-32 ytimelle ja 32-64 säikeelle ilman että ohjelma kuristuisi tuosta todella paljon? :comp:

Se, paljonko tarvitaan muistikaistaa riippuu täysin ajettavasta softasta. On olemassa softia, joiden koko efektiivinen working set mahtuu välimuisteihin, ja muistin nopeudella ei ole käytännössä mitään väliä, yksikanavainen muisti riittäisi vaikka 64 ytimelle.

Ja sitten on olemassa softia, joissa muistintarve on iso ja jokaista ladattua lukua kohden tehdään vain hyvin pieni määrä operaatioita (esim. ethereumin louhinta) joissa käytännössä juuri millään muulla kuin muistin nopeudella ei ole mitään väliä.

Ei siis voida muodosta mitään universaalia sääntöä siitä että tietyn ydinmäärän hyödyntäminen tarvii jonkun tietyn määrän musitikaistaa tai muistikanavia.


Käytännössä kyse on vaan trade-offista, muistikaista maksaa ja piipinta-ala maksaa, ja halutaan tehdä kokoonpano, joka antaa keskimäärin parhaan hinta-suorituskyky-suhteen yleisimmillä/tärkeimmillä softilla.


Käytännössä (monen säikeen) laskentateho halpenee nopeammin kuin muistikaista, ja lisäksi välimuistit suurenevat(jolloin muistiaccesseja tulee vähemmän), joten pikkuhiljaa mennään siihen suuntaan, että laskentateho/kaista-suhde kasvaa.

Ryzen oli selvä askel tähän suuntaan, ensimmäinen 16 säiettä ajava (vain) 128-bittisellä muistilla varustettu piiri. Intel seuraa perässä ja lisäsi nyt 128-bittisen muistiväylän omaavan piirinsä ydinmäärän 4->6, säiemäärän 8->12.

toki tässä pitää ottaa huomioon se, että muistin kellotaajuudet ovat myös kasvaneet, mutta niin on myös prosessorien säie- tai ydinkohtainenkin suorituskyky kasvanut.
 
Viimeksi muokattu:
Varmaan, mutta mietin sitä 7nm prosessia siltä kannalta, että noissa palvelimissa on ilmeisesti jokin maksimi lämpökuorma jota ei pitäisi ylittää. 64 corea nykyisellä prosessilla vaatisi tosi matalat kellot, että se raja ei ylity.

EDIT: Canard oli pistänyt toisenkin tweetin, että prosessori veisi 225W ja maksimissaankin 240W. Ei paha, jossa siinä oikeasti tulee olemaan 64 corea:


Globalfoundries 7LP 7nm Leading Performance FINFET process and FX-7 ASIC platform
Ainakin tuo >60% lasku tehonkulutuksessa ilmeisesti toteutumassa, jos tuo twiitti ei ole mutua.
 
Jos nuo pitää/pitäisi paikkaansa niin on kyllä kovaa vehjettä tulossa punaisesta leiristä. 64 corea yhdessä socketissa ja valmistuskustannukset pysyy silti pieninä, kiitos massavalmistettavan piirin. Intelille tulee vielä kiire tehdä oma MCM versio. :)
 
Jos nuo pitää/pitäisi paikkaansa niin on kyllä kovaa vehjettä tulossa punaisesta leiristä. 64 corea yhdessä socketissa ja valmistuskustannukset pysyy silti pieninä, kiitos massavalmistettavan piirin. Intelille tulee vielä kiire tehdä oma MCM versio. :)
Näinköhän Intel tekee sellaista? Kaikilla muistissa Intelin jutut siitä kuinka Threadripper / EPYC on liimalla kasatty täyspaska. Jos Intel tekisi sellaisen se todistaisi AMD:n olleen hommassa edelläkävijä ja se olisi huonoa PR:ää Intelille

EDIT: Huhut muuten arvelevat, että AMD tekee tulevasta Vegan seuraajasta Navista myös MCM:n. Jos se pitää paikkansa, niin monoliittisten piirien aika on ohi AMD:llä
 
Näinköhän Intel tekee sellaista? Kaikilla muistissa Intelin jutut siitä kuinka Threadripper / EPYC on liimalla kasatty täyspaska. Jos Intel tekisi sellaisen se todistaisi AMD:n olleen hommassa edelläkävijä ja se olisi huonoa PR:ää Intelille

EDIT: Huhut muuten arvelevat, että AMD tekee tulevasta Vegan seuraajasta Navista myös MCM:n. Jos se pitää paikkansa, niin monoliittisten piirien aika on ohi AMD:llä

Intelihän teki liimauksia jo ennen AMD:tä? Pentium D ja core 2 quad ainakin.
 
Intelihän teki liimauksia jo ennen AMD:tä? Pentium D ja core 2 quad ainakin.
Niin teki, mutta piirien välinen liikenne oli vähintäänkin heikosti toteutettu eli kyse oli oikeasta purkkavirityksestä.
 
Niin teki, mutta piirien välinen liikenne oli vähintäänkin heikosti toteutettu eli kyse oli oikeasta purkkavirityksestä.
Muistanko väärin vai keskusteliko joku noista purkkamulticoreista socketin kautta toiselle corelle? eli oli oikeasti dual cpu paketoituna yhteen.
 
Muistanko väärin vai keskusteliko joku noista purkkamulticoreista socketin kautta toiselle corelle? eli oli oikeasti dual cpu paketoituna yhteen.

Tais olla pentium d:n ja core 2 quadilla lastulta lastulle kommunikaatio fsb:n kautta
 
Se, paljonko tarvitaan muistikaistaa riippuu täysin ajettavasta softasta. On olemassa softia, joiden koko efektiivinen working set mahtuu välimuisteihin, ja muistin nopeudella ei ole käytännössä mitään väliä, yksikanavainen muisti riittäisi vaikka 64 ytimelle.

Ja sitten on olemassa softia, joissa muistintarve on iso ja jokaista ladattua lukua kohden tehdään vain hyvin pieni määrä operaatioita (esim. ethereumin louhinta) joissa käytännössä juuri millään muulla kuin muistin nopeudella ei ole mitään väliä.

Ei siis voida muodosta mitään universaalia sääntöä siitä että tietyn ydinmäärän hyödyntäminen tarvii jonkun tietyn määrän musitikaistaa tai muistikanavia.

Puhuimme peleistä ja @Griffin totesi faktana että kun joskus pelit tulevat vaatimaan ja oikeasti tukemaan 6 tai 8 ydintä niin huomataan miten 2-kanavainen muistituki ei siihen enää riitä. En ole 100% varma, voihan olla että olen väärässä, mutta epäilen kyseessä olleen lievähkö trollaus koska silloin paras mitä Intelillä oli tarjolla kuluttajaluokassa oli 7700K ja lukemma AMD:n vastineet vaikka ehkä nyt joissakin peleissä pärjäisivät tulisivat hyytymään kun joskus oikeasti tulisi peli joka tukee tosissaan sitä 6/8-ydintä.

Tosin tämän jälkeen julkaistiin esim. Coffee Lake enkä huomannut siinä ketjussa että Sampsa tai Griffin olisivat valittaneet miten julkaisu olisi ns. surkea koska kun pelit joskus tulevat oikeasti tukemaan/vaatimaan 6 tai 8-ydintä tuo myös Coffee Lake prosessorissa käytetty 2-kanavainen muistituki olisi otaksuttavasti myös siinä liian hidas?
 
[offtopic]

Niin teki, mutta piirien välinen liikenne oli vähintäänkin heikosti toteutettu eli kyse oli oikeasta purkkavirityksestä.

Mistä piirien välisestä liikenteestä nyt puhut/missä tilanteessa sillä oli jotain merkitystä?

x86-moniprosessorikoneiden/moniydinprosessorien ohjelmointimalli on SMP, eikä mikään viestinvälitys.

Tarkoittaa sitä, että ei ole mitään konekielikäskyjä, jotka lähettävät dataa toisille säikeille/ytimille, vaan kaikki säikeet lukevat datansa muistista ja kirjoittavat datansa muistiin, kommunikoivat täysin muistin kautta.

Tilanteet, joissa toinen säie tarvii heti perään toisen säikeen tuottamaa dataa esiintyy paljon lähinnä vain jossain tietokantapalvelmissa eikä juuri muualla.


Eikä P4n tai core2 quadin jaettu prosessoriväylä ollut mikään purkkaviritys. Se oli yksinkertainen ja elegantti ratkaisu joka teki tehtävänsä ilman turhaa monimutkaisuutta.

Toki se ei ollut nopein mahdollinen ratkaisu, mutta ei se ollut mikään paha pullonkaula missään normaalikäytössä.
[/offtopic]
 
Puhuimme peleistä ja @Griffin totesi faktana että kun joskus pelit tulevat vaatimaan ja oikeasti tukemaan 6 tai 8 ydintä niin huomataan miten 2-kanavainen muistituki ei siihen enää riitä. En ole 100% varma, voihan olla että olen väärässä, mutta epäilen kyseessä olleen lievähkö trollaus koska silloin paras mitä Intelillä oli tarjolla kuluttajaluokassa oli 7700K ja lukemma AMD:n vastineet vaikka ehkä nyt joissakin peleissä pärjäisivät tulisivat hyytymään kun joskus oikeasti tulisi peli joka tukee tosissaan sitä 6/8-ydintä.

Tosin tämän jälkeen julkaistiin esim. Coffee Lake enkä huomannut siinä ketjussa että Sampsa tai Griffin olisivat valittaneet miten julkaisu olisi ns. surkea koska kun pelit joskus tulevat oikeasti tukemaan/vaatimaan 6 tai 8-ydintä tuo myös Coffee Lake prosessorissa käytetty 2-kanavainen muistituki olisi otaksuttavasti myös siinä liian hidas?

Niin.. Pitää ensin tulla niitä pelejä, joissa on oikeasti tuki esim 8:lle threadille, joita rasitetaan kaikkia edes kohtuudella. Tämä tulee kuitenkin vielä kestämään käytännössä sen aikaa, että CL on jo "wanha" prossu.

Sekä AMD, että Intel puolella on erittäin selkeästi havaittavissa, varsinkin suurilla threadimäärillä, miten muistien ylikellottamisesta on paljonkin iloa. Jos pullonkaula olisi muualla, niin ko kellotuksen vaikutus olisi vain pieni. Aivan, kuten jos ajetaan nykynäyttiksillä testejä jollain 4K resolla, niin lopputulos on se, että kunhan on joku kohtuullinen yläpään intel tai amd prossu, niin FPS on suurinpiirtein sama (kun pullonkaula ei ole siinä CPU:ssa). Ja jos CPUhun integroidaan vielä näyttis, niin muistiväyläpullonkaula 2:lla muistikanavalla on todella paha.
 
Aikasemmin oli puhetta, että täysverisiä Ryzen 7:ja oli myyty Ryzen 5 1600/X:inä, nyt näemmä näyttäs siltä että myös Ryzen 3:sia löytys kaheksalla ytimellä varustettuna. Redditissä oli juttua, missä OP:n R3 1200 otti lievällä ylikellotuksella yli 1000 pistettä CB15:ssä, CPU-Z näytti kaheksaa ydintä ja kaheksaa säiettä. Eli käytännössä kyseessä olis Ryzen 7 ilman SMT:tä.

Näitten palikoitten kanssa näemmä termi "silicon lottery" on kyllä saanu aivan uuden merkityksen.
 
Kun tietäisi, että tekeekö ne tän tahallaan, vaiko vahingossa. Saattaa tulla harmillisen paljon palautuksia, kun vahingossa kasiytimiseksi säädetty zeppelin onkin viallinen, mutta toimisi neliytimisenä.
 
Eikös sillä ekalla kerralla oltu ulkoistettu valmistusta ja siellä ollut sit häikkää? Olis kiva tietää missä tämä 1200 on valmistettu.
 
Kun tietäisi, että tekeekö ne tän tahallaan, vaiko vahingossa. Saattaa tulla harmillisen paljon palautuksia, kun vahingossa kasiytimiseksi säädetty zeppelin onkin viallinen, mutta toimisi neliytimisenä.
Jo keväällä kulki huhuja, että AMD:n saannot piireissä toimivien osalta ovat niin kovat, että se voisi tehdä melkein kaikista piireista 8-coreja jos haluaisi. En oikein usko suureen palautusmäärään vaikka olisikin liikaa coreja auki.
 
Spekseissä lukee tuossa olevan vain yksi muistikampa, jos tuo "
  • Number of Memory Sticks Included 1" siihen viittaa ja teran HDD. Kaiken lisäksi kolmen kennon akku, joten ei vissiin kovin kovat akkukestot taida olla :think: Oottelisin itse muita malleja.
 
Spekseissä lukee tuossa olevan vain yksi muistikampa, jos tuo "
  • Number of Memory Sticks Included 1" siihen viittaa ja teran HDD. Kaiken lisäksi kolmen kennon akku, joten ei vissiin kovin kovat akkukestot taida olla :think: Oottelisin itse muita malleja.

Kannattaa muistaa että kyseessä on 15W laite, eli akkukesto voi olla aika hyväkin. Testejä olisi tosin kiva nähdä. Toi 750$ oli vähän outo, kun löyty toinen paikka jossa sama laite 600$. Olikohan toisessa kanadan dollareita? :D

HP Envy x360 2-in-1 15.6" Laptop: Ryzen 5 2500U, Vega 8, 8GB DDR4, 1TB HDD $600 + Free Shipping

tuolla 600$

Edit. Ei ollut canadan dollareita, Canadan bestbuyssä hintaa 999.99$ Tuntuu olevan tuota hintahaarukkaa jonkin verran.
 
Spekseissä lukee tuossa olevan vain yksi muistikampa, jos tuo "
  • Number of Memory Sticks Included 1" siihen viittaa ja teran HDD. Kaiken lisäksi kolmen kennon akku, joten ei vissiin kovin kovat akkukestot taida olla :think: Oottelisin itse muita malleja.

8 gigaa on muutenkin "liian vähän" muistia uuteen koneeseen.

Jos siellä on SO-DIMM-slotti niin asentaa itse sen toisen 8 gigan kamman ja nauttii sekä järkevästä määrästä muistia että järkevästä muistikaistasta.
 
Viimeksi muokattu:
  • Tykkää
Reactions: svk
8 gigaa on muutenkin "liian vähän" muistia uuteen koneeseen.

Jos siellä on SO-DIMM-slotti niin asentaa itse sen toisen 8 gigan kamman ja nauttii sekä järkevästä määstäs muistia että järkevästä muistikaistasta.

Ja HDD on turhan hidas, jos on SSD:hen tottunut :D Oottelee mallia, jossa on noi ominaisuudet vakiona, ni ei tarttee heittää rahaa tonnin edestä itse läppäriin ja /lisävaihto-osiin.
 
Ja HDD on turhan hidas, jos on SSD:hen tottunut :D Oottelee mallia, jossa on noi ominaisuudet vakiona, ni ei tarttee heittää rahaa tonnin edestä itse läppäriin ja /lisävaihto-osiin.
Tuolla hp:n omilla sivuilla voi muokata noita osia mieleisekseen. Harmi ettei tuota parempaa prossua saa tilalle: Configure
 
  • Tykkää
Reactions: svk
Tuolla hp:n omilla sivuilla voi muokata noita osia mieleisekseen. Harmi ettei tuota parempaa prossua saa tilalle: Configure

Katos perhana! Eikä olis huonoin mahdollinen hintakaan 16 gigan muistilla, mutta tinkien sisäisen tallennustilan määrästä, kun ssd 256gb on suht kallis(?), $ 879 . 99
 

Statistiikka

Viestiketjuista
258 402
Viestejä
4 489 882
Jäsenet
74 154
Uusin jäsen
Almedin

Hinta.fi

Back
Ylös Bottom