AMD:lta esimakua 2. sukupolven Threadripper-prosessoreista - 32 ydintä

Sampsa · 06.06.2018

Elokuussa julkaistavat uudet Threadripperit pohjautuvat samaan Zen+-päivitykseen kuin keväällä lanseeratut 2. sukupolven Ryzen-prosessorit ja piisirut valmistetetaan 12 nanometrin viivanleveydellä. Arkkitehtuuripuolella Zen+:ssa on viilattu muun muassa välimuistien ja keskusmuistin latensseja alhaisemmiksi ja uuden valmistusprosessin myötä kellotaajuuksia on saatu nostettua parilla sadalla megahertsillä ylöspäin.

AMD päivittää nykyiset 8-, 12- ja 16-ytimiset Threadripperit uuteen Zen+-arkkitehtuuriin ja samalla se paljasti tuovansa markkinoille myös uudet 24- ja 32-ytimiset mallit, joissa otetaan käyttöön aiemmin tyhjänpanttina olleet kaksi 8-ytimistä piisirua. Threadripperin MCM- eli Multi-chip Module -konfiguraatiossa on neljä 8-ytimistä piisirua sijoitettu hartsialustalle ja piisirut kommunikoivat keskenään Infinity Fabric -yhdysväylällä.

AMD on ilmoittanut 24- ja 32-ytimisen Threadripperin TDP-arvoksi 250 wattia ja sen kaveriksi on suunniteltu yhteistyössä Cooler Masterin kanssa uusi RGB-valaistu Wraith Ripper -vakiojäähdytys.

Intel kertoi eilen laajentavansa Core X -malliston vuoden lopulla 28-ytimiseksi, joten kilpailu HEDT-alustalla jatkuu kiivaana. Q3-julkaisullaan AMD on tuomassa markkinoille Inteliä aikaisemmin neljä ydintä enemmän ja oletettavasti hintalappu tulee olemaan huomattavasti edullisempi.

Lähde: AMD

Huom! Foorumiviestistä saattaa puuttua kuvagalleria tai upotettu video.

Linkki alkuperäiseen uutiseen (io-tech.fi)

Palautelomake: Raportoi kirjoitusvirheestä

Kazyaa · 06.06.2018

Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...

Delarent · 06.06.2018

Kazyaa sanoi:
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...

Amd ajeli threadripperiä ilmalla. Intel ajeli tuota 5Ghziä 4 asteisella vedellä.

Skydex · 06.06.2018

Kazyaa sanoi:
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...

Ja nämä kellot saavutettiin nestejäähytyksellä joka pakkasen puolella. Paketista ulos hyvä jos edes 4Ghz pääsee

Nerkoon · 06.06.2018

Kazyaa sanoi:
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...

Se 5GHz kello tehtiin järjettömän tehokkaalla ulkoisella jäähyllä. Koneen powerinkin teho oli 1000-1600W vähän lähteestä riippuen. Noilla spekseillä ei kannata suuremmin brassailla sillä 5GHz kellolla

Yhdellä sivulla oli kuvia siitä jäähdytysyksiköstä. Kokoa oli pienen jääkaapin verran ja laitteen väitettiin vievän kilowatin verran sähköä.

svk · 06.06.2018

Jos spoilerissa oleva tulee toteen, niin suorituskyky edellisen sukupolven TR:n verrattuna on kaukana kaksinkertaisesta suorituskyvystä samoilla kellotaajuuksilla.

Focus0 · 06.06.2018

Kazyaa sanoi:
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...

OT:

Hyvä vitsi... keksippä toinen

Helppo se on elvistellä ku toista ajettais ylikellotettuna ja toista vakiona. Laitetaas samat kellot molempiin ja puhutaan sit lisää.

Asiaan:
Luvut kuulostaa hyvältä. Kyllähän tää Intelin leirissä varmasti kohauttaa/kohautti.
Jännä nähdä miten hyvin tuo sykkii kun joskus testejä alkaa tulemaan. :nb:

Kaotik · 06.06.2018

svk sanoi:
Jos spoilerissa oleva tulee toteen, niin suorituskyky edellisen sukupolven TR:n verrattuna on kaukana kaksinkertaisesta suorituskyvystä samoilla kellotaajuuksilla.

Ei kai nyt kukaan kaksinkertaista suorituskykyä odota muutenkaan? Ei ne lineaarisesti yleensä skaalaa vaikka olisi kaikki piirit kaikkine kilkkeineen käytössä

Sampsa · 06.06.2018

Noniin pysytääs asialinjalla. Jos on jostain ulkomailta lukenut, että tuo Intelin 28-ytiminen tulisi 5 GHz kellotaajuuksilla myyntiin niin suosittelen tsekkaamaan faktat io-techin uutisesta ja palaamaan asiaan.

-SD- · 06.06.2018

Ainut ydinsota, jota kannatan.

RaivokasMagma · 06.06.2018

Tuli jotenki mieleen tämä

suburban · 06.06.2018

Kohdasta 0:45 näkee minkälainen pakastinpönttö vaaditaan Intelin 28core prossan jäähdytykseen. (ja tuossa ei edes testiä ajettu, varmaan oli paloturvallisempaa näyttää pelkkää screenshottia)

prc · 06.06.2018

Sampsa sanoi:
Noniin pysytääs asialinjalla. Jos on jostain ulkomailta lukenut, että tuo Intelin 28-ytiminen tulisi 5 GHz kellotaajuuksilla myyntiin niin suosittelen tsekkaamaan faktat io-techin uutisesta ja palaamaan asiaan.

Kova veikkaus, ettei niistä lastuista kovin moni kulje demoa vastaavalla jäähdytykselläkään sitä 5:ttä kaikilla ytimillä vaikka mitä jänöjä nakkaisi sisään. Toinen veikkaus on, että thermal throttle tai TDP raja puuttu peliin aika äkkiä vähän paremmallakin ilmajäähyllä ja miedommilla kelloilla.

AMD ei toki maksimi taajuuksissa pääse kilpailemaan siltikään, tosin ei noita kyllä pelaamiseen ole tehty, että varmasti molemmat hiton hyviä lastuja niille suunniteltuihin käyttötarkoituksiin työasemasoftissa. Pitkäkestoisilla työkuormilla voi tulla mielenkiintoinen tilanne, toivottavasti joku sellasia testejä ajaa. AMD:n julmetun iso lastu juotoksineen on ilmajäähyille huomattavasti helpompi.

Liekköhän menee osa TR jäähyistä uusiksi?! Omassa duunityöasemassa (1920x) näyttäisi jäähy siltä, että ei välttämättä ihan osu kohdilleen niiden dummy diejen kanssa. 2. gen TR:ssä se olisi siis susipaska jäähy. Vieläkun muistaisi minkä jäähyn siihen valitsin viime syksynä.

JiiPee · 06.06.2018

svk sanoi:
Jos spoilerissa oleva tulee toteen, niin suorituskyky edellisen sukupolven TR:n verrattuna on kaukana kaksinkertaisesta suorituskyvystä samoilla kellotaajuuksilla.

Niin siis eikös toi ole Anan näkemys asiasta?

Itte mietin tuossa jotta kovasti on noita PCI-E linjoja vapaana koska 64 tulee jatkossakin olemaan se mitä prossusta ulos annetaan kun taas vastaavassa EPYC:ssä niitä on 128. Eli tuli semmoinen hajatelma mieleen että voisikohan AMD mahdollisesti käyttää noita ylimääräisiä PCI-E linjoja kasvattamaan kaistaa tuolla zeppelinien välisessä IF:ssä?
@hkultala @The Stilt

Kaotik · 06.06.2018

JiiPee sanoi:
Niin siis eikös toi ole Anan näkemys asiasta?

Itte mietin tuossa jotta kovasti on noita PCI-E linjoja vapaana koska 64 tulee jatkossakin olemaan se mitä prossusta ulos annetaan kun taas vastaavassa EPYC:ssä niitä on 128. Eli tuli semmoinen hajatelma mieleen että voisikohan AMD mahdollisesti käyttää noita ylimääräisiä PCI-E linjoja kasvattamaan kaistaa tuolla zeppelinien välisessä IF:ssä?
@hkultala @The Stilt

Olettaen että kyseessä on normit PCIe-linkit niin käytännössä ei taida olla mahdollista ainakaan mitenkään järkevästi rakentaa koherenttia yhteyttä piirien välille sen yli.
Sen sijaan itse mietin että onkohan tuossa tosiaan kahden sirun molemmat muistiohjaimet käytössä vai olisiko joka sirulla yksi muistiohjain käytössä?

Deleted member 4604 · 06.06.2018

JiiPee sanoi:
Niin siis eikös toi ole Anan näkemys asiasta?

Itte mietin tuossa jotta kovasti on noita PCI-E linjoja vapaana koska 64 tulee jatkossakin olemaan se mitä prossusta ulos annetaan kun taas vastaavassa EPYC:ssä niitä on 128. Eli tuli semmoinen hajatelma mieleen että voisikohan AMD mahdollisesti käyttää noita ylimääräisiä PCI-E linjoja kasvattamaan kaistaa tuolla zeppelinien välisessä IF:ssä?
@hkultala @The Stilt

"IF" on kyllä markkinoinnin saralla sen luokan saatanan emämunaus, että ei jumalauta.
Ei ole olemassa mitään yhtä linkkiä, AMD käyttää samaa nimeä mm. SDF:lle (ytimen sisäinen), GMI (ytimien välinen, SR), xGMI (ytimien välinen, LR) sekä välillä myös PCI-E väylille.

MCM:llä ytimien välinen nopeus riippuu GMI:n leveydestä ja kellotaajuudesta.
GMI on kiinteä 2x 36-bit (64-bit + 8-bit virheenkorjaus) ja sen kellotaajuus on sidottu muistien kellotaajuuteen, kuten kaikkien muidenkin sisäisten SDF:n kytkeytyvien väylien.

3200MHz muistikellolla GMI:stä menee tavaraa läpi 51.2GB/s per GMI.

mRkukov · 06.06.2018

The Stilt sanoi:
"IF" on kyllä markkinoinnin saralla sen luokan saatanan emämunaus, että ei jumalauta.
Ei ole olemassa mitään yhtä linkkiä, AMD käyttää samaa nimeä mm. SDF:lle (ytimen sisäinen), GMI (ytimien välinen, SR), xGMI (ytimien välinen, LR) sekä välillä myös PCI-E väylille.

Eli sehän on oikein hyvä markkinointitermi. Kuulostaa hyvältä, voidaan tunkea melkein mihin vain eikä itsessään paljasta yhtään mitään.

Teknisestä toteutuksesta kiinnostuneelle tietysti ärsyttävä termi, kun ei kerro periaatteessa mitään.

hkultala · 06.06.2018

Kaotik sanoi:
Olettaen että kyseessä on normit PCIe-linkit niin käytännössä ei taida olla mahdollista ainakaan mitenkään järkevästi rakentaa koherenttia yhteyttä piirien välille sen yli.
Sen sijaan itse mietin että onkohan tuossa tosiaan kahden sirun molemmat muistiohjaimet käytössä vai olisiko joka sirulla yksi muistiohjain käytössä?

Ilmeisesti ne ei ole pelkkiä PCIe-linkkejä vaan yhdistettyjä/multiplexattuja PCIE/IFIS-linkkejä, ja IFIS kyllä mahdollistaa välimuistikoherentin liikenteen.

Potentiaalisia ongelmia niiden hyödyntämiselle on kuitenkin kaksi:

1) Ei ole varmaa, salliiko reititysprotokollaa kahta eri linkkiä samojen piilastujen(tais siis SDF-tasojen) välillä.

2) Ongelma liikenteessä piilastujen välillä on enemmän viiveessä kuin kaistanleveydessä. Lisää rinnakkaisia reittejä datalle ei auta viiveeseen, autttaa vain kaistanleveyteen.

Jännä yksityiskohta on se, että zeppelin-piilastulla on IFOP-linkkejä 4 kpl eikä 3kpl, ja yksi IFOP-linkki on aina käyttämättä.

hkultala · 06.06.2018

The Stilt sanoi:
"IF" on kyllä markkinoinnin saralla sen luokan saatanan emämunaus, että ei jumalauta.
Ei ole olemassa mitään yhtä linkkiä, AMD käyttää samaa nimeä mm. SDF:lle (ytimen sisäinen), GMI (ytimien välinen, SR)

Tarkoititko nyt piilastua kun sanoit "ydin" ?

hkultala · 06.06.2018

The Stilt sanoi:
sekä välillä myös PCI-E väylille.

Missä AMD on PCIe:tä markkinoinut infinity fabriccina?

juhomh · 06.06.2018

Mites noi muistiväylät sitten menee jos ja kun niitä on käytössä ainoastaan toi 4 kpl ? Onko se nyt sitten 1/1/1/1 vai 2/2? Viivettä tulee joka tapauksessa muistista hakemiseen.

Xmli · 06.06.2018

hkultala sanoi:
The Stilt sanoi:

sekä välillä myös PCI-E väylille.

Napsauta laajentaaksesi...

Missä AMD on PCIe:tä markkinoinut infinity fabriccina?

Ainakin Raven Ridgen tapauksessa itselle ei ole vieläkään selvinnyt onko se näytönohjain yhteydessä cpu-ytimiin pcie-llä vaiko if:llä ja onko niillä lopuksikaan eroa.

hkultala · 06.06.2018

juhomh sanoi:
Mites noi muistiväylät sitten menee jos ja kun niitä on käytössä ainoastaan toi 4 kpl ? Onko se nyt sitten 1/1/1/1 vai 2/2? Viivettä tulee joka tapauksessa muistista hakemiseen.

Anandtech sanoo, että 2+2. En tiedä, voiko tätä pitää 100% varmana faktana.

hkultala · 06.06.2018

Xmli sanoi:
Ainakin Raven Ridgen tapauksessa itselle ei ole vieläkään selvinnyt onko se näytönohjain yhteydessä cpu-ytimiin pcie-llä vaiko if:llä ja onko niillä lopuksikaan eroa.

Sen muistiliikenne ei voi käytännössä kulkea PCIe:n yli.

Toki on mahdollista, että siellä on joku hassu "kolmiomallinen" väylärakenne jossa sekä CPU- että GPU-puolilla on nopea väylä muistiohjaimelle, mutta silti niiden välissä on myös pcie, lähinnä softayhteensopivuussyistä tms.

Kaotik · 06.06.2018

Xmli sanoi:
Ainakin Raven Ridgen tapauksessa itselle ei ole vieläkään selvinnyt onko se näytönohjain yhteydessä cpu-ytimiin pcie-llä vaiko if:llä ja onko niillä lopuksikaan eroa.

Ei siellä APU-piirin sisällä ole ikinä mitään PCIe-yhteyksiä käytetty GPUhun

hkultala sanoi:
Anandtech sanoo, että 2+2. En tiedä, voiko tätä pitää 100% varmana faktana.

Tosin vain heidän arvauksena, tekevät sen selväksi ettei kyse ole mistään virallisesta infosta

Sami Riitaoja · 06.06.2018

Pakkohan sen on olla 1-kanava per lastu, tuollaisella 2+2 configuraatiolla AMD olisi tehnyt prosessorin jolle pitää tehdä täysin omat NUMA-optimointinsa - eikä optimitilanteessakaan saataisi kunnon suorituskykyä ulos. Ja mitään ongelmaa toteuttaa 1-kanava per lastu muistikonfiguraatiota tuskin on, tuskin AMD haluaa Threadripperissä hyödyntää ytimiä joissa kumpikin muistiohjain on rikki.

Diglo1 · 06.06.2018

Kazyaa sanoi:
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...

5GHz on paras skenaario mihin Intel tulee noilla kivillä pääsemään. Varsinaiset kellot eivät tule varmasti olemaan yli 4,5GHz ja kaikilla ytimillä hyvä jos pysyvät 3,5ghz tietämillä.
5GHz saavutettiin kompuralla ja vesi oli lähempänä nollaa kuin huoneen lämpötilaa. Intelin i9 7980XE saavutti 5ghz 18 yitimellä yli 1kw virrankulutuksen ja huonommin binnattu 28 ytiminen 5ghz vie helposti yli 1kw ja tuo 1,6kw powerikin oli varmasti äärirajoilla. Järeä ulkoinen jäähdytin varmasti pienensi virrankulutusta huomattavasti, mutta kompura syö itsessään jo ihan sikana virtaa.
AMD kumminkin piti 32 yitimisen viileänä ilmajäähyllä, mutta kellot varmasti oli jossain 3,6-3,8ghz kieppeillä.
Käytännössä kumpikaan prosessoreista tuskin pystyy pitämään kelloja yli 4ghz tuolla ydinmäärällä. AMDlla toki on nyt etuna se, että prosessori binnataan kootaan parhaista Ryzen 2 siruista ja virrankulutus saadaan alas paljon tehokkaammin, kuin Intelin massiivisella 28 sirulla.

Deleted member 4604 · 06.06.2018

hkultala sanoi:
Missä AMD on PCIe:tä markkinoinut infinity fabriccina?

Ravenin yhteydessä.

_j03_ · 07.06.2018

Melko jytky tuo wraith ripper vakiocooleriksi

Melbac · 07.06.2018

Toi alkaa jo näyttämään oikealta jäähyltä jota ei tarvitse vaihtaa jos tuuletin on vielä hiljainen.Toihan taitaa olla parempi kuin osa erikseen ostettavista heatsinkeistä noiden heatpipe? määrän perusteella.

Griffin · 07.06.2018

_j03_ sanoi:
Melko jytky tuo wraith ripper vakiocooleriksi

Pirun tiheä ripa ja kun tuuletin on tuolla välissä, niin se ei saa oikein mitään muuta, kuin mekkalaa aikaan, koska imupuolella on este.

zepi · 07.06.2018

Diglo1 sanoi:
AMD kumminkin piti 32 yitimisen viileänä ilmajäähyllä, mutta kellot varmasti oli jossain 3,6-3,8ghz kieppeillä.
Käytännössä kumpikaan prosessoreista tuskin pystyy pitämään kelloja yli 4ghz tuolla ydinmäärällä. AMDlla toki on nyt etuna se, että prosessori binnataan kootaan parhaista Ryzen 2 siruista ja virrankulutus saadaan alas paljon tehokkaammin, kuin Intelin massiivisella 28 sirulla.

Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.

L2K2 · 07.06.2018

Griffin sanoi:
Pirun tiheä ripa ja kun tuuletin on tuolla välissä, niin se ei saa oikein mitään muuta, kuin mekkalaa aikaan, koska imupuolella on este.

Eräällä toisella foorumilla tätä ilmiötä kutsutaan CFD-silmiksi, siis että näkee (laskennallista) virtausmekaniikkaa paljain silmin.

Itse en uskaltaisi tyrmätä tuota pelkästään ulkonäön perusteella äänekkääksi. Tiheämpi rivoitus ei liene sattumaa, kuten ei myöskään tuo tavanomaista isompi lämpöputkien määrä. Tuolla välissä oleva tuuletin lienee myös saman linjan jatkoa: pienempi virtaus riittää samaan jäähdytystehoon kun pinta-alaa on enemmän. Toki sen tuulettimen pitää kyetä tuottamaan isompi paine-ero saadakseen sen virtauksen aikaan, mutta se on vaan lapojen määrän ja muodon tehtävä.

hkultala · 07.06.2018

Sami Riitaoja sanoi:
Pakkohan sen on olla 1-kanava per lastu

Ei ole mikään pakko

, tuollaisella 2+2 configuraatiolla AMD olisi tehnyt prosessorin jolle pitää tehdä täysin omat NUMA-optimointinsa - eikä optimitilanteessakaan saataisi kunnon suorituskykyä ulos.

Ei, vaan 2+2 mahdollistaa paremman suorituskyvyn silloin kun on maksimissaan 16 ydintä käytössä.

Ja mitään ongelmaa toteuttaa 1-kanava per lastu muistikonfiguraatiota tuskin on, tuskin AMD haluaa Threadripperissä hyödyntää ytimiä joissa kumpikin muistiohjain on rikki.

Jätät nyt jälleen kerran huomioitta sen, että muistikaista ei ole mitään "nestettä joka valuu minne tahansa" vaan jokainen muistiaccess tehdään aina johonkin tiettyyn osoitteeseen josta dataa halutaan. Muistikanavat jotka on kytketty osoitteisiin, joista accesseja ei tehdä idlaa, vaikka toiset musitikanavat olisi kuinka täystyöllistettyjä tahansa.

Ja sillä, miten muistiosoitteet on eri kanaviin jaettu on hyvin paljon väliä sen kannalta, millaisia keskimääräisiä muistikaistoja ja viiveitä saadaan.

Alkuperäisessä threadripperissä oli kaksi eri moodia muistin lomittamiseksi eri piilastujen välille

1) Interleavaus piilastujen välillä korkeiden bittien mukaan, "NUMA mode". Alemmat muistiosoitteet yhdellä piilastulla, korkeat osoitteet toisella piilastulla. Kun softa ja käyttis oli NUMA-aware, kukin ydin käytti pääasiallisesti oman piilastun musitiohjainta, keskimäärin hyvä latenssi. Mutta: Kun ajettiin vaikka yhtä 8 ydintä käyttävää softaa, joka käytti vain alinta tai ylintä puolikasta muistista, jäi toisen piilastun muistikaista käyttämättä.

2) Interleavaus matalien bittien mukaan. "UMA mode". Jokainen 64 tavun välimuistilinja on vuorotellen omassa muistikanavassaan, kun accessoidaan 256 tavua muistia peräkkäisistä osooitteista, käytetään kaikkia järjestelmän muistikanavia. Mitkään NUMA-optimoinnit ei ole mahdollisia, puolet accesseista menee aina toisen piilastun muistiohjaimen kautta. Mutta kaikki softat saa triviaalisti kaiken muistikaistan käyttöönsä.

4-piilastuisen version kanssa neljällä muistikanavalla tarkasteltavia vaihtoehtoja on siis 4 kpl:

1) 1+1+1+1 hi-bit interleave
2) 1+1+1+1 lo-bit interleave
3) 2+2+0+0 hi-bit interleave
4) 2+2+0+0 lo-bit interleave

Vaihtoehto 1 on aivan normaali neljän noden "perinteinen NUMA" ja olemassaolevat NUMA-optimoinnit toimivat sille heittämällä. Tässä vaihtoehdossa kuitenkin yhden vähemmän ytimia käyttävän softan muistikaista on rajoittunut YHTEEN muistikanavaan, kun muissa muistikanavissa on vain sellaista muistia, mitä se softa ei käytä.

Vaihtoehdossa 2 75% muistiaccesseista menee aina muiden piilastujen muistikanavien kautta, mikä aiheuttaa huomattavan lisäviiveen kaikkeen. Vähänkin ytimiä käyttäville softille on kuitenkin täydet 4 muistikanavaaa käytössä.

Vaihtoehdot 3 ja 4 käytännössä tarkoittavat sitä, että käyttiksen skedulerin kannattaa suosia niitä ytimiä, joiden piilastuihin on muistia kytketty.

Vaihtoehto 3 tarkoittaa sitä, että NUMA-optimointien kanssa 16 ytimelle saadaan suurin osa muistiaccesseista menemään omaan nopeaan muistiin, ja vähemmän ytimiä käyttäjien softien muistikaista on rajoitettu kahteen muistikanavaan(ei paha rajoitus). Sitten jos tarvii ottaa enemmän kuin 16 ydintä käyttöön, näille ytimille muistinkäyttö on hitaampaa, aina toisen piilastun kautta.

Vaihtoehto 4 tarkoittaa sitä, että 16 ensimmäiselle ytimelle aina puolet muistiaccesseista menee omaan muistiin ja puolet toisen piilastun muistiin, ja seuraaville 16 ytimelle kaikki accessit menee toisen piilastun kautta. Vähänkin ytimiä käyttäville softille on täydet 4 muistikanavaaa käytössä.

Eli siis, mikäli usein on käytössä workloadeja joissa säikeitä on käytössä 16 tai alle, 2+2+0+0 on parempi konfiguraatio (hi vs lo sen mukaan, onko tärkeämpää viive vai kaista)
Jos taas optimoidaan nimenomaan nimenomaan täyden säiemäärän suorituskykyä eikä yhden säikeen suorituskyvyllä ole väliä, mutta softat ja käyttis on NUMA-optimoituja, 1+1+1+1 hi-bit on paras konfiguraatio.

demu · 07.06.2018

zepi sanoi:
Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.

Threadripperin kohdalla lukee turbokelloissa WIP (work in progress), eli eivät välttämättä lopullisia kelloja.

demu · 07.06.2018

hkultala sanoi:
Ei ole mikään pakko

Ei, vaan 2+2 mahdollistaa paremman suorituskyvyn silloin kun on maksimissaan 16 ydintä käytössä.

Jätät nyt jälleen kerran huomioitta sen, että muistikaista ei ole mitään "nestettä joka valuu minne tahansa" vaan jokainen muistiaccess tehdään aina johonkin tiettyyn osoitteeseen josta dataa halutaan. Muistikanavat jotka on kytketty osoitteisiin, joista accesseja ei tehdä idlaa, vaikka toiset musitikanavat olisi kuinka täystyöllistettyjä tahansa.

Ja sillä, miten muistiosoitteet on eri kanaviin jaettu on hyvin paljon väliä sen kannalta, millaisia keskimääräisiä muistikaistoja ja viiveitä saadaan.

Alkuperäisessä threadripperissä oli kaksi eri moodia muistin lomittamiseksi eri piilastujen välille

1) Interleavaus piilastujen välillä korkeiden bittien mukaan, "NUMA mode". Alemmat muistiosoitteet yhdellä piilastulla, korkeat osoitteet toisella piilastulla. Kun softa ja käyttis oli NUMA-aware, kukin ydin käytti pääasiallisesti oman piilastun musitiohjainta, keskimäärin hyvä latenssi. Mutta: Kun ajettiin vaikka yhtä 8 ydintä käyttävää softaa, joka käytti vain alinta tai ylintä puolikasta muistista, jäi toisen piilastun muistikaista käyttämättä.

2) Interleavaus matalien bittien mukaan. "UMA mode". Jokainen 64 tavun välimuistilinja on vuorotellen omassa muistikanavassaan, kun accessoidaan 256 tavua muistia peräkkäisistä osooitteista, käytetään kaikkia järjestelmän muistikanavia. Mitkään NUMA-optimoinnit ei ole mahdollisia, puolet accesseista menee aina toisen piilastun muistiohjaimen kautta. Mutta kaikki softat saa triviaalisti kaiken muistikaistan käyttöönsä.

4-piilastuisen version kanssa neljällä muistikanavalla tarkasteltavia vaihtoehtoja on siis 4 kpl:

1) 1+1+1+1 hi-bit interleave
2) 1+1+1+1 lo-bit interleave
3) 2+2+0+0 hi-bit interleave
4) 2+2+0+0 lo-bit interleave

Vaihtoehto 1 on aivan normaali neljän noden "perinteinen NUMA" ja olemassaolevat NUMA-optimoinnit toimivat sille heittämällä. Tässä vaihtoehdossa kuitenkin yhden vähemmän ytimia käyttävän softan muistikaista on rajoittunut YHTEEN muistikanavaan, kun muissa muistikanavissa on vain sellaista muistia, mitä se softa ei käytä.

Vaihtoehdossa 2 75% muistiaccesseista menee aina muiden piilastujen muistikanavien kautta, mikä aiheuttaa huomattavan lisäviiveen kaikkeen. Vähänkin ytimiä käyttäville softille on kuitenkin täydet 4 muistikanavaaa käytössä.

Vaihtoehdot 3 ja 4 käytännössä tarkoittavat sitä, että käyttiksen skedulerin kannattaa suosia niitä ytimiä, joiden piilastuihin on muistia kytketty.

Vaihtoehto 3 tarkoittaa sitä, että NUMA-optimointien kanssa 16 ytimelle saadaan suurin osa muistiaccesseista menemään omaan nopeaan muistiin, ja vähemmän ytimiä käyttäjien softien muistikaista on rajoitettu kahteen muistikanavaan(ei paha rajoitus). Sitten jos tarvii ottaa enemmän kuin 16 ydintä käyttöön, näille ytimille muistinkäyttö on hitaampaa, aina toisen piilastun kautta.

Vaihtoehto 4 tarkoittaa sitä, että 16 ensimmäiselle ytimelle aina puolet muistiaccesseista menee omaan muistiin ja puolet toisen piilastun muistiin, ja seuraaville 16 ytimelle kaikki accessit menee toisen piilastun kautta. Vähänkin ytimiä käyttäville softille on täydet 4 muistikanavaaa käytössä.

Eli siis, mikäli usein on käytössä workloadeja joissa säikeitä on käytössä 16 tai alle, 2+2+0+0 on parempi konfiguraatio (hi vs lo sen mukaan, onko tärkeämpää viive vai kaista)
Jos taas optimoidaan nimenomaan nimenomaan täyden säiemäärän suorituskykyä eikä yhden säikeen suorituskyvyllä ole väliä, mutta softat ja käyttis on NUMA-optimoituja, 1+1+1+1 hi-bit on paras konfiguraatio.

Voisiko olla mahdollista sellainen kombinaatio, että kaikissa piireissä olisi kaksikanavainen muistiohjain käytössä.
Muistikanavat jaettaisiin tyyliin: 2 hi-bit + 2 lo-bit + 2 high bit + 2 lo-bit?
Vaatisi ehkä jonkun bridge-sirun tms. väliin, jonne johdotettaisiin aina kahden piirin muistilinjat + mahdollisesti uuden NUMA-moodin.

jive · 07.06.2018

Sami Riitaoja sanoi:
Pakkohan sen on olla 1-kanava per lastu, tuollaisella 2+2 configuraatiolla AMD olisi tehnyt prosessorin jolle pitää tehdä täysin omat NUMA-optimointinsa - eikä optimitilanteessakaan saataisi kunnon suorituskykyä ulos. Ja mitään ongelmaa toteuttaa 1-kanava per lastu muistikonfiguraatiota tuskin on, tuskin AMD haluaa Threadripperissä hyödyntää ytimiä joissa kumpikin muistiohjain on rikki.

Kokoonpanoissa on puolensa ja puolensa. Muistikaista on 2+2 maksimissaan sama kuin ykkösversiossa 4x1 versiossa puolet siitä. 1x4 takaisi suurimman teoreettisen kaistan mutta pienimmälle määrälle ytimiä ilman NUMAn aiheuttamaa rasitetta. Ääripäät ovat tasaisin suorituskyky tai hyvin kuormariippuvainen suorituskyky. 2+2 yhdistelmä kuulostaa ymmärrettävältä kompromissilta.

hkultala · 07.06.2018

demu sanoi:
Voisiko olla mahdollista sellainen kombinaatio, että kaikissa piireissä olisi kaksikanavainen muistiohjain käytössä.
Muistikanavat jaettaisiin tyyliin: 2 hi-bit + 2 lo-bit + 2 high bit + 2 lo-bit?

Ei toimi näin.

Muistiosoitteet on yhteisiä koko systeemille, Jollain muistipiirillä on joku tavu ja sen tavun osoitteen on oltava sama kaikille piilastuille, kaikille ytimille.
Saman fyysisen muistiosoitteen tarvii osoittaa aina samoja fyysisiä muistikammalla olevia soluja riippumatta siitä, kuka siihen osoitteeseen viittaa.

Se logiikka, miten ne fyysiset muistisolut mapataan niihin eri piireillä oleviin fyysisiin muistisoluihin voidaan valita (vapaasti etukäteen), mutta sitä ei voi vaihtaa koneen ollessa käynnissä.

Valitseminen voidaan siis tehdä siten että tietty logiikka joko kovakoodataan siihen muistiohjaimeen(*) sitä suunnitellessa, tai että muistiohjain(*) on konfiguroituva, ja konetta bootessa (ennen kuin koneen muistiin on kirjoitettu mitään oikeaa dataa, valitaan se muistiohjaimen(*) moodi). Ryzenin (kuten käytännössä kaikkein muidenkin yhtään modernien piirien) muistiohjain(*) tukee bootissa uudelleenkonfigurointia.

Vaatisi ehkä jonkun bridge-sirun tms. väliin, jonne johdotettaisiin aina kahden piirin muistilinjat + mahdollisesti uuden NUMA-moodin.

Mikä tahansa realistinen siltapiiri tarkoittaisi käytännössä sitä samaa lisäviivettä joka tulee liikenteen kierrättämisestä toisen piilastun kautta, ei senkään puolesta mitään järkeä.

Ja jos halutaan vaan vaihtaa 2-2-0-0 hi ja 2-2-0-0 lo-moodien välilä, siihen ei tarvi mitään lisäpiiriä. Niiden välillä voi vaihtaa konetta rebootatessa.

Periaatteessa hibernate-tilassa käyminen riittää, koska hibernate on raudan kannalta ihan täysin koneen sammutus ja kaikki muistin sisältö talletetaan levylle ja ladataan uusiksi.

(*) tässä muistiohjain ei viittaa pelkästään siihen matalan tason DDR4-ohjaimeen joka on joka kanavalle erikseen, vai yleisesti ottaen myös siihen logiikkaan joka huolehtii datan reitittämisestä oikeaan paikkaan piirillä ja piirien välillä. Oikeampi termi olisi ehkä "järjestelmäagentti"(system agent).

Griffin · 07.06.2018

L2K2 sanoi:
Eräällä toisella foorumilla tätä ilmiötä kutsutaan CFD-silmiksi, siis että näkee (laskennallista) virtausmekaniikkaa paljain silmin.

Itse en uskaltaisi tyrmätä tuota pelkästään ulkonäön perusteella äänekkääksi. Tiheämpi rivoitus ei liene sattumaa, kuten ei myöskään tuo tavanomaista isompi lämpöputkien määrä. Tuolla välissä oleva tuuletin lienee myös saman linjan jatkoa: pienempi virtaus riittää samaan jäähdytystehoon kun pinta-alaa on enemmän. Toki sen tuulettimen pitää kyetä tuottamaan isompi paine-ero saadakseen sen virtauksen aikaan, mutta se on vaan lapojen määrän ja muodon tehtävä.

Ei sitä ilmavirtaa näe! MUTTA sen voi kokeilla. Tuota, miten tuulettimen käyttäytyvän esteiden lähellä on tullut kokeiltua muutama kerta vuosien aikana itse ja testien perusteella tuontyyppinen este tuulettimen imupuolella on ilmavirran kannalta erittäin huono juttu kaikissa tapauksissa. Jos tuuletin on sopiva, niin puhalluspuolella ongelma on erittäinpaljon paljon pienempi. Imupuolella ei pitäisi olla mitään hyvin ohutta lankaritilää lukuunottamatta 3 senttiä lähempänä 120 millistä tuuletinta.

Toinen ongelma, mille tuollainen hyvin tiheä siili on melko altis on siilin pölystyminen ja tällöin tapahtuva jäähdytystehon lasku (tämäkin on ihan käytännössä vuosien aikana havaittu ilmiö, kun käytössä on ollut jo yli 10 vuotta erinäisissä itse kasatuissa pöytäkoneissa tuulettimenohjaimia, jotka mittaavat siilin lämpötilaa ja säätävät tuuletinta sen mukaan.) Itse hylkäsin nuo hyvin tiheät siilit kokonaan kyseisestä syystä.

Itse jokatapauksessa nakkaisin tuulettimen tuosta välistä mäkeen ja pistäisin tn puhaltamaan siihen reunalta ja keskelle vain kotelointi. Ja ilmatunneli kopan takatuularille, joka imemään vielä ulos.

Sampsa · 07.06.2018

zepi sanoi:
Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.

demu sanoi:
Threadripperin kohdalla lukee turbokelloissa WIP (work in progress), eli eivät välttämättä lopullisia kelloja.

Nämä oli tosiaan noissa Computex-demokokoonpanoissa käytetyt kellot, ei vielä lopulliset. Jotain hienosäätöä luvassa varmaan siis vielä kohti julkaisua, mutta jossain tuolla 3-3,5 GHz kaikkien ytimien kellot ja 1-2 ytimellä turbolla sitten varmaan lähempänä 4 GHz.

hkultala · 07.06.2018

The Stilt sanoi:
Ravenin yhteydessä.

Onko Raven Ridgen sisäistä väylärakennetta selitetty jossain julkisessa dokumentissa, vai vaan NDAn alla jaetuissa?

Kaotik · 07.06.2018

hkultala sanoi:
Onko Raven Ridgen sisäistä väylärakennetta selitetty jossain julkisessa dokumentissa, vai vaan NDAn alla jaetuissa?

Kuulostaa kyllä erikoiselta että ne kommunikoisi keskenään pcien yli yhtäkkiä, en muista yhdenkään APUn kohdalta juttua tuollaisesta

hkultala · 07.06.2018

Kaotik sanoi:
Kuulostaa kyllä erikoiselta että ne kommunikoisi keskenään pcien yli yhtäkkiä, en muista yhdenkään APUn kohdalta juttua tuollaisesta

Minä taas nimenomaan muistan että joissain vanhoissa APUissa(mm. trinity) oli jotain ihan hämärää väyläratkaisua, jossa GPU- ja CPU-puolilla oli hyvin erilliset väylänsä sille matalan tason DRAM-ohjaimelle asti, ja esim. samaa muistiosoitetta ei voinut ollenkaan suoraan käsitellä molemmilta puolilta, vaan jos CPU halusi lähettää dataa GPUlle kuuluvalle muistialueelle, CPUn piti lähettää se sinne muistiin GPU-puolen kautta. Ja se CPUta ja GPUta yhdistävä väylä saattoi olla joku piirin sisäinen pcie/softan näkökulmasta olla pcie.

Tuollainen löytyi pikaisesti, AMDn omaa slideä en löytänyt

Eli siis, vaikka CPU- ja GPU-puolet oikeasti käyttivät samoja muistikampoja, se näytti softalle(mukaanlukien ajurit) siltä, kuin niillä olisi ollut täysin erilliset muistit aivan kuten erillis-GPUissa.

edit: löytyi vihdoin RWTn juttu tuosta:

AMD Fusion Architecture and Llano

Mutta olisin odottanut, että tästä olisi luovuttu siinä vaiheessa kun Kaverissa näistä yritettiin tehdä keskenään välimuistikoherentteja(siinä onnistumatta, sinne jäi joku fataali bugi, joka carrizossa lopulta korjattiin, vasta carrizo oli oikeasti välimuistikoherentti CPUn ja GPUn välillä. Hienosti siis Kaverissa ennen julkaisua hypetettiin sitä välimuistikoherenttiutta ja sitten jossain vaiheessa vaan hiljaisesti "unohdettiin" se kun tajuttiin, ettei se toimikaan täydellisesti)

Diglo1 · 07.06.2018

zepi sanoi:
Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.

No joo oikeassa olit, en ollut tuota ehtinyt vielä lukemaan, mutta nuo kellot eivät ole vielä viralliset. Zen+ kyeten helposti +4ghz 1-2core turboihin ja koska ryzen muutenkin on energiatehokas 3,5ghz tietämillä ja 12nm tätä edesauttaa vielä lisää, on itselle melko ihme jos ei 250w TDP kykene samoihin kelloihin kuin 1950x. Kumminkin parhast binnit menee noihin.

Terevis · 07.06.2018

Ei pyöri edes crysis liian huono yhden ytimen suorituskyky. Intel hakkaa maanrakoon.

BlackWolf · 07.06.2018

Griffin sanoi:
Ei sitä ilmavirtaa näe! MUTTA sen voi kokeilla. Tuota, miten tuulettimen käyttäytyvän esteiden lähellä on tullut kokeiltua muutama kerta vuosien aikana itse ja testien perusteella tuontyyppinen este tuulettimen imupuolella on ilmavirran kannalta erittäin huono juttu kaikissa tapauksissa. Jos tuuletin on sopiva, niin puhalluspuolella ongelma on erittäinpaljon paljon pienempi. Imupuolella ei pitäisi olla mitään hyvin ohutta lankaritilää lukuunottamatta 3 senttiä lähempänä 120 millistä tuuletinta.

Toinen ongelma, mille tuollainen hyvin tiheä siili on melko altis on siilin pölystyminen ja tällöin tapahtuva jäähdytystehon lasku (tämäkin on ihan käytännössä vuosien aikana havaittu ilmiö, kun käytössä on ollut jo yli 10 vuotta erinäisissä itse kasatuissa pöytäkoneissa tuulettimenohjaimia, jotka mittaavat siilin lämpötilaa ja säätävät tuuletinta sen mukaan.) Itse hylkäsin nuo hyvin tiheät siilit kokonaan kyseisestä syystä.

Itse jokatapauksessa nakkaisin tuulettimen tuosta välistä mäkeen ja pistäisin tn puhaltamaan siihen reunalta ja keskelle vain kotelointi. Ja ilmatunneli kopan takatuularille, joka imemään vielä ulos.

No onhan nyt vesijäähyissä noita push/pull mallisia tuulettimia käytössä ja tiheät rivat. Tuulettimien rakenne vain on silloin erilainen. Minä en ainakaan ole kuullut että missään olisi ollut testejä missä verrattaisiin jäähdytystehoa, ääntä yms. eri tuuletintyypeillä. On ihan eri asia suunnitella se tuuletin olemaan paine tuuletin, kuin olemaan ilmavirran liikuttaja. Sitten on toki ns. hybrideitä siinä välissä.

Etukäteen rivaston tiheyden merkitystä on aika mahdoton sanoa. Enemmän ilmavirtaa ja harvemmat rivastot voi myös olla ihan vain tuuletinvalmistajien kompromissi valmistushinnan ja katteen välillä. Se ei tee siitä automaattisesti parempaa kuin jokin toinen malli. Tai no ainakaan en ole törmännyt yhteenkään sivustoon missä olisi oikeasti testattu noita asioita, se kun olisi melko perhanan kallista touhua.

JiiPee · 07.06.2018

Terevis sanoi:
Ei pyöri edes crysis liian huono yhden ytimen suorituskyky. Intel hakkaa maanrakoon.

Jahas. Pistäppäs nyt sitten jotain faktaa tuon väitteen pohjaksi ettei crysis pyöri treadripper 2:lla. Vaikka joku testi kiitos.

_j03_ · 07.06.2018

JiiPee sanoi:
Jahas. Pistäppäs nyt sitten jotain faktaa tuon väitteen pohjaksi ettei crysis pyöri treadripper 2:lla. Vaikka joku testi kiitos.

Ei nyt jokaiseen trolliin kannata tarttua...

Nerkoon · 07.06.2018

Terevis sanoi:
Ei pyöri edes crysis liian huono yhden ytimen suorituskyky. Intel hakkaa maanrakoon.

Nyt faktat kehiin tai sitten saat siirtyä tänne trollaamaan:

Virallinen: AMD vs Intel keskustelu- ja väittelyketju

svk · 07.06.2018

Nerkoon sanoi:
Nyt faktat kehiin tai sitten saat siirtyä tänne trollaamaan:

Virallinen: AMD vs Intel keskustelu- ja väittelyketju

silti uskottavampi kuin ne intelin 5GHZ 28-ydinprosessorit :smoke:

AMD:lta esimakua 2. sukupolven Threadripper-prosessoreista - 32 ydintä

Sysop

Se ainoa oikea

Apua, avatarini on sormi!

System Specialist

Banhammer

Sysop

Banhammer

Deleted member 4604

Vieras (tunnus poistettu)

Hrrrr...

Banhammer

Deleted member 4604

Vieras (tunnus poistettu)

BANNATTU

Conducător & Geniul din Carpați

Conducător & Geniul din Carpați

Sysop

Banhammer

BANNATTU

Suomen Michael Jackson

Se ainoa oikea

Apua, avatarini on sormi!

Uutiset

Statistiikka

Hinta.fi