AMD:lta esimakua 2. sukupolven Threadripper-prosessoreista - 32 ydintä

Sampsa

Sysop
Ylläpidon jäsen
Team Tesla
Liittynyt
13.10.2016
Viestejä
12 585



Elokuussa julkaistavat uudet Threadripperit pohjautuvat samaan Zen+-päivitykseen kuin keväällä lanseeratut 2. sukupolven Ryzen-prosessorit ja piisirut valmistetetaan 12 nanometrin viivanleveydellä. Arkkitehtuuripuolella Zen+:ssa on viilattu muun muassa välimuistien ja keskusmuistin latensseja alhaisemmiksi ja uuden valmistusprosessin myötä kellotaajuuksia on saatu nostettua parilla sadalla megahertsillä ylöspäin.



AMD päivittää nykyiset 8-, 12- ja 16-ytimiset Threadripperit uuteen Zen+-arkkitehtuuriin ja samalla se paljasti tuovansa markkinoille myös uudet 24- ja 32-ytimiset mallit, joissa otetaan käyttöön aiemmin tyhjänpanttina olleet kaksi 8-ytimistä piisirua. Threadripperin MCM- eli Multi-chip Module -konfiguraatiossa on neljä 8-ytimistä piisirua sijoitettu hartsialustalle ja piisirut kommunikoivat keskenään Infinity Fabric -yhdysväylällä.

AMD on ilmoittanut 24- ja 32-ytimisen Threadripperin TDP-arvoksi 250 wattia ja sen kaveriksi on suunniteltu yhteistyössä Cooler Masterin kanssa uusi RGB-valaistu Wraith Ripper -vakiojäähdytys.

Intel kertoi eilen laajentavansa Core X -malliston vuoden lopulla 28-ytimiseksi, joten kilpailu HEDT-alustalla jatkuu kiivaana. Q3-julkaisullaan AMD on tuomassa markkinoille Inteliä aikaisemmin neljä ydintä enemmän ja oletettavasti hintalappu tulee olemaan huomattavasti edullisempi.

Lähde: AMD

Huom! Foorumiviestistä saattaa puuttua kuvagalleria tai upotettu video.

Linkki alkuperäiseen uutiseen (io-tech.fi)

Palautelomake: Raportoi kirjoitusvirheestä
 
Viimeksi muokattu:
Liittynyt
09.05.2017
Viestejä
84
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...
 
Liittynyt
27.02.2017
Viestejä
254
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...
Ja nämä kellot saavutettiin nestejäähytyksellä joka pakkasen puolella. Paketista ulos hyvä jos edes 4Ghz pääsee
 

Nerkoon

Se ainoa oikea
Platinum-jäsen
Liittynyt
18.10.2016
Viestejä
5 649
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...
Se 5GHz kello tehtiin järjettömän tehokkaalla ulkoisella jäähyllä. Koneen powerinkin teho oli 1000-1600W vähän lähteestä riippuen. Noilla spekseillä ei kannata suuremmin brassailla sillä 5GHz kellolla

Yhdellä sivulla oli kuvia siitä jäähdytysyksiköstä. Kokoa oli pienen jääkaapin verran ja laitteen väitettiin vievän kilowatin verran sähköä.
 

svk

Apua, avatarini on sormi!
Liittynyt
14.12.2016
Viestejä
2 810
Jos spoilerissa oleva tulee toteen, niin suorituskyky edellisen sukupolven TR:n verrattuna on kaukana kaksinkertaisesta suorituskyvystä samoilla kellotaajuuksilla.

 

Focus0

System Specialist
Liittynyt
01.12.2016
Viestejä
2 054
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...
OT: :facepalm:
Hyvä vitsi... keksippä toinen :rolleyes:
Helppo se on elvistellä ku toista ajettais ylikellotettuna ja toista vakiona. Laitetaas samat kellot molempiin ja puhutaan sit lisää. :vihellys:

Asiaan:
Luvut kuulostaa hyvältä. Kyllähän tää Intelin leirissä varmasti kohauttaa/kohautti.
Jännä nähdä miten hyvin tuo sykkii kun joskus testejä alkaa tulemaan. :nb:
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 565
Jos spoilerissa oleva tulee toteen, niin suorituskyky edellisen sukupolven TR:n verrattuna on kaukana kaksinkertaisesta suorituskyvystä samoilla kellotaajuuksilla.

Ei kai nyt kukaan kaksinkertaista suorituskykyä odota muutenkaan? Ei ne lineaarisesti yleensä skaalaa vaikka olisi kaikki piirit kaikkine kilkkeineen käytössä
 

Sampsa

Sysop
Ylläpidon jäsen
Team Tesla
Liittynyt
13.10.2016
Viestejä
12 585
Noniin pysytääs asialinjalla. Jos on jostain ulkomailta lukenut, että tuo Intelin 28-ytiminen tulisi 5 GHz kellotaajuuksilla myyntiin niin suosittelen tsekkaamaan faktat io-techin uutisesta ja palaamaan asiaan.
 
Liittynyt
02.03.2017
Viestejä
92


Kohdasta 0:45 näkee minkälainen pakastinpönttö vaaditaan Intelin 28core prossan jäähdytykseen. (ja tuossa ei edes testiä ajettu, varmaan oli paloturvallisempaa näyttää pelkkää screenshottia)
 

prc

Liittynyt
18.10.2016
Viestejä
874
Noniin pysytääs asialinjalla. Jos on jostain ulkomailta lukenut, että tuo Intelin 28-ytiminen tulisi 5 GHz kellotaajuuksilla myyntiin niin suosittelen tsekkaamaan faktat io-techin uutisesta ja palaamaan asiaan.
Kova veikkaus, ettei niistä lastuista kovin moni kulje demoa vastaavalla jäähdytykselläkään sitä 5:ttä kaikilla ytimillä vaikka mitä jänöjä nakkaisi sisään. Toinen veikkaus on, että thermal throttle tai TDP raja puuttu peliin aika äkkiä vähän paremmallakin ilmajäähyllä ja miedommilla kelloilla.

AMD ei toki maksimi taajuuksissa pääse kilpailemaan siltikään, tosin ei noita kyllä pelaamiseen ole tehty, että varmasti molemmat hiton hyviä lastuja niille suunniteltuihin käyttötarkoituksiin työasemasoftissa. Pitkäkestoisilla työkuormilla voi tulla mielenkiintoinen tilanne, toivottavasti joku sellasia testejä ajaa. AMD:n julmetun iso lastu juotoksineen on ilmajäähyille huomattavasti helpompi.

Liekköhän menee osa TR jäähyistä uusiksi?! Omassa duunityöasemassa (1920x) näyttäisi jäähy siltä, että ei välttämättä ihan osu kohdilleen niiden dummy diejen kanssa. 2. gen TR:ssä se olisi siis susipaska jäähy. Vieläkun muistaisi minkä jäähyn siihen valitsin viime syksynä. :D
 
Liittynyt
21.06.2017
Viestejä
7 027
Jos spoilerissa oleva tulee toteen, niin suorituskyky edellisen sukupolven TR:n verrattuna on kaukana kaksinkertaisesta suorituskyvystä samoilla kellotaajuuksilla.

Niin siis eikös toi ole Anan näkemys asiasta?

Itte mietin tuossa jotta kovasti on noita PCI-E linjoja vapaana koska 64 tulee jatkossakin olemaan se mitä prossusta ulos annetaan kun taas vastaavassa EPYC:ssä niitä on 128. Eli tuli semmoinen hajatelma mieleen että voisikohan AMD mahdollisesti käyttää noita ylimääräisiä PCI-E linjoja kasvattamaan kaistaa tuolla zeppelinien välisessä IF:ssä?
@hkultala @The Stilt
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 565
Niin siis eikös toi ole Anan näkemys asiasta?

Itte mietin tuossa jotta kovasti on noita PCI-E linjoja vapaana koska 64 tulee jatkossakin olemaan se mitä prossusta ulos annetaan kun taas vastaavassa EPYC:ssä niitä on 128. Eli tuli semmoinen hajatelma mieleen että voisikohan AMD mahdollisesti käyttää noita ylimääräisiä PCI-E linjoja kasvattamaan kaistaa tuolla zeppelinien välisessä IF:ssä?
@hkultala @The Stilt
Olettaen että kyseessä on normit PCIe-linkit niin käytännössä ei taida olla mahdollista ainakaan mitenkään järkevästi rakentaa koherenttia yhteyttä piirien välille sen yli.
Sen sijaan itse mietin että onkohan tuossa tosiaan kahden sirun molemmat muistiohjaimet käytössä vai olisiko joka sirulla yksi muistiohjain käytössä?
 
D

Deleted member 4604

Vieras (tunnus poistettu)
Niin siis eikös toi ole Anan näkemys asiasta?

Itte mietin tuossa jotta kovasti on noita PCI-E linjoja vapaana koska 64 tulee jatkossakin olemaan se mitä prossusta ulos annetaan kun taas vastaavassa EPYC:ssä niitä on 128. Eli tuli semmoinen hajatelma mieleen että voisikohan AMD mahdollisesti käyttää noita ylimääräisiä PCI-E linjoja kasvattamaan kaistaa tuolla zeppelinien välisessä IF:ssä?
@hkultala @The Stilt
"IF" on kyllä markkinoinnin saralla sen luokan saatanan emämunaus, että ei jumalauta.
Ei ole olemassa mitään yhtä linkkiä, AMD käyttää samaa nimeä mm. SDF:lle (ytimen sisäinen), GMI (ytimien välinen, SR), xGMI (ytimien välinen, LR) sekä välillä myös PCI-E väylille.

MCM:llä ytimien välinen nopeus riippuu GMI:n leveydestä ja kellotaajuudesta.
GMI on kiinteä 2x 36-bit (64-bit + 8-bit virheenkorjaus) ja sen kellotaajuus on sidottu muistien kellotaajuuteen, kuten kaikkien muidenkin sisäisten SDF:n kytkeytyvien väylien.

3200MHz muistikellolla GMI:stä menee tavaraa läpi 51.2GB/s per GMI.
 

mRkukov

Hrrrr...
Liittynyt
17.10.2016
Viestejä
7 722
"IF" on kyllä markkinoinnin saralla sen luokan saatanan emämunaus, että ei jumalauta.
Ei ole olemassa mitään yhtä linkkiä, AMD käyttää samaa nimeä mm. SDF:lle (ytimen sisäinen), GMI (ytimien välinen, SR), xGMI (ytimien välinen, LR) sekä välillä myös PCI-E väylille.
Eli sehän on oikein hyvä markkinointitermi. Kuulostaa hyvältä, voidaan tunkea melkein mihin vain eikä itsessään paljasta yhtään mitään. :D
Teknisestä toteutuksesta kiinnostuneelle tietysti ärsyttävä termi, kun ei kerro periaatteessa mitään. :)
 
Liittynyt
22.10.2016
Viestejä
11 121
Olettaen että kyseessä on normit PCIe-linkit niin käytännössä ei taida olla mahdollista ainakaan mitenkään järkevästi rakentaa koherenttia yhteyttä piirien välille sen yli.
Sen sijaan itse mietin että onkohan tuossa tosiaan kahden sirun molemmat muistiohjaimet käytössä vai olisiko joka sirulla yksi muistiohjain käytössä?
Ilmeisesti ne ei ole pelkkiä PCIe-linkkejä vaan yhdistettyjä/multiplexattuja PCIE/IFIS-linkkejä, ja IFIS kyllä mahdollistaa välimuistikoherentin liikenteen.

Potentiaalisia ongelmia niiden hyödyntämiselle on kuitenkin kaksi:

1) Ei ole varmaa, salliiko reititysprotokollaa kahta eri linkkiä samojen piilastujen(tais siis SDF-tasojen) välillä.

2) Ongelma liikenteessä piilastujen välillä on enemmän viiveessä kuin kaistanleveydessä. Lisää rinnakkaisia reittejä datalle ei auta viiveeseen, autttaa vain kaistanleveyteen.


Jännä yksityiskohta on se, että zeppelin-piilastulla on IFOP-linkkejä 4 kpl eikä 3kpl, ja yksi IFOP-linkki on aina käyttämättä.
 
Liittynyt
22.10.2016
Viestejä
11 121
"IF" on kyllä markkinoinnin saralla sen luokan saatanan emämunaus, että ei jumalauta.
Ei ole olemassa mitään yhtä linkkiä, AMD käyttää samaa nimeä mm. SDF:lle (ytimen sisäinen), GMI (ytimien välinen, SR)
Tarkoititko nyt piilastua kun sanoit "ydin" ?
 
Liittynyt
09.02.2017
Viestejä
93
Mites noi muistiväylät sitten menee jos ja kun niitä on käytössä ainoastaan toi 4 kpl ? Onko se nyt sitten 1/1/1/1 vai 2/2? Viivettä tulee joka tapauksessa muistista hakemiseen.
 
Liittynyt
22.10.2016
Viestejä
11 121
Mites noi muistiväylät sitten menee jos ja kun niitä on käytössä ainoastaan toi 4 kpl ? Onko se nyt sitten 1/1/1/1 vai 2/2? Viivettä tulee joka tapauksessa muistista hakemiseen.
Anandtech sanoo, että 2+2. En tiedä, voiko tätä pitää 100% varmana faktana.
 
Liittynyt
22.10.2016
Viestejä
11 121
Ainakin Raven Ridgen tapauksessa itselle ei ole vieläkään selvinnyt onko se näytönohjain yhteydessä cpu-ytimiin pcie-llä vaiko if:llä ja onko niillä lopuksikaan eroa.
Sen muistiliikenne ei voi käytännössä kulkea PCIe:n yli.

Toki on mahdollista, että siellä on joku hassu "kolmiomallinen" väylärakenne jossa sekä CPU- että GPU-puolilla on nopea väylä muistiohjaimelle, mutta silti niiden välissä on myös pcie, lähinnä softayhteensopivuussyistä tms.
 
Viimeksi muokattu:

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 565
Ainakin Raven Ridgen tapauksessa itselle ei ole vieläkään selvinnyt onko se näytönohjain yhteydessä cpu-ytimiin pcie-llä vaiko if:llä ja onko niillä lopuksikaan eroa.
Ei siellä APU-piirin sisällä ole ikinä mitään PCIe-yhteyksiä käytetty GPUhun

Anandtech sanoo, että 2+2. En tiedä, voiko tätä pitää 100% varmana faktana.
Tosin vain heidän arvauksena, tekevät sen selväksi ettei kyse ole mistään virallisesta infosta
 
Liittynyt
03.01.2018
Viestejä
576
Pakkohan sen on olla 1-kanava per lastu, tuollaisella 2+2 configuraatiolla AMD olisi tehnyt prosessorin jolle pitää tehdä täysin omat NUMA-optimointinsa - eikä optimitilanteessakaan saataisi kunnon suorituskykyä ulos. Ja mitään ongelmaa toteuttaa 1-kanava per lastu muistikonfiguraatiota tuskin on, tuskin AMD haluaa Threadripperissä hyödyntää ytimiä joissa kumpikin muistiohjain on rikki.
 
Liittynyt
17.01.2017
Viestejä
1 125
Intel tarjoaa 28 ydintä jossa kaikki ovat 5Ghz kelloista... AMD:lla on 4 ydintä enemmän ja ovat myös 4Ghz tietämillä, joten Intel vie voiton suoritusteholtaan... kysymykseksi jää kuinka monta epyc 64ydin/128säikeillä olevaa tietokonetta voi ostaa...
5GHz on paras skenaario mihin Intel tulee noilla kivillä pääsemään. Varsinaiset kellot eivät tule varmasti olemaan yli 4,5GHz ja kaikilla ytimillä hyvä jos pysyvät 3,5ghz tietämillä.
5GHz saavutettiin kompuralla ja vesi oli lähempänä nollaa kuin huoneen lämpötilaa. Intelin i9 7980XE saavutti 5ghz 18 yitimellä yli 1kw virrankulutuksen ja huonommin binnattu 28 ytiminen 5ghz vie helposti yli 1kw ja tuo 1,6kw powerikin oli varmasti äärirajoilla. Järeä ulkoinen jäähdytin varmasti pienensi virrankulutusta huomattavasti, mutta kompura syö itsessään jo ihan sikana virtaa.
AMD kumminkin piti 32 yitimisen viileänä ilmajäähyllä, mutta kellot varmasti oli jossain 3,6-3,8ghz kieppeillä.
Käytännössä kumpikaan prosessoreista tuskin pystyy pitämään kelloja yli 4ghz tuolla ydinmäärällä. AMDlla toki on nyt etuna se, että prosessori binnataan kootaan parhaista Ryzen 2 siruista ja virrankulutus saadaan alas paljon tehokkaammin, kuin Intelin massiivisella 28 sirulla.
 

Melbac

BANNATTU
BANNED
Liittynyt
19.10.2016
Viestejä
3 544
Toi alkaa jo näyttämään oikealta jäähyltä jota ei tarvitse vaihtaa jos tuuletin on vielä hiljainen.Toihan taitaa olla parempi kuin osa erikseen ostettavista heatsinkeistä noiden heatpipe? määrän perusteella.:):kahvi:
 
Liittynyt
17.10.2016
Viestejä
12 025
AMD kumminkin piti 32 yitimisen viileänä ilmajäähyllä, mutta kellot varmasti oli jossain 3,6-3,8ghz kieppeillä.
Käytännössä kumpikaan prosessoreista tuskin pystyy pitämään kelloja yli 4ghz tuolla ydinmäärällä. AMDlla toki on nyt etuna se, että prosessori binnataan kootaan parhaista Ryzen 2 siruista ja virrankulutus saadaan alas paljon tehokkaammin, kuin Intelin massiivisella 28 sirulla.
Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.
 
Liittynyt
17.10.2016
Viestejä
1 020
Pirun tiheä ripa ja kun tuuletin on tuolla välissä, niin se ei saa oikein mitään muuta, kuin mekkalaa aikaan, koska imupuolella on este.
Eräällä toisella foorumilla tätä ilmiötä kutsutaan CFD-silmiksi, siis että näkee (laskennallista) virtausmekaniikkaa paljain silmin.

Itse en uskaltaisi tyrmätä tuota pelkästään ulkonäön perusteella äänekkääksi. Tiheämpi rivoitus ei liene sattumaa, kuten ei myöskään tuo tavanomaista isompi lämpöputkien määrä. Tuolla välissä oleva tuuletin lienee myös saman linjan jatkoa: pienempi virtaus riittää samaan jäähdytystehoon kun pinta-alaa on enemmän. Toki sen tuulettimen pitää kyetä tuottamaan isompi paine-ero saadakseen sen virtauksen aikaan, mutta se on vaan lapojen määrän ja muodon tehtävä.
 
Liittynyt
22.10.2016
Viestejä
11 121
Pakkohan sen on olla 1-kanava per lastu
Ei ole mikään pakko

, tuollaisella 2+2 configuraatiolla AMD olisi tehnyt prosessorin jolle pitää tehdä täysin omat NUMA-optimointinsa - eikä optimitilanteessakaan saataisi kunnon suorituskykyä ulos.
Ei, vaan 2+2 mahdollistaa paremman suorituskyvyn silloin kun on maksimissaan 16 ydintä käytössä.

Ja mitään ongelmaa toteuttaa 1-kanava per lastu muistikonfiguraatiota tuskin on, tuskin AMD haluaa Threadripperissä hyödyntää ytimiä joissa kumpikin muistiohjain on rikki.
Jätät nyt jälleen kerran huomioitta sen, että muistikaista ei ole mitään "nestettä joka valuu minne tahansa" vaan jokainen muistiaccess tehdään aina johonkin tiettyyn osoitteeseen josta dataa halutaan. Muistikanavat jotka on kytketty osoitteisiin, joista accesseja ei tehdä idlaa, vaikka toiset musitikanavat olisi kuinka täystyöllistettyjä tahansa.

Ja sillä, miten muistiosoitteet on eri kanaviin jaettu on hyvin paljon väliä sen kannalta, millaisia keskimääräisiä muistikaistoja ja viiveitä saadaan.


Alkuperäisessä threadripperissä oli kaksi eri moodia muistin lomittamiseksi eri piilastujen välille

1) Interleavaus piilastujen välillä korkeiden bittien mukaan, "NUMA mode". Alemmat muistiosoitteet yhdellä piilastulla, korkeat osoitteet toisella piilastulla. Kun softa ja käyttis oli NUMA-aware, kukin ydin käytti pääasiallisesti oman piilastun musitiohjainta, keskimäärin hyvä latenssi. Mutta: Kun ajettiin vaikka yhtä 8 ydintä käyttävää softaa, joka käytti vain alinta tai ylintä puolikasta muistista, jäi toisen piilastun muistikaista käyttämättä.

2) Interleavaus matalien bittien mukaan. "UMA mode". Jokainen 64 tavun välimuistilinja on vuorotellen omassa muistikanavassaan, kun accessoidaan 256 tavua muistia peräkkäisistä osooitteista, käytetään kaikkia järjestelmän muistikanavia. Mitkään NUMA-optimoinnit ei ole mahdollisia, puolet accesseista menee aina toisen piilastun muistiohjaimen kautta. Mutta kaikki softat saa triviaalisti kaiken muistikaistan käyttöönsä.


4-piilastuisen version kanssa neljällä muistikanavalla tarkasteltavia vaihtoehtoja on siis 4 kpl:

1) 1+1+1+1 hi-bit interleave
2) 1+1+1+1 lo-bit interleave
3) 2+2+0+0 hi-bit interleave
4) 2+2+0+0 lo-bit interleave

Vaihtoehto 1 on aivan normaali neljän noden "perinteinen NUMA" ja olemassaolevat NUMA-optimoinnit toimivat sille heittämällä. Tässä vaihtoehdossa kuitenkin yhden vähemmän ytimia käyttävän softan muistikaista on rajoittunut YHTEEN muistikanavaan, kun muissa muistikanavissa on vain sellaista muistia, mitä se softa ei käytä.

Vaihtoehdossa 2 75% muistiaccesseista menee aina muiden piilastujen muistikanavien kautta, mikä aiheuttaa huomattavan lisäviiveen kaikkeen. Vähänkin ytimiä käyttäville softille on kuitenkin täydet 4 muistikanavaaa käytössä.


Vaihtoehdot 3 ja 4 käytännössä tarkoittavat sitä, että käyttiksen skedulerin kannattaa suosia niitä ytimiä, joiden piilastuihin on muistia kytketty.


Vaihtoehto 3 tarkoittaa sitä, että NUMA-optimointien kanssa 16 ytimelle saadaan suurin osa muistiaccesseista menemään omaan nopeaan muistiin, ja vähemmän ytimiä käyttäjien softien muistikaista on rajoitettu kahteen muistikanavaan(ei paha rajoitus). Sitten jos tarvii ottaa enemmän kuin 16 ydintä käyttöön, näille ytimille muistinkäyttö on hitaampaa, aina toisen piilastun kautta.

Vaihtoehto 4 tarkoittaa sitä, että 16 ensimmäiselle ytimelle aina puolet muistiaccesseista menee omaan muistiin ja puolet toisen piilastun muistiin, ja seuraaville 16 ytimelle kaikki accessit menee toisen piilastun kautta. Vähänkin ytimiä käyttäville softille on täydet 4 muistikanavaaa käytössä.


Eli siis, mikäli usein on käytössä workloadeja joissa säikeitä on käytössä 16 tai alle, 2+2+0+0 on parempi konfiguraatio (hi vs lo sen mukaan, onko tärkeämpää viive vai kaista)
Jos taas optimoidaan nimenomaan nimenomaan täyden säiemäärän suorituskykyä eikä yhden säikeen suorituskyvyllä ole väliä, mutta softat ja käyttis on NUMA-optimoituja, 1+1+1+1 hi-bit on paras konfiguraatio.
 
Viimeksi muokattu:

demu

Conducător & Geniul din Carpați
Tukijäsen
Liittynyt
20.10.2016
Viestejä
4 403
Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.
Threadripperin kohdalla lukee turbokelloissa WIP (work in progress), eli eivät välttämättä lopullisia kelloja.
 

demu

Conducător & Geniul din Carpați
Tukijäsen
Liittynyt
20.10.2016
Viestejä
4 403
Ei ole mikään pakko



Ei, vaan 2+2 mahdollistaa paremman suorituskyvyn silloin kun on maksimissaan 16 ydintä käytössä.



Jätät nyt jälleen kerran huomioitta sen, että muistikaista ei ole mitään "nestettä joka valuu minne tahansa" vaan jokainen muistiaccess tehdään aina johonkin tiettyyn osoitteeseen josta dataa halutaan. Muistikanavat jotka on kytketty osoitteisiin, joista accesseja ei tehdä idlaa, vaikka toiset musitikanavat olisi kuinka täystyöllistettyjä tahansa.

Ja sillä, miten muistiosoitteet on eri kanaviin jaettu on hyvin paljon väliä sen kannalta, millaisia keskimääräisiä muistikaistoja ja viiveitä saadaan.


Alkuperäisessä threadripperissä oli kaksi eri moodia muistin lomittamiseksi eri piilastujen välille

1) Interleavaus piilastujen välillä korkeiden bittien mukaan, "NUMA mode". Alemmat muistiosoitteet yhdellä piilastulla, korkeat osoitteet toisella piilastulla. Kun softa ja käyttis oli NUMA-aware, kukin ydin käytti pääasiallisesti oman piilastun musitiohjainta, keskimäärin hyvä latenssi. Mutta: Kun ajettiin vaikka yhtä 8 ydintä käyttävää softaa, joka käytti vain alinta tai ylintä puolikasta muistista, jäi toisen piilastun muistikaista käyttämättä.

2) Interleavaus matalien bittien mukaan. "UMA mode". Jokainen 64 tavun välimuistilinja on vuorotellen omassa muistikanavassaan, kun accessoidaan 256 tavua muistia peräkkäisistä osooitteista, käytetään kaikkia järjestelmän muistikanavia. Mitkään NUMA-optimoinnit ei ole mahdollisia, puolet accesseista menee aina toisen piilastun muistiohjaimen kautta. Mutta kaikki softat saa triviaalisti kaiken muistikaistan käyttöönsä.


4-piilastuisen version kanssa neljällä muistikanavalla tarkasteltavia vaihtoehtoja on siis 4 kpl:

1) 1+1+1+1 hi-bit interleave
2) 1+1+1+1 lo-bit interleave
3) 2+2+0+0 hi-bit interleave
4) 2+2+0+0 lo-bit interleave

Vaihtoehto 1 on aivan normaali neljän noden "perinteinen NUMA" ja olemassaolevat NUMA-optimoinnit toimivat sille heittämällä. Tässä vaihtoehdossa kuitenkin yhden vähemmän ytimia käyttävän softan muistikaista on rajoittunut YHTEEN muistikanavaan, kun muissa muistikanavissa on vain sellaista muistia, mitä se softa ei käytä.

Vaihtoehdossa 2 75% muistiaccesseista menee aina muiden piilastujen muistikanavien kautta, mikä aiheuttaa huomattavan lisäviiveen kaikkeen. Vähänkin ytimiä käyttäville softille on kuitenkin täydet 4 muistikanavaaa käytössä.


Vaihtoehdot 3 ja 4 käytännössä tarkoittavat sitä, että käyttiksen skedulerin kannattaa suosia niitä ytimiä, joiden piilastuihin on muistia kytketty.


Vaihtoehto 3 tarkoittaa sitä, että NUMA-optimointien kanssa 16 ytimelle saadaan suurin osa muistiaccesseista menemään omaan nopeaan muistiin, ja vähemmän ytimiä käyttäjien softien muistikaista on rajoitettu kahteen muistikanavaan(ei paha rajoitus). Sitten jos tarvii ottaa enemmän kuin 16 ydintä käyttöön, näille ytimille muistinkäyttö on hitaampaa, aina toisen piilastun kautta.

Vaihtoehto 4 tarkoittaa sitä, että 16 ensimmäiselle ytimelle aina puolet muistiaccesseista menee omaan muistiin ja puolet toisen piilastun muistiin, ja seuraaville 16 ytimelle kaikki accessit menee toisen piilastun kautta. Vähänkin ytimiä käyttäville softille on täydet 4 muistikanavaaa käytössä.


Eli siis, mikäli usein on käytössä workloadeja joissa säikeitä on käytössä 16 tai alle, 2+2+0+0 on parempi konfiguraatio (hi vs lo sen mukaan, onko tärkeämpää viive vai kaista)
Jos taas optimoidaan nimenomaan nimenomaan täyden säiemäärän suorituskykyä eikä yhden säikeen suorituskyvyllä ole väliä, mutta softat ja käyttis on NUMA-optimoituja, 1+1+1+1 hi-bit on paras konfiguraatio.
Voisiko olla mahdollista sellainen kombinaatio, että kaikissa piireissä olisi kaksikanavainen muistiohjain käytössä.
Muistikanavat jaettaisiin tyyliin: 2 hi-bit + 2 lo-bit + 2 high bit + 2 lo-bit?
Vaatisi ehkä jonkun bridge-sirun tms. väliin, jonne johdotettaisiin aina kahden piirin muistilinjat + mahdollisesti uuden NUMA-moodin.
 
Liittynyt
27.12.2016
Viestejä
1 843
Pakkohan sen on olla 1-kanava per lastu, tuollaisella 2+2 configuraatiolla AMD olisi tehnyt prosessorin jolle pitää tehdä täysin omat NUMA-optimointinsa - eikä optimitilanteessakaan saataisi kunnon suorituskykyä ulos. Ja mitään ongelmaa toteuttaa 1-kanava per lastu muistikonfiguraatiota tuskin on, tuskin AMD haluaa Threadripperissä hyödyntää ytimiä joissa kumpikin muistiohjain on rikki.
Kokoonpanoissa on puolensa ja puolensa. Muistikaista on 2+2 maksimissaan sama kuin ykkösversiossa 4x1 versiossa puolet siitä. 1x4 takaisi suurimman teoreettisen kaistan mutta pienimmälle määrälle ytimiä ilman NUMAn aiheuttamaa rasitetta. Ääripäät ovat tasaisin suorituskyky tai hyvin kuormariippuvainen suorituskyky. 2+2 yhdistelmä kuulostaa ymmärrettävältä kompromissilta.
 
Liittynyt
22.10.2016
Viestejä
11 121
Voisiko olla mahdollista sellainen kombinaatio, että kaikissa piireissä olisi kaksikanavainen muistiohjain käytössä.
Muistikanavat jaettaisiin tyyliin: 2 hi-bit + 2 lo-bit + 2 high bit + 2 lo-bit?
Ei toimi näin.

Muistiosoitteet on yhteisiä koko systeemille, Jollain muistipiirillä on joku tavu ja sen tavun osoitteen on oltava sama kaikille piilastuille, kaikille ytimille.
Saman fyysisen muistiosoitteen tarvii osoittaa aina samoja fyysisiä muistikammalla olevia soluja riippumatta siitä, kuka siihen osoitteeseen viittaa.

Se logiikka, miten ne fyysiset muistisolut mapataan niihin eri piireillä oleviin fyysisiin muistisoluihin voidaan valita (vapaasti etukäteen), mutta sitä ei voi vaihtaa koneen ollessa käynnissä.

Valitseminen voidaan siis tehdä siten että tietty logiikka joko kovakoodataan siihen muistiohjaimeen(*) sitä suunnitellessa, tai että muistiohjain(*) on konfiguroituva, ja konetta bootessa (ennen kuin koneen muistiin on kirjoitettu mitään oikeaa dataa, valitaan se muistiohjaimen(*) moodi). Ryzenin (kuten käytännössä kaikkein muidenkin yhtään modernien piirien) muistiohjain(*) tukee bootissa uudelleenkonfigurointia.

Vaatisi ehkä jonkun bridge-sirun tms. väliin, jonne johdotettaisiin aina kahden piirin muistilinjat + mahdollisesti uuden NUMA-moodin.
Mikä tahansa realistinen siltapiiri tarkoittaisi käytännössä sitä samaa lisäviivettä joka tulee liikenteen kierrättämisestä toisen piilastun kautta, ei senkään puolesta mitään järkeä.

Ja jos halutaan vaan vaihtaa 2-2-0-0 hi ja 2-2-0-0 lo-moodien välilä, siihen ei tarvi mitään lisäpiiriä. Niiden välillä voi vaihtaa konetta rebootatessa.

Periaatteessa hibernate-tilassa käyminen riittää, koska hibernate on raudan kannalta ihan täysin koneen sammutus ja kaikki muistin sisältö talletetaan levylle ja ladataan uusiksi.


(*) tässä muistiohjain ei viittaa pelkästään siihen matalan tason DDR4-ohjaimeen joka on joka kanavalle erikseen, vai yleisesti ottaen myös siihen logiikkaan joka huolehtii datan reitittämisestä oikeaan paikkaan piirillä ja piirien välillä. Oikeampi termi olisi ehkä "järjestelmäagentti"(system agent).
 
Viimeksi muokattu:
Liittynyt
16.10.2016
Viestejä
12 136
Eräällä toisella foorumilla tätä ilmiötä kutsutaan CFD-silmiksi, siis että näkee (laskennallista) virtausmekaniikkaa paljain silmin.

Itse en uskaltaisi tyrmätä tuota pelkästään ulkonäön perusteella äänekkääksi. Tiheämpi rivoitus ei liene sattumaa, kuten ei myöskään tuo tavanomaista isompi lämpöputkien määrä. Tuolla välissä oleva tuuletin lienee myös saman linjan jatkoa: pienempi virtaus riittää samaan jäähdytystehoon kun pinta-alaa on enemmän. Toki sen tuulettimen pitää kyetä tuottamaan isompi paine-ero saadakseen sen virtauksen aikaan, mutta se on vaan lapojen määrän ja muodon tehtävä.
Ei sitä ilmavirtaa näe! MUTTA sen voi kokeilla. Tuota, miten tuulettimen käyttäytyvän esteiden lähellä on tullut kokeiltua muutama kerta vuosien aikana itse ja testien perusteella tuontyyppinen este tuulettimen imupuolella on ilmavirran kannalta erittäin huono juttu kaikissa tapauksissa. Jos tuuletin on sopiva, niin puhalluspuolella ongelma on erittäinpaljon paljon pienempi. Imupuolella ei pitäisi olla mitään hyvin ohutta lankaritilää lukuunottamatta 3 senttiä lähempänä 120 millistä tuuletinta.

Toinen ongelma, mille tuollainen hyvin tiheä siili on melko altis on siilin pölystyminen ja tällöin tapahtuva jäähdytystehon lasku (tämäkin on ihan käytännössä vuosien aikana havaittu ilmiö, kun käytössä on ollut jo yli 10 vuotta erinäisissä itse kasatuissa pöytäkoneissa tuulettimenohjaimia, jotka mittaavat siilin lämpötilaa ja säätävät tuuletinta sen mukaan.) Itse hylkäsin nuo hyvin tiheät siilit kokonaan kyseisestä syystä.

Itse jokatapauksessa nakkaisin tuulettimen tuosta välistä mäkeen ja pistäisin tn puhaltamaan siihen reunalta ja keskelle vain kotelointi. Ja ilmatunneli kopan takatuularille, joka imemään vielä ulos.
 

Sampsa

Sysop
Ylläpidon jäsen
Team Tesla
Liittynyt
13.10.2016
Viestejä
12 585
Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.
Threadripperin kohdalla lukee turbokelloissa WIP (work in progress), eli eivät välttämättä lopullisia kelloja.
Nämä oli tosiaan noissa Computex-demokokoonpanoissa käytetyt kellot, ei vielä lopulliset. Jotain hienosäätöä luvassa varmaan siis vielä kohti julkaisua, mutta jossain tuolla 3-3,5 GHz kaikkien ytimien kellot ja 1-2 ytimellä turbolla sitten varmaan lähempänä 4 GHz.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 565
Onko Raven Ridgen sisäistä väylärakennetta selitetty jossain julkisessa dokumentissa, vai vaan NDAn alla jaetuissa?
Kuulostaa kyllä erikoiselta että ne kommunikoisi keskenään pcien yli yhtäkkiä, en muista yhdenkään APUn kohdalta juttua tuollaisesta
 
Liittynyt
22.10.2016
Viestejä
11 121
Kuulostaa kyllä erikoiselta että ne kommunikoisi keskenään pcien yli yhtäkkiä, en muista yhdenkään APUn kohdalta juttua tuollaisesta
Minä taas nimenomaan muistan että joissain vanhoissa APUissa(mm. trinity) oli jotain ihan hämärää väyläratkaisua, jossa GPU- ja CPU-puolilla oli hyvin erilliset väylänsä sille matalan tason DRAM-ohjaimelle asti, ja esim. samaa muistiosoitetta ei voinut ollenkaan suoraan käsitellä molemmilta puolilta, vaan jos CPU halusi lähettää dataa GPUlle kuuluvalle muistialueelle, CPUn piti lähettää se sinne muistiin GPU-puolen kautta. Ja se CPUta ja GPUta yhdistävä väylä saattoi olla joku piirin sisäinen pcie/softan näkökulmasta olla pcie.

Tuollainen löytyi pikaisesti, AMDn omaa slideä en löytänyt

Eli siis, vaikka CPU- ja GPU-puolet oikeasti käyttivät samoja muistikampoja, se näytti softalle(mukaanlukien ajurit) siltä, kuin niillä olisi ollut täysin erilliset muistit aivan kuten erillis-GPUissa.


edit: löytyi vihdoin RWTn juttu tuosta:

AMD Fusion Architecture and Llano

Mutta olisin odottanut, että tästä olisi luovuttu siinä vaiheessa kun Kaverissa näistä yritettiin tehdä keskenään välimuistikoherentteja(siinä onnistumatta, sinne jäi joku fataali bugi, joka carrizossa lopulta korjattiin, vasta carrizo oli oikeasti välimuistikoherentti CPUn ja GPUn välillä. Hienosti siis Kaverissa ennen julkaisua hypetettiin sitä välimuistikoherenttiutta ja sitten jossain vaiheessa vaan hiljaisesti "unohdettiin" se kun tajuttiin, ettei se toimikaan täydellisesti)
 
Viimeksi muokattu:
Liittynyt
17.01.2017
Viestejä
1 125
Turha arvailla kun speksit ovat julki.

32 ydintä, 250W TDP, 3.0GHz Base Frequency ja 3.4GHz max turbo.
No joo oikeassa olit, en ollut tuota ehtinyt vielä lukemaan, mutta nuo kellot eivät ole vielä viralliset. Zen+ kyeten helposti +4ghz 1-2core turboihin ja koska ryzen muutenkin on energiatehokas 3,5ghz tietämillä ja 12nm tätä edesauttaa vielä lisää, on itselle melko ihme jos ei 250w TDP kykene samoihin kelloihin kuin 1950x. Kumminkin parhast binnit menee noihin.
 

Terevis

BANNATTU
BANNED
Liittynyt
01.11.2016
Viestejä
333
Trollaaminen
Ei pyöri edes crysis liian huono yhden ytimen suorituskyky. Intel hakkaa maanrakoon.
 

BlackWolf

Suomen Michael Jackson
BANNED
NOSTO
Liittynyt
18.10.2016
Viestejä
1 797
Ei sitä ilmavirtaa näe! MUTTA sen voi kokeilla. Tuota, miten tuulettimen käyttäytyvän esteiden lähellä on tullut kokeiltua muutama kerta vuosien aikana itse ja testien perusteella tuontyyppinen este tuulettimen imupuolella on ilmavirran kannalta erittäin huono juttu kaikissa tapauksissa. Jos tuuletin on sopiva, niin puhalluspuolella ongelma on erittäinpaljon paljon pienempi. Imupuolella ei pitäisi olla mitään hyvin ohutta lankaritilää lukuunottamatta 3 senttiä lähempänä 120 millistä tuuletinta.

Toinen ongelma, mille tuollainen hyvin tiheä siili on melko altis on siilin pölystyminen ja tällöin tapahtuva jäähdytystehon lasku (tämäkin on ihan käytännössä vuosien aikana havaittu ilmiö, kun käytössä on ollut jo yli 10 vuotta erinäisissä itse kasatuissa pöytäkoneissa tuulettimenohjaimia, jotka mittaavat siilin lämpötilaa ja säätävät tuuletinta sen mukaan.) Itse hylkäsin nuo hyvin tiheät siilit kokonaan kyseisestä syystä.

Itse jokatapauksessa nakkaisin tuulettimen tuosta välistä mäkeen ja pistäisin tn puhaltamaan siihen reunalta ja keskelle vain kotelointi. Ja ilmatunneli kopan takatuularille, joka imemään vielä ulos.
No onhan nyt vesijäähyissä noita push/pull mallisia tuulettimia käytössä ja tiheät rivat. Tuulettimien rakenne vain on silloin erilainen. Minä en ainakaan ole kuullut että missään olisi ollut testejä missä verrattaisiin jäähdytystehoa, ääntä yms. eri tuuletintyypeillä. On ihan eri asia suunnitella se tuuletin olemaan paine tuuletin, kuin olemaan ilmavirran liikuttaja. Sitten on toki ns. hybrideitä siinä välissä.

Etukäteen rivaston tiheyden merkitystä on aika mahdoton sanoa. Enemmän ilmavirtaa ja harvemmat rivastot voi myös olla ihan vain tuuletinvalmistajien kompromissi valmistushinnan ja katteen välillä. Se ei tee siitä automaattisesti parempaa kuin jokin toinen malli. Tai no ainakaan en ole törmännyt yhteenkään sivustoon missä olisi oikeasti testattu noita asioita, se kun olisi melko perhanan kallista touhua.
 
Toggle Sidebar

Statistiikka

Viestiketjut
240 207
Viestejä
4 194 565
Jäsenet
70 871
Uusin jäsen
Hedelma

Hinta.fi

Ylös Bottom