AMD esitteli Zen-arkkitehtuuriin perustuvan Naples-palvelimen suorituskykyä

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 377
amd-naples-processor-20170307.jpg



AMD julkaisi tänään yksityiskohtia tulevasta Naples-koodinimellisestä palvelinprosessoristaan ja siihen perustuvista palvelimista. Naples perustuu samaan Zen-arkkitehtuuriin kuin yhtiön tuoreet Ryzen-työpöytäprosessorit. AMD ei ole vielä kertonut miten se tulee nimeämään Naples-prosessorit, kun ne julkaistaan markkinoille vuoden toisen neljänneksen eli huhti-kesäkuun aikana.

AMD:n yritystuotepuolen johtajiin kuuluvan Dan Boundsin esitelmässä saatiin paitsi aiempaa tarkempi silmäys Naples-prosessoreihin, myös ensimmäiset viitteet niiden suorituskyvystä. Naples-prosessoreiden sisältä löytyy yhteensä 32 Zen-ydintä, eli CCX-CPU-komplekseja on käytössä kahdeksan. Naples-prosessori tukee kahdeksaa DDR4-muistikanavavaa ja 128 PCI Express 3.0 -linjaa. Oletettavasti Naples-prosessori on neljän piisirun MCM-ratkaisu (Multi-Chip Module), mutta AMD ei ole toistaiseksi varmistanut asiaa.



Kahden Naples-prosessorin palvelimessa prosessorit keskustelevat keskenään välimuistikoherentin Infinity Fabric -väylän avulla. PCI Express -väylien määrää rajoitetaan kahden prosessorin järjestelmissä 64:ään per prosessori. Kuriositeettina AMD:n mukaan Naples-prosessori ja neljä Radeon Instinct -kiihdytintä vastaavat laskentateholtaan ihmisaivoja.



Suorituskykytesteissä AMD vertaili kahdella Naples-prosessorilla (yhteensä 64 ydintä, 128 säiettä, 16 muistikanavaa, 128 PCIe 3.0 -linjaa) ja 512 Gt:llä DDR4-2400-muistia varustettua palvelintaan suuren OEM-valmistajan nopeimpaan kahden prosessorin Intel-palvelimeen, josta löytyy kaksi Xeon E5-2699A V4 -prosessoria (yhteensä 44 ydintä, 88 säiettä, 8 muistikanavaa, 80 PCIe 3.0 -linjaa) ja 384 Gt DDR4-1866-muistia. Xeon E5-2699A V4 perustuu Broadwell-EP-arkkitehtuuriin.

Suorituskykymittauksissa käytettiin seismistä analyysiä eli iteroitiin kymmeneen kertaan kolmiulotteisten aaltojen etenemistä vähintään miljardin näytepisteen verkostossa. AMD:n mukaan tekniikkaa käytetään oikeassa elämässä luonnonrikkauksien etsinnässä.



Aluksi AMD:n palvelin rajoitettiin Intelin tavoin 44 ytimeen ja DDR4-1866-muisteihin, jolloin se suoriutui tehtävästä 18 sekunnissa, kun Intel-palvelimella aikaa vierähti 35 sekuntia. 64 ytimellä ja DDR4-2400-muisteilla AMD:n aika tippui 14 sekuntiin. Nostamalla laskettavan verkoston näytepisteiden määrä 4 miljardiin AMD:lla vierähti testissä 54 sekuntia ja Intelin palvelimesta loppui muisti kesken.



Lähde: AMD Naples Tech Day

Huom! Foorumiviestistä saattaa puuttua kuvagalleria tai upotettu video.

Linkki alkuperäiseen uutiseen (io-tech.fi)
 
Viimeksi muokannut ylläpidon jäsen:
Unohtakaa Ryzenit, tästä tulee kunnon peliprossu. :psmoke:

No ei sentään. Näyttää kuitenkin ihan hyvältä AMD:n kannalta. Olen ymmärtänyt, että palvelinpuolella liikkuu kuitenkin vähän isommat rahat. :hammer: Nooh, kohtahan ne uudet Intelitkin tulee (kesällä, syksyllä??).
 
Unohtakaa Ryzenit, tästä tulee kunnon peliprossu. :psmoke:

No ei sentään. Näyttää kuitenkin ihan hyvältä AMD:n kannalta. Olen ymmärtänyt, että palvelinpuolella liikkuu kuitenkin vähän isommat rahat. :hammer: Nooh, kohtahan ne uudet Intelitkin tulee (kesällä, syksyllä??).

Korkeammat katteet ainakin. Volyymit ovat toki pienempiä, eli kokonaisliikevaihto ei välttämättä yllä kuluttajapuolelle.

Ainakin tuon sortin tehtävät sujuvat, mielenkiinnolla odottaa miten nämä sopivat pilvipalveluiden alustoiksi. Niissä laskenta on todennäköisemmin vähän monimuotoisempaa.
 
Itsellä pisti silmään tuo 8 CCX-CPU-komplexia, mutta samalla vain 8 muistikanavaa, eli onko yhdessä CCX:ssä vain 1 muistikanava, vai perustuuko tuo Infinity Fabric sen toisen muistikanavan hyödyntämiseen kerran sen nopeuskin on riippuvainen muistien nopeudesta (tai 50% siitä, ei siis DDR)? Toisaalta jos yksi CCX-CPU-komplexi sisältäisi vain yhden muistikanavan, olisi 4 ytiminen Zen pakostakin valmistettava kahdesta CCX-CPU-komplexista, jotta se tukisi kahta muistikanavaa.:think:
 
Viimeksi muokattu:
Itsellä pisti silmään tuo 8 CCX-CPU-komplexia, mutta samalla vain 8 muistikanavaa, eli onko yhdessä CCX:ssä vain 1 muistikanava, vai perustuuko tuo Infinity Fabric sen toisen muistikanavan hyödyntämiseen kerran sen nopeuskin on riippuvainen muistien nopeudesta (tai 50% siitä, ei siis DDR)? Toisaalta jos yksi CCX-CPU-komplexi sisältäisi vain yhden muistikanavan, olisi 4 ytiminen Zen pakostakin valmistettava kahdesta CCX-CPU-komplexista, jotta se tukisi kahta muistikanavaa.:think:
Naples on käsittääkseni aika lailla sama kuin 4 x 8-core Ryzen (kasattu vaan useammasta lastusta). Ryzenissä on kaksi muistikanavaa, joten Naples saa niitä 8.
 
Naples on käsittääkseni aika lailla sama kuin 4 x 8-core Ryzen (kasattu vaan useammasta lastusta). Ryzenissä on kaksi muistikanavaa, joten Naples saa niitä 8.
Et taida nyt olla ihan perillä 8-ydin Ryzenin rakenteesta ja Zen-arkkitehtuurista?

Käytännön tasolla Zen-arkkitehtuuriin pohjautuva tuote rakentuu CPU-kompleksista eli CCX:stä, joita voidaan yhdistää toisiinsa ja esimerkiksi 8-ytimisessä Ryzen-prosessorissa on käytössä kaksi CPU-kompleksia.
AMD:n uusi Zen x86-arkkitehtuuri ja clock-to-clock-suorituskyky - io-tech.fi
 
Itsellä pisti silmään tuo 8 CCX-CPU-komplexia, mutta samalla vain 8 muistikanavaa, eli onko yhdessä CCX:ssä vain 1 muistikanava, vai perustuuko tuo Infinity Fabric sen toisen muistikanavan hyödyntämiseen kerran sen nopeuskin on riippuvainen muistien nopeudesta (tai 50% siitä, ei siis DDR)? Toisaalta jos yksi CCX-CPU-komplexi sisältäisi vain yhden muistikanavan, olisi 4 ytiminen Zen pakostakin valmistettava kahdesta CCX-CPU-komplexista, jotta se tukisi kahta muistikanavaa.:think:
Muistikanavat eivät ole vissiin suoraan osa CCX:ää vaan sitä "uncorea", eli periaatteessa ne eivät ole riippuvaisia toisistaan.
Mutta kuten @Nerkoon yllä totesi, kyse on ilmeisesti 4x "Ryzenistä" eli 4x Zeppelin-siruja MCM:nä
 
Niin siis kahden prosessorin kokoonpanoissa PCIE-väylien määrää ei ole mitenkään "rajoitettu puoleen", vaan molemmilta prosessoreilta napataan puolet PCIE-väylistä tuota infinity fabricia varten, jota prosessorit käyttävät keskenään kommunikointiin.
Eli joka Naples -prosessorilla on samat 128 PCIE-väylää riippumatta siitä, montako prosessoria järjestelmässä on, mutta kahden prosessorin kokoonpanoissa puolet väylistä on käytössä prosessorien väliseen kommunikaatioon, jolloin jäljelle jää taas yhteensä 128 (64 per prosessori) PCIE-väylää kaikkeen muuhun käyttöön.
 
Muistikanavat eivät ole vissiin suoraan osa CCX:ää vaan sitä "uncorea", eli periaatteessa ne eivät ole riippuvaisia toisistaan.
Mutta kuten @Nerkoon yllä totesi, kyse on ilmeisesti 4x "Ryzenistä" eli 4x Zeppelin-siruja MCM:nä
Niinpä tietenkin, eipä tullut ajateltuakaan että nuo tosiaan rakentuisivat neljästä kaksi CCX:ää sisältävästä sirusta, eikä yhdestä kokonaisuudesta.:tup:
 
Jos vain hinta kohtaa näissä pienemmissä coreissa ja tehoa löytyy niin miksei.
 
Ainakin tuon sortin tehtävät sujuvat, mielenkiinnolla odottaa miten nämä sopivat pilvipalveluiden alustoiksi. Niissä laskenta on todennäköisemmin vähän monimuotoisempaa.

Monessa pilivi tunkissa ajellaan melko perus web serveri kikatinta yms. jolloin käytännössä mennään ALU yksiköiden varassa. Ainakaan tällä hetkellä ei ole kovin kustannustehokasta tunkea laskenta palvelimia pilveen. Tuskimpa noilla Zen coreilla mitään ongelmia on perinteisissä palvelin softissa.

Pilvistä tuli mieleen että m$:n Azuresta ainakin tuli jotain AMD virutaalipatoja vielä 2014.. joten jos nuo BD:t kelpasi asiakkaille vuokrattavaksi niin eiköhän Zen kelpaa myös jos vaan rautakulut on järjelliset kilpailijan rautaan nähden.

Jos nyt Intel ei tee jotain samanlaista kikkailua kuin K8 aikoihin ja uhkaile vendoreita ettei AMD laitteita parane myydä, niin eiköhän palvelin markkinoilla nähdä kilpailua.
 
Jos nyt Intel ei tee jotain samanlaista kikkailua kuin K8 aikoihin ja uhkaile vendoreita ettei AMD laitteita parane myydä, niin eiköhän palvelin markkinoilla nähdä kilpailua.

Tämä. Ei olisi ensimmäinen kerta Inteliltä, mutta olisivatkohan oppineet edellisistä sakoista? Vai oliko sakot pienemmät kuin saatu hyöty. :/

Toisaalta jos Naples todetaan kaikkien puolueettomien tahojen osalta parhaaksi niin voi vain ihmetellä jos se ei ala vuoden parin jälkeen yleistyä. Palvelinpuolella sopparit on kuitenkin pitkiä, eli kaikki ei voi heti hypätä toisen kelkkaan. Vasta kun sopparit olisi menossa uusiksi.
 
Hienoa että osasit hakea Intelin tähänkin uutiseen.
Täh? Näitä prosessoreita kuitenkin tekee käytännössä vain Intel ja AMD, joten vähemmän yllättäen aina kun toinen mainitaan niin mainitaan se toinenkin. Lisäksi tällä hetkellä Intelillä ei käsittääkseni ole mitään vastaavaa tuotetta Naplesille, eikä mitään ole tulossa kuin vasta Naplesin suunnitellun julkaisun jälkeen (Skylake pohjaiset Xeonit kesä/syksy?). Eli kysymys onkin meneekö AMD serveripuolella kärkeen ainakin hetkeksi. :think:
 
Aika paljon varmaan menestys riippuu siitä, kuinka serverialustojen valmistajat kiinnostuvat, HP ja Dell muun muassa. Ja tietysti isot pelaajat, kuten Google, jonka rackit taitaa olla aika custom systeemit. HP:lla ja Dellillä taitanut olla mallistoissa ainakin vanhoja Opteroneja, joten uskon että myös Naplesille on kiinnostusta. Valmistajien kannalta piirien hinta on tärkeä, tällöinen heille jää potentiaalisesti enemmän voittoa verrattuna kilpailijan verrokkiin.

Esittelyssä ei taidettu mainita vielä juurikaan mitään tehonkulutuksesta? Tehonkulutus on se yksi mielenkiintoinen parametri datakeskuksien kannalta. Joka tapauksessa, tuollaiselle yhdelle Naples alustalle kaiken logiikan (enemmän coreja/muistia) mukaan saa enemmän virtualisoitua palveluita, joten saavutettu hyöty per tehonkulutus on varmasti ihan lupaava. :tup:
 
Täh? Näitä prosessoreita kuitenkin tekee käytännössä vain Intel ja AMD, joten vähemmän yllättäen aina kun toinen mainitaan niin mainitaan se toinenkin. Lisäksi tällä hetkellä Intelillä ei käsittääkseni ole mitään vastaavaa tuotetta Naplesille, eikä mitään ole tulossa kuin vasta Naplesin suunnitellun julkaisun jälkeen (Skylake pohjaiset Xeonit kesä/syksy?). Eli kysymys onkin meneekö AMD serveripuolella kärkeen ainakin hetkeksi. :think:

Ja riittääkö Intelin "5-10%" päivitykset yhtään mihinkään tätä vastaan? Taitaa mennä Intelin suunnitelmat uusiksi tämän Naplesin takia.

Intel liittyy tähän aiheeseen todella suoraan ja siksi linkitän tämän videon:


Way to go AMD! Player 2 has returned.
Tekee kyllä hyvää AMD:lle saada vihdoin ihan kunnon ote markkinoista. Myös palvelimissa, toivottavasti.

Edit:
Esittelyssä ei taidettu mainita vielä juurikaan mitään tehonkulutuksesta? Tehonkulutus on se yksi mielenkiintoinen parametri datakeskuksien kannalta. Joka tapauksessa, tuollaiselle yhdelle Naples alustalle kaiken logiikan (enemmän coreja/muistia) mukaan saa enemmän virtualisoitua palveluita, joten saavutettu hyöty per tehonkulutus on varmasti ihan lupaava. :tup:
Tämä. Ei piirin hinta ole niinkään oleellinen kuin perf/w suhde. Jos Ryzenia katsotaan ja mietitään esim 1700 TDP 65W niin hyvältä näyttää silläkin rintamalla.
 
Esittelyssä ei taidettu mainita vielä juurikaan mitään tehonkulutuksesta? Tehonkulutus on se yksi mielenkiintoinen parametri datakeskuksien kannalta. Joka tapauksessa, tuollaiselle yhdelle Naples alustalle kaiken logiikan (enemmän coreja/muistia) mukaan saa enemmän virtualisoitua palveluita, joten saavutettu hyöty per tehonkulutus on varmasti ihan lupaava. :tup:

Voisi olettaa ettei haeta samanlaisia kellotaajuuksia kuin kuluttaja lastuihin. @The Stilt :n strictkly technical threadissa anandilla (sori.. ei ole linkkiä työkoneella) oli melko hyviä tehonkulutus lukemia cinebenchissä hieman matalemmilla kelloilla.

Eli ei liene se tehonkulutuskaan ongelma kun pysytään vähän matalemmmissa kellotaajuuksissa.
 
Voisi olettaa ettei haeta samanlaisia kellotaajuuksia kuin kuluttaja lastuihin. @The Stilt :n strictkly technical threadissa anandilla (sori.. ei ole linkkiä työkoneella) oli melko hyviä tehonkulutus lukemia cinebenchissä hieman matalemmilla kelloilla.

Eli ei liene se tehonkulutuskaan ongelma kun pysytään vähän matalemmmissa kellotaajuuksissa.

Tuossa
Ryzen: Strictly technical

Juu, ei todellakaan samanlaisia kellotaajuuksia kuin kuluttaja lastuissa. Mutta eiköhän noissa nyt vähintään se 2Ghz nähdä, siinä 32C64T hirviössäkin?
Zeppelin hyötysuhde on hyvässä mielessä aika hullu, Ryzen 7 1800X 30W ja 850 pojoa Cinebench R15 MT. Vissiin noin ~1.9Ghz kellotaajuudella olettaen että vakiona all core 3.7Ghz pisteitä tippuu reippaat 1600 (io-tech testissä 1628).

Voishan se esim 120W TDP olla ihan mahdollinen tuollaisella hirviöllä, vajaa 2Ghz kaikkien ytimien kuormassa. Ja ihan kiva "markkinointi kikka" kun nuo Intelin esim E5-2697v4 ja E5-2699v4 on 145W TDP:llä.
 
Viimeksi muokattu:
Tuossa
Ryzen: Strictly technical

Juu, ei todellakaan samanlaisia kellotaajuuksia kuin kuluttaja lastuissa. Mutta eiköhän noissa nyt vähintään se 2Ghz nähdä, siinä 32C64T hirviössäkin?
Zeppelin hyötysuhde on hyvässä mielessä aika hullu, Ryzen 7 1800X 30W ja 850 pojoa Cinebench R15 MT. Vissiin noin ~1.9Ghz kellotaajuudella olettaen että vakiona all core 3.7Ghz pisteitä tippuu reippaat 1600 (io-tech testissä 1628).

Jees kiitoksia. Sieltähän se linkki löytyi.

Valtaosassa serverijuttuja (varsinkin front-end softissa) se singlecore suorituskyky on melko yhdentekevä.. joten jotkut maltilliset ~2Ghz taajuudet voisi olla 32C Naplesille ihan validi veikkaus. Silläkin voisi arvata TDP heiluvan 140-160W per lastu. (4x 30W (tosta ryzenista napattuna) + vähän varaa extra muistiohjaimille, pcie väylä hipattimille jne).
 
Jees kiitoksia. Sieltähän se linkki löytyi.

Valtaosassa serverijuttuja (varsinkin front-end softissa) se singlecore suorituskyky on melko yhdentekevä.. joten jotkut maltilliset ~2Ghz taajuudet voisi olla 32C Naplesille ihan validi veikkaus. Silläkin voisi arvata TDP heiluvan 140-160W per lastu. (4x 30W (tosta ryzenista napattuna) + vähän varaa extra muistiohjaimille, pcie väylä hipattimille jne).
Tuossa on ihan sama määrä muistiväyliä ja muita suhteessa ytimiin, kunnes toisin todistetaan se on kirjaimellisesti 4x Zeppelin MCM kun Ryzen on 1x Zeppelin
 
Intel liittyy tähän aiheeseen todella suoraan ja siksi linkitän tämän videon:

Tuo tyyppi on AMD-fanipoika. Kattelee muita ton videoita, niin käy varsin selvästi ilmi. Esim. tuossa videossa esittää väitteen, että GTX200 sarjan kortteja ostivat vain ihmiset, jotka eivät tienneet asioista ja todelliset tehokäyttäjät ostivat HD4800 sarjan kortteja:


27 minuutin tietoolla väittää myös, että RX480 on parempi valinta kuin GTX1060 :rofl:
 
Viimeksi muokattu:
Zeppelin hyötysuhde on hyvässä mielessä aika hullu, Ryzen 7 1800X 30W ja 850 pojoa Cinebench R15 MT.
Paras PPW @35 W, 1000cb

Karkeana vertailuna Broadwell i3-5020U Intel XTU:lla @8,75 W (short burst disabloituna), 207cb. Taajuus testin aikana hyvin pitkälti 2,0 GHz.

Eli Zeppelin ei missään nimessä vaikuta huonolta, kun tuskin Stiltin yksilö edes mikään vähiten vuotava. Tulossa varmasti mukavan kustannus- ja energiatehokas alusta moneen käyttöön.
 
Tuossa on ihan sama määrä muistiväyliä ja muita suhteessa ytimiin, kunnes toisin todistetaan se on kirjaimellisesti 4x Zeppelin MCM kun Ryzen on 1x Zeppelin

Kyllä. Joo muistiväylät voinee tuosta tiputtaa. Ne infinity fabric:in käytetyt PCIe väylät kuitenkin kuluttavat luultavasti työtä tehdessään enempi virtaa kun idlatessaan. Eli jotakin eroa pöytäkoneen Cinebenciin ja serverikäyttöön jossa sockettien välillä dataa viuhuaa voi olla.

Tai olisi ainakin kaikkine virransäästö vipattimineen ja sensoreineen aika kummallista jos PCIe väylä ja sen ohjaimet kuluttaisivat saman verran virtaa kulki dataa tai ei.

No ihan hyvältä näytää oli miten oli. =)
 
Viimeksi muokattu:
Menee niin pahasti ot etten edes vastaa. :)

Kyseinen henkilö on kuitenkin erikoisella aksentillaan kertonut monia asioita jotka ovat myöhemmin käyneet toteen. En yhtään ihmettelisi jos Intel olisi oikeasti vain tuudittautunut siihen että amd epäonnistuisi taas. Jos siellä ei ole jotain oikeasti uutta tulossa niin pienet muutaman prosentin boostit ei enää riitä. Alkaako sitten armoton kellotaajuuskisa kuten 2000-luvun alussa? Intel juottaa piirit taas kiinni purkan sijasta ja hyper-OC mallia myydään 5+ GHz, kulutuksesta välittämättä. True gamer you know.

Mutta tämä Zen arkkitehtuuri tosiaan tuntuu taipuvan kohtalaisesti työpöytäprossuksi, mutta sen ominaisuudet viittaa kyllä paljon enemmän server/mobile piiriin. Eli sellaiseen käyttöön jossa hertsejä ei tartte olla miljoonia vaan perf/w ratkaisee. Servereissä se kauhea OC on kaikkea muuta kuin se mitä halutaan. Onko Intelillä muuta? Se jää nähtäväksi.
 


Kuinkahan totta tuo. Ilmeisesti alikellottivat ja voltittivat 1800X kunnes 32c mahtuisi 180W TDP:lle. :)
 

Uusimmat viestit

Statistiikka

Viestiketjuista
257 000
Viestejä
4 465 826
Jäsenet
73 879
Uusin jäsen
Torvelo

Hinta.fi

Back
Ylös Bottom