Intel kertoi lisää Cascade Lake -palvelinprosessoreista + uudet suorituskykytestit

Kaotik · 05.11.2018

Intel julkaisi viime viikon alussa uusia tietoja tulevista Cascade Lake -arkkitehtuurin palvelinprosessoreista. Cascade Lake Advanced Performance -prosessorit tulevat olemaan parhaimmillaan 48-ytimisiä ja ne käyttävät useamman sirun MCM-paketointia.

Intelin alkuperäisessä diapaketissa oli mukana suorituskykytestit kolmesta eri skenaariosta, joista kahdessa uutta 48-ytimistä prosessoreita verrattiin kahden prosessorikannan palvelinkokoonpanoissa AMD:n Epyc 7601 -prosessoreihin ja yhdessä Intelin omaan Xeon Platinum -lippulaivaprosessoriin.

Tarkempi tarkastelu kuitenkin osoitti, että testitulokset perustuvat Cascade Lake AP:n osalta Intelin arvioihin suorituskyvystä, jonka lisäksi Epyc-prosessoreiden Stream Triad ja Xeon Platinum -prosessoreiden syväoppimissuorituskyky perustui kummankin prosessorin julkaisun aikaisiin tuloksiin. Lisäksi Intel oli jättänyt Hyper-threading- ja SMT-ominaisuudet pois käytöstä itse ajamissaan Epyc- ja Xeon Platinum -tuloksissa, mutta ei kerro pitikö sama paikkaansa myös Cascade Lake AP:n arvioitujen tulosten osalta.

Nyt Intel on julkaissut uusia testituloksia useammasta oikean maailman sovelluksesta 2S-palvelimissa. Cascade Lake AP:n tulokset perustuvat edelleen Intelin arvioihin lopullisesta suorituskyvystä prototyyppialustojen perusteella. Uusien testien Epyc-tulokset on ajettu aidoilla 2S-palvelimilla ja niissä on SMT-teknologia käytössä, mutta MILC-, WRF- ja OpenFOAM-testeissä säikeiden määrä on rajoitettu yhteen per ydin, kun NAMD- ja YASK-testeissä säikeitä on kaksi per ydin.

Intelin mukaan kahdella tulevalla 48-ytimisellä Cascade Lake Advanced Performance -prosessilla varustettu palvelin peittoaa kahdella 32-ytimisellä Epyc 7601 -prosessilla varustetun palvelimen kaikissa viidessä oikean maailman sovelluksia käyttävissä testeissä selvin eroin. MILC-testissä Cascade Lake AP -kokoonpano tulee yhtiön mukaan tarjoamaan parhaimmillaan 1,5-kertaista ja WRF- sekä OpenFOAM-testeissä 1,6-kertaista suorituskykyä Epyceihin nähden. NAMD (APOA1) -testissä suorituskykyero venähtää parhaimmillaan 2,1- ja YASK (ISO3DFD) -testissä peräti 3,1 kertaiseksi.

Lähde: Intel

Huom! Foorumiviestistä saattaa puuttua kuvagalleria tai upotettu video.

Linkki alkuperäiseen uutiseen (io-tech.fi)

Palautelomake: Raportoi kirjoitusvirheestä

--
Alkuperäinen uutinen:

Intel on kertonut lisätietoja tulevista Cascade Lake -arkkitehtuurin palvelinprosessoreistaan. Cascade Lake -arkkitehtuuriin perustuvat Xeon Platinum -prosessorit tullaan näillä näkymin julkaisemaan joko aivan tämän vuoden lopulla tai ensi vuoden alussa.

Cascade Laken muutokset nykyisiin prosessoreihin nähden sisältävät muun muassa optimoidun välimuistihierarkian, tietoturvakorjauksia sivukanavahyökkäyksiin, uudet syväoppimiseen tarkoitetut VNNI-käskyt sekä aiempaa korkeammat kellotaajuudet.

Myös prosessoriydinten määrä tulee kasvamaan rajusti, sillä Cascade Laket tulevat saataville AMD:n Epyc-prosessoreista tuttuun tapaan MCM-piireinä. Ydinmäärien perusteella yhdessä Cascade Lake -prosessorissa voi olla parhaimmillaan kaksi 24-ytimistä sirua, joskin on myös mahdollista, että kyseessä on kaksi 28-ytimistä sirua, joista 4 ydintä on poistettu käytöstä. Intel ei ole kertonut, miten sirut on yhdistetty toisiinsa, mutta mainostaa sitä suorituskykyoptimoituna ratkaisuna. Yhdellä 48-ytimisellä Cascade Lake -prosessorilla on käytössään 12 DDR4-muistikanavaa.

Suorituskyvyn osalta Intel kertoo prosessoreiden tarjoavan Linpackissa parhaimmillaan 3,4-kertaista suorituskykyä ja Stream Triadissa 1,3-kertaista suorituskykyä AMD:n Epyc 7601 -prosessoreihin nähden. Intelin edellisten Xeon Platinum -prosessoreiden julkaisun aikaiseen suorituskykyyn verrattuna uutuuksien luvataan kykenevän jopa 17 kertaiseen suorituskykyyn syväoppimiseen perustuvissa päättelytehtävissä. Suorituskykylukemat on mitattu kahden prosessorikannan järjestelmillä (2x 32-ytimen AMD Epyc 7601, 2x 48 ytimen Cascade Lake, 2x 28 ytimen Xeon Platinum 8180).

Lähde: Intel

Huom! Foorumiviestistä saattaa puuttua kuvagalleria tai upotettu video.

Linkki alkuperäiseen uutiseen (io-tech.fi)

Palautelomake: Raportoi kirjoitusvirheestä

E.T · 05.11.2018

Sitten vain odottelemaan "The Way It's Meant to be Glued" mainoskampanjaa...

Linpackin osalta olisi kyllä ollut kiinnostavaa, kun olisivat kertoneet tehonkulutuksen.

Kepe · 05.11.2018

Reilut mittaukset taas Intelillä.
AMD:n 64 ydintä vs. Intelin 96.
Sen lisäksi yhden Xeon Platinum 8180:n hinnalla saa kaksi Epyc 7601:htä.

vemkki · 05.11.2018

Kepe sanoi:
Reilut mittaukset taas Intelillä.
AMD:n 64 ydintä vs. Intelin 96.

Tässä taistellaan nyt AMD:tä vastaan sen omilla aseilla, eli on otettu maksimimäärä ytimiä, mitä saadaan kahden prosessorikannan ratkaisulla kummaltakin valmistajalta.

S@ber · 05.11.2018

vemkki sanoi:
Kepe sanoi:

Reilut mittaukset taas Intelillä.
AMD:n 64 ydintä vs. Intelin 96.

Napsauta laajentaaksesi...

Tässä taistellaan nyt AMD:tä vastaan sen omilla aseilla, eli on otettu maksimimäärä ytimiä, mitä saadaan kahden prosessorikannan ratkaisulla kummaltakin valmistajalta.

Tilanne muuttuu taas kun uudet Epycit tulee lisäytimineen

zepi · 05.11.2018

vemkki sanoi:
Tässä taistellaan nyt AMD:tä vastaan sen omilla aseilla, eli on otettu maksimimäärä ytimiä, mitä saadaan kahden prosessorikannan ratkaisulla kummaltakin valmistajalta.

Tietysti unohtaen, että AMD julkistanee huomenna 128 ytimisen dual-socket ratkaisunsa...

vemkki · 05.11.2018

zepi sanoi:
Tietysti unohtaen, että AMD julkistanee huomenna 128 ytimisen dual-socket ratkaisunsa...

Ehkä siksi Intelille tuli kiire saada julkistettua oma ratkaisunsa juuri nyt.

prc · 05.11.2018

Kepe sanoi:
Reilut mittaukset taas Intelillä.
AMD:n 64 ydintä vs. Intelin 96.
Sen lisäksi yhden Xeon Platinum 8180:n hinnalla saa kaksi Epyc 7601:htä.

Sinänsä ei, sinänsä kyllä. Datacenter hommissa on myös oleellista paljonko saat kamaa 1U, 2U, 4U tjsp standardi räkkihyllyyn. Toinen oleellinen on sitten perf/W, kaapeloinnin ja jäähdytyksen kannalta.

Monelle DC hostaajalle 2x Epyc 7601:siä voi olla paska kompromissi tilan vuoksi vs Xeon Pt 8180. Näin niinkun teorisassa.

Todellisuudessa 8180:stä tuskin saa käsiinsä ihan heti vaikka tilaisi.. joten odotellaan huomista next horizonsia niin saadaan tietää mitä kakkos Epyc tarjoaa.

mRkukov · 05.11.2018

prc sanoi:
Toinen oleellinen on sitten perf/W, kaapeloinnin ja jäähdytyksen kannalta.

Julkaisiko Intel W tietoja ollenkaan?

prc sanoi:
Monelle DC hostaajalle 2x Epyc 7601:siä voi olla paska kompromissi tilan vuoksi vs Xeon Pt 8180. Näin niinkun teorisassa.

Joo ei noita vanhoja Epycejä paljoa kannata ostella kun huomenna julkaistaan uutta ja paljon tehokkaampaa.

Intel julkaisi tänään, jotta ovat edes päivän "parasta mitä rahalla saa" - paitsi että tuskin noita saa yhtään mistään ennen kuin uudet epyc tulee markkinoille.

Kaotik · 05.11.2018

mRkukov sanoi:
Joo ei noita vanhoja Epycejä paljoa kannata ostella kun huomenna julkaistaan uutta ja paljon tehokkaampaa.

Intel julkaisi tänään, jotta ovat edes päivän "parasta mitä rahalla saa" - paitsi että tuskin noita saa yhtään mistään ennen kuin uudet epyc tulee markkinoille.

Tuskinpa huomenna julkaistaan yhtään mitään, kerrotaan luultavasti max vastaavan tason settejä ja ehkä enemmän benchejä kuin Intel nyt

BlackWolf · 05.11.2018

Ei kyllä Intel pettänyt taaskaan. Sieltähän tuli melkonen "paperi" julkistus päivää ennen kuin AMD julkaisee omansa. Ei toki sinällään paperijulkistus, koska tämä nyt varmana tulee, mutta melkonen purkka ratkaisu kun AMD yllättänyt housut kintuissa.

mRkukov · 05.11.2018

Kaotik sanoi:
Suorituskyvyn osalta Intel kertoo prosessoreiden tarjoavan Linpackissa parhaimmillaan 3,4-kertaista suorituskykyä ja Stream Triadissa 1,3-kertaista suorituskykyä AMD:n Epyc 7601 -prosessoreihin nähden.

Miksihän ihmeessä ovat disabloineet HT / SMT noissa testeissä? Intelin HT ei toimi niin pitää disabloida kilpailijan parempi toteutus?

mRkukov · 05.11.2018

Kaotik sanoi:
Tuskinpa huomenna julkaistaan yhtään mitään, kerrotaan luultavasti max vastaavan tason settejä ja ehkä enemmän benchejä kuin Intel nyt

Noh eipä noita 48 core prossujakaan ihan hetkeen saa.
"The Intel Xeon E-2100 is available as of today, while Cascade Lake Advanced Performance processors will arrive during the first half of 2019."

BlackWolf · 05.11.2018

mRkukov sanoi:
Noh eipä noita 48 core prossujakaan ihan hetkeen saa.
"The Intel Xeon E-2100 is available as of today, while Cascade Lake Advanced Performance processors will arrive during the first half of 2019."

Niin eikös tuo nyt tule ilmi ihan otsikostakin, että "kertoi lisää". Eli siis mainostaa omia tuotteitaan etukäteen, vaikka eivät ole vielä edes ko. tuotetta saaneet markkinoille. Lieköhän että onko edes olemassa koko prosessoria vielä kuin vasta teoriatasolla ja testauksessa. Saas nähdä millanen purkkaviritys siellä on noiden ytimien välissä. Pikkupräntillä voi sitten lukea että testitkin on simuloituja kuvitelmia mahdollisesta nopeudesta.

anidabi · 05.11.2018

Aika nolo firma ja huono häviämään tuo Intel nykyään. Ensin haukutaan kilpailijan valmistusmetodeja ja sitten kopioidaan kun ei parempaan pystytä. :facepalm:

Vaikeat ajat edessä jos tällä menolla jatketaan kilpailun saralla, kun otetaan huomioon että tulevaisuudessa apple ei tule olemaan asiakas ja ARM osastolta pikkuhiljaa pusketaan x86:n alueelle.

Joo-o, tiedän että x86:lla on vankka asema laajan softatuen ansiosta, mutta mikään ei ole ikuista ja olen aivan varma että jos applen kaltainen IPC lisäys sukupolvesta toiseen on mahdollista muillakin ARM siruilla niin ei tarvii mitään vuosikymmenii odotella että sieltä tulee sitä softaa ja rautaa PC puolellekkin.

hupiukko · 05.11.2018

Voisi nämä uutiset olla muutakin kuin pressitiedoitteiden uudelleenjulkaisua.

prc · 05.11.2018

mRkukov sanoi:
Julkaisiko Intel W tietoja ollenkaan?

Ei julkaissut, kunhan toin esille että DC hommissa on vertailtavana muutakin kuin core määrät keskenään. Eli intelin "vertailu" ei ole ihan yhtä epäreilua kuin jos deskari käytössä verrataan hyvin eri core counttine lastuja vastakkain. Vaikkakin se on ihan totta, että kilpailijan lastut SMT off ajettuna on ihme spedeilyä. Jos nyt varmistuu että Zen2 epycissä on 64Corea max, niin Intelillä on pari aika karua vuotta edessä. =)

anidabi sanoi:
Joo-o, tiedän että x86:lla on vankka asema laajan softatuen ansiosta, mutta mikään ei ole ikuista ja olen aivan varma että jos applen kaltainen IPC lisäys sukupolvesta toiseen on mahdollista muillakin ARM siruilla niin ei tarvii mitään vuosikymmenii odotella että sieltä tulee sitä softaa ja rautaa PC puolellekkin.

Kuinka pitkään ne IPC parannukset jatkuu nykytasolla onkin ihan toinen juttu.

ARM:n IPC parannukset johtuu pitkälti siitä, että ottavat samoja tekniikoita käyttöön joita x86:ssa on otettu jo kauan sitten. OoO -suoritusta, isompia cacheja, lisää rinnakkaisia suoritusyksiköitä yms. Niitä ei ole otettu aikaisemmin käytöön, koska käyttökohteesa (pääosin mobiililaitteet) ei niistä välttämättä ihan hirveästi hyödy, mutta kuluttavat virtaa.

Tuskin sen ARM puulaakikaan on keksinyt mitään maagista jippoa jolla IPC nousee taivaisiin. Ei ole keksinyt kukaan muukaan vielä, useita erilaisia CPU arkkitehtuureita on kuitenkin tullut, mennyt ja kuollut vuosien mittaan.

eternality · 05.11.2018

Mielenkiintoiset benchmarkit valittu kyllä. Tuo stream triad on ilmeisesti muistikaista testi jos oikein ymmärsin, ja linpakissa Intel taitaa voittaa ihan jo paremmalla AVX tuella?

hkultala · 05.11.2018

anidabi sanoi:
Aika nolo firma ja huono häviämään tuo Intel nykyään. Ensin haukutaan kilpailijan valmistusmetodeja ja sitten kopioidaan kun ei parempaan pystytä.

Intelillä on ollut MCM ainakin jo vuonna 1995, Pentium Prossa. Ennen AMDtä.

Sen jälkeen Intelillä on ollut MCM ainakin mm. Pentium D:ssä vuonna 2005, Core 2 quadissa vuonna 2008, Westmeressä vuonna 2010, ja Kaby Lake-G:ssä tänä vuonna.

Se, että intel käyttää MCMää ei ole mitään AMDn kopiointia.

hkultala · 05.11.2018

eternality sanoi:
Mielenkiintoiset benchmarkit valittu kyllä.
Tuo stream triad on ilmeisesti muistikaista testi jos oikein ymmärsin

Stream triad tekee muistaakseni pari laskutoimitustakin, mutta datasetit on niin suuria, että se on käytännössä täysin muistikaistarajoittunut kaikilla normaaleilla prosessoreilla.

Käytännössä se siis mittaa todellista softalle käytettävissä olevaa muistikaistaa (eikä teoreetttista ei-hyödynnettävissä olevaa)

Käytännössä intel on siis tässä hiukan EPYCiä nopeampi, koska EPYCillä on vain 8 muistikanavaa/soketti, näissä 12.

Huomioitavaa on kuitenkin, että ero ei ole 1.5x mikä on ero muistikanavien määrässä, vaan vähemmän, mikä tarkoittaa sitä, että EPYC onnistuu hyödyntämään käytettävissään olevan teoreettisen kaistan paremmin tai sillä on muistilla suuremmat kellotaajuudet.

Mikähän tuon intelin piilastuja yhdistävän väylän kaistanleveys on? Tulisiko se pullonkaulaksi pahemmin kuin AMDllä?

, ja linpakissa Intel taitaa voittaa ihan jo paremmalla AVX tuella?

Juu, Intelillä 512 bittiä leveät SIMD-yksiköt, AMDllä 128-bittiset.

S@ber sanoi:
Tilanne muuttuu taas kun uudet Epycit tulee lisäytimineen

Näiden benchmarkkien osalta ei merkittävästi muutu. Jos AMD tuplaa ytimien määrän, mutta pysyy kantayhteensopivana jolloin muistikanavien määrää ei kasvateta, AMDn muistikaista ei tule kasvamaan kuin korkeintaan inasen(jos muistien kelloa hiukan kasvatetaan), joten streamissa intel pysynee edellä.

Linpackissä tuo 3.4x etu taas on niin suuri, että AMDn pitäisi sekä tuplata SIMD-leveys ETTÄ tuplata ytimien määrä ja lisäksi olla joutumatta pudottamaan kellotaajuuksia juuri yhtään, että ei ihan heti ole saavuttamassa.

Mutta intel tosiaan valitsi ne benchmarkit, joissa on vahvoilla. Monissa muissa AMD potentiaalisella 64 ytimellä menisi kyllä helposti ohi.

prc · 05.11.2018

hkultala sanoi:
Intelillä on ollut MCM ainakin jo vuonna 1995, Pentium Prossa. Ennen AMDtä.

Jos menneitä muistellaa (ja liene tarkoitat Pro:n L2 kakkua) niin mites noi SLOT koteloidut pentium II ja III. Pitäiskö nekin laskea MCM:ksi? Ainakin Power5 on sellaiseksi laskettu.

POWER5 - Wikipedia

hkultala · 05.11.2018

prc sanoi:
Jos menneitä muistellaa (ja liene tarkoitat Pro:n L2 kakkua) niin mites noi SLOT koteloidut pentium II ja III. Pitäiskö nekin laskea MCM:ksi? Ainakin Power5 on sellaiseksi laskettu.

Ei, noissa välimuistipiirit oli eri paketissa mutta samalla kortilla. Se kortti oli kuitenkin ihan PCBtä, ei paketointia. Ei eroa mitenkään siitä miten esim tyypillisissä näyttiksissä on kortilla sekä varsinainen työn tekevä piiri että muistipiirit, kaikki juotettuna piirilevylle.

POWER5 - Wikipedia

Näitä en tunne tarpeeksi hyvin että osasin varmasti sanoa. Tuo yksi kuva näyttäisi siltä, että siellä olisi kahden piilastun MCM (prossu + L3?) mutta sen lisäksi kortilla pari erillistä piilastua (muistiohjainpiirit?) omissa paketeissaan, mutta muissa malleissa saattaa olla ihan samassa MCssä kaikki.

prc · 05.11.2018

hkultala sanoi:
Ei, noissa välimuistipiirit oli eri paketissa mutta samalla kortilla. Se kortti oli kuitenkin ihan PCBtä, ei paketointia. Ei eroa mitenkään siitä miten esim tyypillisissä näyttiksissä on kortilla sekä varsinainen työn tekevä piiri että muistipiirit, kaikki juotettuna piirilevylle.

Jees no se varmisti tämän terminologia asian.

hkultala sanoi:
Näitä en tunne tarpeeksi hyvin että osasin varmasti sanoa. Tuo yksi kuva näyttäisi siltä, että siellä olisi kahden piilastun MCM (prossu + L3?) mutta sen lisäksi kortilla pari erillistä piilastua (muistiohjainpiirit?) omissa paketeissaan, mutta muissa malleissa saattaa olla ihan samassa MCssä kaikki.

Joo en minäkään tunne niin hyvin. Tuli vaan tuo hirvitys joskus vastaan. Kuvatekstin mukaan siinä on 4 kpl Power5 CPU lastuja ja 4 kpl 36MB L3 kakkuja. Piti huvikseen linkata kun keskustelu MCM virveleistä, että tuollainenkin kauheus on keksitty.

ps. Linkitys oli paska.. en huomannut että wiki oli ottanut käyttöön tuollaisen kuvien selailu härpättimen. Eli tämän kuvan kuvateksti kutsuu MCMksi jossa 4 x cpu + 4x L3.

(Keskellä olevaa tököä arvelen vain jäähyn tueksi. Tuolta kun katsoo noita kuvia niin joku on saanut tuosta MCM alustasta lohkottua reunoista palasia irti).

hkultala · 05.11.2018

prc sanoi:
Jees no se varmisti tämän terminologia asian.

Joo en minäkään tunne niin hyvin. Tuli vaan tuo hirvitys joskus vastaan. Kuvatekstin mukaan siinä on 4 kpl Power5 CPU lastuja ja 4 kpl 36MB L3 kakkuja. Piti huvikseen linkata kun keskustelu MCM virveleistä, että tuollainenkin kauheus on keksitty.

ps. Linkitys oli paska.. en huomannut että wiki oli ottanut käyttöön tuollaisen kuvien selailu härpättimen. Eli tämän kuvan kuvateksti kutsuu MCMksi jossa 4 x cpu + 4x L3.

(Keskellä olevaa tököä arvelen vain jäähyn tueksi. Tuolta kun katsoo noita kuvia niin joku on saanut tuosta MCM alustasta lohkottua reunoista palasia irti).

Joo, tuo näyttää MCMltä.

Sami Riitaoja · 05.11.2018

prc sanoi:
Kuinka pitkään ne IPC parannukset jatkuu nykytasolla onkin ihan toinen juttu.

ARM:n IPC parannukset johtuu pitkälti siitä, että ottavat samoja tekniikoita käyttöön joita x86:ssa on otettu jo kauan sitten. OoO -suoritusta, isompia cacheja, lisää rinnakkaisia suoritusyksiköitä yms. Niitä ei ole otettu aikaisemmin käytöön, koska käyttökohteesa (pääosin mobiililaitteet) ei niistä välttämättä ihan hirveästi hyödy, mutta kuluttavat virtaa.

Tuskin sen ARM puulaakikaan on keksinyt mitään maagista jippoa jolla IPC nousee taivaisiin. Ei ole keksinyt kukaan muukaan vielä, useita erilaisia CPU arkkitehtuureita on kuitenkin tullut, mennyt ja kuollut vuosien mittaan.

Tässähän se mielenkiintoisin prosessoririntamalla onkin, Applen A12 omaa melkein tuplasti paremman IPC:n kuin Intelin x86-prossut. IPC ero on niin suuri että 2,5GHZ:n A12 on ihan tasavertainen ~4GHz:n kelloilla käyviä Intelin prossuja vastaan.

mRkukov · 05.11.2018

E.T sanoi:
Sitten vain odottelemaan "The Way It's Meant to be Glued" mainoskampanjaa...

Jos epyc oli "liimattu" kasaan niin tämä on kyllä "purkattu" kasaan.

mRkukov · 05.11.2018

Sami Riitaoja sanoi:
Tässähän se mielenkiintoisin prosessoririntamalla onkin, Applen A12 omaa melkein tuplasti paremman IPC:n kuin Intelin x86-prossut. IPC ero on niin suuri että 2,5GHZ:n A12 on ihan tasavertainen ~4GHz:n kelloilla käyviä Intelin prossuja vastaan.

Jossain yksittäisessä testissä?

Jos testattaisiin vähän laajemmin ja huomioitaisiin kaikki ne asiat joita x86 prossut nykyisin osaa niin ero olisi aika toinen.

Sami Riitaoja · 05.11.2018

mRkukov sanoi:
Jossain yksittäisessä testissä?

Jos testattaisiin vähän laajemmin ja huomioitaisiin kaikki ne asiat joita x86 prossut nykyisin osaa niin ero olisi aika toinen.

Ihan missä vaan.

Tästähän nousi vähän haloo kun Anandtech huomasi että Applen A12 puhelinprosessori on yhden säikeen Spec-testeissä aikalailla yhtä nopea kuin Intelin nopeimmat työpöytäprosessorit. Sen ei pitäisi olla näin, Applen prossut on niin hyviä että harmittaa että moinen paskafirma on sellaiset kehittänyt

Tässä esimerkiksi Intelin 8650 4,2GHz turbo vs A12 2,5GHz Spec testi GCC:llä käännettynä, jonkun Anandtech-foorumin käyttäjän testaamana:

Here is CINT 2006 on a Kaby Lake R i7-8650U gcc 7.3.0 -O3 -march=native
Code:
8650u A12 A12/8650u
400.perlbench - 45.38 -
401.bzip2 30.2 28.54 0.95
403.gcc 43 44.56 1.04
429.mcf 33.3 49.92 1.50
445.gobmk 31.5 38.54 1.22
456.hmmer 37.3 43.24 1.16
458.sjeng 32.9 27.97 0.85
462.libquantum 95.5 113.40 1.19
464.h264ref 69.6 66.59 0.96
471.omnetpp 20.5 35.73 1.74
473.astar 24.4 27.25 1.12
483.xalancbmk 47.3 57.03 1.21

Applen prossut on aivan sairaan hyviä - kukakohan kellottaa uusia ennätyksiä ensimmäisenä pädistä viritetyillä laitteilla.....

Toisaalta Applella on rahaa ja Intel ei ole tehnyt mitään viimeiseen viiteen vuoteen....

Kaotik · 05.11.2018

Sami Riitaoja sanoi:
Tässähän se mielenkiintoisin prosessoririntamalla onkin, Applen A12 omaa melkein tuplasti paremman IPC:n kuin Intelin x86-prossut. IPC ero on niin suuri että 2,5GHZ:n A12 on ihan tasavertainen ~4GHz:n kelloilla käyviä Intelin prossuja vastaan.

Geekbenchissä siis, voi olla että se realisoituu muuallakin mutta tästä ei taida olla näyttöä vielä?

Sami Riitaoja · 05.11.2018

Kaotik sanoi:
Geekbenchissä siis, voi olla että se realisoituu muuallakin mutta tästä ei taida olla näyttöä vielä?

On. Siitä ei pääse yli eikä ympäri että Applen A12 on ihan eriluokkaa IPC:n osalta kuin Intelin x86:det.

mRkukov · 05.11.2018

Sami Riitaoja sanoi:
Tässä esimerkiksi

Laitatko lähdettä. Google ei moista löydä.

Sami Riitaoja sanoi:
Here is CINT 2006

Vuoden 2006 integer testi. Tämäkö kuvastaa nykyisten x86 prossujen huipputestausta? Miksei Sampsa testaa tällä uusimpia i9-9900K prossuja kun kerran paras testi ikinä?

Sami Riitaoja sanoi:
On. Siitä ei pääse yli eikä ympäri että Applen A12 on ihan eriluokkaa IPC:n osalta kuin Intelin x86:det.

Lähteitä kiitos.

Jos verrataan soutuvenettä ja maastoautoa siinä että kumpi ylittää lammen nopeammin, niin kyllä se maastoauto vinsseineen häviää. Mutta jos tehtävä oli päästä lammen toiselle puolen niin autolla voi kätevästi ajaa lammenympärystietä pitkin.

Sami Riitaoja · 05.11.2018

mRkukov sanoi:
Vuoden 2006 integer testi. Tämäkö kuvastaa nykyisten x86 prossujen huipputestausta? Miksei Sampsa testaa tällä uusimpia i9-9900K prossuja kun kerran paras testi ikinä?

Specint2006. Se on se mielenkiintoisin, A12 pärjää tosin ihan hyvin Specfp:ssäkin mutta siinä testataan paljon muistijärjestelmää myös joten kännykän prossu antaa aika paljon tasoitusta.

Jos prossuvalmistaja kertoo valmistaneensa nopeimman prosessorin se esittänee asian pääsääntöisesti Spec-tuloksina. Applee ei edes kiinnosta, tekevät vain mobiililaitteiden prossuja......

hkultala · 05.11.2018

Sami Riitaoja sanoi:
Ihan missä vaan.

Tästähän nousi vähän haloo kun Anandtech huomasi että Applen A12 puhelinprosessori on yhden säikeen Spec-testeissä aikalailla yhtä nopea kuin Intelin nopeimmat työpöytäprosessorit. Sen ei pitäisi olla näin, Applen prossut on niin hyviä että harmittaa että moinen paskafirma on sellaiset kehittänyt

Tässä esimerkiksi Intelin 8650 4,2GHz turbo vs A12 2,5GHz Spec testi GCC:llä käännettynä, jonkun Anandtech-foorumin käyttäjän testaamana:

8650U käännettynä gcc:llä, Applelle käännettynä applen omalla llvm-pohjaisella sille optimoidulla kääntäjällä. :facepalm:

llvm ainakin oletusasetuksilla vektoroi paremmin kuin gcc, joten tuossa voi hyvin olla looppeja, jotka llvm on vektoroinut applelle mutta gcc ei ole vektoroinut intelille.

Reilu vertailu olisi joko ottaa sama kääntäjä molemmille, tai sitten molemmille paras kääntäjä.

Ja kun katsoo specin virallisia tuloksia heidän sivuiltaan, siellä löytyy niitä intelin kääntäjällä tehtyjä tuloksia intelille.

Here is CINT 2006 on a Kaby Lake R i7-8650U gcc 7.3.0 -O3 -march=native
Code:
8650u A12 A12/8650u
400.perlbench - 45.38 -
401.bzip2 30.2 28.54 0.95
403.gcc 43 44.56 1.04
429.mcf 33.3 49.92 1.50[/B]

mcf on hyvin muistikaistariippuvainen benchmark. Suuren kellotaajuuden prossu kärsii siinä keinotekoisesti.

445.gobmk 31.5 38.54 1.22
456.hmmer 37.3 43.24 1.16
458.sjeng 32.9 27.97 0.85
462.libquantum 95.5 113.40 1.19
464.h264ref 69.6 66.59 0.96
471.omnetpp 20.5 35.73 1.74

TÄmä oli benchmark jossa applella oli suurin ylivoima. Kun vähän kaivelee, löytyy, että tuo tekee hyvin paljon muistivarausta ja muistinvapautusta. Rutiineita, jotka tulee joko käyttikseltä tai standardikirjastolta. Ja molemmat on eri intelin ja applen välillä. Eli tämän suorituskykyyn vaikuttaa huomattavatsi muut tekijät kuin vanin prosessorin (ja kääntäjän) nopeus.

473.astar 24.4 27.25 1.12
483.xalancbmk 47.3 57.03 1.21

Jospa kaivettaisiin tähän verrokiksi sen sijaan 2.8 GHz turbottavan Intelin viralliset tulokset, vaikka HPn palvelimessa (Xeon Platinium 8153)

CINT2006 Result: Hewlett Packard Enterprise Synergy 480 Gen10 (2.00 GHz, Intel Xeon Platinum 8153) (test sponsored by HPE)

400.perlbench 35.8
401.bzip2 22.0 1.37
403.gcc 35.6 1.25
429.mcf 65.7 0.75
445.gobmk 25.5 1.51
456.hmmer 73.2 0.59
458.sjeng 28.6 0.98
462.libquantum 6460 0.018 (tässä intelin kääntäjä onnistuu vähän liian hyvin, laskee käännösaikana vaikka mitä tms., tätä ei oikein voi pitää prossun ansiona

)
464.h264ref 52.6 1.26
471.omnetpp 31.7 1.13
473.astar 30.4 0.89
483.xalancbmk 66.4 0.86

Saadaan tulos, että intelin 2.8 GHz on keskimäärin aika lailla yhtä nopea, tai vain inasen hitaampi kuin applen 2.5GHz. Applen kellotaajuuskohtainen suorituskykyetu onkin siis n. 10-20%, ei n. kaksinkertainen.

Ja tämä ei ole IPC, IPCtä ei voi järkevästi verrata eri arkkitehtuurin prosessoreiden välillä.

Ja specFPssä skylake-SP pärjää sitten vielä selvästi paremmin:

433.milc 78.9 41.03 0.57
444.namd 35.6 36.73 1.03
447.dealII 72.0 36.54 0.51
450.soplex 50.2 65.17 1.30
453.povray 69.5 55.62 0.8
470.lbm 1180 101.11 0.086
482.sphinx3 83.7 73.90 0.88

Toisaalta Applella on rahaa ja Intel ei ole tehnyt mitään viimeiseen viiteen vuoteen....

Intel on tehnyt vaikka mitä, sinä et vaan tiedä, mitä siellä on tehty. Asioiden tuotekehityksessä kestää vuosia.

Ja skylake-SP tuli jo ulos vuosi sitten ja tuplasi numeronmurskausnopeuden/ydin, se sinun pitäisi kyllä tietää.

Sami Riitaoja · 05.11.2018

Kun oikein kaivellaan niin saadaan Applen etu vain kymmeneksi prosentiksi. Intelin kääntäjä huijaa Spec-testeissä, eli siellä on vartavasten käsin optimoituja polkuja jotka korvaa koodia tehokkaammalla, tämä on ihan tunnettua ja Intelin kääntäjää ei spec-testeissä käytetä jos halutaan edes suurinpiirtein vertailukelpoisia tuloksia.

Koko homman pointtihan on että Applen prossu on niin sairaan hyvä että kusinen kännykkä kilpailee ihan tasaveroisesti Intelin parhaan pään serveriprossun kanssa Spec-tuloksissakin, tässä nyt ei kellään voi jäädä epäselväksi että Applen prossu on aivan sairaan hyvä vrt Intelin tuotokset.

IPC ei nyt tosiaan voi arkkitehtuurien välillä vertailla suoraan mutta epäsuorasti voi esimerkiksi juuri käännettyjen Spec-tulosten kanssa aivan hyvin. Applen prossu taitaa dekoodata ja suorittaa maksimissaan 7 käskyä per kellojakso ja toteutuneetkin on hyvin korkeat, tässä lienee apua paljonkin yksinkertaisesta käskykannasta.

anidabi · 05.11.2018

hkultala sanoi:
Intelillä on ollut MCM ainakin jo vuonna 1995, Pentium Prossa. Ennen AMDtä.

Sen jälkeen Intelillä on ollut MCM ainakin mm. Pentium D:ssä vuonna 2005, Core 2 quadissa vuonna 2008, Westmeressä vuonna 2010, ja Kaby Lake-G:ssä tänä vuonna.

Se, että intel käyttää MCMää ei ole mitään AMDn kopiointia.

Pointtini ei ollut että kuka tehnyt ensimmäisenä MCM ratkaisun vaan lähinnä toi intelin nykyinen nolo sekoilu ja huutelu "liimaus" haukkumiset sun muut.

mRkukov · 05.11.2018

anidabi sanoi:
Pointtini ei ollut että kuka tehnyt ensimmäisenä MCM ratkaisun vaan lähinnä toi intelin nykyinen nolo sekoilu ja huutelu "liimaus" haukkumiset sun muut.

Pakkohan intelin on yrittää kampittaa jos kilpailija meinaa päästä edelle.

Kannattaa myös hieman katsoa noita intelin slidejä. Monessako muistutetaan että "meillä on 20 vuoden kokemus". Vastaus: Melkein joka toisessa.

Läkäläkä · 05.11.2018

Sami Riitaoja sanoi:
jonkun Anandtech-foorumin käyttäjän testaamana

Joku Anandtech-foorumin käyttäjä työskentelee Applen markkinointitiimissä.

Sami Riitaoja · 05.11.2018

Läkäläkä sanoi:
Joku Anandtech-foorumin käyttäjä työskentelee Applen markkinointitiimissä.

Se A12 on niin nopea että eihän sitä ihan helposti todeksi usko. Mutta jo A10 ja A11 olivat hyviä.

Anandtechin virallinen artikkelihan jutun nosti esiin joku aika sitten(Applen kännykkäprossu on yhden threadin nopeudessa aivan tasaveroinen Intelin desktop-prossujen kanssa), nää myöhemmät on sitten käyttäjien omia vertailuja. Ei ole vielä näkynyt testejä joissa A12 olisi flopannut....

The iPhone XS & XS Max Review: Unveiling the Silicon Secrets

prc · 05.11.2018

Sami Riitaoja sanoi:
Se A12 on niin nopea että eihän sitä ihan helposti todeksi usko. Mutta jo A10 ja A11 olivat hyviä.

Anandtechin virallinen artikkelihan jutun nosti esiin joku aika sitten(Applen kännykkäprossu on yhden threadin nopeudessa aivan tasaveroinen Intelin desktop-prossujen kanssa), nää myöhemmät on sitten käyttäjien omia vertailuja. Ei ole vielä näkynyt testejä joissa A12 olisi flopannut....

The iPhone XS & XS Max Review: Unveiling the Silicon Secrets

Vielä kun tiedettäisiin enemmän siitä A12, että miten pitkät (ts. mobiili lastun kysessä ollessa lyhyet) liukuhihnat siinä on. Voipi olla, että deskarien huippupään tehot jää saavuttamatta, koska arkkitehtuurinsa puolesta ei veny riittäville kelloille.

Itselleppä tuo on ihan sama kun ei omana prossua voi käyttää ilman että myy (ts. maksaa siitä että saa antaa ilmaiseksi) sielunsa ja datansa omena firmalle ja olla vendor lockissa, niin ei tule koskaan omena prossua käyttöönkään.

Threadripper · 05.11.2018

Läkäläkä sanoi:
Joku Anandtech-foorumin käyttäjä työskentelee Applen markkinointitiimissä.

Anandtechin perustaja työskentelee Applelle :psmoke:

Sami Riitaoja sanoi:
Se A12 on niin nopea että eihän sitä ihan helposti todeksi usko. Mutta jo A10 ja A11 olivat hyviä.

Anandtechin virallinen artikkelihan jutun nosti esiin joku aika sitten(Applen kännykkäprossu on yhden threadin nopeudessa aivan tasaveroinen Intelin desktop-prossujen kanssa), nää myöhemmät on sitten käyttäjien omia vertailuja. Ei ole vielä näkynyt testejä joissa A12 olisi flopannut....

The iPhone XS & XS Max Review: Unveiling the Silicon Secrets

Ihan sattumaa kuinka sivuston omistaja siirtyy Applen palkkalistoille ja Applea ylistetään joka käänteessä

yberkurko · 05.11.2018

Voisko ton omppufanituksen siirtää vaikka omaan omppuihannointiketjuunsa? (Jos semmonen on; en tiedä enkä välitä vaikkei olisi... mappi Ö kelpaa myös)

Mut asiaan. Taisi tosiaan tulla kiire, kun on noin selkeästi valittu kotiinpäin vetävät testit ja vielä verrokkiprossusta smt laitettu pois (tasoittamaan sitä, ettei vielä toimi intelin testiversiossa tarpeeksi hyvin tai lainkaan?)

Sami Riitaoja · 05.11.2018

Threadripper sanoi:
Ihan sattumaa kuinka sivuston omistaja siirtyy Applen palkkalistoille ja Applea ylistetään joka käänteessä

Taitaapi olla sangen vahva Intel-sponsorointi em. sivustolla ja havaintoja A12:n suorituskyvystä ei suurinpiirtein uskalleta edes mainita kunnolla.

Applesta voi olla mitä mieltä vain mutta tosiasia on että ne on tehneet jo useamman todella hyvän prosessoriytimen, ja kun samalla Intel on täysin halvaantunut uusien mallien peruuntuessa valmistusteknisistä syistä tilanne on nyt suorastaan naurettava.

Kepe · 05.11.2018

Threadripper sanoi:
Anandtechin perustaja työskentelee Applelle
Ihan sattumaa kuinka sivuston omistaja siirtyy Applen palkkalistoille ja Applea ylistetään joka käänteessä

Anand Lal Shimpi lähti Applelle töihin joskus 4v sitten eikä sillä ole sen jälkeen ollut mitään tekemistä perustaneensa sivuston kanssa. Anandtechin on omistanut 4 vuoden ajan sama firma joka omistaa Tom's Hardwaren.

Anand osasi kyllä hehkuttaa Applea, ja Applen puhelimet sai ihan valtavan määrän huomiota ja artikkeleita sivustolla Anandin aikaan. Nykyään meno on ollu tasaisempaa, ja jostain vuoden tai parin takaisesta Applen puhelinpiiristä ei edes koskaan saatu aikaan deep dive -artikkelia, joita Anandtechissa on totuttu näkemään, vaikka sellaista oltiin lupailtu.

Sama kuin syyttäisit Sampsa Kurria siitä, mitä Muropaketissa tapahtuu (tai ei tapahdu, lol) nykyään.

hkultala · 05.11.2018

Sami Riitaoja sanoi:
Taitaapi olla sangen vahva Intel-sponsorointi em. sivustolla ja havaintoja A12:n suorituskyvystä ei suurinpiirtein uskalleta edes mainita kunnolla.

Applesta voi olla mitä mieltä vain mutta tosiasia on että ne on tehneet jo useamman todella hyvän prosessoriytimen,

Tämän ketjun aihe on Intelin palvelinprosessorit, ei applen mobiiliprosessorit.

Applen mobiiliprosessoreiden ylistäminen on tällä on aivan täyttä off-topiccia. Ne kun eivät ole edes millään tavalla kilpaileva tuote näille.

Ja kun samalla Intel on täysin halvaantunut uusien mallien peruuntuessa valmistusteknisistä syistä tilanne on nyt suorastaan naurettava.

Höpöhöpö. Juuri viime vuonna tuottiin skylake-SP joka sekä tuplasi SIMD-leveyden että lisäsi ydinmäärää, ja lisäksi uusi piirin sisäisen väylä- ja välimuistirakenteen.

Ja nyt taas yhden soketin ydinmäärää melkein tuplattiin.

Eli yhden soketin numeronmurskaussuorituskyky on intelillä n. nelinkertaistunut sinä aikana kun Intel sinun mielestäsi on ollut "halvanntunut".

Nutti · 05.11.2018

Hintaa tällä on $15000, joten se Epyc on yhä järki vaihtoehto.

JiiPee · 05.11.2018

Njahas että sieltä se liimailtu intteli sitten tullatupsahti. Johan tuo Adoredtv tästä osasi kerto monta kuukautta sitten.

mRkukov · 06.11.2018

JiiPee sanoi:
Njahas että sieltä se liimailtu intteli sitten tullatupsahti. Johan tuo Adoredtv tästä osasi kerto monta kuukautta sitten.

Ja todeta että tdp tulee olemaan järkyttävä.

hkultala · 06.11.2018

mRkukov sanoi:
Ja todeta että tdp tulee olemaan järkyttävä.

Voihan se aika melkoinen olla, riippuu hyvin paljon kellotaajuudesta.

Nuo valitut benchmarkit kuitenkin ehkä vähän vihjaisivat siihen, että kellotaajuus ei tule olemaan kovin korkea, vaan kelloja on tiputettu reippaasti alaspäin.

Juuri sen takia mielestäni tällainen >1000 mm^2 piitä on yleensä mielestäni järkevämpi laittaa useampaan sokettiin, saadaan jäähdytys toteutettua paremmin.

Olisi mielenkiintoista tietää siitä päätöksentekoprosessista, joka tähän piiriin johti. Tuliko sieltä vaan korkeammalta tasolta käsky, että "meillä pitää olla parempi yhden prosessorin suorituskyky ja suurempi ydinmäärä kuin AMDllä" ja insinöörit yrittäneet selittää, että "eikun meillä näitä soketteja laitetaan 2 siinä missä AMDllä yksi" vai onko tässä olleet oikeasti insinöörit täydellä sydämellä mukana haluamassa tehdä järeintä 1-sokettista x86-piiriä.

mRkukov · 06.11.2018

hkultala sanoi:
Voihan se aika melkoinen olla, riippuu hyvin paljon kellotaajuudesta.

Onkohan nuo 28 ytimisiä piirejä, joista 4 huonointa on otettu pois juuri siksi, että saadaan kelloja lisää? 28 ytimen saannot huonoja ja kellot jää aina sen heikomman coren tasolle. Silloin se 4 ytimen poistaminen käytöstä voisi tarkoittaa edes jonkin sortin kellotaajuutta. Toki testit oli aika hyvin valittu kertomaan mahdollisimman vähän.

hkultala · 06.11.2018

mRkukov sanoi:
Onkohan nuo 28 ytimisiä piirejä, joista 4 huonointa on otettu pois juuri siksi, että saadaan kelloja lisää? 28 ytimen saannot huonoja ja kellot jää aina sen heikomman coren tasolle. Silloin se 4 ytimen poistaminen käytöstä voisi tarkoittaa edes jonkin sortin kellotaajuutta. Toki testit oli aika hyvin valittu kertomaan mahdollisimman vähän.

Ei, vaan ihan suorien piirin rikkovien valmistusvirheiden.

Tuo on melkein 700 mm^2 kokoinen piilastu. On aika suuri todennäköisyys, että sinne tulee jonnekin valmistusvirhe, mikä tarkoittaa, että vain harvoja piilastuja voidaan käyttää 28-ytimisinä. Mutta jos siellä on valmistusvirheitä vain maksimissaan neljän ytimen kohdalla, voidaan se käyttää 24-ytimisenä.

Käsittääkseni nuo kellotaajuuteen ja virrankulutukseen vaikuttavat valmistustekniikan variaatiot menee enemmän siten, että saman piilastun sisälle ei näiden suhteen kovin suuria eroja ei tule, vaan ero on enemmänkkn piikiekon reuna vs piikiekon keskiosa, tai eri piikiekkojen välillä. En ole tästä kuitenkaan aivan varma. Ja toki tuo on niin iso piilastu, että tuleehan siinä jo reunimmaisten ytimien välille selvästi matkaa että toinen on selvästi lähempänä keskustaa kuin toinen.

Intel kertoi lisää Cascade Lake -palvelinprosessoreista + uudet suorituskykytestit

Banhammer

Hrrrr...

Banhammer

Suomen Michael Jackson

Hrrrr...

Hrrrr...

Suomen Michael Jackson

Hrrrr...

Hrrrr...

Banhammer

Hrrrr...

Hrrrr...

Hrrrr...

Hrrrr...

Uutiset

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi