Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Tuo viivanalle jäävähän saadaan helposti tuotua niin lähelle nollaa kun halutaan, lyhennetään lainoja, sijoitetaan tuotekehitykseen jne. AMD:lla on aika pirusti lainaa, joten sitä taakkaa varmaan aika mielellään pienentävät nyt tämän hyvän tuloksen avulla. Siellä ei kuitenkaan istuta rahakirstun päällä.
Ei se lainojen lyhentäminen vähennä mitenkään voittoja viivan alta - kassaa kylläkin.
 
Tämä "pakon sanelema juttu" on jotain, jota Intel on suunnitteluosastollaan parhaillaan kopioimassa kaikin insinöörivoimin. Mooren lain mukaisessa kasvussa ei ole enää mahdollista pysyä mitenkään muuten kuin Chiplet-ratkaisuilla.
En nyt olisi niin varma tuosta. Chipletit ovat yksi ratkaisu, mutta varsinkin kuluttajapuolella en ole ihan vakuuttunut, että ne olisivat varsinkaan korkeintaan 8 ytimen prosessoreissa paras ratkaisu. AMD:lle ne ovat olleet hyvä ratkaisu, kun samoja siruja voidaan käyttää servereissä ja desktopissa ja täten vähentää suunnittelukuluja, mutta kyllähän tuossa otetaan latensseissa takkiin. Serveripuoli ja HEDT ovat sitten ihan eri asia, siellä prioriteetit ovat toiset.
 
Tämä "pakon sanelema juttu" on jotain, jota Intel on suunnitteluosastollaan parhaillaan kopioimassa kaikin insinöörivoimin. Mooren lain mukaisessa kasvussa ei ole enää mahdollista pysyä mitenkään muuten kuin Chiplet-ratkaisuilla.
Ei nyt kannata ihan liikoja luulla.
Tuossa ratkaisussa on edelleen ongelmia, joista ryzenit kärsii selvästi ja tuollaisenaan tuo on, kuten totesin jo vanha ratkaisu intelille. Ei tuossa siis ole mitään ihmeellistä vaikeaa kopioimista. sen sijaan tuossa syntyvien viiveiden pienentäminen / seurausten minimointi on kaikilla se asia, joka on ongelma ja johon kaikki etsivät niitä ratkaisuja "insinöörivoimin".
 
Ei nyt kannata ihan liikoja luulla.
Tuossa ratkaisussa on edelleen ongelmia, joista ryzenit kärsii selvästi ja tuollaisenaan tuo on, kuten totesin jo vanha ratkaisu intelille. Ei tuossa siis ole mitään ihmeellistä vaikeaa kopioimista. sen sijaan tuossa syntyvien viiveiden pienentäminen / seurausten minimointi on kaikilla se asia, joka on ongelma ja johon kaikki etsivät niitä ratkaisuja "insinöörivoimin".
Koko prosessorin suunnittelu uudelleen siten, että sillä on oma I/O-siru ja ytimet on viety AMD:n kaltaisille "compute" chipleteille vie aikaa. Koko nykyinen design pitää räjäyttää kappaleiksi ja se ei tapahdu vuodessa.

Tuo AMD:n malli, jossa compute chiplet on yhteinen niin palvelin- kuin työpöytäprosesseille ja HEDT-prosessoreille on todella innovatiivinen ja mahdollistaa sirujen hyödyntämisen valmiissa tuotteissa hyvin monipuolisilla tavoilla sirujen ominaisuudet parhaiten (lajittelemalla) hyödyntäen.

Toki chiplet-mallissa on omat ongelmansa, mutta samat ongelmat ovat jatkossa kaikilla suuritehoisia työpöytä- tai palvelinprosessoreita tekevillä valmistajilla.

Tällä hetkellä Intel on etenkin palvelinprosessoreissa täysin altavastaaja - AMD:ta edes läheisesti vastaavia tuotteita ei yksinkertaisesti ole Intelillä tarjolla, sillä nykyiset tuotteet eivät skaalaudu yli 28 ytimeen. Kilpailukykyisten tuotteiden suunnittelu vie aikansa ja niiden julkaisua on tuskin odotettavissa ennen vuotta 2021.
 
Viimeksi muokattu:
Koko prosessorin suunnittelu uudelleen siten, että sillä on oma I/O-siru ja ytimet on viety AMD:n kaltaisille "compute" chipleteille vie aikaa. Koko nykyinen design pitää räjäyttää kappaleiksi ja se ei tapahdu vuodessa.

Ensinnäkin, sillä ei ole mitään vaikutusta itse ytimiin. Että "koko designia" ei todellakaan pidä "räjäyttää", vaan vain piiri(e)n korkean tason layout ja korkeimman tason väyläarkkitehtuuri menisi uusiksi.

Ja AMDlläkään se korkean tason väyläarkkitehtuuri ei ole kovin optimaalinen neljän ytimen CCXillä kahdeksan ytimen chipleteille. Vasta zen3ssa se arkkitehtuuri tulee olemaan näiden suhteen järkevä.

Toisekseen, sinulla ei ole mitään tietoa siitä, millä aikataululla intel on minkäkinlaisten prosessorien suunnittelun aloittanut.

Ja intel on jo HotChips-konferenssissaan kertonut lakefield-prosessoreistaan.

Intel Lakefield 3D Foveros Hybrid Processors: Hot Chips 31 Live Coverage

Niissä samaan pakettiin paketoidaan useampi piilastu, mutta sillä erolla AMDhen verrattuna, että
1) piilastut ovat päällekkäin ei vierekkäin, ja niiden välille saadaan paljon suurempi kaistanleveys ja paketti vie vähemmän tilaa.
2) Samaan pakettiin ängetään vielä myös DRAM-muistikin.
3) Muistiohjain on samalla piilastulla kuin prosessorikin, eikä IO-piilastulla, mikä mahdollistaa prosessorille selvästi pienemmät muistiviiveet.

Ajatus, että "intel alkoi kopioida AMDn parempaa ratkaisua heti kun kuuli siitä" on yksinkertaisesti todella typerä.
Intel kyllä tietää, että samaan pakettiin voi laittaa erilaisia piilastuja, intel on tehnyt sitä kymmeniä vuosia (mm. pentium pro:ssa jo 1990-luvulla) ja Intelillä oli aivan zen2n kaltainen ratkaisu n. 10 vuotta sitten ensimmäisen sukupolven core 5issa, mutta siitä luovuttiin, mm. koska muistiohjain haluttiin muistiviiveiden parantamiseksi samalle piilastulle prosessoriytimien kanssa.

Ja nyt tosiaan inteliltä on tulossa hiukan samantyylinen mutta yksityiskohdiltaan kuitenkin selvästi erilainen ratkaisu jossa mm. ei ole AMDn ratkaisun pahinta huonoa puolta - lisääntynyttä muistiviivettä. Ja se on tulossa sellaisella aikataululla, että on selvää, että sen suunnittelu on aloitettu aiemmin kuin milloin intel kuuli AMDn "chipleteistä".

Intel on itseasiassa nimenomaan jo useita vuosia kehittänyt tuota EMIB-kytkentätekniikkaansa, jolla nimenomaan mahdollisestetaan AMDtä kehittyneemmät MCM-ratkaisut.

Tuo AMD:n malli, jossa compute chiplet on yhteinen niin palvelin- kuin työpöytäprosesseille ja HEDT-prosessoreille on todella innovatiivinen ja mahdollistaa sirujen hyödyntämisen valmiissa tuotteissa hyvin monipuolisilla tavoilla sirujen ominaisuudet parhaiten (lajittelemalla) hyödyntäen.

Se, että samaa sirua voi hyödyntää sekä työpöydällä että palvelimissa tarkoittaa lähinnä sitä, että se ei ole kumpaankaan erityisen hyvin optimoitu.

AMD tarvii tätä, koska AMDllä ei ole resursseja suunnitella montaa erilaista piilastua. Intelillä on.

Tämän sinun suuren "innovaatiosi" ainoat hyödyt tulee pienemmistä R&D-kustannuksista. Ja intel tahkoaa kvartaalissa miljardeja voittoa samalla kun AMD tahkoaa kvartaalissa 120 miljoonaa voittoa - intelillä on insinöörit ja varaa niihin useaman piilastun layoutista tuleviin joitain kymmeniä miljoonia suurempiin R&D-kustannuksiinsa. (paitsi että intel tosin käyttää vielä selvästi suuremman määrän rahaa siihen, että suunnittelee oikeasti erilaisia mikroarkkitehtuureitakin palvelinprosessoreihinsa, koska sillä on varaa siihenkin)

Toki chiplet-mallissa on omat ongelmansa, mutta samat ongelmat ovat jatkossa kaikilla suuritehoisia työpöytä- tai palvelinprosessoreita tekevillä valmistajilla.

Ei ole.

Kun muistiohjain pidetään jatkossakin CPU-piilastulla, ei ole mitään sen takia kasvanutta muistiviivettä.

Tällä hetkellä Intel on etenkin palvelinprosessoreissa täysin altavastaaja - AMD:ta edes läheisesti vastaavia tuotteita ei yksinkertaisesti ole Intelillä tarjolla, sillä nykyiset tuotteet eivät skaalaudu yli 28 ytimeen.

Intel® Xeon® Platinum 9282 Processor (77M Cache, 2.60 GHz) Product Specifications

Intelillä on markkinoilla tuote, jossa on 56 ydintä samassa paketissa. Väite että "intelin nykyiset tuotteet eivät skaalaudu yli 28 ytimeen" on täyttä puppua.

Kilpailukykyisten tuotteiden suunnittelu vie aikansa ja niiden julkaisua on tuskin odotettavissa ennen vuotta 2021.

... ja niitä tuotteita on jatkuvasti tulossa tuotekehitysliukuhihnalla. Ajatus siitä, että jonkun tuotteen kehitys aloitetaan vasta sen jälkeen kun kilpailija on ensin tehnyt oman tuotteensa on todella typerä.

Cooper Lake-SPn ja Ice Lake-SPn pitäisi molempien tulla ulos 2020. Siitä, kuinka kilpailukykyisiä ne tulevat olemaan ei toki ole vielä mitään varmaa tietoa.
 
Viimeksi muokattu:
Intelillä on markkinoilla tuote, jossa on 56 ydintä samassa paketissa. Väite että "intelin nykyiset tuotteet eivät skaalaudu yli 28 ytimeen" on täyttä puppua.

Vielä kun näytät että mistä tuon voisi ostaa :p Isoilta pojilta kuulin huhua, että tuo olisi lähinnä semmoinen show-tuote jolla voidaan esitellä että kyllä mekin tarvittaessa voidaan laittaa coreja nippuun, mutta ei tuota oikeasti ole tarjottu suurille markkinoille. Ei taida olla edes benchmarkkeja tai revikoita missään.
 
Vielä kun näytät että mistä tuon voisi ostaa :p Isoilta pojilta kuulin huhua, että tuo olisi lähinnä semmoinen show-tuote jolla voidaan esitellä että kyllä mekin tarvittaessa voidaan laittaa coreja nippuun, mutta ei tuota oikeasti ole tarjottu suurille markkinoille. Ei taida olla edes benchmarkkeja tai revikoita missään.
Eiköhän esim Delliltä saa, kun ladot tarpeeksi vaihdonvälinettä heillepäin:
Intel® Xeon® Scalable processors | Dell USA
PDF:ssä on esim mainittu.
 
Viimeksi muokattu:
Vielä kun näytät että mistä tuon voisi ostaa :p Isoilta pojilta kuulin huhua, että tuo olisi lähinnä semmoinen show-tuote jolla voidaan esitellä että kyllä mekin tarvittaessa voidaan laittaa coreja nippuun, mutta ei tuota oikeasti ole tarjottu suurille markkinoille. Ei taida olla edes benchmarkkeja tai revikoita missään.

Vaikka tuolta saa tilattua koneen jossa on tuollainen

https://www.aspsys.com/server-list/intel-s9200wk-server/

Mikään verkkokauppa.com ei pidä tuollaisia hyllyssä, koska niiden menekki on sen verran pientä, ettei ole järkeä ottaa hyllyyn. Noita menee isojen valmistajien järeimpiin palvelinmalleihin, ei kukaan itse kokoa konetta tuollaisista.

Ei niitä EPYCejäkään löydy verkkokaupan hinnastosta erillisinä, vaan pitää osaa koko palvelin jos sellaisen haluaa. Ja niissäkin palvelimissa, joita verkkokauppa.com:n hinnastoista löytyy, on vielä vasta ekan sukupolven EPYCjä, ei vielä zen2-pohjaisia.
 
Ja intel on jo HotChips-konferenssissaan kertonut lakefield-prosessoreistaan.
Intel Lakefield 3D Foveros Hybrid Processors: Hot Chips 31 Live Coverage

Niissä samaan pakettiin paketoidaan useampi piilastu, mutta sillä erolla AMDhen verrattuna, että
1) piilastut ovat päällekkäin ei vierekkäin, ja niiden välille saadaan paljon suurempi kaistanleveys ja paketti vie vähemmän tilaa.
2) Samaan pakettiin ängetään vielä myös DRAM-muistikin.
3) Muistiohjain on samalla piilastulla kuin prosessorikin, eikä IO-piilastulla, mikä mahdollistaa prosessorille selvästi pienemmät muistiviiveet.

Foveros on ymmärtääkseni aika vähävirtaisille laitteille suunnattu prossu. Vasteaikojen suhteen tällainen kolmen akselin paketoinnin tehokkuus on varmasti kiistämätön. Kuitenkin olisi mielenkiintoista nähdä miten tämä skaalautuu kovemmille kuormille ja nimenomaan lämpökuormille koska näin maallikon silmään tuon rakenteen jäähdytys voi olla melko haastavaa jos lujaa halutaan mennä.
 
Foveros on ymmärtääkseni aika vähävirtaisille laitteille suunnattu prossu. Vasteaikojen suhteen tällainen kolmen akselin paketoinnin tehokkuus on varmasti kiistämätön. Kuitenkin olisi mielenkiintoista nähdä miten tämä skaalautuu kovemmille kuormille ja nimenomaan lämpökuormille koska näin maallikon silmään tuon rakenteen jäähdytys voi olla melko haastavaa jos lujaa halutaan mennä.

Tuo piiri ei tosiaan ole tulossa pöytäkoneille, eikä tarvikaan. Pöytäkoneeseen muisteja ei haluta samaan pakettiin vaan ulkoisille DIMMeille, ja IO-piiriäkään ei työpöydällä tarvi laittaa alle, koska ei ole tilanpuutetta, se voidaan laittaa joko 1) viereen 2) emolevylle erilliseksi eteläsiltapiiriksi 3) integroida samalle piilastulle ytimien kanssa.

Tosiaan IO-piirin laittaminen kauas emolevyllekin toimii erinomaisesti kun muistiohjain pidetään CPU-piirillä, IO-piirille ei mene mitään viivekriittistä ja kaistaa sinne saadaan ihan tarpeeksi sen tarpeisiin vaikka se olisi emolevylläkin.

Heitin tuon vaan esimerkkinä siitä, että vastaavaa (mutta kuitenkin yksityiskohdiltaan selvästi erilaista) tekniikkaa on inteliltä tulossa, ja että kyse ei ole mistään "AMDn kopioinnista".
 
Viimeksi muokattu:
Ei niitä EPYCejäkään löydy verkkokaupan hinnastosta erillisinä, vaan pitää osaa koko palvelin jos sellaisen haluaa. Ja niissäkin palvelimissa, joita verkkokauppa.com:n hinnastoista löytyy, on vielä vasta ekan sukupolven EPYCjä, ei vielä zen2-pohjaisia.

Tosta esim. pari paikkaa joista vois halutessaan pistää ostoskoriin ja tilata 64-ytimisen Epyc 7742:n. Noin viikon toimitusajalla nuita löytyy vaikka mistä.

AMD EPYC 7742 64-Core 2.25GHz (3.4 GHz Max Boost) Socket SP3 225W 100-100000053WOF Server Processor - Newegg.com
AMD EPYC 7742 - 2.25 GHz - 64 Kerne - 128 Threads - 256 MB Cache-Speicher - Socket SP3 · [ PC-KING ]
 
Intelillä on markkinoilla tuote, jossa on 56 ydintä samassa paketissa. Väite että "intelin nykyiset tuotteet eivät skaalaudu yli 28 ytimeen" on täyttä puppua.
Ja AMD:llä on tarjota 128 ydintä samaan NUMA konfiguraatioon samalla virrankulutuksella. Väittäisin että skaalautuminen on parempi AMD:n tuotteilla tällä hetkellä. Kukaan ei halua noodeja enempää kuin on aivan pakko.
 
Se, että samaa sirua voi hyödyntää sekä työpöydällä että palvelimissa tarkoittaa lähinnä sitä, että se ei ole kumpaankaan erityisen hyvin optimoitu.

AMD:n alkuperäisissä suunnitelmissa Zen2 arkkitehtuuri ja chipplet-layout oli tulossa pelkästään servereihin, eli se nimenomaan on sinne optimoitu.

Osatekijänä tässä sopassa oli GoFlon vetäytyminen uusista valmistusmenetelmistä ja TSCM:n 7nm prosessin odotukset ylittävät maksimikellot
 
Ja AMD:llä on tarjota 128 ydintä samaan NUMA konfiguraatioon samalla virrankulutuksella. Väittäisin että skaalautuminen on parempi AMD:n tuotteilla tällä hetkellä. Kukaan ei halua noodeja enempää kuin on aivan pakko.

Kyllä, skaalautuminen suurelle määrälle ytimiä on tällä hetkellä AMDllä parempaa, mutta MOS6510 väitti että intelin piirit eivät skaalaudu yli 28 ytimeen, mikä on puppua.

Ja virrankulutusero tulee valmistusprosessista, ei arkkitehtuurista. Intelin tämän hetken palvelinprossut on vielä tehty "vanhalla" "14nm" prosessilla, joka on optimoitu saavuttamaan maksimaalinen kellotaajuus, ja häviää energiatehokkuudeltaan selvästi TSMCn "7nm" prosessille.

Ensi vuonna tuleva Ice Lake SP tullaaan valmistamaan uudemmalla "10nm" valmistustekniikalla.
 
AMD:n alkuperäisissä suunnitelmissa Zen2 arkkitehtuuri ja chipplet-layout oli tulossa pelkästään servereihin, eli se nimenomaan on sinne optimoitu.

Osatekijänä tässä sopassa oli GoFlon vetäytyminen uusista valmistusmenetelmistä ja TSCM:n 7nm prosessin odotukset ylittävät maksimikellot

Valitan OT, mutta GloFo ja TSMC (huom.kirjoitusasu) sopivat muuten tässä viikolla kaikki patenttikiistansa ja ristiinlisensoivat teknologioitansa nyt toisilleen.

GlobalFoundries and TSMC Sign Broad Cross-Licensing Agreement, Dismiss Lawsuits
 
AMD:n "innovaatio" oli pakon sanelema juttu. Ko tekniikkaan liittyy myös ongelmia (miksi sitä ei käytetty) ja ko ongelmat ovat edelleen olemassa.

Mitä ongelmia?

Ei nyt kannata ihan liikoja luulla.
Tuossa ratkaisussa on edelleen ongelmia, joista ryzenit kärsii selvästi ja tuollaisenaan tuo on, kuten totesin jo vanha ratkaisu intelille. Ei tuossa siis ole mitään ihmeellistä vaikeaa kopioimista. sen sijaan tuossa syntyvien viiveiden pienentäminen / seurausten minimointi on kaikilla se asia, joka on ongelma ja johon kaikki etsivät niitä ratkaisuja "insinöörivoimin".

Mitä ne ongelmat nyt oikein on mitkä tekee siitä niin huonon että sinun tarvii joka käänteessä muistutella asiasta? Jos tarkoitat jotain muistilatensseja niin eipä ne latenssit ole inttelin meshissäkään mitenkään erityisen mairittelevat.

Ja nyt tosiaan inteliltä on tulossa hiukan samantyylinen mutta yksityiskohdiltaan kuitenkin selvästi erilainen ratkaisu jossa mm. ei ole AMDn ratkaisun pahinta huonoa puolta - lisääntynyttä muistiviivettä. Ja se on tulossa sellaisella aikataululla, että on selvää, että sen suunnittelu on aloitettu aiemmin kuin milloin intel kuuli AMDn "chipleteistä".

Eli jos intteliltä on tulossa "chiplet" ratkaisu niin en ymmärrä että miten ihmeessä ne pystyy toteuttamaan sen niin ettei muistiviiveissä näy varsinkin jos tunkeevat muistiohjaimet niihin core chipletteihin. Sehän vastaa silloin ensimmäisen genin epyc:ä jonka akilleen kantapää oli nimenomaan siinä että muistiohjaimet oli chipleteillä joka puolestaan generoi sitten x määrän numa nodeja.

Intel on itseasiassa nimenomaan jo useita vuosia kehittänyt tuota EMIB-kytkentätekniikkaansa, jolla nimenomaan mahdollisestetaan AMDtä kehittyneemmät MCM-ratkaisut.

Ja AMD on jo vuosia tutkinut aktiivisen interposerin käyttöä että saa nähdä mitä joku Zen 5 vaikka tuo tullessaan. Kyse on siitä että AMD:llä on MCM nyt ulkona ja varsin hyvällä mallilla. Inttelillä ei ole hyvällä mallilla juuri nyt, ainoastaan jotain liimarävellyksiä josta joku vuosi takaperin kovasti ilkkuivat AMD:tä.

Intelillä on markkinoilla tuote, jossa on 56 ydintä samassa paketissa. Väite että "intelin nykyiset tuotteet eivät skaalaudu yli 28 ytimeen" on täyttä puppua.

Halo tuotteita ei lasketa.

Kyllä, skaalautuminen suurelle määrälle ytimiä on tällä hetkellä AMDllä parempaa, mutta MOS6510 väitti että intelin piirit eivät skaalaudu yli 28 ytimeen, mikä on puppua.

No jos liimailtu halo tuote sinun mielestäsi on validi niin sitten joo, omasta mielestäni Inttelillä ei kyllä ole mitään 28-coresta ylitte koska toi 56-core liimaprossu on sellainen tuote että käsittääkseni yksikään AIB ei edes innostunut emoja kyseisellä rävellykselle tekemään. Eikä pidä unohtaa että kyseisen rävellyksen virrankulutus on jotain aivan tolkutonta.
 
Mitä ongelmia?

1) Muistin viive.
2) "CPU-Chiplettejä" muistiohjaimpiiriin yhdistävän väylän energiankulutus (ja kun tästä ei liiku vain itse muistiaccessit vaan myös suuri määrä välimuistikoherenssiusliikennettä)
3) AMDn toteutuksessa myös se, että käytetään vanhaa sokettia jonka pinout oli tarkoitettu aivan erilaiselle muistiohjainten sijoittelulle paketissa - signaalivedot paketin sisällä on epäoptimaaliset, mikä vaikuttaa niiden laatuun - voi rajoittaa kellotaajuutta, millä muisteja voidaan luotettavasti käyttää

Mitä ne ongelmat nyt oikein on mitkä tekee siitä niin huonon että sinun tarvii joka käänteessä muistutella asiasta? Jos tarkoitat jotain muistilatensseja niin eipä ne latenssit ole inttelin meshissäkään mitenkään erityisen mairittelevat.

Benchmarkkien perusteella Xeonin meshin viiveissä ei ole mitään vikaa, on ihan ymmärrettää että 28 ytimen kytkentäverkko on hiukan hitaam kuin AMDn neljän ytimen kytkentäverkko, ja L3-viive on Intelillä tämän takia hitaampi kuin AMDllä. Ja se globaali L3 mahdollistaa yhden ytimen käyttöön yli tuplasti suuremman L3-välimuistin kuin AMDn erilliset L3-välimuistit mahdollistavan. Ja silti ero sen L3n viiveessä vain 7ns (EPYC 6642 vs Xeon 8280)

Mutta lopetetaan siitä jauhaminen, sillä ei ole mitään tekemistä sen kanssa, että ne muistiohjaimet ovat eri piirillä, tuntuu pelkältä harhautukselta että edes otit tuon tässä esille.

Anandtechin reviewissä muistiviive Xeonilla 89-109 ns, EPYCillä 113-134ns.

(vaikka xeon pyöri selvästi matalammalla kellolla ja käytti selvästi hitaampia muisteja)

Eli jos intteliltä on tulossa "chiplet" ratkaisu niin en ymmärrä että miten ihmeessä ne pystyy toteuttamaan sen niin ettei muistiviiveissä näy varsinkin jos tunkeevat muistiohjaimet niihin core chipletteihin. Sehän vastaa silloin ensimmäisen genin epyc:ä jonka akilleen kantapää oli nimenomaan siinä että muistiohjaimet oli chipleteillä joka puolestaan generoi sitten x määrän numa nodeja.

Siten että niitä cpu+muistiohjain-piirejä ei koskaan ole enempää kuin yksi.

Kännyköihin ja tabletteihin tehty piiri ei kilpaile minkään EPYCin kanssa.

Ja AMD on jo vuosia tutkinut aktiivisen interposerin käyttöä että saa nähdä mitä joku Zen 5 vaikka tuo tullessaan. Kyse on siitä että AMD:llä on MCM nyt ulkona ja varsin hyvällä mallilla. Inttelillä ei ole hyvällä mallilla juuri nyt, ainoastaan jotain liimarävellyksiä josta joku vuosi takaperin kovasti ilkkuivat AMD:tä.

:facepalm:

Liima kuuluu prosessorin paketointiin, ihan samanlaista se Intelin liima on kuin AMDn liima. Eikä tällä liimalla ole mitään tekemistä sen kanssa, onko piiri MCM tai montako NUMA-nodea siinä paketissa on.

Mutta jos puhtutaan MCMien käyttämästä kytkentätekniikasta ja siitä mitä tekniikkaa firmoilla on olemassa niin tästä tunnut olevan pihalla kuin lumiukko.

Intelillä on jo ulkona (ilmeisesti ei tosin käytössä cascade lake-APssa mutta käytössä parissa muussa tuotteessa) EMIB joka mahdollistaa aika paljon paremman hinta-nopeussuhteen kytkentöihin saman paketin sisällä. AMD joutuu joko käyttämään kaikkien siihen kytkettävien piirien kokoista interposeria (kallis) tai perinteisiä johtoja paketin sisällä (hidastaa tiedonsiirtoa selvästi).

Halo tuotteita ei lasketa.

Mitä ihmettä oikein höpiste joistain haloista?

Kyseessä on palvelinprosessori jota myydään oikeita palvelimia valmistaville firmoille, oikeisiin käyttöarkoituksiin, eikä näillä ole mitään tekemistä sen kanssa että Pekka Perusmuro pääsee sanomaan "mun pappa betalar-rahoilla hankittu prossu on nopeampi kuin sun", mitä ilmeisesti haloillasi tarkoitat.

No jos liimailtu halo tuote sinun mielestäsi on validi niin sitten joo, omasta mielestäni Inttelillä ei kyllä ole mitään 28-coresta ylitte koska toi 56-core liimaprossu on sellainen tuote että käsittääkseni yksikään AIB ei edes innostunut emoja kyseisellä rävellykselle tekemään. Eikä pidä unohtaa että kyseisen rävellyksen virrankulutus on jotain aivan tolkutonta.

Kaikki prossut on liimattuja. Sillä, että paketin sisällä on kaksi NUMA-nodea ei ole mitään tekemistä sen liiman kanssa, se on sen kanssa täysin ortogonaali asia.

"Omasta mielestä" :facepalm:

Se, onko intelillä 56-ytiminen prosessoripaketti markkinoilla ei ole mielipideasia. Se, että siitä sellasta yritetään tehdä on melkoisen typerää ylimielisyyttä.

Ja siinä, että tuolle ei tehdä erillisemoja myytäviksi kolmansille osapuolille on kyse vain hinnasta, ei siitä että se olisi jotenkin "räpellys". Käytännössä kukaan harrastelija, tai edes pienen tietokonefirman työntekijä ei ala kokoamaan konetta, jossa on yli kymppitonnin prossu, vaan sellaisen palvelimen ostaa kokonaisena iso firma toiselta isolta firmalta.



Ja jos pitää NUMAn aiheuttamaa viiveilisää toiseen piilastuun kytkettyyn muistiin pahaan asiana, voisi miettiä, että kumpi onkaan huonompi
1) Ilman NUMA-optimointeja puolet accesseista on toisen piirin muistiohjaimessa, jolloin niihin tulee viivepenalty, mutta NUMA-optimointejen kanssa (melkein) accessit osuu omaan muistiin, ilman viivepenaltyä
2) KAIKKI accessit on toisella piirilastulla olevassa muistiohjaimessa, jolloin KAIKKIIN tulee viivepenalty eikä tätä voi nopeuttaa millän optimoinneilla.
 
Viimeksi muokattu:
Liima kuuluu prosessorin paketointiin, ihan samanlaista se Intelin liima on kuin AMDn liima. Eikä tällä liimalla ole mitään tekemistä sen kanssa, onko piiri MCM tai montako NUMA-nodea siinä paketissa on.

...
Kaikki prossut on liimattuja. Sillä, että paketin sisällä on kaksi NUMA-nodea ei ole mitään tekemistä sen liiman kanssa, se on sen kanssa täysin ortogonaali asia.
AMD:n EPYC:llä (ym. Zen -prosessoreiden) ja Intelin ratkaisulla on se erä, että Zen -arkkitehtuuri eri versioineen on lähtökohtaisesti suunniteltu MCM -ratkaisuksi. Mielestäni tässä AMD:n tapauksessa ei voi siis puhua 'liimaratkaisusta'.

Intelin 56-coren versio taas ei ole lähtökohtaisesti suunniteltu MCM-ratkaisuksi, vaan siinä on käytännössä kahdella erillisellä kannalla toimivat 28-ydinprosessorit yhdistetty yhdelle kannalle. Kyse on pikemminkin emolevytason kanden kannan integroinnista yhdelle kannalle. 56-coren ratkaisuja ei sitten saakaan 2 kannan ratkaisuina.
Intel -ratkaisusta voi siis mielestäni käyttää termiä 'liimaratkaisu' - se kun on hätäistä reagointia AMD:n fiksumpaan MCM-toteutukseen eikä alkuperäinen suunnittelutavoite.
 
AMD:n EPYC:llä (ym. Zen -prosessoreiden) ja Intelin ratkaisulla on se erä, että Zen -arkkitehtuuri eri versioineen on lähtökohtaisesti suunniteltu MCM -ratkaisuksi. Mielestäni tässä AMD:n tapauksessa ei voi siis puhua 'liimaratkaisusta'.

Intelin 56-coren versio taas ei ole lähtökohtaisesti suunniteltu MCM-ratkaisuksi, vaan siinä on käytännössä kahdella erillisellä kannalla toimivat 28-ydinprosessorit yhdistetty yhdelle kannalle. Kyse on pikemminkin emolevytason kanden kannan integroinnista yhdelle kannalle. 56-coren ratkaisuja ei sitten saakaan 2 kannan ratkaisuina.
Intel -ratkaisusta voi siis mielestäni käyttää termiä 'liimaratkaisu' - se kun on hätäistä reagointia AMD:n fiksumpaan MCM-toteutukseen eikä alkuperäinen suunnittelutavoite.

Kuten totesin: Zenin rakenne oli pakon sanelema juttu. Ei AMD:llä ollut varaa /mahdollisuutta käydä tíettämään kovinkaan isoja piirejä. Siitä nyt seurasi ongelmia muistilatenssien kanssa, jonka takia suorituskyky kärsi ratkaisevasti (Intel on pelipuolella pysynyt hieman edellä). Pelipuolella kun ei nyt auta, olipa niitä coreja 8 tai 128 vaan päinvastoin, pienemmän coremäärän prossuja voidaan yleensä ajella vähäsen suuremmilla kelloilla, jolloin pelit toimivat paremmin.
 
AMD:n EPYC:llä (ym. Zen -prosessoreiden) ja Intelin ratkaisulla on se erä, että Zen -arkkitehtuuri eri versioineen on lähtökohtaisesti suunniteltu MCM -ratkaisuksi. Mielestäni tässä AMD:n tapauksessa ei voi siis puhua 'liimaratkaisusta'.

Jos ruvetaan tutkimaan sitä piirien sisäistä arkkitehtuuria sen suhteen että kuinka optimaalisia ne on niissä käytetyihin MCM-ratkaisuihin, niin eipä ne AMDn nykypiiritkään mitenkään erityisen optimaalisesti siihen suunniteltuja ole:

Zen2n neljän ytimen CCXt kahdeksan ytimen "chipleteillä" tarkoittaa sitä että siellä joko
A) tarvitaan käytännössä kolmentasoisia väyliä, 1) CCXn sisäinen 2) saman paketin sisässä CCXt yhdistävä ja 3) CPU-chipletin ja IO-piirin välinen, TAI
B) on täysin erilliset väylät CPU-chipletin molemmilta CCXltä IO-piirille, mikä on melkoista haaskuuta verrattuna siihen, paljonko muistikaistaa yhden CCXn ytimet voivat saada käyttöönsä.

Vasta zen3 on tämän suhteen oikeasti järkevä/siihen optimoitu arkkitehtuuri, kun siinä CCXn koko on tuplattu kahdeksaan ytimeen joten sieltä CCXltä voi lähteä suoraan yksi väylä IO-piirille.

Intelin 56-coren versio taas ei ole lähtökohtaisesti suunniteltu MCM-ratkaisuksi, vaan siinä on käytännössä kahdella erillisellä kannalla toimivat 28-ydinprosessorit yhdistetty yhdelle kannalle. Kyse on pikemminkin emolevytason kanden kannan integroinnista yhdelle kannalle. 56-coren ratkaisuja ei sitten saakaan 2 kannan ratkaisuina.

Cascade Lake-AP toimii aivan hyvin kahden soketin kokoonpanoissa, ja vapaiden(*") UPI-linkkien määrän(4) pitäisi mahdollistaa jopa neljän soketin kokoonpanot, tosin neljän soketin kokoonpanoja ei ilmeisesti ole julkistettu.

(niitä UPI-linkkejä on siis oikeasti 2*3 kpl, mutta molemmista piilastuista käytetään yksi niiden yhdistämiseen toisiinsa)
 
Viimeksi muokattu:
Ja virrankulutusero tulee valmistusprosessista, ei arkkitehtuurista. Intelin tämän hetken palvelinprossut on vielä tehty "vanhalla" "14nm" prosessilla, joka on optimoitu saavuttamaan maksimaalinen kellotaajuus, ja häviää energiatehokkuudeltaan selvästi TSMCn "7nm" prosessille.

Ensi vuonna tuleva Ice Lake SP tullaaan valmistamaan uudemmalla "10nm" valmistustekniikalla.
Käsittääkseni keskusteltiin prosessoreista (semmoisista joita saa kaupasta) eikä valmistusprosesseista. Ensi vuonna tulee kans 7nm+ prosessilla zen3 joka luultavasti pyyhkii lattiaa kaikella mitä tulee inteliltä markkinoille. Ice laken IPC parannukset eivät riitä ottamaan nykyistäkään zen2:sta kiinni ja 10nm ei ainakaan läppäritesteissä ole osoittautunut merkittävästi virtapihimmäksi kuin 14nm+++ prosessi.

AMDn toteutuksessa myös se, että käytetään vanhaa sokettia jonka pinout oli tarkoitettu aivan erilaiselle muistiohjainten sijoittelulle paketissa - signaalivedot paketin sisällä on epäoptimaaliset, mikä vaikuttaa niiden laatuun - voi rajoittaa kellotaajuutta, millä muisteja voidaan luotettavasti käyttää
Ihan hyvä teoria sulla tässä, mutta faktat puhuu vastaan. Sekä speksatut, että käytännön muistikellot on kovemmat amd:n tuotteissa tällä hetkellä. Jopa ennätyskellontaajuuksia metsästetään tällä hetkellä onnistuneemmin ryzen alustalla.
 
Käsittääkseni keskusteltiin prosessoreista (semmoisista joita saa kaupasta) eikä valmistusprosesseista.
Valmistusprosessi vaikuttaa saatanasti kulutukseen ja kelloihin, mitä on mahdollista järkevästi ajaa 24/7 satunnaisen turbon kera, niin on hyvä ottaa se huomioon prossuista puhuttaessa.
 
Kos ruvetaan tutkimaan sitä piirien sisäistä arkkitehtuuria sen suhteen että kuinka optimaalisia ne on niissä käytetyihin MCM-ratkaisuihin, niin eipä ne AMDn nykypiiritkään mitenkään erityisen optimaalisesti siihen suunniteltuja ole:

Zen2n neljän ytimen CCXt kahdeksan ytimen "chipleteillä" nimenomaan vaikuttaa nimenomaan melko epäoptimaaliselta rakenteelta jota ei ole mietitty alusta asti chiplettejä/MCMää silmälläpitäen kun siellä joko
A) tarvitaan käytännössä kolmentasoisia väyliä, 1) CCXn sisäinen 2) saman paketin sisässä CCXt yhdistävä ja 3) CPU-chipletin ja IO-piirin välinen, TAI
B) on täysin erilliset väylät CPU-chipletin molemmilta CCXltä IO-piirille, mikä on melkoista haaskuuta verrattuna siihen, paljonko muistikaistaa yhden CCXn ytimet voivat saada käyttöönsä.

Vasta zen3 on tämän suhteen oikeasti järkevä/siihen optimoitu arkkitehtuuri, kun siinä CCXn koko on tuplattu kahdeksaan ytimeen joten sieltä CCXltä voi lähteä suoraan yksi väylä IO-piirille.



Cascade Lake AP toimii aivan hyvin vähintään kahden soketin kokoonpanoissa, ja vapaiden UPI-linkkien määrän(4) pitäisi mahdollistaa jopa neljän soketin kokoonpanot.

(niitä UPI-linkkejä on siis oikeasti 2*3 kpl, mutta molemmista piilastuista käytetään yksi niiden yhdistämiseen toisiinsa)
Eivät AMD:n nykypiirit ole optimaalisesti suunniteltuja MCM-toteutuksia, vaikka mielestäni Zen2 alkaakin olla oikeilla jäljillä.
Mutta: Tässä ratkaisussa on muita merkittäviä segmentointiin liittyviä etuja.
- Zen /Zen+ -ratkaisussa saatiin yhdellä ainoalla chipletillä (+ segmenttikohtaisella interposerilla) skaalattua 4-32 CPU:n ja 2-8 muistikanavan ratkaisuja sekä kaikki muisti/io/ym. tarpeet. Intel tarvitsi tähän aika monta erillistä piiritoteutusta (pelkästään Xeon -puolella LCC/HCC/XCC, kuluttajapuolella vielä lukuisia lisää (2,4, 6 ja 8 coren chipit + niiden eri versiot). Tämä oli nopeuden kannalta aika epäoptimaalinen ratkaisu, mutta suunnittelun, kustannusten, segmentoinnin ja tuotannon & saannon kannalta riemuvoitto verrattuna Intelin ratkaisuun.
- Zen2 -arkkitehtuurissa tehdään edelleen yhtä ainoaa CCD-chiplettiä kaikkiin segmentteihin (4-64 cpu:n prosessorit). Vaikka tässä tarvitaankin eri kannoille erillinen IO-piiri (ainakin yksi versio ryzenille sekä 1- versiota Threadrippereille/EPYCeille), on ratkaisussa saatu poistettua monia Zen/Zen+:n arkkitehtuurin ongelmia. Tämä edelleen merkittävästi fiksumpi arkkitehtuuri kuin mihin Intel on tällä välin kyennyt (tai siis ei ole kyennyt), koska tässä voitiin optimoida CCD:n valmistus 7nm prosessille ja IO-chipin valmistus halvemmalle 12nm prosessille.
Tulevaisuudessa AMD:n MCM -ratkaisu mahdollistaa CCD-chippien ja IO-sirun kehittämisen tuotantoprosessin kannalta erillisinä ratkaisuina, mitä Intelin monoliittinen ratkaisu ei mahdollista.

Tulevaisuudessa on aika varma, että Intel valitsee AMD:n ratkaisua muistuttavan MCM-rakenteen - jollakin tavalla muutettuna ja mahdollisesti paremmin suunniteltuna ja toteutettuna, mutta ei tuolla monoliittiratkaisulla kovin pitkälle enää pärjätä.
 
Valmistusprosessi vaikuttaa saatanasti kulutukseen ja kelloihin, mitä on mahdollista järkevästi ajaa 24/7 satunnaisen turbon kera, niin on hyvä ottaa se huomioon prossuista puhuttaessa.
No miksei intel sit tee prossujaan TSMC:n toimesta? Aivan sama millä tekniikalla ja arkkitehtuurilla asiat on tehty tuotteista puhuttaessa. Suorituskyky ratkaisee.
 
Eivät AMD:n nykypiirit ole optimaalisesti suunniteltuja MCM-toteutuksia, vaikka mielestäni Zen2 alkaakin olla oikeilla jäljillä.
Mutta: Tässä ratkaisussa on muita merkittäviä segmentointiin liittyviä etuja.
- Zen /Zen+ -ratkaisussa saatiin yhdellä ainoalla chipletillä (+ segmenttikohtaisella interposerilla) skaalattua 4-32 CPU:n ja 2-8 muistikanavan ratkaisuja sekä kaikki muisti/io/ym. tarpeet. Intel tarvitsi tähän aika monta erillistä piiritoteutusta (pelkästään Xeon -puolella LCC/HCC/XCC, kuluttajapuolella vielä lukuisia lisää (2,4, 6 ja 8 coren chipit + niiden eri versiot). Tämä oli nopeuden kannalta aika epäoptimaalinen ratkaisu, mutta suunnittelun, kustannusten, segmentoinnin ja tuotannon & saannon kannalta riemuvoitto verrattuna Intelin ratkaisuun.
- Zen2 -arkkitehtuurissa tehdään edelleen yhtä ainoaa CCD-chiplettiä kaikkiin segmentteihin (4-64 cpu:n prosessorit). Vaikka tässä tarvitaankin eri kannoille erillinen IO-piiri (ainakin yksi versio ryzenille sekä 1- versiota Threadrippereille/EPYCeille), on ratkaisussa saatu poistettua monia Zen/Zen+:n arkkitehtuurin ongelmia. Tämä edelleen merkittävästi fiksumpi arkkitehtuuri kuin mihin Intel on tällä välin kyennyt (tai siis ei ole kyennyt), koska tässä voitiin optimoida CCD:n valmistus 7nm prosessille ja IO-chipin valmistus halvemmalle 12nm prosessille.
Tulevaisuudessa AMD:n MCM -ratkaisu mahdollistaa CCD-chippien ja IO-sirun kehittämisen tuotantoprosessin kannalta erillisinä ratkaisuina, mitä Intelin monoliittinen ratkaisu ei mahdollista.

Tulevaisuudessa on aika varma, että Intel valitsee AMD:n ratkaisua muistuttavan MCM-rakenteen - jollakin tavalla muutettuna ja mahdollisesti paremmin suunniteltuna ja toteutettuna, mutta ei tuolla monoliittiratkaisulla kovin pitkälle enää pärjätä.

Kaikessa on kyse tradeoffeista, valinnoista siitä mitä pidetään tärkeänä.

AMD on tällä rakenteellaan optimoinut R&D-kustannuksia (lähinnä eri piirien layout-kustannuksia), koska sillä ei ole varaa layoutata viittä eri CPU-piilastua vuodessa.

Intelillä myynti on niin paljon suurempaa, että sillä on varaa layoutata viisi eri CPU-piilastua vuodessa.

Kyse ei tämän suhteen ole mistään että "AMDllä olisi käytössään parempaa teknologiaa" tai "AMD on valinnut fiksumman artkkitehtuurin" kuten jotkut yrittää väittää, vaan siitä että AMD joutuu optimoimaan sitä, monellako eri piilastulla saa kaiken katettua siinä missä intel voi tehdä eri kokoluokkiin niille optimoidut piilastut.
 
Näkisin että AMD:n innovaatio oli soveltaa teknologiaa tavalla jota intelin ei ole tarvinut tehdä.

Eikä siinä ole mitään vähäteltävää, mielestäni AMDn suoritus on koko Zen aikakautena ollu yhtiön resursseihin katsoen huikean hieno.

Ja saahan siitä sivutuotteena edullisia yli 8 ytimen prosessoreitakin
 
Käsittääkseni keskusteltiin prosessoreista (semmoisista joita saa kaupasta) eikä valmistusprosesseista.

Käsittääkseni vertailtiin prosessorien arkkitehtuurillisia ominaisuuksia.

Ja palvelinprossuja ei osteta erillisinä kaupasta vaan ostetaan koko palvelinkone.

Ensi vuonna tulee kans 7nm+ prosessilla zen3 joka luultavasti pyyhkii lattiaa kaikella mitä tulee inteliltä markkinoille. Ice laken IPC parannukset eivät riitä ottamaan nykyistäkään zen2:sta kiinni

Ice Laken IPC on luokkaa n. 15% zen2n IPCn edellä, vaikka ei edes käytetä AVX-512sta. Ja jos AVX-512sta käytetään, ero kasvaa vielä paljon suuremmaksi.

Kelloa se ei toki vielä ota yhtä paljoa kuin coffee lake, mutta palvelimissa ei muutenkaan käytetä ytimiä niiden maksimikelloilla. Ja ottaa kelloa about yhtä paljon kuin zen2.

ja 10nm ei ainakaan läppäritesteissä ole osoittautunut merkittävästi virtapihimmäksi kuin 14nm+++ prosessi.

Kerrotko lisää näistä testeistä? Jotain yli vuoden takaisia Cannon Lake-testejä? Sitä on sen jälkeen ehditty viilamaan aika paljon, ja ice lake/sunny cove on muutenkin erilainen arkkitehtuuri kuin cannon lake.
 
Viimeksi muokattu:
AMD:llä nimenomaan on käytössä ylivoimaista teknologiaa, ei se muuten olisi Inteliä edellä jokaisella mittarilla yhden ytimen maksimisuorituskykyä lukuunottamatta.

Eli ne Intelin eri tehtäviin optimoidut piirit ovat kuraa verrattuna AMD:n tuotteisiin paitsi pelikäyttöön ostettavissa koneissa ja sielläkin AMD:n hinnoittelu on agresiivisempaa, ts AMD:ltä saat samaan hintaan enemmän säikeitä
 
Kaikessa on kyse tradeoffeista, valinnoista siitä mitä pidetään tärkeänä.

AMD on tällä rakenteellaan optimoinut R&D-kustannuksia (lähinnä eri piirien layout-kustannuksia), koska sillä ei ole varaa layoutata viittä eri CPU-piilastua vuodessa.

Intelillä myynti on niin paljon suurempaa, että sillä on varaa layoutata viisi eri CPU-piilastua vuodessa.

Kyse ei tämän suhteen ole mistään että "AMDllä olisi käytössään parempaa teknologiaa" tai "AMD on valinnut fiksumman artkkitehtuurin" kuten jotkut yrittää väittää, vaan siitä että AMD joutuu optimoimaan sitä, monellako eri piilastulla saa kaiken katettua siinä missä intel voi tehdä eri kokoluokkiin niille optimoidut piilastut.
AMD on tällä ratkaisulla erityisesti optiminut tuotantokustannuksia.
Minkähän kokoinen olisi 14nm+ -prosessilla tehty 64-ytimen Xeon? Mitkä olisivat saannot? Mikä olisi virrankulutus? Mitä maksaisi?
-> mahdoton.
Jo 56 core glue-Xeon on järkyttävän kokoinen, kuuma ja kallis. Eikä pärjää suorityskyvyssä 64-coren merkittävästi edullsiemmalle EPYCille.
AMD on pystynyt ratkaisullaan sellaiseen mihin Intel ei ole pystynyt.

Hullu paljon työtä tekee, viisas pääsee vähemmällä. Ja tässä tapauksessa pääsee myös parempaan lopputulokseen.
 
Viimeksi muokattu:
AMD:llä nimenomaan on käytössä ylivoimaista teknologiaa, ei se muuten olisi Inteliä edellä jokaisella mittarilla yhden ytimen maksimisuorituskykyä lukuunottamatta
Sanoisin ennemminkin, että niillä oli käytössä ylivoimainen suunnittelija mitä tuli zen arkkitehtuurin kehittämiseen, mutta Keller on jo lähtenyt muihin seikkailuihin...
 
AMD:llä nimenomaan on käytössä ylivoimaista teknologiaa, ei se muuten olisi Inteliä edellä jokaisella mittarilla yhden ytimen maksimisuorituskykyä lukuunottamatta.

:facepalm:

"Jokaisella mittarilla" on puhdasta paskaa. Suosittelisin vähän avaamaan katsantokantaa siitä, millaisia mittareita on olemassa.

Nopeasti tule mieleen mm. seuraavat asiat:

1)
Läppäriprossuissa Intel on huomattavasti AMDn läppäriprossuja edellä, käytännössä millä tahansa CPU-suorituskykyä mittaavalla testillä mitattuna.
(Tämä on asia joka menee tarpeeksi lähelle jopa perusmuron hyvin kapeaa koti-PC-näkökulmaa että tämä pitäisi ainakin huomata)

2)
Maksimaalisessa yhden tietokoneen (Yhden SMP/NUMA-järjestelmän) numeronmurskaussuorituskyyvyssä Skylake-SP/Cascade Lake-SP on moninkertaisesti EPYCiä edellä, intelillä saa samaa muistia accessoimaan 224 ydintä joissa AVX-512 (7168 DP flops/cycle), AMDllä 128 ydintä joissa vain AVX2 (2048 DP flops/cycle). Ja muistikanavia Skylake-SP-järjestelmässä 48, EPYC-järjestelmässä 16.

Skylake-SP & Cascade Lake-SP nimittäin skaalautuu kahdeksaan sokettiin asti, EPYC vain kahteen.

AMDllä ainoa keino saada enemmän numeronmurskaussuorituskykyä on laittaa koneita useampi kappale, ja silloin kommunikaatio ei enää toimi siten että vaan kirjoitetaan ja luetaan samaa muistia.

Ja sillä on ihan älyttömästi väliä, voiko ne säikeet suoraan käyttää samoja pointtereita ja vaan accessoida sitä dataa suoraan, vain pitää alkaa erikseen siirtämään dataa tietokoneelta toiselle.


3)
Yhden soketin numeronmurskauksessakin Cascade Lake-AP on selvästi EPYCin edellä, koska 12 vs 8 muistikanavaa, ja AVX-512, vaikka AMDllä onkin hiukan enemmän ytimiä (64 vs 56).

4)
AMDltä puuttuu DDIO, joka pienentää kivasti viivettä sen välillä, koska verkkopaketti saapuu ja koska CPU saa sen datan käsiteltyä, ja voi myös säästää hiukan muistikaistaa.

Eli ne Intelin eri tehtäviin optimoidut piirit ovat kuraa verrattuna AMD:n tuotteisiin paitsi pelikäyttöön ostettavissa koneissa ja sielläkin AMD:n hinnoittelu on agresiivisempaa, ts AMD:ltä saat samaan hintaan enemmän säikeitä

Suurempi säikeiden määrä on irrelevantti asia. Se, millä on väliä on suorituskyky joka näkyy käyttäjälle.



Mutta hei, AMD keksi uuden markkinointitermin, "Chiplet", joten senhän täytyy automaattisesti tarkoittaa sitä, että AMDllä on käytössään aivan ylivoimaista teknologiaa ja sen kaikkien prossujen pitää kaikessa (muussa paitsi yhden säikeen suoriotuskyvyssä) automaattisesti tämän ansiosta olla Intelin kaikkia kilpailevia prosessoreita parempia! Viis faktoista!
 
Viimeksi muokattu:
1) läppärit Intelille, se on selvä.
2) kuinkas yleinen skenaario on maksimaalinen suorituskyky maksoi mitä maksoi periaatteella? Ja vielä pitäisi AVX-512 hyödyntävä ohjelmisto.
3) katse se hinta... AMD:ltä dualsocket halvemmalla. Lisäksi toi 56 core vaatii Intelin itsensä mukaan nestejäähdytyksen. Kuinka moni on valmis lähtemään serverien kanssa tuohon? Lisäksi saatavuus on ilmeisen olematon, siinä missä AMD:tä saa jopa tavan kuluttaja hyllystä.

Suorituskyky per rahayksikkö, suorituskyky per watti, säikeet per rahayksikkö, watti per säie jne ovat 99% tapauksissa määrittäviä hankintakriteerejä saatavuuden jälkeen, ei absoluuttinen maksimisuorituskyky hinnasta välittämättä.
 
Ice Laken IPC on luokkaa n. 15% zen2n IPCn edellä
Intel itse kehuu sen olevan vain 18% nopeampi kuin skylake, joka vastaavasti on selvästi yli 3% hitaampi kuin zen2. Mistä ton 15% arvion oot repiny?
Jos oletetaan että intelin 18% pitää paikkansa, niin zen2 nykyisellä n. 13% ipc kaulalla jää vain n. 5% intelin joskus hamassa tulevaisuudessa julkaistavilta tuotteilta. Anandilta tulee tässä lähiaikoina laajempi ipc katsaus skylake vs. icelake, mutta jo toms hardwaren nopea katsaus paljasti että merkittävää suorituskykyparannusta tuli lähinnä grafiikkaohjaimeen ja avx-512 ohjelmiin.

lisäksi toi sun yhden socketin vertailu 56 vs. 64 on ihan roskaa, ku ei sillä sockettien määrällä ole mitään väliä, vaan numa nodeilla. AMD vie ku pässiä narussa 1-2 numa noden konfiguraatioissa ja häviää vain avx-512 hyödyntäville softille 3-4 noodin setupeissa (koska siihen asti se amd:n kahden noodin setuppi on edelleen nopeampi).
 
Ottaen huomioon hkultalan näkemyksen AMD:n kehnosta tasosta on mielenkiintoista, että tässä lähiaikoina on ollut useampikin uutinen supertietokoneista jotka tulevat olemaan Zen2 pohjaisia. Noihin ei kuvittelisi paskaa valittavan
 
Ottaen huomioon hkultalan näkemyksen AMD:n kehnosta tasosta on mielenkiintoista, että tässä lähiaikoina on ollut useampikin uutinen supertietokoneista jotka tulevat olemaan Zen2 pohjaisia. Noihin ei kuvittelisi paskaa valittavan
Saattaa kuitenkin vain olla että et ymmärrä lukemaasi. Missään ei tässä keskustelun kontekstissa ole väitetty etteikö ole tehtäviä maailmassa, joka voisi hoitua AMD:lla, nopeammin, paremmin, halvemmalla tms.
 
Ottaen huomioon hkultalan näkemyksen AMD:n kehnosta tasosta on mielenkiintoista, että tässä lähiaikoina on ollut useampikin uutinen supertietokoneista jotka tulevat olemaan Zen2 pohjaisia. Noihin ei kuvittelisi paskaa valittavan
Joo, suomeenkin on tulossa yksi, mikä muistaakseni koostui kahdesta osasta, joista toinen on zen 2 prosessoreihin perustuva ja toinen intelin prosessoreihin perustuva, eli saadaan sekä hieman paremmin tietynlaisiin numeronmurskauksiin sopiva kone ja toinen toisenlaisiin tarkoituksiin.
Tieteen Tietotekniikan Keskuksen BullSequana-supertietokone tulee olemaan pohjoismaiden tehokkain - io-tech.fi
 
Ottaen huomioon hkultalan näkemyksen AMD:n kehnosta tasosta on mielenkiintoista, että tässä lähiaikoina on ollut useampikin uutinen supertietokoneista jotka tulevat olemaan Zen2 pohjaisia. Noihin ei kuvittelisi paskaa valittavan
Asiassa on kyllä aika monta muuttujaa, esim. käyttötarkoitus ja hinta. AMD:n ratkaisut ovat varsin hyviä, jos esim. säikeiden ei tarvitse käyttää samaa muistiavaruutta.
 
1) läppärit Intelille, se on selvä.
2) kuinkas yleinen skenaario on maksimaalinen suorituskyky maksoi mitä maksoi periaatteella? Ja vielä pitäisi AVX-512 hyödyntävä ohjelmisto.

Kun mennään isojen poikien numeronmurskaukseen (sääennustukset, virtausfysiikan simuloinnit jne) niin tuo on todella merkittävä. Toki osa siitä laskennasta on saatu siirrettyä GPUlle joten tämän merkitys on hiukan vähenemään päin.

Ja isojen poikien softat kyllä osaa hyödyntää kaikki SIMD-käskykannat; Usein ne softat tule lähdekoodina ja ne voi itse kääntää. Ja AVX-512lle on nimenomaan kääntäjän helpompi vektoroida kuin AVX2lle; On looppeja, jotka zen2lla suoritetaan skalaarisena (eikä neljää doublea rinnakkain laskien) mutta käännettynä AVX-512lle saadaan rinnakkaistettua, jollon näiden osalta nopeutus AVX-512sta onkin 8x eikä 2x.

3) katse se hinta... AMD:ltä dualsocket halvemmalla.

Jos kone pitää esim. saada palvelinräkissä tiettyyn kokoon niin sitten se pitää saada tiettyyn kokoon ja siitä maksetaan se mitä se maksaa.

Se, että tuote on kalliimpi ei tee siitä tuotteesta olematonta.

Lisäksi toi 56 core vaatii Intelin itsensä mukaan nestejäähdytyksen. Kuinka moni on valmis lähtemään serverien kanssa tuohon?

Kuka tahansa kuka haluaa palvelinräkkiinsä maksimaalisen suorituskyvyn pieneen tilaan

Lisäksi saatavuus on ilmeisen olematon, siinä missä AMD:tä saa jopa tavan kuluttaja hyllystä.

Mistä hyllystä? Ei ainakaan verkkokauppa.com:n tai Jimmsin hyllystä, ei edes tilaamalla kummastakaan. Verkkokauppa.com:lla ei mitään EPYCejä irrallisena hinnastossa edes tilattavissa, ja jimmsillä vain vanhoja zen1-pohjaisia EPCYejä hinnastossa edes tilattavissa.

Suorituskyky per rahayksikkö

Oletko koskaan kuullut sellaisesta asiasta kuin "markkinatalous"?

Piireistä pyydetään se hinta, minkä asiakkaat ovat niistä valmiit maksamaan.

Intelin datacenter-yksikkö teki jälleen erinomaisen tuloksen, reippaasti yli kolme kertaa enemmän kuin AMDn koko liikevaihto, ja datacenter-yksikön liikevaihto kasvoi viime vuoteen nähden 4%.

Asiakkaat ovat selvästi olleet Intelin piireistä valmiita maksamaan sen minkä intel niistä pyytää.


Se, että intel pystyy pyytämään piireistään suhteessa suorituskykyyn kalliimpaa hintaa ei kerro mitään siitä, että intelin tekniikka olisi "huonompaa". Päin vastoin, se kertoo siitä, että intelillä on piireissään paljon sellaisia palvelinasiakkaille merkittäviä ei suoraan suorituskyvyssä näkyviä ominaisuuksia, joista asiakkaat ovat valmiita maksamaan.

suorituskyky per watti,

Tämä on useissa tapauksissa paikkaansapitävä muttei mitenkään universaalisti.

säikeet per rahayksikkö
watti per säie

Todella typeriä mittareita, joilla ei ole mitään väliä. Kaskun et vielä keksi, että AMDn prosessorit tulee paremmanvärisessä pakkauksessa?

Päin vastoin, siinä että suorituskyky saavutetaan pienemmällä säiemäärällä on kolme merkittävää etua:

1) On ties kuinka paljon softaa, joita ei ole vielä säikeistetty monelle säikeelle
2) On paljon algoritmeja, joita ei voi tehokkaasti säikeistää monelle säikeelle.
3) Vaikka jonkun homman voi tehokkaasti monisäikeistää, jos monisäikeistys pitää tehdä liian korkealla tasolla, voidaan homman suorittamiseen tarvia huomattava määrä säiekohtaista muistia, eli muistinkulutus kasvaa säiemäärän kasvaessa. Voi tuntua sekä siinä, paljonko ohjelma vie muistia että siinä, mikä on ulompien tasojen välimuistien osumatarkkuus
4) Monien palvelinsoftien lisenssimaksu menee sen mukaan, monellako ytimellä tai säikeellä sitä ajetaan.

Näistä neljästä vain ensimmäisen suhteen tilanne on ehkä parantumassa, kolmen jälkimmäisen suhteen ei. Tosin Pythonin ja Javascriptin yleistyminen saattaa näistä ykköstäkin viedä huonompaan suuntaan.


jne ovat 99% tapauksissa määrittäviä hankintakriteerejä saatavuuden jälkeen, ei absoluuttinen maksimisuorituskyky hinnasta välittämättä.

Nuo kaksi viimeistä säijuttua ei ole kenellekään järkevälle ihmiselle hankintakriteereitaä. Ne on hankintakriteereitä ainoastaan idiooteille.
 
Viimeksi muokattu:
Ottaen huomioon hkultalan näkemyksen AMD:n kehnosta tasosta on mielenkiintoista, että tässä lähiaikoina on ollut useampikin uutinen supertietokoneista jotka tulevat olemaan Zen2 pohjaisia. Noihin ei kuvittelisi paskaa valittavan

Näissä olisi mielenkiintoista tietää toteutunut myyntihinta vs Intelin tarjous. Onko siellä myyty zen 2 todella pienillä katteilla PR:n takia?
Joka tapauksessa huikea suoritus AMD:ltä, että voi kilpailla Intelin kanssa niin pienellä budjetilla!
 
Ottaen huomioon hkultalan näkemyksen AMD:n kehnosta tasosta on mielenkiintoista, että tässä lähiaikoina on ollut useampikin uutinen supertietokoneista jotka tulevat olemaan Zen2 pohjaisia. Noihin ei kuvittelisi paskaa valittavan

Missä olen puhunut jotain "AMDn kehnosta tasosta" ?

Olen lähinnä debunkannut joidenkin typeriä väitteitä siitä, että AMD olisi jotenkin ylivoimainen ja tekniikaltaan inteliä edellä, ottamalla esille niitä tilanteita, joissa intel on selvästi AMDtä edellä.

Jos joku tulisi tänne puhumaan paskaa ja keksimään tänne typeriä paikkaansapitämättömiä väitteitä intelin ylivoimaisuudesta, ottaisin aivan samalla tavalla esille tilanteita, joissa AMD on inteliä edellä.


Molemmilla on heikkoutensa ja vahvuutensa.

Ja noissa supertietokoneissa tilanne on se, että niissä mittakaava on suuri, että pitää joka tapauksessa käyttää MPItä että meillä on joka tapauksessa useita erillisiä koneita jolla oma muistinsa. Kun joudutaan tekemään se suuri (ohjelmaa selvästi haittaava) hyppy että sitä ei enää ajeta yhdessä muistissa vaan monessa, sitten on taas melko sama onko niitä 512 vai 2048 kpl.


Ja lisäksi noissa uusissa supertietokoneissa varsinainen numeronmurskaus tehdään usein GPUilla, ei CPUIlla, jolloin sen CPUn numeronmurskausnopeus ei ole niin merkittävä.
 
Missä olen puhunut jotain "AMDn kehnosta tasosta" ?

Olen lähinnä debunkannut joidenkin typeriä väitteitä siitä, että AMD olisi jotenkin ylivoimainen ja tekniikaltaan inteliä edellä, ottamalla esille niitä tilanteita, joissa intel on selvästi AMDtä edellä.

Jos joku tulisi tänne puhumaan paskaa ja keksimään tänne typeriä paikkaansapitämättömiä väitteitä intelin ylivoimaisuudesta, ottaisin aivan samalla tavalla esille tilanteita, joissa AMD on inteliä edellä.


Molemmilla on heikkoutensa ja vahvuutensa.
Kyllä minulle ainakin on noista posteistasi tullut kuva, että kaikki tärkeät softat käyttävät AVX-512:sta, Intel on vaan paras ja AMD:llä on käyttöä lähinna harrastelijoiden koneissa.
 
Missä olen puhunut jotain "AMDn kehnosta tasosta" ?

Olen lähinnä debunkannut joidenkin typeriä väitteitä siitä, että AMD olisi jotenkin ylivoimainen ja tekniikaltaan inteliä edellä, ottamalla esille niitä tilanteita, joissa intel on selvästi AMDtä edellä.

Jos joku tulisi tänne puhumaan paskaa ja keksimään tänne typeriä paikkaansapitämättömiä väitteitä intelin ylivoimaisuudesta, ottaisin aivan samalla tavalla esille tilanteita, joissa AMD on inteliä edellä.
Tällä hetkellä Intel on konesaliratkaisuissa kilpailukyvytön ja AVX-512 on täysin merkityksetön tekninen detailji oikeille yritysten käyttämille sovelluksille (mikään tieteellinen laskenta tai renderöintifarmit eivät ole tällaisia). Kilpailukykyongelmaa pahentaa Intelin huomattavasti suurempi energiankulutus samalla kapasiteetilla. Ja kyllä, tiedän asian.

Intel on jo faktisesti laskenut prosessoriensa hintaa todella paljon listahinnasta, vaikka näitä alennuksia ei ole vielä yleisesti julkistettu.
 
:facepalm:
Maksimaalisessa yhden tietokoneen (Yhden SMP/NUMA-järjestelmän) numeronmurskaussuorituskyyvyssä Skylake-SP/Cascade Lake-SP on moninkertaisesti EPYCiä edellä, intelillä saa samaa muistia accessoimaan 224 ydintä joissa AVX-512 (7168 DP flops/cycle), AMDllä 128 ydintä joissa vain AVX2 (2048 DP flops/cycle). Ja muistikanavia Skylake-SP-järjestelmässä 48, EPYC-järjestelmässä 16.

Skylake-SP & Cascade Lake-SP nimittäin skaalautuu kahdeksaan sokettiin asti, EPYC vain kahteen.
Ihan oikeassa elämässä käytetään nykyisin äärimmäisen harvoin yli kahden socketin palvelimia. Ei sellaiselle ole yrityskäytössä yksinkertaisesti tarvetta, sillä skaalaus voidaan tehdä vertikaalisesti. Nuo 8 socketin palvelimet ovat kuriositeetteja, joita ei monta kappaletta vuodessa Suomen kokoiseen maahan mene.
 
Tällä hetkellä Intel on konesaliratkaisuissa kilpailukyvytön

Ihan täysin kilpailukyvyttömillä prosessoreilla vaan tehtiin Intelin DCG-osastossa 6.4 miljardin liikevaihto yli 3 miljardin voitolla, ja 1.4 miljardin(n. 28%) kasvu liikevaihdossa edellisestä kvartaalista ja n. 4% kasvu viime vuoden Q3-kvartaalista :facepalm:

Intel Reports Third-Quarter 2019 Financial Results | Intel Newsroom

Ihan oikeassa elämässä käytetään nykyisin äärimmäisen harvoin yli kahden socketin palvelimia. Ei sellaiselle ole yrityskäytössä yksinkertaisesti tarvetta, sillä skaalaus voidaan tehdä vertikaalisesti. Nuo 8 socketin palvelimet ovat kuriositeetteja, joita ei monta kappaletta vuodessa Suomen kokoiseen maahan mene.

Tosin, silloin kun ajettava algoritmi vaatii jaetun muistin käyttöä, mikään vertikaalinen skaalauksesi ei toimi.

Ja se, että joku on harvinainen tilanne on merkityksetön argumentti kun keskustellaan siitä, onko jotain tilannetta olemassa vai ei.

Kun nuo esimerkkini olivat vastaesimerkkejä katkarapun typerään "jokaisella mittarilla paitsi yhden säikeen suorituskyvyssä AMD on edellä" -väitteeseen.
 
Viimeksi muokattu:
Ja lisäksi noissa uusissa supertietokoneissa varsinainen numeronmurskaus tehdään usein GPUilla, ei CPUIlla, jolloin sen CPUn numeronmurskausnopeus ei ole niin merkittävä.

Tämä ei ole ihan näin yksinkertainen asia. Suurin osa Zen2 superkoneista ei sisällä GPUta ollenkaan, kuten Suomessa vuodenvaihteen jälkeen käyttöön otettava Mahti, Saksassa käyttöön tuleva Hawk tai tuo juuri uutisoitu ARCHER2.

Moni superkone softa ei vain ole vielä valmis uuden mallin (CPU+GPU) superkoneille ja sen takia niitä ei ihan vielä hommata. Siis esim. ARCHER2ssa pitäisi ajaa pääosin CP2K ja Gromacs ohjelmia (ja muutamaa muuta) ja nuo ohjelmat eivät taivu GPUlle kovin hyvin. Tai sanoisinko, ne saattavat hyötyä GPUsta jossain tilanteissa, kuten Gromacs silloin, kun ajetaan pientä systeemiä, suurilla systeemeillä CPU on tällä hetkellä yksinkertaisesti nopeampi.


Olen yrittänyt miettiä, miksi AMD näyttäisi olevan melkein kaikkien uusien superkoneiden valinta tällä hetkellä, mutta en osaa sanoa miksi. Todennäköisesti tässä on taustalla useita syitä.

Saksassa päätös tehtiin, koska Zen2 kykeni pitämään suurempia kelloja kuin Intelin tarjoama kilpailija. Hintakin varmasti on mukana - siis kuinka paljon saadaan kokonaissuorituskykyä summalla X, ei se mitä yksittäinen jaetunmuistin laskenta solmu kykenee laskemaan, ja tässä AMD on nähtävästi edellä. Lisäksi softat eivät vielä täysin tue avx512ta, kuten CP2K joka on suunnilleen yhtä nopea Cascade Lakella kuin Haswellilla (syynä libint jossa ei ole avx512 tukea).

Tähän loppuu ihan henkilökohtainen kommentti asiaan liittyen.

Iso osa superkone softasta on hyvin vanhaa perua ja ne ovat aika kaukana nykyaikaisesta hyvän ohjelmisto suunnitelun mukaisesta softasta. Niitä vain yritetään pitää hengissä, koska ei ole resursseja/halua tehdä asioita järkevästi. Mistä seuraa, että nyt kun uuden mallin CPU+GPU koneet ovat tulossa, niin niitä ei voidakaan käyttää, koska softan muuttaminen niille sopivaksi on mahdotonta.
 
Ihan täysin kilpailukyvyttömillä prosessoreilla vaan tehtiin Intelin DCG-osastossa 6.4 miljardin liikevaihto yli 3 miljardin voitolla, ja 1.4 miljardin(n. 28%) kasvu liikevaihdossa edellisestä kvartaalista ja n. 4% kasvu viime vuoden Q3-kvartaalista :facepalm:

Intel Reports Third-Quarter 2019 Financial Results | Intel Newsroom
Q3-kvartaalissa ei EPYCien vaikutus näy vielä mitenkään. Q2 2020 alkaa olla jo toinen juttu - tuolloin tulee viivan alla näkymään tiettyjen mallien jopa 70% alennukset.

Tosin, silloin kun ajettava algoritmi vaatii jaetun muistin käyttöä, mikään vertikaalinen skaalauksesi ei toimi.

Ja se, että joku on harvinainen tilanne on merkityksetön argumentti kun keskustellaan siitä, onko jotain tilannetta olemassa vai ei.

Kun nuo esimerkkini olivat vastaesimerkkejä katkarapun typerään "jokaisella mittarilla paitsi yhden säikeen suorituskyvyssä AMD on edellä" -väitteeseen.
Tulet aina löytämään jonkin erityistapauksen, jossa Intel vielä pärjää. Olen itsekin tässä keskustelussa jo aiemmin sanonut, että pienten ydinmäärien + maksimikellojen case-esimerkki, jota tarvitaan ydinpohjaisen lisensoinnin lisenssikulujen minimoimiseksi on esimerkki tapauksesta, jossa Intel on vielä kilpailukykyinen.

Suuren massan osalta (jota edustavat mm. yritysten virtuaalialustat) on Intel tällä hetkellä täysin kilpailukyvytön (nykyisellä virallisella hintatasolla). Ja se tulee näkymään Intelin viivan alla tulevien kvartaalien aikana.

Mitä järeämmästä Intelin prosessorista on kyse, sitä suurempia alennuksia kilpailukyvyn palauttaminen vaatii. 28-core Xeon Platiniumien osalta puhutaan yli 70% alennuksista.

Eikä mikään hinnanalennus poista sitä ongelmaa, että EPYCeillä saa tällä hetkellä 2x kapasiteettia yhteen räkki- tai blade-palvelimeen ja pienemmällä sähkökulutuksella kuin Intelillä.

EPYCit käytännössä myös lopettavat sen pienen 4-socket-busineksen mikä Intelillä vielä on. Eihän kukaan maksa itseään kipeäksi Intelin neljän socketin Xeon Platinium-ratkaisusta (max 4 x 28 = 112 ydintä), kun yhden U:n 2-socket EPYC-palvelin (2 x 64 = 128 ydintä) antaa saman tehon murto-osalla kustannuksista.
 
Viimeksi muokattu:
3) AMDn toteutuksessa myös se, että käytetään vanhaa sokettia jonka pinout oli tarkoitettu aivan erilaiselle muistiohjainten sijoittelulle paketissa - signaalivedot paketin sisällä on epäoptimaaliset, mikä vaikuttaa niiden laatuun - voi rajoittaa kellotaajuutta, millä muisteja voidaan luotettavasti käyttää

Täyttä kukkua ja höpöhöpöhumppaa. Der8auer tuossa joku kuukausi sitten teki videon jossa ajeli 3900X 5GHz:n muistinopeudella. Ja tuo tapahtui ihan vaan biosista muistien tukema profiili valitsemalla, ei vaatinut siis mitään virittämistä, aivan samoin kuin itse heitin silloin tähän 3200MHz DOCP profiilin päälle ja eikun kovaa ajoa.

Siten että niitä cpu+muistiohjain-piirejä ei koskaan ole enempää kuin yksi.

Mutta kun minä vähän yritin tiedustella että miten se intteli hoitaa homman sitten niin paljon paremmin jos ovat menossa "chiplet" ratkaisuun.

Liima kuuluu prosessorin paketointiin, ihan samanlaista se Intelin liima on kuin AMDn liima. Eikä tällä liimalla ole mitään tekemistä sen kanssa, onko piiri MCM tai montako NUMA-nodea siinä paketissa on.

Tiedät kyllä varsin hyvin mitä tuossa yhteydessä sillä liimalla tarkoitin. Se on sitä samaa liimaa jonka käytöstä intteli vielä tovi sitten ilkkui amd:lle.
Se on totta että kaikki prosessorit on liimattuja mutta se ei ollut pointti tuossa. Älä lue asioita kuin piru raamattua.

Kyseessä on palvelinprosessori jota myydään oikeita palvelimia valmistaville firmoille, oikeisiin käyttöarkoituksiin, eikä näillä ole mitään tekemistä sen kanssa että Pekka Perusmuro pääsee sanomaan "mun pappa betalar-rahoilla hankittu prossu on nopeampi kuin sun", mitä ilmeisesti haloillasi tarkoitat.

Edelleen, se on niin "oikea" prosessori ettei kenelläkään ollut halua alkaa tekemään sille emolevyjä paitsi enttelillä itsellään. Eli tuo on kyllä melkoinen menestystarina.

Se, onko intelillä 56-ytiminen prosessoripaketti markkinoilla ei ole mielipideasia. Se, että siitä sellasta yritetään tehdä on melkoisen typerää ylimielisyyttä.

No emolevyjen valmistajat ilmaisi mielipiteensä kyseistä sötöstä kohtaan ja totesivat että kiitos mutta ei kiitos.

Siitä nyt seurasi ongelmia muistilatenssien kanssa, jonka takia suorituskyky kärsi ratkaisevasti (Intel on pelipuolella pysynyt hieman edellä).

Intteli on pelipuolella ainoastaan kellojen takia edellä.

Tämä oli nopeuden kannalta aika epäoptimaalinen ratkaisu, mutta suunnittelun, kustannusten, segmentoinnin ja tuotannon & saannon kannalta riemuvoitto verrattuna Intelin ratkaisuun.

Tämä. Täällä tuntuu osa porukkaa ajattelevan että ainoastaan inttelin tapa valmistaa prosessoreja on se oikea tapa.

Tulevaisuudessa AMD:n MCM -ratkaisu mahdollistaa CCD-chippien ja IO-sirun kehittämisen tuotantoprosessin kannalta erillisinä ratkaisuina, mitä Intelin monoliittinen ratkaisu ei mahdollista.

Intelin suunnitelmat seuraaviksi vuosiksi on erään vuodon perusteella että monoliittisellä prosessorilla jatketaan, 10nm prosessilla core määrä nostetaan 38. On siinä inttelillä mäkeä kiivettäväksi.

Ja palvelinprossuja ei osteta erillisinä kaupasta vaan ostetaan koko palvelinkone.

Kyllä niitä ihan kaupoissa myydään, ei ehkä prismasta saa ostettua mutta kyllä tuota interwebbiä selaamalla löytää montakin putiikkia josta voi epyc taikka xeonia ostaa.
Se ettei suomesta saa, ei tarkoita etteikö maailmalta saisi. Ja ei tarvi edes mennä mihinkään lätäkön toiselle puoleen, riittää kun suuntaa katseensa tuonne keskieurooppaan.

Lisäksi AMD on nyt tuonut jälleen mahdolliseksi datacentereille sen ettei välttämättä tartte laittaa kaikkea uusiksi jos halutaan tehoa lisää. Riittää kun vaihtaa 1st gen epycin romeen. Se että inttelin valtakaudella tämä ei ole ollut mahdollista tai suorituskyky lisät ollu niin pieniä ettei kyseisessä operaatiossa olisi järkeä, ei tarkoita etteikö niin voisi nyt tehdä kun se on taas kerran järkevää. Viimeeksi tuo pelkkien prosessoreiden upgrade on tainnut olla järkevää opteron aikana eli onhan tässä tovi vierähtänyt ja mieliin päässyt pesiytymään syöpä että tarvii koko kone vaihtaa jos tehoa haluaa lisää.

Läppäriprossuissa Intel on huomattavasti AMDn läppäriprossuja edellä, käytännössä millä tahansa CPU-suorituskykyä mittaavalla testillä mitattuna.

Toistaiseksi tämä on faktaa. Tilanne tulee todennäköisesti muuttumaan kunhan pikatsu julkaistaan.

Maksimaalisessa yhden tietokoneen (Yhden SMP/NUMA-järjestelmän) numeronmurskaussuorituskyyvyssä Skylake-SP/Cascade Lake-SP on moninkertaisesti EPYCiä edellä, intelillä saa samaa muistia accessoimaan 224 ydintä joissa AVX-512 (7168 DP flops/cycle), AMDllä 128 ydintä joissa vain AVX2 (2048 DP flops/cycle). Ja muistikanavia Skylake-SP-järjestelmässä 48, EPYC-järjestelmässä 16.

Ohhoh, no nyt kyllä väänsit melkoisen olkikukon!

xeon-processor-scalable-family-tech-overview-fig09.png


Ei taita ihan ongelmaton olla tuo sötös. Hei mutta sehän näyttää aika paljon ensimmäisen genin epyciltä, kun ei lokaalista muistista löydy niin lähetään hyppimään ja pomppimaan UPI:a pitkin. Saattaapi mennä UPI:t tukkoon kun oikein vallattomasti ruvetaan hyppimään.
Pitää olla hyvin hyvin speciaali keissi mihin tommosta ruvetaan hommaamaan.
RDMA kun on keksitty jo tovi sitten niin ei se datan pyörittely esim. ib linkin kautta serveri klusterissa ole enää mitenkään.

Vaikka noita räkillisen laittaisit niin silti Rome:n kanssa saa siihen samaan räkkiin enemmän laskentatehoa ja ei varmaan tarvitse edes ottaa puheeksi sitä mitä räkillinen tommoisia maksaa? Saatikka hörppii sähköä? Taitaa pelkkä emo jo kustantaa yhden dual rome serverin verran. :)

Yhden soketin numeronmurskauksessakin Cascade Lake-AP on selvästi EPYCin edellä, koska 12 vs 8 muistikanavaa, ja AVX-512, vaikka AMDllä onkin hiukan enemmän ytimiä (64 vs 56).

No laitetaan nyt sentään maalitolpat silleen oikeille paikoille että NUMA vs NUMA, eli otetaan AMD:ltä se dual socket rome tuohon vertailuun niin tilanne muuttuu kummasti.

Intelin datacenter-yksikkö teki jälleen erinomaisen tuloksen, reippaasti yli kolme kertaa enemmän kuin AMDn koko liikevaihto, ja datacenter-yksikön liikevaihto kasvoi viime vuoteen nähden 4%.

Ilmeisesti sinä et ole vieläkään oppinut että tuolla isojen poikien leikeissä noi muutokset tapahtuu varsin hitaasti. Vertauksena voisi käyttää tilannetta kun täydessä lastissa oleva öljytankkeri pitää pysäyttää "nopeasti". Siellä saa koneet jumputtaa pitkään "pakilla" että mitään näkyvää tapahtuu saatikka pysähtyy.
Esim. VPS puolella muutoksia alkaa varmaan tapahtua vasta sitten kun pistetään jonnekin ihan uutta salia pystyyn koska kuuma migraatio ei taida edelleenkään olla mahdollinen intel -> amd taikka päinvastoin.
 
Intelin Comet Lake -prosessorien speksejä on vuotanut, tosin K-mallien speksit eivät vielä ole selvillä.
Intel 10th Gen Comet Lake Desktop CPU Family & 400-Series Leaked
Paras ei-K-malli on i9-10900, joka on 10C/20T, 3.0 GHz base clock, 5.1 GHz boost, 65W TDP. Coffee lakessa vastaava on ollut i9-9900, joka on 8C/16T, 3.1 GHz base clock, 5.0 GHz boost ja 65W TDP, eli erona lähinnä pari ydintä lisää. Mielenkiintoista nähdä, että säädetäänkö hinnoittelua kilpailukykyisemmäksi.
 
Täyttä kukkua ja höpöhöpöhumppaa. Der8auer tuossa joku kuukausi sitten teki videon jossa ajeli 3900X 5GHz:n muistinopeudella. Ja tuo tapahtui ihan vaan biosista muistien tukema profiili valitsemalla, ei vaatinut siis mitään virittämistä, aivan samoin kuin itse heitin silloin tähän 3200MHz DOCP profiilin päälle ja eikun kovaa ajoa.

AMD itse esityksessään mainitsee tämän ongelman, tosin näköjään siellä myös todetaan, että saatiin ratkaistua 12-kerroksisella johdotuksella paketin sisällä.

Tom_Ley-Next_Horizon_Gaming-Physical_Design_06092019-page-011.jpg


Mutta joo, saatiin siis ratkaistua selvästi kalliimmalla paketoinnilla, eli lopulta ratkaisun kanssa lisääkin vain valmistuskustannuksia, ei haittaa kelloja.

Mutta kun minä vähän yritin tiedustella että miten se intteli hoitaa homman sitten niin paljon paremmin jos ovat menossa "chiplet" ratkaisuun.

Ensinnäkin, kun keskustellaan suunnitteluratkaisun hyvistä ja huonoista puolista, logiikka että voidaan täysin ignorata AMDn suunnitteluratkaisun negatiiviset puolet, koska "kilpailija on ehkä tekemässä tulevaisuudessa samanlaiset ratkaisun jolloin sillä on ehkä edessään sama negatiiviset puolet" on melkoisen typerä ja värittynyt.

Sillä, tekeekö intel joskus "chiplettejä" myös palvelimiin vai ei ja millainen muistiviive niissä tulee sitten olemaan ei vaikuta siihen, mikä muistiviive AMDn tällä hetkellä markkinoilla olevissa tuotteissa on.

Mutta jos vastataan kysymykseen:

Riippuu täysin mitä sillä "chiplet"-ratkaisulla tarkkaan ottaen tarkoitataan. Että millainen se arkkitehtuuri oikeasti on, ja miten ne on kytketty toisiinsa.

Esim se, että muistiohjain pidetään samalla piilastulla kuin itse ytimet, ja piilastut vaan yhdistetään toisiinsa selvästi nopeammalla väylällä (jonka EMIB mahdollistaa) tarkoittaa selvästi pienempiä keskimääräisiä viiveitä kuin AMDn nykyratkaisussa.

Muta vaikka intel tekee tällaisen teknisesti AMDn ratkaisua muistiviiveiltään ja muistikaistaltaan paremman ratkaisun, sinä todennäköisesti jatkaisit sen haukkumista "liimaksi" koska se "näyttäisi" liikaa siltä, että kaksi "erillispiiriä" on vaan "liimattu" yhteen.

Tiedät kyllä varsin hyvin mitä tuossa yhteydessä sillä liimalla tarkoitin. Se on sitä samaa liimaa jonka käytöstä intteli vielä tovi sitten ilkkui amd:lle.
Se on totta että kaikki prosessorit on liimattuja mutta se ei ollut pointti tuossa. Älä lue asioita kuin piru raamattua.

Se että keskustelussa käytetään jotain lapsellisia ilkkumistermejä kertoo lähinnä keskustelijan tasosta ja haluttomuudesta pysyä asia-argumenteissa.

Edelleen, se on niin "oikea" prosessori ettei kenelläkään ollut halua alkaa tekemään sille emolevyjä paitsi enttelillä itsellään. Eli tuo on kyllä melkoinen menestystarina.

Eiköhän sille ole tehnyt emolevyjä useammat palvelinvalmistajat. Niitä van ei myydä erillään vaan vain kokonaisen koneen mukana. Koska kukaan ei osta yli kymppitonnin prossua ja sille emolevyä irrallisena verkkokauppa.com:sta, vaan tilataan aina kokonainen kon. Tai sitten jos joku google (joka kokoaa itse koneensa) niitä käyttää, ne ostavat ne komponentit aivan muualta kuin normaalista atk-liikkeestä, ja google käyttää esim. ihan omaa standardiaan virtalähten ja emolevyn liittämiseksi toisiinsa, ATX-standardiemot ei googlen koneissa edes toimi.

No emolevyjen valmistajat ilmaisi mielipiteensä kyseistä sötöstä kohtaan ja totesivat että kiitos mutta ei kiitos.

Kts. edellinen kohta

Intteli on pelipuolella ainoastaan kellojen takia edellä.

... mutta jos AMDllä olisi pienemmät muistiviiveet, voisi olla ettei olisi edellä edes niistä suuremmista kelloista huolimatta.

Intelin suunnitelmat seuraaviksi vuosiksi on erään vuodon perusteella että monoliittisellä prosessorilla jatketaan, 10nm prosessilla core määrä nostetaan 38. On siinä inttelillä mäkeä kiivettäväksi.

:facepalm:

Jospa lukisit sen koko sliden niin siellä mainitaan myös Cooper Lake, joka on MCM.

Ja Cascade Lake-APssä vaan on jo kaksi piilastua :facepalm:

Se että pistetään silmät kiinni ja kieltäydytään näkemästä niitä faktoja, jotka on oman maailmankatsomuksen vastaisia, että voidaan sitten kirkkain silmin hokea paikkansapitäviä "vaihtoehtofaktoja" on todella typerää ja älyllisesti epärehellistä.

Kyllä niitä ihan kaupoissa myydään, ei ehkä prismasta saa ostettua mutta kyllä tuota interwebbiä selaamalla löytää montakin putiikkia josta voi epyc taikka xeonia ostaa.
Se ettei suomesta saa, ei tarkoita etteikö maailmalta saisi. Ja ei tarvi edes mennä mihinkään lätäkön toiselle puoleen, riittää kun suuntaa katseensa tuonne keskieurooppaan.

Niin, aivan kuin Cascade lake -APtä saa ostettua vaikka sitä ei sieltä sen verkkokauppa.com:n tai jimmsin hinnastgosta löydy. Molemmat on ihan yhtä oikeita tuotteita.

Lisäksi AMD on nyt tuonut jälleen mahdolliseksi datacentereille sen ettei välttämättä tartte laittaa kaikkea uusiksi jos halutaan tehoa lisää. Riittää kun vaihtaa 1st gen epycin romeen. Se että inttelin valtakaudella tämä ei ole ollut mahdollista tai suorituskyky lisät ollu niin pieniä ettei kyseisessä operaatiossa olisi järkeä, ei tarkoita etteikö niin voisi nyt tehdä kun se on taas kerran järkevää. Viimeeksi tuo pelkkien prosessoreiden upgrade on tainnut olla järkevää opteron aikana eli onhan tässä tovi vierähtänyt ja mieliin päässyt pesiytymään syöpä että tarvii koko kone vaihtaa jos tehoa haluaa lisää.

Taisi onnistua Sandy Bridge EP:stä Ivy Bridge EPhen, 8->12 ydintä

Samoin taisi onnsitua Haswell-EPstä broadwell-EPhen, 18 ->22 ydintä.

Ohhoh, no nyt kyllä väänsit melkoisen olkikukon!



xeon-processor-scalable-family-tech-overview-fig09.png


Ei taita ihan ongelmaton olla tuo sötös. Hei mutta sehän näyttää aika paljon ensimmäisen genin epyciltä, kun ei lokaalista muistista löydy niin lähetään hyppimään ja pomppimaan UPI:a pitkin. Saattaapi mennä UPI:t tukkoon kun oikein vallattomasti ruvetaan hyppimään.
Pitää olla hyvin hyvin speciaali keissi mihin tommosta ruvetaan hommaamaan.
RDMA kun on keksitty jo tovi sitten niin ei se datan pyörittely esim. ib linkin kautta serveri klusterissa ole enää mitenkään.

Ensin kaikkein oleellisin: RDMA ei ole välimuistikoherentti.

Se ei toimi täysin läpinäkyvästi. Dataa pitää erikseen flushailla välimuistista että se näkyy toisille koneille oikein.

Toisekseen:

Se datan siirto UPI-linkin yli on aika paljon nopeampaa kuin sen datan siirto verkon yli.

Melkoisen valikoivaa näkökykyä nähdä se ongelma siinä UPIn nopeudessa muttei nähdä sitä ongelmaa sen paljon hitaamman verkkolinkin nopeudessa.

Kolmannekseen:

Tämä postattiin vastineena ratkakapun typerään väitteeseen, että kaikilla muilla mittareilla paitsi yhden säikeen suorituskyvyllä amd on inteliä edellä.

No laitetaan nyt sentään maalitolpat silleen oikeille paikoille että NUMA vs NUMA, eli otetaan AMD:ltä se dual socket rome tuohon vertailuun niin tilanne muuttuu kummasti.

:facepalm:

Ja tässä malliesimerkki todella törkeästä maalitolppien siirtelystä sinulta. Haluat siirtää maalitolpat kohtaan, missä AMD on optimaalisesti kaikkia rajoittimiaan vastaan, mutta ei ota inteliltä konfiguraatioita, jotka hinkkaa intelin(suurempia) rajoittimia vastaan.

Reilu versio tästä oli jo ylempänä, 8 soketin Xeon(skylake-SP/Cascade lake-SP) vs 2 soketin EPYC.

Ilmeisesti sinä et ole vieläkään oppinut että tuolla isojen poikien leikeissä noi muutokset tapahtuu varsin hitaasti.

Tämän olen tainnut oppia jo melko samoihin aikoihin kuin milloin sinä olet oppinut lukemaan.

Ja tuo "vieläkään"-sanan käyttö tuossa on sinulta jälleen typerä "oletko vieläkään lakannut hakkaamasta vaimoasi"-argumentointivirhe, jolla yrität virheellisesti/valheellisesti vihjata että minulla on joskus aiemmin ollut vaikeuksia sen ymmärtämisessä.

Vertauksena voisi käyttää tilannetta kun täydessä lastissa oleva öljytankkeri pitää pysäyttää "nopeasti". Siellä saa koneet jumputtaa pitkään "pakilla" että mitään näkyvää tapahtuu saatikka pysähtyy.
Esim. VPS puolella muutoksia alkaa varmaan tapahtua vasta sitten kun pistetään jonnekin ihan uutta salia pystyyn koska kuuma migraatio ei taida edelleenkään olla mahdollinen intel -> amd taikka päinvastoin.

Kyllä niitä palvelinkeskuksia rakennetaan jatkuvasti ja niihin hankitaan uusia koneita.

Analysts: There are Now More than 500 Hyperscale Data Centers in the World
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
259 320
Viestejä
4 509 422
Jäsenet
74 352
Uusin jäsen
JuhaSaar

Hinta.fi

Back
Ylös Bottom