Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Itellä jäänyt tuon homman seuraaminen viimevuosina vähemmälle edellisen kerran kuin seurasin aktiivisesti niin itteli vei amd tä kuin pässiä narusta onkohan tilanne edelleen samanlainen silloin kuin aktiivisesti seurasin noita niin oli I5 ja I7 sarjat siellä 3000 sarjalaisissa 4000 sarjaa odoteltiin julkaistavaksi eli muutamaan vuoteen ei oo oikeen innostunut onko tilanne muutunut ja amd saavuttanut inteliä vs jokunen vuosi sitten tilanne

Ilmeisesti et siis ole kartalla ollenkaan etkä ole Ryzen prosessoreista kuullut? Kannattaa tutustua asiaan, AMD on melko lähellä jo nyt Inteliä suorituskyvyssä. Niin lähellä että Intelin on ollut pakko kohta jo tuplata coremäärä kuluttajaluokkaan.
 
Ihan mielenkiinnosta, paljoko arvaat/epäilet Zen2 perustuvien prossujen kelloiksi?

Täysin mahdotonta sanoa, koska mitään speksejä (tietoja ominaisuuksista tai muutoksista) AMD:n sen paremmin kuin prosessitoimittajien puolelta ei ole saatavilla.
Eli onko AMD päivittänyt prosessorin rakenteen leveämmäksi (2x128 > 2x256-bit) ja miten nuo uudet valmistusprosessit vertautuvat nykyisiin tai mitkä niiden prioriteetit noin ylipäänsä ovat.

Jos kuluttajamallit käyttävät TSMC:n prosessia niin luvassa voi olla merkittäviä, positiivisia yllätyksiä.

Jos taas GlobalFoundriesin prosessia, niin omat odotukset romahtaa melkolailla samantien vaikka valmistusprosessi ei olisi edes mikään lisensioitu matalalle tehonkulutukselle optimoitu prosessi, kuten nämä nykyiset.
GlobalFoundriesin kyky suorittaa on ollut keskimäärin ala-arvoinen viimeisen vuosikymmenen: 45nm SOI oli pahoissa ongelmissa alkuvaiheessa, 32nm SHP SOI kesti lähes 2 vuotta päästä toivotulle tasolle, 28nm HPP oli kaikilla osa-alueilla umpisurkea verrattuna aiempaan 32nm SHP prosessiin ja 20nm sekä oma 14nm XM prosessi kuopattiin kokonaan. 14nm LPP ja 12nm LP on taas pääasiassa lisensioituja prosesseja, joten niiden suorituskyky ei kerro GlobalFoundriesin tekemisistä hirveästi.

Keskimäärin GlobalFoundriesien kanssa, mainostetut suorituskykyparannuksiin (eli kellotaajuuksiin) liittyvät lukemat jakamalla kolmella on päästy melko realistiseen lopputulokseen.
Toki jos samaan aikaan tehdään isompia muutoksia itse piirisuunnitteluun, niin silloin niistä ei juuri voida vetää mitään johtopäätöksiä.

Fakta kuitenkin on, että AMD kärsii valtavasti tällä hetkellä käyttämistä valmistusprosesseistaan.

Jos Zen 2 pohjaiset EPYC:t on valmistettu TSMC:n prosessilla, niin silloin on hyvinkin todennäköisestä että myös kuluttajamallitkin ovat.
AMD:lla tuskin on vieläkään resursseja toteuttaa samaa piiriä useammalla eri prosessilla valmistettavaksi.

Veikkaisin että Zen 2 pohjainen "iso" ydin (eli nykyistä Zeppeliniä vastaava) valmistetaan TSMC:n prosessilla ja Zen 2 pohjainen APU GlobalFoundriesin prosessilla.
Vastaavasti näytönohjainpuolella isommat piirit TSMC:llä ja pienemmät GlobalFoundriesilla. Konsoli SoC:t myös todennäköisesti siellä.

Loppupeleissä prosessitoimittajalla ei ole mitään merkitystä, kunhan prosessin ominaisuudet suorituskyvyn kannalta on kohdallaan ja nykyisen kaltaista etumatkaa kilpailijoille ei tarvitse sen takia antaa.
Itse en usko että kellotaajuudet tulevat millään valmistajalla nousemaan merkittävästi nykyisestä tasosta, seuraavan parin vuoden aikana.
 
Voi juku, en malta pysyä housuissani Zen 2 odottaessa. Lähtee kyllä i5 3570k äkäiseen vaihtoon, kun Zen 2 tulee.

Intel-ISSCC3.jpg
 
Viimeksi muokattu:
Täysin mahdotonta sanoa, koska mitään speksejä (tietoja ominaisuuksista tai muutoksista) AMD:n sen paremmin kuin prosessitoimittajien puolelta ei ole saatavilla.

Eilen olit tuota mieltä:

Jos huhut Intelin 9000-sarjan prossuista pitää paikkansa, niin Intelillä tuskin on mitään ongelmia kilpailla Zen 2 pohjaisten prosessorien kanssa.

Et ala edes veikkaamaan käytännössä yhtään mitään Zen2:sta mutta kuitenkin arvioit ettei se pärjää Intelin 9000-sarjalle :confused: "Analyysisi" perustui mihin o_O
 
Et ala edes veikkaamaan käytännössä yhtään mitään Zen2:sta mutta kuitenkin arvioit ettei se pärjää Intelin 9000-sarjalle :confused: "Analyysisi" perustui mihin o_O

Villi veikkaus: ihan vaan siksi, että tälläkin hetkellä Intelin tämän hetken suorituskykyisin arkkitehtuuri on sen keskimäärin 7-10% nopeampi kaikessa Clock-to-Clock vrt. Zen+, ja että kellotaajuus on intelillä tälläkin hetkellä sen +600 MHz korkeampi samalla kulutuksella. :smoke: Jos nuo huhut IPC suorituskyvyn kasvusta Zen 2:ssa pitävät paikkaansa, pitää Intel asemansa ihan pelkällä kellotaajuus erolla. Tietysti siinä tilanteessa, että TSMC:n 7nm prosessi mahdollistaisi Zenille korkeammat kellotaajuudet voisi AMD saada Intelin kiinni lähes kaikessa. :kahvi:
 
Villi veikkaus: ihan vaan siksi, että tälläkin hetkellä Intelin tämän hetken suorituskykyisin arkkitehtuuri on sen keskimäärin 7-10% nopeampi kaikessa Clock-to-Clock vrt. Zen+, ja että kellotaajuus on intelillä tälläkin hetkellä sen +600 MHz korkeampi samalla kulutuksella. :smoke: Jos nuo huhut IPC suorituskyvyn kasvusta Zen 2:ssa pitävät paikkaansa, pitää Intel asemansa ihan pelkällä kellotaajuus erolla. Tietysti siinä tilanteessa, että TSMC:n 7nm prosessi mahdollistaisi Zenille korkeammat kellotaajuudet voisi AMD saada Intelin kiinni lähes kaikessa. :kahvi:

TSMC:n ja Global Foundriesin 7nm prosessit ovat molemmat parempia (ainakin paperilla) kuin Intelin nykyinen prosessi. Eli mikäli AMD saa Intelin IPC:ssa kiinni, AMD menee valmistustekniikan ansiosta menojaan.

Eli tiivistetysti: AMD päivittää arkkitehtuuria ja vaihtaa Inteliä parempaan valmistusprosessiin, Intel pysyy edellä kun laittaa kaksi ydintä lisää :btooth:
 
Eilen olit tuota mieltä:



Et ala edes veikkaamaan käytännössä yhtään mitään Zen2:sta mutta kuitenkin arvioit ettei se pärjää Intelin 9000-sarjalle :confused: "Analyysisi" perustui mihin o_O

Sillä perusteella, että en usko AMD:n puolelta vaadittujen parannusten olevan realistisia yhden sukupolven aikana.

Coffee Lakella on 14.4% keskimääräinen etumatka IPC:ssä Pinnacle Ridgeen nähden. 9000-sarjan prosessorien IPC on lähes varmasti täsmälleen sama kuin Skylakella, Kaby Lakella ja Coffee Lakella.

Jos AMD saa Zen 2 IPC:tä hilattua tuon verran ylöspäin, kasvatettua kellotaajuuksia > 15% ja potentiaalisesti vielä kasvatettua ytimien määrää siinä samalla, niin ei voi kuin hattua nostaa.

Markettipuvun (prosessin) on hankala kilpailla istuvuudessa mittojen mukaan räätälöidyn puvun kanssa. Viivanleveys ei korreloi käytännössä mitenkään kellotaajuuksien kanssa ja sen osalta en pidä
lainkaan mahdottomana että Intelin viimeisin 14nm prosessivariantti olisi sen osalta parempi kuin tulevat GlobalFoundriesien tai TSMC:n valmistusprosessit. Transistoritiheydessä ja energiatehokkuudessa varmasti
tulee päähän ja pahasti, sikäli kun noita uudemmilla prosesseilla valmistettuja tuotteita ei tarvitse piiskata niiden optimaalisen toiminta-alueen ulkopuolelle kuten nykyisten AMD 14nm LPP ja 12nm LP (Polaris, Vega, Ryzen) tuotteiden tapauksessa.
 
Jos taas GlobalFoundriesin prosessia, niin omat odotukset romahtaa melkolailla samantien vaikka valmistusprosessi ei olisi edes mikään lisensioitu matalalle tehonkulutukselle optimoitu prosessi, kuten nämä nykyiset.

Eli kun GloFo lupaa että 7nm LP prosessi on optimoitu 5GHz kelloille niin ne puhuu täyttä paskaa?

Sanoit että GloFon lupaukset kun jakaa kolmella niin saadaan todellinen tulos?

Eli sinun mielestäsi Zen 2 GloFon prosessilla on 1,67Ghz kelloille optimi.

Lukitaanko vastaus vai haluatko kilauttaa kaverille, käyttää ehkä fiftysixty vaihtoehdon vai kysytäänkö yleisöltä?

Ihan mielenkiinnosta kysyn. 14nm LPP prosessi ilmeisesti on aika optimi jollekkin 2,2GHz kelloille, eli oliko AMD tai GloFo jossain luvannut 6,6GHz kelloja Zen prossuille vai mistä tämä sinun jaettuna kolmella on oikein nyhdetty?
 
Eli kun GloFo lupaa että 7nm LP prosessi on optimoitu 5GHz kelloille niin ne puhuu täyttä paskaa?

Sanoit että GloFon lupaukset kun jakaa kolmella niin saadaan todellinen tulos?

Eli sinun mielestäsi Zen 2 GloFon prosessilla on 1,67Ghz kelloille optimi.

Lukitaanko vastaus vai haluatko kilauttaa kaverille, käyttää ehkä fiftysixty vaihtoehdon vai kysytäänkö yleisöltä?

Tiedät tuohon vastauksen aivan hyvin itsekin.

Puhuin GF:n markkinointimateriaaleissa yleensä esiintyvistä numeroista.
12nm LP:lle mainostettiin AMD:n / GF:n materiaalissa > 10% parempaa PPW:tä ja totuus oli keskimäärin ~ 3.65% hyvällä prosessoriyksilöllä.
14nm LPP:lle mainostettiin kaksinkertaista kellotaajuutta 28nm HPP nähden. 28nm HPP:n piti luonnollisesti olla myös parempi kuin 32nm SHP:n, mutta lopputulos
ei ollut miltään osin (kellotaajuus, energiatehokkuus) "aivan" sitä mitä piti.

Siinä mielessä en väitä että GF puhuu paskaa, koska epäilemättä testilabrassa saavuttavat mainostetut numerot hetkellisesti jollain ARM prosessorin solulla (kuten 14nm LPP tapauksessa).
Ne numerot vaan harvemmin, jos koskaan korreloi suoraan radikaalisti erilaisen kuluttajille päätyvän piirin kanssa.
 
Eli kun GloFo lupaa että 7nm LP prosessi on optimoitu 5GHz kelloille niin ne puhuu täyttä paskaa?

Sanoit että GloFon lupaukset kun jakaa kolmella niin saadaan todellinen tulos?

Eli sinun mielestäsi Zen 2 GloFon prosessilla on 1,67Ghz kelloille optimi.
Tuollahan se sano että nousu jakamalla kolmella. eli jos 4.0 -> 5.0 nousu on 1.0 niin 4.3333 repeating of courrse on oikea.
 
Eli onko 4,3GHz se @The Stilt vastaus Zen 2 kelloiksi?

Miksi tunnet tarvetta laittaa sanoja suuhuni?

AMD ei ole tainnut tässä vaiheessa antaa mitään arviota parannuksista miltään osin (kellotaajuus tai IPC), vaan ainoastaan sanonut sen että parannuksia tulee useilla osa-alueilla.
 
Miksi tunnet tarvetta laittaa sanoja suuhuni?

AMD ei ole tainnut tässä vaiheessa antaa mitään arviota parannuksista miltään osin (kellotaajuus tai IPC), vaan ainoastaan sanonut sen että parannuksia tulee useilla osa-alueilla.

No okei. 4,5Ghz all core, 4,8GHz turbo ja 10% IPC parannus Zen+ on oma veikkaus. Onko liian optimistinen?
 
No okei. 4,5Ghz all core, 4,8GHz turbo ja 10% IPC parannus Zen+ on oma veikkaus. Onko liian optimistinen?

Mahdotonta sanoa, ilman että tietää mitä AMD on tehnyt Zen 2 kanssa.
Jos ytimien määrä on kasvanut nykyisestä, niin ainakaan kaikkien ytimien taajuutta tuskin saadaan noin ylös ihan tehonkulutuksen kannaltakaan.
Uudemmat prosessit on varmasti energiatehokkaampia, mutta vastaavasti niiden käyttöjännitteet on oletettavasti melkoisesti pienemmät. Esim. 100W tehonkulutus 1.000V jännitteellä ja AM4 kannan ja nykyisten emojen rajat alkaa tulemaan vastaan.
AM4 kannan pitkäikäisyys on hyvä asia, mutta se aiheuttaa myös tiettyjä rajoitteita koska kyseessä on hybridikanta (APU yhteensopivuus). Jos AMD haluaa tuoda uudemman version kannasta ns. etuajassa saataville, niin silloin tuotakaan ongelmaa ei tietysti ole.
 
Sillä perusteella, että en usko AMD:n puolelta vaadittujen parannusten olevan realistisia yhden sukupolven aikana.

Coffee Lakella on 14.4% keskimääräinen etumatka IPC:ssä Pinnacle Ridgeen nähden. 9000-sarjan prosessorien IPC on lähes varmasti täsmälleen sama kuin Skylakella, Kaby Lakella ja Coffee Lakella.

Jos AMD saa Zen 2 IPC:tä hilattua tuon verran ylöspäin, kasvatettua kellotaajuuksia > 15% ja potentiaalisesti vielä kasvatettua ytimien määrää siinä samalla, niin ei voi kuin hattua nostaa.

Markettipuvun (prosessin) on hankala kilpailla istuvuudessa mittojen mukaan räätälöidyn puvun kanssa. Viivanleveys ei korreloi käytännössä mitenkään kellotaajuuksien kanssa ja sen osalta en pidä
lainkaan mahdottomana että Intelin viimeisin 14nm prosessivariantti olisi sen osalta parempi kuin tulevat GlobalFoundriesien tai TSMC:n valmistusprosessit. Transistoritiheydessä ja energiatehokkuudessa varmasti
tulee päähän ja pahasti, sikäli kun noita uudemmilla prosesseilla valmistettuja tuotteita ei tarvitse piiskata niiden optimaalisen toiminta-alueen ulkopuolelle kuten nykyisten AMD 14nm LPP ja 12nm LP (Polaris, Vega, Ryzen) tuotteiden tapauksessa.

15% parannus ei olisi ihan ihmeellinen juttu kun huomioi Zenissä olevan paljon Bulldozeria.

Viivanleveys ei pelkästään kerro kellotaajuuksista, varsinkaan kun kyseessä on alhaiselle kellotaajuudelle optimoitu prosessi. Tiettävästi TSMC:n tai GF:n prosesseista kumpikaan ei ole sellaisia.

Aiemmin spekuloitiin Zen2:n asettuvan Cannon Lakea (tai mikä se 10nm Lake olikaan) jolloin AMD olisi "tasoissa" valmistusprosessissa Intelin kanssa. Nyt kun Intel säätää 10nm prosessin kanssa, AMD menee samalla logiikalla ohi.

Kun AMD pystyy kellottamaan täysin surkealla prosessilla Ryzen 2:n 4,3 GHz:n ilman lämmöntuoton karkaamista taivaisiin, mitä AMD saakaan aikaan seuraavan sukupolven prosessilla jolla ei tarvitse iskeä "rajoitinta vasten" ihan heti?

Kun viimeksi ennustit Zenin floppaavan, sinulla (tai jollakin joka kirjoitti samalla nimimerkillä) oli hyviä perusteluja miksi Zen floppaa (kellotaajuudet jäävät alhaisiksi koska surkea prosessi). Tällä kertaa sieltä suunnasta ei näytä tulevan muuta kuin "AMD, GF ja TSMC on kaikki paskoja koska uskon niin" -tasoista settiä.

Tiedät tuohon vastauksen aivan hyvin itsekin.

Puhuin GF:n markkinointimateriaaleissa yleensä esiintyvistä numeroista.
12nm LP:lle mainostettiin AMD:n / GF:n materiaalissa > 10% parempaa PPW:tä ja totuus oli keskimäärin ~ 3.65% hyvällä prosessoriyksilöllä.
14nm LPP:lle mainostettiin kaksinkertaista kellotaajuutta 28nm HPP nähden. 28nm HPP:n piti luonnollisesti olla myös parempi kuin 32nm SHP:n, mutta lopputulos
ei ollut miltään osin (kellotaajuus, energiatehokkuus) "aivan" sitä mitä piti.

12nm LP:lle luvattiin "more than a 10 percent improvement in performance over 16/14nm FinFET solutions on the market today."

Pitää aika hyvin kutinsa. Lisäksi GF harvoin noissa lupauksissaan sanoo mihin prosessiin tarkalleen verrataan.

Miksi tunnet tarvetta laittaa sanoja suuhuni?

AMD ei ole tainnut tässä vaiheessa antaa mitään arviota parannuksista miltään osin (kellotaajuus tai IPC), vaan ainoastaan sanonut sen että parannuksia tulee useilla osa-alueilla.

Joten mistä tiedät Intelin pysyvän edellä :confused: Koska heitit tuollaista rapalaa

Jos huhut Intelin 9000-sarjan prossuista pitää paikkansa, niin Intelillä tuskin on mitään ongelmia kilpailla Zen 2 pohjaisten prosessorien kanssa.

Niin täytyyhän olla jokin arvio siitä mihin Zen2 pystyy. Et muuten voi arvioida Intelin pysyvän edellä :rolleyes:
 
Kun AMD pystyy kellottamaan täysin surkealla prosessilla Ryzen 2:n 4,3 GHz:n ilman lämmöntuoton karkaamista taivaisiin, mitä AMD saakaan aikaan seuraavan sukupolven prosessilla jolla ei tarvitse iskeä "rajoitinta vasten" ihan heti?

AMD pystyy kellottamaan Ryzen 2:n 4.35GHz taajuuteen ja silloin ollaan jo tilanteessa jossa energiatehokkuus on kadonnut kauan sitten ja jännitettä joudutaan varomaan luotettavuuden takia. Jos AMD olisi monopoliasemassa, niin Ryzen 2:sta ei olisi järkeä kellottaa missään tilanteessa yli 3.9GHz taajuudelle (energiatehokkuuden kannalta).

Kun viimeksi ennustit Zenin floppaavan, sinulla (tai jollakin joka kirjoitti samalla nimimerkillä) oli hyviä perusteluja miksi Zen floppaa (kellotaajuudet jäävät alhaisiksi koska surkea prosessi). Tällä kertaa sieltä suunnasta ei näytä tulevan muuta kuin "AMD, GF ja TSMC on kaikki paskoja koska uskon niin" -tasoista settiä.

Tämä käsiteltiin jo eilen (ks. arvio kellotaajuudesta yli vuosi ennen julkaisua).

12nm LP:lle luvattiin "more than a 10 percent improvement in performance over 16/14nm FinFET solutions on the market today."

Pitää aika hyvin kutinsa. Lisäksi GF harvoin noissa lupauksissaan sanoo mihin prosessiin tarkalleen verrataan.

14nm prosessin ottaminen vertailuun mukaan jättää melko vähän tulkinnan varaa, koska ainoat muut 14nm prosessit löytyy Inteliltä :vihellys:


Joten mistä tiedät Intelin pysyvän edellä :confused: Koska heitit tuollaista rapalaa

Lainasit sitä viestiä missä selitin miksi arvelen Intelin pystyvän kilpailemaan Zen 2 kanssa tulevilla 9000-sarjan (14nm) osilla ilman ongelmia?
Vaadittu IPC parannus pääsemiseksi Intelin nykyiselle tasolle, sekä vaadittu kasvu kellotaajuuksissa on vaikea saavuttaa erikseen, saati samanaikaisesti.
Yllätysmomenttina tuohon vielä huhut, joiden mukaan AMD on kasvattamassa ydinmääriä joka luonnollisesti vaikeuttaa kellotaajuuksien kasvattamista ennestään.

Niin täytyyhän olla jokin arvio siitä mihin Zen2 pystyy. Et muuten voi arvioida Intelin pysyvän edellä :rolleyes:

Katson vaadittua kokonaisparannusta. Vaadittu kokonaisparannus on sen verran iso, että sitä on vaikea saada aikaan yhden sukupolven aikana.
Tämä tietysti pohjautuu oletukseen, että Intelin 9000-sarjalle huhutut speksit ei ole hatusta vedetty ;)
 
AMD pystyy kellottamaan Ryzen 2:n 4.35GHz taajuuteen ja silloin ollaan jo tilanteessa jossa energiatehokkuus on kadonnut kauan sitten ja jännitettä joudutaan varomaan luotettavuuden takia. Jos AMD olisi monopoliasemassa, niin Ryzen 2:sta ei olisi järkeä kellottaa missään tilanteessa yli 3.9GHz taajuudelle (energiatehokkuuden kannalta).

Energiatehokkuus on mennyttä koska ollaan prosessin rajoilla. Silti energiatehokkuus lähes vetää vertoja Intelille. Kuten AMD sanoi, Zen on erittäin energiatehokas ydin.

Tämä käsiteltiin jo eilen (ks. arvio kellotaajuudesta yli vuosi ennen julkaisua).

Silloin pystyit perustelemaan kantasi, tällä kertaa et.

14nm prosessin ottaminen vertailuun mukaan jättää melko vähän tulkinnan varaa, koska ainoat muut 14nm prosessit löytyy Inteliltä :vihellys:

Onhan niitä Samsungillakin :smoke:

Lainasit sitä viestiä missä selitin miksi arvelen Intelin pystyvän kilpailemaan Zen 2 kanssa tulevilla 9000-sarjan (14nm) osilla ilman ongelmia?
Vaadittu IPC parannus pääsemiseksi Intelin nykyiselle tasolle, sekä vaadittu kasvu kellotaajuuksissa on vaikea saavuttaa erikseen, saati samanaikaisesti.
Yllätysmomenttina tuohon vielä huhut, joiden mukaan AMD on kasvattamassa ydinmääriä joka luonnollisesti vaikeuttaa kellotaajuuksien kasvattamista ennestään.

Miksi se on vaikea saavuttaa samanaikaisesti? Zen2:n arkkitehtuuri oli valmis jo 3 vuotta sitten. Sen jälkeen ovat ehkä lisänneet jotain Spectre suojauksia ja muuta pientä. Mikäli valmistusprosessi toimii, ei kellotaajuuksien saavuttamisessa ole mitään ihmeellistä. AMD pystyi Zenin kohdallakin ihmeeseen, nyt ei tarvita ihmettä vaan normaali suoritus riittää. Ydinmäärien lisäys jää nähtäväksi.

Katson vaadittua kokonaisparannusta. Vaadittu kokonaisparannus on sen verran iso, että sitä on vaikea saada aikaan yhden sukupolven aikana.
Tämä tietysti pohjautuu oletukseen, että Intelin 9000-sarjalle huhutut speksit ei ole hatusta vedetty ;)

Mikä siinä on niin vaikeaa? Mikäli valmistusprosessi toimii eikä ole mikään Intel 10nm v2, niin kellotaajuusongelma ratkeaa sillä. Arkkitehtuuria taas on ollut aikaa viilata se 3 vuotta.

Käytit muistaakseni osin samoja perusteluja (kaikki uusiksi kerralla, uusi valmistusprosessi josta ei kokemusta) Zenin kohdalla. Nyt AMD on paljon helpommassa tilanteessa.
 
Katselin nyt ensimmäistä kertaa noita 7nm LP:n markkinointispeksejä.

GlobalFoundries puhuu > 40% ISO power parannuksesta 14nm LPP nähden ja tämä on saavutettu ARM Cortex A72 lohkolla (eli perinteinen).
Vastaava GlobalFoundriesin antama luku mentäessä 28nm HPP > 14nm LPP oli 106%...

Ongelmana on että ISO power arvo ei kerro prosessille / designille optimaalisista tai mahdollisista kellotaajuuksista yhtään mitään.
Jos 14nm LPP prosessilla valmistettu Ryzen pääsi 95W tehonkulutuksella 3.7GHz kelloille, täyttyy tuo > 40% lupaus jos täsmälleen sama kellotaajuus saavutetaan esim 67W tehonkulutuksella tuolla 7nm LP prosessilla.

https://www.eetimes.com/document.asp?doc_id=1332328

1444307976423.jpg
 
15% parannus ei olisi ihan ihmeellinen juttu kun huomioi Zenissä olevan paljon Bulldozeria.

:facepalm:

Höpö höpö. Zenissä ei ole "paljoa bulldozeria". Se on ihan puhtaalta pöydältä tehty arkkitehtuuri.

Molemmista arkkitehtuureista on esimerkiksi kaikkien käskyjen viiveet ihan julkista tietoa. Niitä kun vertaa niin näkee suoraan, että käytännössä kaikki laskentayksiköt on ihan uusiksi tehtyjä.

Lisäksi molemmista arkkitehtuureista on julkisesti kerrottu paljon:

Välimuistien rakenne on täysin erilainen. LSUt on täysin erilaiset johtuen sekä erilaisista välimuisteista että SMTn lisäämisestä.

Haarautumisenennustus.. perustuu oleelliselta osin eri algoritmeihin, mutta voi olla peräisin Jaguarista/Pumasta(pienin parannuksin), mutta ei bulldozerista/sen johdannaisista

Zenissä on mikrokode-looppipuskuri, Bulldozer-johdannaisissa ei. Tämä sekä täysin erilainen monisäikeistys laittaa etupään aivan uusiksi.

Yhteistä on lähinnä se, että molemmissa on 128-bittinen SIMD-datapolku. Ihan kuten kaikissa ennen Core2sta tulleissa x86-prossuissa oli 64-bittinen SIMD-datapolku.

Toinen mikä on yhteistä on, että prosessorissa on selkeästi erilliset kokonaisluku-/skalaari- ja liukuluku-/vektoriclusterit. Pätee kaikkiin AMDn prosessoreihin K7sta lähtien. Joten tämän ei voi sanoa mitenkään järkevästi olevan "bulldozeria", se on vaan AMDn tapa tehdä asiat.

Viivanleveys ei pelkästään kerro kellotaajuuksista, varsinkaan kun kyseessä on alhaiselle kellotaajuudelle optimoitu prosessi. Tiettävästi TSMC:n tai GF:n prosesseista kumpikaan ei ole sellaisia.

CMOS-valmistusprosesseista ei ole yli kymmeneen vuoteen ilmoitettu mitään todellisia viivanleveyksiä, joten kyseisen termin käyttäminen tai vertaaminen on jo itsessään typerää.

Niistä ilmoitetaan ainoastaan markkinointinumero, jonka yksikkönä käytetään nanometriä. Tällä ei ole mitään tekemistä minkään todellisen viivanleveyden(jota ei voi edes järkevästi mitata) kanssa.

Todelliset numerot mitä voidaan verrata on esimerkiksi kahden vierekkäisen transitorin minimiväli ja kahden vierekkäisen johdon minimiväli.

Aiemmin spekuloitiin Zen2:n asettuvan Cannon Lakea (tai mikä se 10nm Lake olikaan) jolloin AMD olisi "tasoissa" valmistusprosessissa Intelin kanssa. Nyt kun Intel säätää 10nm prosessin kanssa, AMD menee samalla logiikalla ohi.

Intel on koko ajan jatkanut "14nm" prosessinsa viilaamista paremmaksi. Intel vaihtaa massatuotantoonsa "10nm" prosessiinsa vasta sitten, kun se on heidän "14nm" prosessiaan parempi. "14nm" prosessia parantavat viilaukset on siis myös oleellinen tekijä siinä, miksi "10nm" prosessi viivästyy.

Kun AMD pystyy kellottamaan täysin surkealla prosessilla Ryzen 2:n 4,3 GHz:n ilman lämmöntuoton karkaamista taivaisiin, mitä AMD saakaan aikaan seuraavan sukupolven prosessilla jolla ei tarvitse iskeä "rajoitinta vasten" ihan heti?

Niiden "7nm" prosessien suorituskyvystä ei vielä tiedätä varmuudella juuri mitään. Esimerkiksi siirtymä 32nm SOI -> 28nm bulk tarkoitti vaan kellotaajuuksien hidastumista(mutta matalan kellotaajuuden sähkönkulutuksen pienenemistä, ja transistorin hinnan selvää halpenemista)

Sen sijaan niiden mitat ja transitoritiheydet tiedetään tarkasti.

Eikä GFn "12" nm prosessi ole "täysin surkea" (eikä The Stilt ole sitä sellaiseksi väittänytkään). Se on vaan huonompi kuin intelin "14nm" prosessi.

12nm LP:lle luvattiin "more than a 10 percent improvement in performance over 16/14nm FinFET solutions on the market today."

Pitää aika hyvin kutinsa. Lisäksi GF harvoin noissa lupauksissaan sanoo mihin prosessiin tarkalleen verrataan.

Ryzen 1800X turbo-kello 4 GHz, 2700x turbo-kello 4.3 GHz. 7.5% parannus, ei yli 10% parannus.
 
Ryzen 1800X turbo-kello 4 GHz, 2700x turbo-kello 4.3 GHz. 7.5% parannus, ei yli 10% parannus.

GF:n numerot näyttää olevan aina kiinteällä tehonkulutuksella (IP), niin myös 12nm LP tapauksessa.

GlobalFoundries promises that its 12LP provides a 15% higher transistor density and enables a 10% higher frequency potential (at the same power and complexity) compared to “16/14nm FinFET solutions on the market today”.

jbaXO5r.png


Huippu 4.4% (@ 3.75GHz), keskiarvo 3.65%.
 
:facepalm:

Höpö höpö. Zenissä ei ole "paljoa bulldozeria". Se on ihan puhtaalta pöydältä tehty arkkitehtuuri.

Molemmista arkkitehtuureista on esimerkiksi kaikkien käskyjen viiveet ihan julkista tietoa. Niitä kun vertaa niin näkee suoraan, että käytännössä kaikki laskentayksiköt on ihan uusiksi tehtyjä.

AMD sanoi käyttäneensä joitakin osia Excavatorista säästääkseen aikaa. Ellen ihan väärin muista, itsekin totesit mm. AVX yksiköiden olevan hyvin lähelle samat kuin Excavatorissa.

Käskyjen viiveet eivät kerro onko Excavatorista lainattu jotain. Niitä yksiköitä voi muokatakin (ja niitä varmasti on muokattukin).

Lisäksi molemmista arkkitehtuureista on julkisesti kerrottu paljon:

Välimuistien rakenne on täysin erilainen. LSUt on täysin erilaiset johtuen sekä erilaisista välimuisteista että SMTn lisäämisestä.

Haarautumisenennustus.. perustuu oleelliselta osin eri algoritmeihin, mutta voi olla peräisin Jaguarista/Pumasta(pienin parannuksin), mutta ei bulldozerista/sen johdannaisista

Zenissä on mikrokode-looppipuskuri, Bulldozer-johdannaisissa ei. Tämä sekä täysin erilainen monisäikeistys laittaa etupään aivan uusiksi.

Yhteistä on lähinnä se, että molemmissa on 128-bittinen SIMD-datapolku. Ihan kuten kaikissa ennen Core2sta tulleissa x86-prossuissa oli 64-bittinen SIMD-datapolku.

Toinen mikä on yhteistä on, että prosessorissa on selkeästi erilliset kokonaisluku-/skalaari- ja liukuluku-/vektoriclusterit. Pätee kaikkiin AMDn prosessoreihin K7sta lähtien. Joten tämän ei voi sanoa mitenkään järkevästi olevan "bulldozeria", se on vaan AMDn tapa tehdä asiat.

Miten mikään noista asioista todistaa yhtään mitään siitä ettei AMD olisi lainannut/muokannut Excavatorin osia? Hankala keksiä syitä miksi AMD EI olisi lainannut Excavatorista osia ja/tai kehittänyt niitä samanaikaisesti Excavatoriin ja Zeniin. Kerrotko sellaisia?

Syitä miksi niin kannatti tehdä riittää. Tärkein oli aika: AMD ei ollut julkaissut teholuokan työpöytäprosessoria sitten 2012 eikä Bulldozer sarjaan panostettu juuri mitään sitten Piledriverin. Excavator osien käyttö säästi aikaa joten sitä kannattaa tehdä. Ts. vaikka Zeniin olisi copypastettu Excavatorista suunnilleen kaikki pl. suoritusyksiköt ja välimuistit, se olisi silti ollut selvästi parempi (paremmin nykyohjelmistoille sopiva) kuin Excavator. Zen piti saada nopeasti markkinoille (se saatiin todella nopeasti) eikä siihen ole muita järkeviä tapoja kuin käyttää jotain mitä on jo valmiina.

Lisäksi, mikäli Jim Keller lähti vasta kun Zen2 arkkitehtuuri oli valmis, se tarkoittaisi Zen2:lle 3 vuoden kehitysaikaa puhtaalta pöydältä. Uskottavaa. Koska AMD testasi Zeniä jo marraskuussa 2015 (3 vuotta, 2 kuukautta sen jälkeen kun suunnittelu aloitettiin), arkkitehtuurin piti olla valmis viimeistään alkuvuodesta 2015. alle 2,5 vuotta noinkin monimutkaisen arkkitehtuurin kehitykselle puhtaalta pöydältä on niin nopeaa touhua etten siihen usko.

CMOS-valmistusprosesseista ei ole yli kymmeneen vuoteen ilmoitettu mitään todellisia viivanleveyksiä, joten kyseisen termin käyttäminen tai vertaaminen on jo itsessään typerää.

Niistä ilmoitetaan ainoastaan markkinointinumero, jonka yksikkönä käytetään nanometriä. Tällä ei ole mitään tekemistä minkään todellisen viivanleveyden(jota ei voi edes järkevästi mitata) kanssa.

Todelliset numerot mitä voidaan verrata on esimerkiksi kahden vierekkäisen transitorin minimiväli ja kahden vierekkäisen johdon minimiväli.

Juuri sen takia Intel onkin mainostanut heidän 10nm prossessinsa olevan samaa tasoa kuin muiden 7nm.

Intel on koko ajan jatkanut "14nm" prosessinsa viilaamista paremmaksi. Intel vaihtaa massatuotantoonsa "10nm" prosessiinsa vasta sitten, kun se on heidän "14nm" prosessiaan parempi. "14nm" prosessia parantavat viilaukset on siis myös oleellinen tekijä siinä, miksi "10nm" prosessi viivästyy.

Intel vaihtaa 10nm prosessiin sitten kun saavat sen kunnolla toimimaan. 14nm parannuksia on tehty vain siksi ettei 10nm prosessia saada toimimaan kunnolla ennen kuin vasta ensi vuonna. Parannukset eivät ole syy vaan seuraus.

Niiden "7nm" prosessien suorituskyvystä ei vielä tiedätä varmuudella juuri mitään. Esimerkiksi siirtymä 32nm SOI -> 28nm bulk tarkoitti vaan kellotaajuuksien hidastumista(mutta matalan kellotaajuuden sähkönkulutuksen pienenemistä, ja transistorin hinnan selvää halpenemista)

Sen sijaan niiden mitat ja transitoritiheydet tiedetään tarkasti.

Eikä GFn "12" nm prosessi ole "täysin surkea" (eikä The Stilt ole sitä sellaiseksi väittänytkään). Se on vaan huonompi kuin intelin "14nm" prosessi.

Aivan, tiedossa ei ole prosesseista juuri mitään konkreettista. Jotain kuitenkin voidaan päätellä siitä ettei TSMC:n tai GF:n prosesseista kuulu soraääniä edes huhuina samaan tapaan kuin Intelin 10nm prosessista. 14nm LPP ja 12nm LP ovat aika huonoja mikäli tavoitteena on tehdä korkean kellotaajuuden prosessoreita. Eikä niitä siihen ollut tarkoitettukaan.
 
AMD sanoi käyttäneensä joitakin osia Excavatorista säästääkseen aikaa. Ellen ihan väärin muista, itsekin totesit mm. AVX yksiköiden olevan hyvin lähelle samat kuin Excavatorissa.

Taisin sanoa tyyliin, että ainoat osat mitkä VOI olla peräisin excavatorista on nuo AVX-yksiköt, että ne on sen verran samantyylisiä.

Tosin näidenkin osalta on huomattavia eroja, zenissä on esimerkiksi erilliset fp-adderit joita excavatorissa ei ollut, ja nuo FMA-yksiköt ei sitten laske yhteenlaskua. Ja datapolut näiden ruokkimiseen ovat melko erilaiset.

Käskyjen viiveet eivät kerro onko Excavatorista lainattu jotain. Niitä yksiköitä voi muokatakin (ja niitä varmasti on muokattukin).

Jos niitä yksiköitä on muokattu niin paljon, että niistä on esim latenssi muuttunut, sitten samalla on käytännössä myös päästy eroon kaikesta "vanhan arkkitehtuurin painolastista" mitä ne on voineet sisältää.

IPCtä haittaa se, että käskyillä on liikaa viivettä.
Kellotaajuutta haittaa se, että käskyillä on liian vähän viivettä, jolloin liukuhihnavaiheet käskyn toteutuksessa on liian pitkiä.

Miten mikään noista asioista todistaa yhtään mitään siitä ettei AMD olisi lainannut/muokannut Excavatorin osia? Hankala keksiä syitä miksi AMD EI olisi lainannut Excavatorista osia ja/tai kehittänyt niitä samanaikaisesti Excavatoriin ja Zeniin. Kerrotko sellaisia?

Jos jotain on "lainattu vanhemmista designeista" ne "lainatut osat" on niin pieniä yksittäisiä osia ja vähäisessä määrin että sen "lainaamisen" vaikutus suorituskykyyn on käytännössä olematon, eikä sillä, että nämä osat "tehdään kokonaan uuusiksi" saada mitään merkittävää suorituskykyparannusta.

Sinä taas nimenomaan väitit, että suorituskykyparannusta on luvassa sen takia että "bulldozer-legacy-kamasta" päästään eroon.
 
Viimeksi muokattu:
15% parannus ei olisi ihan ihmeellinen juttu kun huomioi Zenissä olevan paljon Bulldozeria.

Bulldozer osio tulikin tuolla jo hkutalan toimesta. Tuota 15% parannuksesta, sehän olisi mielentön suoritus.
Huhuthan on 10-15% tason parannuksesta, mutta 10% on siitä uskottavammasta päästä. Koska kyseessä on uusi arkkitehtuuri, niin Zen2 voi poimia ne klassiset "matallalla roikkuvat hedelmät", joten 10% on mahdollista päästä.

Sen jälkeen odottaisin niitä perinteisiä 0-5% parannuksia, joita intelkin tehtailee.
 
Taisin sanoa tyyliin, että ainoat osat mitkä VOI olla peräisin excavatorista on nuo AVX-yksiköt, että ne on sen verran samantyylisiä.

Tosin näidenkin osalta on huomattavia eroja, zenissä on esimerkiksi erilliset fp-adderit joita excavatorissa ei ollut, ja nuo FMA-yksiköt ei sitten laske yhteenlaskua. Ja datapolut näiden ruokkimiseen ovat melko erilaiset.

Miksi lähes kaikki muutkin osat eivät voi myös olla muokattuja? Laajalla skaalalla katsottuna Excavatorissa ja Zenissä on aika paljonkin yhteistä. Vaikka Ryzenissä cacheja onkin nopeutettu kauttaaltaan, L1 data cachea muutettin Excavatoriin Steamrollerista. Excavatorin L1 data cache on kooltaan, latenssiltaan, assosiativityltään jne käytännössä 1:1 sama kuin Ryzenissä, tuskin sattumaa.

Prosessorin sisäisestä arkkitehtuurista on hyvin vaikea sanoa mitä siellä on tehty ja mitä ei, I/O puoli on hyvin helppo:

xamd_bristol_ridge_promontory.png.pagespeed.ic.LlNFTOCq5r.png


Ryzenin I/O puoli on steroideilla varustettu Excavator. Jopa piirisarjan antiikkiset PCI Express 2.0 liitännät on säilytetty :smoke:

Sitten ne aikataulut. Omien sanojesi mukaan:

Sen RTL ja layout oli valmis viimeistään 1998, mutta arkkitehtuuritason suunnittelun valmistumisesta RTLn ja layoutin valmistumiseen menee vähintään vuosi, käytännössä usein selvästi kauemmin. Ja näistä julkaisuun vähintään toinen vuosi.

Koska AMD:lla oli valmistettu Zen testissä marraskuussa 2015 ja arkitehtuuritasolta sellaisen tekemiseen menee "vähintään vuosi", se tarkoittaa AMD:n saaneen Zenin arkkitehtuurin valmiiksi joskus syyskuussa 2014. Zenin suunnittelu aloitettiin elokuussa 2012. Jos Jim Keller lähti vasta Zen2 arkkitehtuurin valmistuttua, se valmistui 2015 syyskuussa.

Kumpi on uskottavampaa?

- AMD kehittää täysin tyhjästä arkkitehtuurin 2 vuodessa ja sen jälkeen virittelee siitä vuodessa paremman.

- AMD kehittää arkkitehtuurin 2 vuodessa jossa lainataan kaikkea mahdollista jotta saadaan edes jotain valmiiksi ja sen jälkeen kehittää aiemman pohjalle vuodessa arkkitehtuurin jossa ei tarvitse tehdä kompromisseja.

Koska Zenin kanssa oli Kiire isolla koolla, käytettiin varmasti kaikki mahdolliset asiat joilla saatiin nopeutusta aikaan.

Jos niitä yksiköitä on muokattu niin paljon, että niistä on esim latenssi muuttunut, sitten samalla on käytännössä myös päästy eroon kaikesta "vanhan arkkitehtuurin painolastista" mitä ne on voineet sisältää.

IPCtä haittaa se, että käskyillä on liikaa viivettä.
Kellotaajuutta haittaa se, että käskyillä on liian vähän viivettä, jolloin liukuhihnavaiheet käskyn toteutuksessa on liian pitkiä.

Ei välttämättä. Jossakin mainittin BMI2 käskykannan osalta Ryzenin olevan tietyissä käskyissä (PEXT ainakin) todella hidas. En valitettavasti löytänyt miten hidas se on Excavatorissa (yhtä hidas?). Ehkä "heikkous" olisi copypastettu suoraan Excavatorista. Tuollaista heikkoutta tuskin olisi laitettu täysin puhtaalta pöydältä suunniteltuun Zeniin, sen voisi ymmärtää saman arkkitehtuurin eri versioiden välillä. Tuo voisi olla hyvä esimerkki siitä menneisyyden painolastista jos löytyisi tietoa miten Excavator saman käskyn hoitaa. Jos tuo asia on lainattu suoraan Excavatorista, ei tarvitse keskustella onko Excavatorista kopioitu jotain. Voidaan keskustella paljonko kopioitu ja mitä.

Jos jotain on "lainattu vanhemmista designeista" ne "lainatut osat" on niin pieniä yksittäisiä osia ja vähäisessä määrin että sen "lainaamisen" vaikutus suorituskykyyn on käytännössä olematon, eikä sillä, että nämä osat "tehdään kokonaan uuusiksi" saada mitään merkittävää suorituskykyparannusta.

Sinä taas nimenomaan väitit, että suorituskykyparannusta on luvassa sen takia että "bulldozer-legacy-kamasta" päästään eroon.

Bulldozer-arkkitehtuurin design eroaa niin paljon Zenistä ettei Bulldozer arkkitehtuurista lainatuilla ja muokatuilla osilla saada yhtä hyvää lopputulosta aikaan kuin täysin tyhjältä pöydältä suunnitellessa. AMD sanoi ihan suoraan ettei tiettyjä asioita laitettu Zeniin koska virrankulutus olisi kasvanut liikaa. Varmasti myös noin, mutta rivien välistä luetuna: ne uudet asiat olisivat vaatineet liikaa aikaa jota ei Zenin kanssa ollut. Helppo arvata niiden tulevan Zen2:n.

Bulldozer osio tulikin tuolla jo hkutalan toimesta. Tuota 15% parannuksesta, sehän olisi mielentön suoritus.
Huhuthan on 10-15% tason parannuksesta, mutta 10% on siitä uskottavammasta päästä. Koska kyseessä on uusi arkkitehtuuri, niin Zen2 voi poimia ne klassiset "matallalla roikkuvat hedelmät", joten 10% on mahdollista päästä.

Sen jälkeen odottaisin niitä perinteisiä 0-5% parannuksia, joita intelkin tehtailee.

Perustellusti väitän ettei Zen ollut puhtaalta pöydältä suunniteltu vaan Zen2 on. Niitä perusteluja tuossa ylempänä. Vertailun vuoksi: Intelillä kesti noin 5 vuotta saada aikaan Skylake valmiiksi tuotteeksi suunnittelun aloituksesta. AMD:lla kesti 4,5 vuotta saada aikaan Zen suunnittelun aloituksesta valmiiksi tuotteeksi.

Lisäksi AMD oli hyvin hiljaa Excavatorin arkkitehtuurista (verrattuna aiempiin FX-sarjan prosessoreihin) mutta tarjosi hyvin auliisti tietoa Zenistä. Markkinointisyistä AMD:lle sopii vallan mainiosti "Zen on puhtaalta pöydältä suunniteltu". Mitä enemmän Excavatorista annetaan tietoa, sitä enemmän Zeniä voitaisiin pitää Excavatorina steroideilla.
 
Kannattaa myös muistaa että Zen oli DoA kun ekat sämplet tuli testattavaksi, tiedä mihin kaikkeen jos mihinkään tuo on voinut vaikuttaa kun siihen on purkka tehty. Oliko tuolla esim. jotain tekemistä niiden alkupään rysien aiheuttaessa seqfaulttia?
 
Kannattaa myös muistaa että Zen oli DoA kun ekat sämplet tuli testattavaksi, tiedä mihin kaikkeen jos mihinkään tuo on voinut vaikuttaa kun siihen on purkka tehty. Oliko tuolla esim. jotain tekemistä niiden alkupään rysien aiheuttaessa seqfaulttia?

Ryzen A versiosta päästiin eroon vasta joulukuun alussa 2016.
Suorituskyvyn kannalta niissä oli ongelma SMT:n kanssa ja esim. CB R15:a A ja lopullisen version ero oli noin 8% jälkimmäisen hyväksi.
IPC ei itsessään juurikaan muuttunut mihinkään, ainoastaan SMT hyötysuhde kasvoi melko paljon.

Noiden pahin ongelma oli todella alhaiset kellotaajuudet ja lämmöntuotto.
Yksilö joka mulla on vieläkin tuolla kaapissa kulki maksimissaan 3.6GHz tms AIO:lla ja vei yli 140W tehoa.

Lopullisella piiriversiolla maksimikellot sitten parani keskimäärin sen 300MHz ja tehonkulutus putosi radikaalisti.

Ryzenien segfaultit tuskin johtuvat piirissä olevasta bugista itsestään, koska Threadrippereissä käytettävät Zeppelin ytimet tai EPYC:t ovat sille immuuneja.
Ongelma on käsittääkseni joku valmistustekninen seikka, joka korreloi tiettyjen bitcellejä ruokkivien dLDO jänniteregulaattorien asetusten kanssa.
 
Noiden pahin ongelma oli todella alhaiset kellotaajuudet ja lämmöntuotto.
Yksilö joka mulla on vieläkin tuolla kaapissa kulki maksimissaan 3.6GHz tms AIO:lla ja vei yli 140W tehoa.

Niin siis oliko tää se DoA zen johon joku purkka tehtiin että päästii ylipäätään testaamaan?
 
Niin siis oliko tää se DoA zen johon joku purkka tehtiin että päästii ylipäätään testaamaan?

Tuo oli ainoa piiriversio 2016 puolella, kunnes lopullinen B1 versio tuli ulos.
Joten eiköhän.
 
Miksi lähes kaikki muutkin osat eivät voi myös olla muokattuja? Laajalla skaalalla katsottuna Excavatorissa ja Zenissä on aika paljonkin yhteistä. Vaikka Ryzenissä cacheja onkin nopeutettu kauttaaltaan, L1 data cachea muutettin Excavatoriin Steamrollerista. Excavatorin L1 data cache on kooltaan, latenssiltaan, assosiativityltään jne käytännössä 1:1 sama kuin Ryzenissä, tuskin sattumaa.

Assosiatiivisuudesta.. ensinnäkin, mistä löysit tiedon excavatorin L1D:n assosiatiivisuudesta?

Toisekseen, siihen että se assosiatiivisuus on sama, on erinomainen syy joka ei liity saman designin uudelleenkäyttöön:

Jos välimuisti-wayn koko on suurempi kuin virtuaalimuistisivun koko, VIPT-toimintamekanismi välimuistille ei toimi ongelmitta, vaan sama fyysinen osoite voi meinata päätyä välimuistiin moneen kertaan(aliasoituminen) . Ja tämä aiheuttaa lukuisia ongelmia, sekä suorituskyvylle että sille että prosessori ylipäätään toimii oikein (tarvitaan ylimääräistä purkkaa varmistamaan että aliasoitumista ei tapahdu tai sitä tapahtuu pelkästään lukemisten välille).

Bulldozerissa L1I:llä välimuistin way oli suurempi kuin virtuaalimuistisivu, ja nämä purkat toteutettiin. Käskyvälimuistissa tätä purkkaa tarvitaan kuitenkin vähemmän kuin datavälimuisitissa, koska käskyvälimuistiin ei tule kirjoituksia. Ja tämän alisoitumisongelman suorituskykyvaikutus näkyi aluksi selvästi, käyttiksiin piti tehdä ylimääräisiä optimointeja tämän minimoimiseksi.

AMD Bulldozer Cache Aliasing Issue Fix - Phoronix


Takaisin zenin ja excavatoriin..

Yhden cache-wayn ei siis kannata olla suurempi kuin virtuaalimuistisivun. Kun Excavatorissa L1D suurennettiin 32 kibitavuun, ainoa järkevä tapa oli vaan tuplata cache-wayden määrä eli assosiatiivisuus.

Mutta kun mennään niihin sen L1D:n tarkempiin yksityskohtiin, niin sieltä löytyy mm. sellainen yksityiskohta, että väylän leveys L1Dn ja L2n välillä on tuplattu (16 vs 32 tavua kellojaksossa). Että sinne voidaan kirjoittaa tuplasti enemmän dataa kellojaksossa, täytyy sen rakenteen olla sisäisesti kuitenkin selvästi erilainen.

Ja sen välimuistin vaikutus suorituskykyyn. Zenissä se on jaettu kahden säikeen välillä, excavatorissa joka säikeellä omansa. Softan suorituskyvynkin näkökulmasta toimii aivan eri tavalla, kun Zenissä on SMT käytössä ja kuormitettuna.

Prosessorin sisäisestä arkkitehtuurista on hyvin vaikea sanoa mitä siellä on tehty ja mitä ei, I/O puoli on hyvin helppo:

xamd_bristol_ridge_promontory.png.pagespeed.ic.LlNFTOCq5r.png


Ryzenin I/O puoli on steroideilla varustettu Excavator. Jopa piirisarjan antiikkiset PCI Express 2.0 liitännät on säilytetty :smoke:

:facepalm:

Menee kiinni samoihin ulkoisiin väyliin, joo.

Mutta ne sisäiset väylät joilla itse ytimet ja nuo ulkoisten väylien lähettimet on kytketty ytimiin on täysin erilaisia.

... ja tällä ei ole muutenkaan mitään tekemistä sen itse ytimen mikroarkkitehtuurin kanssa.

Tiedätkö mitä: AMD K6nkin sai kiinni samaan piirisarjaan kuin intelin pentiumin!

Sitten ne aikataulut. Omien sanojesi mukaan:

Koska AMD:lla oli valmistettu Zen testissä marraskuussa 2015 ja arkitehtuuritasolta sellaisen tekemiseen menee "vähintään vuosi", se tarkoittaa AMD:n saaneen Zenin arkkitehtuurin valmiiksi joskus syyskuussa 2014. Zenin suunnittelu aloitettiin elokuussa 2012. Jos Jim Keller lähti vasta Zen2 arkkitehtuurin valmistuttua, se valmistui 2015 syyskuussa.

Kumpi on uskottavampaa?

- AMD kehittää täysin tyhjästä arkkitehtuurin 2 vuodessa ja sen jälkeen virittelee siitä vuodessa paremman.

- AMD kehittää arkkitehtuurin 2 vuodessa jossa lainataan kaikkea mahdollista jotta saadaan edes jotain valmiiksi ja sen jälkeen kehittää aiemman pohjalle vuodessa arkkitehtuurin jossa ei tarvitse tehdä kompromisseja.

:facepalm:

Edelleen hyvin pihalla siitä, mitä arkkitehtuurilla tarkoitetaan tai miten piirien suunnitteleminen toimii.

Arkkitehtuuritaso on käytännössä sitä piirisuunnittelun speksamista. Omilla prosessorinkehitystyökaluillamme(tce.cs.tut.fi) pystyn tekemään sillä suunniteltuihin prosessoreihin huomattavia arkkitehtuuritason muutoksia parissa minuutissa.

Mutta excavator ja zen ovat niin erilaisia arkkitehtuureita että ei sieltä ole arkkitehtuuritasolla lainattu mitään oleellista.

Ei kyse ole oleellisesti mistään "lainaamisesta", vaan siitä että
1) Ekassa versiossa päätetään että jotkut käskyt toteutetaan yksinkertaisemmalla tavalla, siten että ne yksiköt on nopeampi toteuttaa ja testata ja ne vievät vähemmän pinta-alaa. Monesta yksiköstä esim. 1.5x nopeampi versio saattaa olla neljä kertaa monimutkaisempi.

AMD tiesi hyvissä ajoin, että zen2 tullaan valmistamaan pienemmällä valmistustekniikalla, joten sen kanssa on varaa jälleen isompaan ytimeen.

2) Kun sitä arkkitehtuuria simuloidaan ja sillä simulaatiossa ajetaan paljon erilaisia benchmarkkeja, selviää, mitkä sen pullonkaulat ovat. Huomataan, että joku puskuri on kohtalaisen usein täynnä ja muu liukuhihna stallaa sitä odotellessa yms. Sitten sitä puskuria suurennetaan hiukan arkkitehtuurin seuraavaan versioon.

3) Kehitetään jälleen parempi haarautumisenennustusalgoritmi tms. ja toteutetaan se.

Koska Zenin kanssa oli Kiire isolla koolla, käytettiin varmasti kaikki mahdolliset asiat joilla saatiin nopeutusta aikaan.

Ei. "kaikki mahdolliset asiat" olisi tarkoittanut sitä että ei olisi tehty zeniä vaan olisi tehty joku viides hiukan viilattu maanrakennuskone, joka olisi näyttänyt hyvin selvästi maanrakennuskoneelta lliukuhihnansa pituudelta ja laskentayksiköiden määrältä ja monisäikeistystavalataan jne.
Zen ei ole maanrakennuskone vaan täysin erilainen arkkitehtuuri.

Ei välttämättä. Jossakin mainittin BMI2 käskykannan osalta Ryzenin olevan tietyissä käskyissä (PEXT ainakin) todella hidas. En valitettavasti löytänyt miten hidas se on Excavatorissa (yhtä hidas?). Ehkä "heikkous" olisi copypastettu suoraan Excavatorista.
Tuollaista heikkoutta tuskin olisi laitettu täysin puhtaalta pöydältä suunniteltuun Zeniin, sen voisi ymmärtää saman arkkitehtuurin eri versioiden välillä.

PEXT on käsky joka operoi ihan normaalisti kahdella normaalissa rekisterissä olevalla syötteellä.
Bulldozer-pohjaisissa arkkitehtuureissa ei ole mitään, mikä niillä pakottaa hitaaseen PEXT-implementaation.

Sillä , että excavator tuli ennen Zeniä ei siis ollut mitään vaikutusta siihen, millainen zenin PEXT-implementaatio on.

Järeämpi PEXT-toteutus olisi vaan vaatinut enemmän piipinta-alaa ja enemmän tuotekehitysaikaa ihan täysin riippumatta siitä, oltaisiinko sitä kehitetty exvacatoriin vai zeniin.

AMD totesi, että PEXT on (toistaiseksi) harvinainen käsky jonka suorituskyvyllä ei ole paljoa väliä, mutta sen paremman toteutuksen kehittämiseen menisi lisäaikaa ja se lisäisi prosessorin pinta-alaa jonkin verran ja sen mukana kriittiset polut voisi pidentyä ja sen myötä kellotaajuus laskea. Se voidaan siis toteuttaa hvyin hitaalla ja pienellä implementaatiolla. Se, oliko sama hidas ja pieni implementaatio käytössä jo excavatorissa on irrelevanttia.

Tuo voisi olla hyvä esimerkki siitä menneisyyden painolastista jos löytyisi tietoa miten Excavator saman käskyn hoitaa. Jos tuo asia on lainattu suoraan Excavatorista, ei tarvitse keskustella onko Excavatorista kopioitu jotain. Voidaan keskustella paljonko kopioitu ja mitä.

Ei, se on juuri malliesimerkki siitä, että VAIKKA se yksikkö olisi sama kuin excavatorissa, excavatorin bulldozer-juurilla ei ole mitään merkitystä sen nopeuteen. AMD olisi aivan hyvin voinut toteuttaa jo exvacatoriin nopean PEXTin, muttei ilmeisesti toteuttanut.

Bulldozer-arkkitehtuurin design eroaa niin paljon Zenistä ettei Bulldozer arkkitehtuurista lainatuilla ja muokatuilla osilla saada yhtä hyvää lopputulosta aikaan kuin täysin tyhjältä pöydältä suunnitellessa.

Sinulla ei ole mitään ymmärrystä niistä yksityiskohdista joiden pohjalta näin väität.

AMD sanoi ihan suoraan ettei tiettyjä asioita laitettu Zeniin koska virrankulutus olisi kasvanut liikaa. Varmasti myös noin, mutta rivien välistä luetuna: ne uudet asiat olisivat vaatineet liikaa aikaa jota ei Zenin kanssa ollut. Helppo arvata niiden tulevan Zen2:n.

Kyllä. Melko oikein, muttei mitään tekemistä excavatorin kanssa.

Perustellusti väitän ettei Zen ollut puhtaalta pöydältä suunniteltu vaan Zen2 on.

:facepalm:

Zen2 pohjaa hyvin vahvasti Zeniin. Ei mikään puhtaalta pöydältä suunniteltu.

Niitä perusteluja tuossa ylempänä.

Joo, ja kaikki perustelut typeriä. Määrä ei korvaa laatua/paikkaansapitävyyttä.

Vertailun vuoksi: Intelillä kesti noin 5 vuotta saada aikaan Skylake valmiiksi tuotteeksi suunnittelun aloituksesta.

Lähdettä?

AMD:lla kesti 4,5 vuotta saada aikaan Zen suunnittelun aloituksesta valmiiksi tuotteeksi.

Lisäksi AMD oli hyvin hiljaa Excavatorin arkkitehtuurista (verrattuna aiempiin FX-sarjan prosessoreihin) mutta tarjosi hyvin auliisti tietoa Zenistä. Markkinointisyistä AMD:lle sopii vallan mainiosti "Zen on puhtaalta pöydältä suunniteltu".

Steamroller ja Excavator eivät ole mitään FX-sarjan prosessoreita. FX oli vain markkinointinimi AMDn järeimmille kuluttaja-CPU-piireille ajalle rnnen ryzeniä, mutta steamrollerista ja excavatorista ei näitä tehty. K8sta sen sijaan tehtiin.

AMD ei todella pitkään aikaan myynyt excavatoria muualle kuin läppäreihin. ja syynä dokumentaation puutteeseen saattoi osaltaan olla se, että AMD oli jo sisäisesti luokitellut bulldozer-johdannaiset niin muinaisjäänteiksi, ettei halunnut haaskata työntekijöidensä aikaa niiden parempaan dokumentointiin, vaan halusi keskittyä täysillä zeniin.

Ja mitä enemmän AMD antaisi tietoja excavatorista ulos, sitä enemmän sieltä paljastuisi nimenomaan niitä EROJA niissä oleellisissa merkitsevissä yksityisikohdissa.

Mitä enemmän Excavatorista annetaan tietoa, sitä enemmän Zeniä voitaisiin pitää Excavatorina steroideilla.

:facepalm:

Tähän ei voi jälleen kerran todeta kuin tämän:

Dunning–Kruger effect - Wikipedia
 
Viimeksi muokattu:
Asiaton käytös - henkilökohtaisuuksiin meneminen
@hkultala en tiedä miten jaksat tuollaisen ö-luokan inttäjän kanssa edes keskustella. Mies, joka tutkii noita laitteita työkseen vs. fanipoika jolta puuttuu lähteet, joka ei usko edes testituloksia ja jota kiinnostaa lähinnä provoaminen ja jota se spammaa kaikkiin mahdollisiin väleihin. :facepalm:

Keskustelu ainakin antaa hyvän kuvan siitä, miten monta muuttujaa prosessorien suunnittelussa on huomioitava. Itselläni ei ainakaan ole mitään hajua suunnitteluun liittyen mutta antaapahan nämä tekstit jotain eväitä arvioida sitä, mihin suuntaan asiat menevät tulevaisuidessa. :)
 
Mielestäni oikein mielenkiintoisia väitteilyitä, vaikka tässä tosin puhdas trollaaminen haiseekin. Hieman tosin ärsyttää sama jankutus viikko tolkulla, mutta jotain tästä itsekin oppii.
 
Assosiatiivisuudesta.. ensinnäkin, mistä löysit tiedon excavatorin L1D:n assosiatiivisuudesta?

Toisekseen, siihen että se assosiatiivisuus on sama, on erinomainen syy joka ei liity saman designin uudelleenkäyttöön:

Jos välimuisti-wayn koko on suurempi kuin virtuaalimuistisivun koko, VIPT-toimintamekanismi välimuistille ei toimi ongelmitta, vaan sama fyysinen osoite voi meinata päätyä välimuistiin moneen kertaan(aliasoituminen) . Ja tämä aiheuttaa lukuisia ongelmia, sekä suorituskyvylle että sille että prosessori ylipäätään toimii oikein (tarvitaan ylimääräistä purkkaa varmistamaan että aliasoitumista ei tapahdu tai sitä tapahtuu pelkästään lukemisten välille).

Bulldozerissa L1I:llä välimuistin way oli suurempi kuin virtuaalimuistisivu, ja nämä purkat toteutettiin. Käskyvälimuistissa tätä purkkaa tarvitaan kuitenkin vähemmän kuin datavälimuisitissa, koska käskyvälimuistiin ei tule kirjoituksia. Ja tämän alisoitumisongelman suorituskykyvaikutus näkyi aluksi selvästi, käyttiksiin piti tehdä ylimääräisiä optimointeja tämän minimoimiseksi.

AMD Bulldozer Cache Aliasing Issue Fix - Phoronix

Ehdion hukkamaan lähteen, vaikea oli löytää.

Menet taas asian vierestä. Excavatorin suunnittelu aloitettiin Zenin suunnittelun kanssa suunnilleen samoihin aikoihin. Excavatorin tiedetiin olevan marginaalitapaus jonka myyntimäärät jäävät pieniksi ja joka tehdään vanhentuneella 28nm valmistusprosessilla. Joten miksi AMD tekisi noinkin suurta arkkitehtuurimuutosta marginaalitapaukseen ellei siitä saataisi yhtään mitään hyötyä jatkossa? AMD:lle oli ihan sama saako Excavator 5% lisää IPC:ta tai ei. Rajallisten resurssien takia kaikki panostus oli Zeniin joten tuon tason muutosta ei tehdä ihan huvin vuoksi. Se on tässä koko ajan se pääpointti.

Takaisin zenin ja excavatoriin..

Yhden cache-wayn ei siis kannata olla suurempi kuin virtuaalimuistisivun. Kun Excavatorissa L1D suurennettiin 32 kibitavuun, ainoa järkevä tapa oli vaan tuplata cache-wayden määrä eli assosiatiivisuus.

Mutta kun mennään niihin sen L1D:n tarkempiin yksityskohtiin, niin sieltä löytyy mm. sellainen yksityiskohta, että väylän leveys L1Dn ja L2n välillä on tuplattu (16 vs 32 tavua kellojaksossa). Että sinne voidaan kirjoittaa tuplasti enemmän dataa kellojaksossa, täytyy sen rakenteen olla sisäisesti kuitenkin selvästi erilainen.

Ja sen välimuistin vaikutus suorituskykyyn. Zenissä se on jaettu kahden säikeen välillä, excavatorissa joka säikeellä omansa. Softan suorituskyvynkin näkökulmasta toimii aivan eri tavalla, kun Zenissä on SMT käytössä ja kuormitettuna.

Olennainen kysymys kuuluu, miksi Excavatorissa se cache suurennettiin 32 kilotavuun? Marginaaliprosessorissa on yksi ja sama saako sillä jonkun 5% lisäåä IPC:ta tai ei.

AMD:lla ei yhdessäkään aikaisemmassa prosessorissa ole ollut 1. 32KB:n kokoista L1 data cachea 2. 8-way L1 data cachea. Ts. AMD:lla on nollakokemus siitä miten tällainen ratkaisu voisi toimia käytännössä. Excavator on mitä mainioin beta-testi, koska homman mennessä puihin haitta on minimaalinen. Instruction cachen osalta vastaavaa beta-testiä ei voitu tehdä kunnolla Excavatorin rakenteen takia. Zeniin parannettiin Excavatorin ratkaisua kuten monia muitakin, luonnollisesti.

Suorituskyvyn kannalta Excavator oli uhrattavissa, tässä tapauksessa testi tosin onnistui.

:facepalm:

Menee kiinni samoihin ulkoisiin väyliin, joo.

Mutta ne sisäiset väylät joilla itse ytimet ja nuo ulkoisten väylien lähettimet on kytketty ytimiin on täysin erilaisia.

... ja tällä ei ole muutenkaan mitään tekemistä sen itse ytimen mikroarkkitehtuurin kanssa.

Tiedätkö mitä: AMD K6nkin sai kiinni samaan piirisarjaan kuin intelin pentiumin!

Hyvin ymmärretty. Prosessorin arkkitehtuurin kannalta sillä ei ole merkitystä.

AMD:n prosessorin ulkoiset liitännät vuonna 2018 ovat samat kuin 2015, ainoastaan määrissä on pientä eroa. Tämä kertoo täysin selvää kieltä: Carrizo oli Ryzenin beta-testi.

:facepalm:

Edelleen hyvin pihalla siitä, mitä arkkitehtuurilla tarkoitetaan tai miten piirien suunnitteleminen toimii.

Arkkitehtuuritaso on käytännössä sitä piirisuunnittelun speksamista. Omilla prosessorinkehitystyökaluillamme(tce.cs.tut.fi) pystyn tekemään sillä suunniteltuihin prosessoreihin huomattavia arkkitehtuuritason muutoksia parissa minuutissa.

Mutta excavator ja zen ovat niin erilaisia arkkitehtuureita että ei sieltä ole arkkitehtuuritasolla lainattu mitään oleellista.

Ei kyse ole oleellisesti mistään "lainaamisesta", vaan siitä että
1) Ekassa versiossa päätetään että jotkut käskyt toteutetaan yksinkertaisemmalla tavalla, siten että ne yksiköt on nopeampi toteuttaa ja testata ja ne vievät vähemmän pinta-alaa. Monesta yksiköstä esim. 1.5x nopeampi versio saattaa olla neljä kertaa monimutkaisempi.

2) Kun sitä arkkitehtuuria simuloidaan ja sillä simulaatiossa ajetaan paljon erilaisia benchmarkkeja, selviää, mitkä sen pullonkaulat ovat. Huomataan, että joku puskuri on kohtalaisen usein täynnä ja muu liukuhihna stallaa sitä odotellessa yms. Sitten sitä puskuria suurennetaan hiukan arkkitehtuurin seuraavaan versioon.

3) Kehitetään jälleen parempi haarautumisenennustusalgoritmi tms. ja toteutetaan se.

Muuten vaan piireistä löytyy suuri määrä yhtäläisyyksiä. Excavatorin ehkä suurimmat muutokset ovat L1 data cache (pitkälti vastaava kuin Ryzenissä) ja branch prediction yksikkö (patenttien perusteella Ryzenissä on pitkälti vastaava vaikka sitä onkin muokattu).

1) AMD tiesi myös Zenin tehtävän pienemmällä valmistustekniikalla.

2) Miten tämä estää käyttämästä Excavatorista niitä osia joissa on vähiten pullonkauloja?

3) Tuonkin toteutukseen täysin tyhjästä menee enemmän aikaa kuin parannella vanhaa.

Ei. "kaikki mahdolliset asiat" olisi tarkoittanut sitä että ei olisi tehty zeniä vaan olisi tehty joku viides hiukan viilattu maanrakennuskone, joka olisi näyttänyt hyvin selvästi maanrakennuskoneelta lliukuhihnansa pituudelta ja laskentayksiköiden määrältä ja monisäikeistystavalataan jne. Zen ei ole maanrakennuskone vaan täysin erilainen arkkitehtuuri.

Sehän on täysin erilainen arkkitehtuuri, kuka sitä on edes väittänyt? Tästähän käytiin aiemmin keskustelua Sandy Bridgen osalta. Edeltäjäänsä nähden Sandy Bridge oli liukuhihnan pituudelta, välimuisteilta, laskentayksiköiden määrältä, monisäikeistykseltä ja niin edelleen käytännössä täysin vastaava. Silti se oli "täysin uusi arkkitehtuuri". Joten "täysin uusi arkkitehtuuri" ei edellytä mainittujen asioiden osalta mitään muutosta.

PEXT on käsky joka operoi ihan normaalisti kahdella normaalissa rekisterissä olevalla syötteellä.
Bulldozer-pohjaisissa arkkitehtuureissa ei ole mitään, mikä niillä pakottaa hitaaseen PEXT-implementaation.

Sillä , että excavator tuli ennen Zeniä ei siis ollut mitään vaikutusta siihen, millainen zenin PEXT-implementaatio on.

Järeämpi PEXT-toteutus olisi vaan vaatinut enemmän piipinta-alaa ja enemmän tuotekehitysaikaa ihan täysin riippumatta siitä, oltaisiinko sitä kehitetty exvacatoriin vai zeniin.

AMD totesi, että PEXT on (toistaiseksi) harvinainen käsky jonka suorituskyvyllä ei ole paljoa väliä, mutta sen paremman toteutuksen kehittämiseen menisi lisäaikaa ja se lisäisi prosessorin pinta-alaa jonkin verran ja sen mukana kriittiset polut voisi pidentyä ja sen myötä kellotaajuus laskea. Se voidaan siis toteuttaa hvyin hitaalla ja pienellä implementaatiolla. Se, oliko sama hidas ja pieni implementaatio käytössä jo excavatorissa on irrelevanttia.

On ihan normaalia ettei AMD laita kaikista harvinaisemmista (tai yleisemmistäkin) erikoiskäskyistä nopeaa versiota heti alkuun. On kuitenkin melkoinen "sattuma" että AMD pitää samaa käskyä "tarpeettomana" vielä vuosia myöhemmin. AMD:lla oli myös "varaa" lisätä Zeniin uusia lisäkäskyjä.

Ei, se on juuri malliesimerkki siitä, että VAIKKA se yksikkö olisi sama kuin excavatorissa, excavatorin bulldozer-juurilla ei ole mitään merkitystä sen nopeuteen. AMD olisi aivan hyvin voinut toteuttaa jo exvacatoriin nopean PEXTin, muttei ilmeisesti toteuttanut.

Totta kai AMD olisi voinut toteuttaa sen nopeana jo Excavatoriin. Koska AMD ei sitä Excavatoriin toteuttanut nopeana, on aika ihmeellistä mikäli AMD päättää tehdä saman vaikka suunnittelee kaiken uusiksi.

Sinulla ei ole mitään ymmärrystä niistä yksityiskohdista joiden pohjalta näin väität.

Sinä taas et vastaa mitenkään esittämiini asioihin aikatauluihin liittyen.

Kyllä. Melko oikein, muttei mitään tekemistä excavatorin kanssa.

Tästä voi ollakin samaa mieltä.

:facepalm:

Zen2 pohjaa hyvin vahvasti Zeniin. Ei mikään puhtaalta pöydältä suunniteltu.

Tai sitten: Zen2 puhtaalta pöydältä, Zen1 lainataan mitä vaan kunhan nopeuttaa suunnittelua.

Joo, ja kaikki perustelut typeriä. Määrä ei korvaa laatua/paikkaansapitävyyttä.

Perusteletko esim. sen miten AMD:lla on varaa suunnitella Zen puhtaalta pöydältä, heti perään Zen2 ja vielä Excavatoriin tehdä huomattavia muutoksia arkkitehtuuriin vaikka resursseista on pulaa?


Intel Introduced its 6th Generation Intel Core -Israel Electronics News

Mikäli sama tiimi suunnitteli Sandy Bridgen, tuosta sen voi laskea.

Steamroller ja Excavator eivät ole mitään FX-sarjan prosessoreita. FX oli vain markkinointinimi AMDn järeimmille kuluttaja-CPU-piireille ajalle rnnen ryzeniä, mutta steamrollerista ja excavatorista ei näitä tehty. K8sta sen sijaan tehtiin.

AMD ei todella pitkään aikaan myynyt excavatoria muualle kuin läppäreihin. ja syynä dokumentaation puutteeseen saattoi osaltaan olla se, että AMD oli jo sisäisesti luokitellut bulldozer-johdannaiset niin muinaisjäänteiksi, ettei halunnut haaskata työntekijöidensä aikaa niiden parempaan dokumentointiin, vaan halusi keskittyä täysillä zeniin.

Ja mitä enemmän AMD antaisi tietoja excavatorista ulos, sitä enemmän sieltä paljastuisi nimenomaan niitä EROJA niissä oleellisissa merkitsevissä yksityisikohdissa.

FX-sarja, rakennuskonesarja, sama asia.

Sitä suuremmalla syyllä: koska AMD panostaa täysillä Zeniin, miksi ihmeessä haaskataan resursseja Excavatoriin ellei siitä saada muuta hyötyä kuin Excavator nopeammaksi?

Annat ymmärtää AMD:n panostaneen täysillä Zeniin ja samalla annat ymmärtää panostaneen "turhiin asioihin" kuten Excavatoriin :think:

Trolleissa on se hyvä puoli, että trollaus provosoi välillä asiantuntijat kirjoittamaan teknisiä juttuja tarkkuustasolla, jolle ei normaalisti olisi ehkä tarvetta tällaisilla foorumeilla. Kiinnostavaa luettavaa. :)

Esitäppä missä kohtaa sitä trollausta on?

@hkultala en tiedä miten jaksat tuollaisen ö-luokan inttäjän kanssa edes keskustella. Mies, joka tutkii noita laitteita työkseen vs. fanipoika jolta puuttuu lähteet, joka ei usko edes testituloksia ja jota kiinnostaa lähinnä provoaminen ja jota se spammaa kaikkiin mahdollisiin väleihin. :facepalm:

Mikäli ymmärtäisit lukemaasi, huomaisit vastapuolen välttävän vastaamista niihin kysymyksiin jotka ovat pääasiallisia pointtejani.
 
AMD:n prosessorin ulkoiset liitännät vuonna 2018 ovat samat kuin 2015, ainoastaan määrissä on pientä eroa. Tämä kertoo täysin selvää kieltä: Carrizo oli Ryzenin beta-testi.
Luin tähän kommenttiin asti. Lue muutama tieteellinen artikkeli, niin tiedät että ei ollut minkään prossun beta-testi. Tuo kommenttisi on niin hanurista, että muilla ei taida olla enää mitään väliä.

Siis jotain tasoa nyt sentään jos prossu suunnittelusta vänkäät.
 
Luin tähän kommenttiin asti. Lue muutama tieteellinen artikkeli, niin tiedät että ei ollut minkään prossun beta-testi. Tuo kommenttisi on niin hanurista, että muilla ei taida olla enää mitään väliä.

Siis jotain tasoa nyt sentään jos prossu suunnittelusta vänkäät.

AMD:lla oli resursseista pulaa, check. AMD tiesi Carrizon jäävän arkkitehtuurin viimeiseksi edustajaksi, check. AMD panosti täysillä Zeniin, check. Carrizon myyntimäärien tiedettiin jäävän olemattomiksi, check.

Joten miksi "DOA" prosessoriin tehdään suuria arkkitehtuuritason muutoksia? Miksi "DOA" prosessoriin laitetaan DDR4 muistiohjain, PCI Express ohjain, USB ohjain ja SATA ohjain? Näitä ei ollut aikaisemmin missään AMD:n prosessorissa. Vastaus: niitä hyödynnettiin Ryzenissä.

Eli jotain rajaa ennen kuin alat kommentoimaan tuollaista roskaa.
 
@hkultala en tiedä miten jaksat tuollaisen ö-luokan inttäjän kanssa edes keskustella. Mies, joka tutkii noita laitteita työkseen vs. fanipoika jolta puuttuu lähteet, joka ei usko edes testituloksia ja jota kiinnostaa lähinnä provoaminen ja jota se spammaa kaikkiin mahdollisiin väleihin. :facepalm:
Totta ihan joka sana. Pahinta tossa on vielä se, että ei opi koskaan mitään noista mitä sille sanoo ja samat tyhmät argumentit toisessa threadissa jatkuu.
 
Ehdion hukkamaan lähteen, vaikea oli löytää.

Menet taas asian vierestä. Excavatorin suunnittelu aloitettiin Zenin suunnittelun kanssa suunnilleen samoihin aikoihin.

Ei, vaan pari vuotta aiemmin.

Excavator nähtiin jo mm. lokakuussa 2011 julkaistuissa slideissä.

Excavatorin tiedetiin olevan marginaalitapaus jonka myyntimäärät jäävät pieniksi ja joka tehdään vanhentuneella 28nm valmistusprosessilla.

Suunnittelun alussa ei.

Ensinnäkin, noiden APUjen myyntimäärät on tyypillisesti olleet paljon suurempia kuin AMDn erillis-CPUiden.

Toisekseen, siinä vaiheessa kun mikroarkkitehtuurin suunnittelu aloitettiin, siitä oli vielä tarkoitus tehdä myös iso Opteron-/FX-sarjalainen pelkkä CPU-piiri.

Steamroller- ja excavator-pohjaiset pelkät CPU-piiirit kuitenkin peruttiin siinä vaiheessa, kun AMD tajusi, että ne eivät olisi kilpailukykyisiä, ja päätti säästää tuotekehityksessä eikä tuhlata turhaan rahaa piireihin, joiden tuoteketyskustannuksia ei saisi katettua, ja toi näistä ulos pelkästään APU-piirit, ja jatkoi piledriver-pohjaisen Visheran valmistusta rinnan Kaverin kanssa.

Joten miksi AMD tekisi noinkin suurta arkkitehtuurimuutosta marginaalitapaukseen

Mistä ihmeen suuresta arkkitehtuurimuutoksesta nyt oikein puhut? Se, että aivan samanlaisten cache-wayden määrä nostetaan neljästä kahdeksaan ei ole mikään suuri arkkitehtuurimuutos. Se on vaadittavan tuotekehityksen kannalta todella yksinkertainen arkkitehtuurimuutos moneen muuhuin verrattuna.

ellei siitä saataisi yhtään mitään hyötyä jatkossa? AMD:lle oli ihan sama saako Excavator 5% lisää IPC:ta tai ei.

Ei, vaan pienistä puroista kasvaa suuri virta.

Prosessorien uusien mallien kehittäminen on nykyään nimenomaan sitä, että tehdään 10 kpl pikkuviilauksia, joista jokainen antaa keskimäärin puolen prosentin suorituskykylisäyksen, ja sillä saadaan yhteensä 5% suorituskykyä lisää

Rajallisten resurssien takia kaikki panostus oli Zeniin joten tuon tason muutosta ei tehdä ihan huvin vuoksi. Se on tässä koko ajan se pääpointti.

Tuotekehitysresurssien kannalta välimuistin tuplaaminen on erinomainen tapa käyttää niitä tuotekehitysresursseja. Vaatii hyvin vähän mitään tuotekehitystä. Se, että aletaan kehittämään usuai algoritmeja johonkin haarautumisenennustukseen tai jonkun käskyn toteutukseen vaatii paljon monimutkaisempaa logiikkaa, jossa on paljon enemnän työtä, ja paljon enemmän mahdollisuuksia bugeille eli vaatii myös paljon enemmän testaamista. Ja siinä niiden yksittäisten parannusten suorituskykyhyöty on paljon pienempi.

Olennainen kysymys kuuluu, miksi Excavatorissa se cache suurennettiin 32 kilotavuun? Marginaaliprosessorissa on yksi ja sama saako sillä jonkun 5% lisäåä IPC:ta tai ei.

:facepalm:

5% on nykyaikana ihan älyttömän SUURI ipc-parannus jos sen saa yhdellä muutoksella.

Miksi koko excavator ylipäätään kehitettiin? miksei vaan jatkettu steamrollerilla?

Excavatoria ei alun perin suunniteltu marginaaliprosessoriksi, se ajautui sellaiseksi koska ei pystynyt kilpailemaan intelin prossuja vastaan, ja vaikka tehdään kuinka marginaaliprosessoria, ei sen tuotekehityksessä voi lepsuilla.

Suorituskyvyn lisäksi L1-välimuistin kasvattaminen parantaa myös prosessorin energiatehokkuutta, kun hakuja kauempana olevaan L2-välimuistiin tulee vähemmän. Tosin bulldozer-johdannaisten läpikirjoittava L1D-kakku tarkoittaa sitä, että hyöty tästä jää hiukan pienemmäksi, kun kirjoitukset kuitenkin heti tehdään sinne L2-kakkuun asti.

Ja niin, tämä oli tosiaankin myös hyvin oleellinen toimintaperiaate-ero excavatorin ja zenin L1D-kakkujen välillä. Excavatorin L1D on läpikirjoittava, zenin L1D takaisinkirjoittava. Tämä myös tarkoittaa välimuisteille melko erllaista rakennetta.

Että voisitko nyt lopettaa paskapuheesi siitä kuinka samanlaisia ne välimuistit on kun et ymmärrä niistä yhtään mitään?

AMD:lla ei yhdessäkään aikaisemmassa prosessorissa ole ollut 1. 32KB:n kokoista L1 data cachea 2. 8-way L1 data cachea.

.. paitsi Bobcatissä, Pumassa ja Jaguarissa :facepalm:

Niinkuin oikeasti. Olet pihalla kuin lumiukko ja jankutat vaikka mitä päätöntä.

Ts. AMD:lla on nollakokemus siitä miten tällainen ratkaisu voisi toimia käytännössä.

Mistähän kokemuksesta nyt oikein puhut? Nämä on numerollisia parametreja, ei algoritmeja. Niiden suunnittelu/valmistaminen menee siten että otetaan kahkdensa kappaletta 4 kiB cache waytä ja laitetaan ne rinnakkain. Eteen ehkä way prediction-logiikka, mutta se varmaan on ollut jo ennestään että sen 4-way -välimuistin on saanut toimimaan pienellä virrankulutuksella, ihan sama way prediction-logiikka toinii kahdeksallekin kuin neljälle waylle.

Ja sen osumatarkkuuden kannalta taas tämän simuloimiseen kykenevän välimuistisimulaattorin koodaa muutamassa päivässä. Tai siis kun se välimuistisimulaattori on jo olemassa niiden kaikkien aiempien prosessoreiden kehittämistä varten, siihen olemassaolevaan välimuistisimulaattoriin syöttää parissakymmenessä sekunnissa sen uuden välimuistin parametrit.

Ja niin, se kokemus tosiaankin juuri tällaisita parametreista oli jo ennestään niistä pikkukissoista.

Pikemminkin kysymys on, että miksei tätä tehty jo aiemmin? Varmaan, koska oletettiin kellotaajuuden kärsivän tästä enemmän, kuin mitä tästä saatiin IPC-hyötyjä. Excavatorissa tähdättiin enemmän energiatehokkuuteen kuin aiemmissa, joten tämä ehkä sen takia koettiin tässä vaiheessa järkeväksi muutokseksi.
Tai sitten tässä vaiheessa vihdoin tajuttiin, että arkkitehtuurissa on muualla pahempia kriittisiä polkuja, ja että tämä ei lopulta hidastakaan sitä kellotaajuutta.

Excavator on mitä mainioin beta-testi, koska homman mennessä puihin haitta on minimaalinen. Instruction cachen osalta vastaavaa beta-testiä ei voitu tehdä kunnolla Excavatorin rakenteen takia. Zeniin parannettiin Excavatorin ratkaisua kuten monia muitakin, luonnollisesti.

Suorituskyvyn kannalta Excavator oli uhrattavissa, tässä tapauksessa testi tosin onnistui.

:facepalm:

Muuten vaan piireistä löytyy suuri määrä yhtäläisyyksiä. Excavatorin ehkä suurimmat muutokset ovat L1 data cache (pitkälti vastaava kuin Ryzenissä)

Tuotekehitysajan kannalta ei todellakaan. Tuotekehitysajan kannalta se L1D oli käytännössä triviaaleimmasta päästä olevia muutoksia. Sen sijaan siellä lisättiin tuki monille sellaisille käskyille, joita steamrollerissa ei ollut tuettu, ja näiden toteutus oli

Mutta ihan turha tästä L1Dstä on jankuttaa kun pitäisi olla jo tehty täysin selväksi, että se on zenissä oikeasti täysin erilainen kuin excavatorissa, vaikka ulkoiset kokoparametrir onkin samat.

Vähän sama, kun väittäisi 1.5l maitopurkkia ja 1.5 limsapurkkia samoiksi purkeiksi sen takia, että molempien tilavuus on 1.5 litraa ja molemmat säilöö nestettä.

ja branch prediction yksikkö (patenttien perusteella Ryzenissä on pitkälti vastaava vaikka sitä onkin muokattu).

Jotain lähdettä excavatorin haarautumisenennustusparannuksille? vai mutuiletko vaan jälleen?

Tästähän käytiin aiemmin keskustelua Sandy Bridgen osalta. Edeltäjäänsä nähden Sandy Bridge oli liukuhihnan pituudelta, välimuisteilta, laskentayksiköiden määrältä, monisäikeistykseltä ja niin edelleen käytännössä täysin vastaava. Silti se oli "täysin uusi arkkitehtuuri". Joten "täysin uusi arkkitehtuuri" ei edellytä mainittujen asioiden osalta mitään muutosta.

Sandy bridgessä ytimen oleellinen toimintaperiaate muuttui täysin.

Jälleen palataan siihen, että ignoraat sellaiset pointit, mitä et ymmärrä.

On ihan normaalia ettei AMD laita kaikista harvinaisemmista (tai yleisemmistäkin) erikoiskäskyistä nopeaa versiota heti alkuun. On kuitenkin melkoinen "sattuma" että AMD pitää samaa käskyä "tarpeettomana" vielä vuosia myöhemmin. AMD:lla oli myös "varaa" lisätä Zeniin uusia lisäkäskyjä.

:facepalm:

BMI2 on uusi käskykantalaajennos, jota äärimmäisen harvat softat käyttää.

Eikä sinulla ole mitään tietoa siitä, kuinka nopa PEXT-käsky on excavatorilla.

Se vasta kummaa olisikin, jos joku uusi hyvin harvinaisen käyttötarkoitukseen tehty erikoiskäsky yleistyisi kahdessa vuodessa sillai että yhtäkkiä se olisi hirveä pullonkaula koko prosessorin nopeudelle.

Perusteletko esim. sen miten AMD:lla on varaa suunnitella Zen puhtaalta pöydältä, heti perään Zen2 ja vielä Excavatoriin tehdä huomattavia muutoksia arkkitehtuuriin vaikka resursseista on pulaa?

Excavatoriin ei tehty mitään "huomattavia muutoksia steamrollerista", ja ne muutokset, mitä tehtiin, tehtiin pääosin ENNEN Zenin kehitystä.

Muutokset välillä Piledriver->Steamroller olivat paljon merkittävämpiä ja vaativat paljon enemmän tuotekehitystyötä.

Ja zen2 taas on suoraa jatkokehitelmää zenistä. Kaikki sellaiset ideat, mitä ei ole aikaa toteuttaa ajoissa zeniin siirrettiin sinne.

Toisekseen, Zenin kehityksen aikana tuotekehitysporukkaa siirrettiin GPU-puolella CPU-puolelle, että zen saatiin aikaiseksi sillä aikataululla kuin se nyt saatiin aikaiseksi. Tämän huomaa hyvin AMDn GPUiden viimeaikaisessa kehityksessä-

Tämä lienee myös oleellinen syy siihen, miksi Lisa Su:lla ja Raja Kodurilla meni sukset ristiin, raja koko että hän ei saa tarpeeksi resursseja kehittää tehokkaita näyttiksiä joita hän olisi halunnut kehittää. ja Vega myöhästyi selvästi ja oli alitehoinen.

Intel Introduced its 6th Generation Intel Core -Israel Electronics News

Mikäli sama tiimi suunnitteli Sandy Bridgen, tuosta sen voi laskea.

... paitsi että se sama tiimi siinä välissä suunnitteli ainakin myös ivy bridgen, eikä projektit muutenkaan toimi siten, että projekti julistetaan valmiiksi ja loppuu kuin seinään ja samalla hetkellä kaikki siirtyvät seuraavaan projektiin.

FX-sarja, rakennuskonesarja, sama asia.

Sitä suuremmalla syyllä: koska AMD panostaa täysillä Zeniin, miksi ihmeessä haaskataan resursseja Excavatoriin ellei siitä saada muuta hyötyä kuin Excavator nopeammaksi?

Ensinnäkin, excavatorin arkkitehtuurisuunnittelu oli käytännössä jo melkein valmis kun zen-projekti alkoi, joten arkkitehtuurisuunnittelun osalta excavator ei ollut paljoa zenistä pois.

Piirisuunnittelun osalta taas, siinä vaiheessa kun excavatorin piirisuunnittelua tehtiin, zenin arkkitehtuurista ei ollut paljoa vielä niin lukossa, että sen piirisuunnittelu olisi voinut kunnolla edetä.

Ja kolmannekseen.. jos vaikka tiedetään, että "vuoden päästä tarvitaan paljon piirisuunnittelijoita seuraavalle, hyvälle arkkitehtuurille", niin paras tapa varmistaa niiden piirisuunnittelijoiden osaaminen silloin vuoden päästä on laittaa ne tekemään jotain oikeaa siksi vuodeksi. Se, että piirisuunnittelijat olisivat pyöritelleen peukaloitaan odotellessaan, koska pääsevät zeniä kehittämään olisi tarkoittanut selvästi bugisempaa ja mahdollisesti myös kellotaajuudeltaan hitaampaa zeniä.

Ja se kaikkein tärkein: AMD tarvi myytäviä uusia (Steamrolleria/kaveria/Godavaria parempia) tuotteita myös välille 2015-2016.

Annat ymmärtää AMD:n panostaneen täysillä Zeniin ja samalla annat ymmärtää panostaneen "turhiin asioihin" kuten Excavatoriin :think:

Excavator ei ollut turha. Se vaan ei pärjännyt intelin piirejä vastaan kovin hyvin, mihin oli syynä sekä
1) bulldozer-kuona (läpikirjoittava L1D, pitkät viiveet monilla käskyillä, liian hidas viive L2-kakussa, liian pieni määrä kokonaislukuliukuhihnoja, ...
2) huono valmistustekniikka
3) intelin liian kova suoriutuminen noihin aikoihin
4) sen matalan tason piirisuunnittelussa optimoitiin vähemmän kellotaajuutta, enemmän tiheyttä ja pienen kellotaajuuden sähkönkulutusta. Päätös tästä tehtiin todennäköisesti myöhemmin kuin aivan arkkitehtuurisuunnittelun alkuvaiheessa.

Mikäli ymmärtäisit lukemaasi, huomaisit vastapuolen välttävän vastaamista niihin kysymyksiin jotka ovat pääasiallisia pointtejani.

Pääasialliset pointtisi ovat pintapuolisia virheellisiä oletuksia excavatorin ja zenin mikroarkkitehtuureista.

Olen jo selittänyt hyvin selvästi nämä pointtisi vääriksi, mutta silti jaksat jankuttaa niiden pohjalta tekemiäsi virhepäätelmiä.


Arkkitehtuuriltaan Zen muistuttaa itse asiassa kissasarjan ytimiä paljon enemmän kuin Bulldozer-sarjaa. Kun ensimmäiset tiedot zenin arkkitehtuurista tuli, luulin sitä kissa-sarjan jatkokehitelmäksi, mutta sitten myöhemmin kun arkkitehtuurista tuli tarkempia tietoja, kävi ilmi, että se on oikeasti puhtaalta pöydältä tehty, eikä vain paljon lihotettu(tai lihastettu) kissa.
 
Viimeksi muokattu:
Onhan tämä taas vänkäystä. Voisi jo ennustaa seuraavaa: Kerran Zen oli jeesusteipillä kasattattu ja pikkufiksattu excavator ja zen2 on se oikeasti uusi arkkitehtuuri, joten jos pikkufikseillä ja tekemällä aito 8/8 - 8/4 prosun sijaan saatiin 40% ipc nousu, niin zen2 räjäyttää pankin ja keulii kauas Intelin ohi.

Sitten kun zen2 tuo sen 3-15% IPC parannuksen, niin alkaa tarina siitä, miten zen2 oli osoitus siitä, että AMD siirtyikin TICK/TOCK malliin ja Zen3 on se kokonaan uusi arkkitehtuuri, jossa ei ole enää mitään excavator palikoita.
 
Ei, vaan pari vuotta aiemmin.

Excavator nähtiin jo mm. lokakuussa 2011 julkaistuissa slideissä.

Excavator nimenä esiintyi silloin. Nyt jo esiintyy nimi Zen4 ja Zen5, jotka tulevat joskus 2020+.

Jos Excavatorin kehitys alkoi 2011, 4 vuoden kehitysaika käy järkeen mutta Zen 4,5 vuodessa on todella nopeaa. On myös mahdollista ettei Excavatorin ensimmäistä versiota lopulta käytetty.

Suunnittelun alussa ei.

Ensinnäkin, noiden APUjen myyntimäärät on tyypillisesti olleet paljon suurempia kuin AMDn erillis-CPUiden.

Toisekseen, siinä vaiheessa kun mikroarkkitehtuurin suunnittelu aloitettiin, siitä oli vielä tarkoitus tehdä myös iso Opteron-/FX-sarjalainen pelkkä CPU-piiri.

Steamroller- ja excavator-pohjaiset pelkät CPU-piiirit kuitenkin peruttiin siinä vaiheessa, kun AMD tajusi, että ne eivät olisi kilpailukykyisiä, ja päätti säästää tuotekehityksessä eikä tuhlata turhaan rahaa piireihin, joiden tuoteketyskustannuksia ei saisi katettua, ja toi näistä ulos pelkästään APU-piirit, ja jatkoi piledriver-pohjaisen Visheran valmistusta rinnan Kaverin kanssa.

Sitähän ei tiedä milloin julkaistun Excavatorin suunnittelu aloitettiin. Resurssien kannalta voisi käydä järkeen myös suunnitella samaan aikaan kuin Zen.

APU:jen myyntimäärät ovat kohtalaisia mutta katteet heikot. Ei niillä paljoa tuotekehitystä saa katettua.

Mistä ihmeen suuresta arkkitehtuurimuutoksesta nyt oikein puhut? Se, että aivan samanlaisten cache-wayden määrä nostetaan neljästä kahdeksaan ei ole mikään suuri arkkitehtuurimuutos. Se on vaadittavan tuotekehityksen kannalta todella yksinkertainen arkkitehtuurimuutos moneen muuhuin verrattuna.

Samalla cachen koko tuplattiin. Mitä muita suuria muutoksia Carrizoon tehtiin? Ei juuri muuta.

Ei, vaan pienistä puroista kasvaa suuri virta.

Prosessorien uusien mallien kehittäminen on nykyään nimenomaan sitä, että tehdään 10 kpl pikkuviilauksia, joista jokainen antaa keskimäärin puolen prosentin suorituskykylisäyksen, ja sillä saadaan yhteensä 5% suorituskykyä lisää

Eiköhän tuolla cachella ollut aika suuri merkitys siinä IPC:n parantamisessa.

Tuotekehitysresurssien kannalta välimuistin tuplaaminen on erinomainen tapa käyttää niitä tuotekehitysresursseja. Vaatii hyvin vähän mitään tuotekehitystä. Se, että aletaan kehittämään usuai algoritmeja johonkin haarautumisenennustukseen tai jonkun käskyn toteutukseen vaatii paljon monimutkaisempaa logiikkaa, jossa on paljon enemnän työtä, ja paljon enemmän mahdollisuuksia bugeille eli vaatii myös paljon enemmän testaamista. Ja siinä niiden yksittäisten parannusten suorituskykyhyöty on paljon pienempi.

Bulldozerissa tiedettiin varmasti heti alussa pienen L1 cachen olevan ongelma koska L2 cache on hidas. Sen korjaamiseen meni 4 vuotta. Lisäksi L1 cachen koko vaikuttaa prosessorin rakenteeseen suurella skaalalla, ei se ole mikään ihan pikkujuttu historiankaan valossa.

:facepalm:

5% on nykyaikana ihan älyttömän SUURI ipc-parannus jos sen saa yhdellä muutoksella.

Miksi koko excavator ylipäätään kehitettiin? miksei vaan jatkettu steamrollerilla?

Excavatoria ei alun perin suunniteltu marginaaliprosessoriksi, se ajautui sellaiseksi koska ei pystynyt kilpailemaan intelin prossuja vastaan, ja vaikka tehdään kuinka marginaaliprosessoria, ei sen tuotekehityksessä voi lepsuilla.

Suorituskyvyn lisäksi L1-välimuistin kasvattaminen parantaa myös prosessorin energiatehokkuutta, kun hakuja kauempana olevaan L2-välimuistiin tulee vähemmän. Tosin bulldozer-johdannaisten läpikirjoittava L1D-kakku tarkoittaa sitä, että hyöty tästä jää hiukan pienemmäksi, kun kirjoitukset kuitenkin heti tehdään sinne L2-kakkuun asti.

Ja niin, tämä oli tosiaankin myös hyvin oleellinen toimintaperiaate-ero excavatorin ja zenin L1D-kakkujen välillä. Excavatorin L1D on läpikirjoittava, zenin L1D takaisinkirjoittava. Tämä myös tarkoittaa välimuisteille melko erllaista rakennetta.

Että voisitko nyt lopettaa paskapuheesi siitä kuinka samanlaisia ne välimuistit on kun et ymmärrä niistä yhtään mitään?

Resurssipulassa oleva AMD tekee Excavatoriin DDR4 muistiohjaimen, SATA ohjaimen, USB ohjaimen ja PCI Express ohjaimen. Miksi ja millä resursseilla? Vastaus: käytännössä samat liitännät löytyvät vielä 2018 Ryzenistä. Hyvä syy julkaista Carrizo.

Miksi ei voi lepsuilla? AMD:lla oli selkeä visio kehittää Zeniä täysillä, ei siinä ole varaa tehdä mitään turhaa Excavatoriin.

Koko ajan jauhetaan kuinka AMD:lla ei ole varaa kehittää useaa arkkitehtuuria samaan aikaan. Miten tuo sovelletaan Excavatorin ja Zenin samanaikaiseen kehittämiseen?

Annat ymmärtää L1 cachen kasvattamisen olevan joku sormia napsauttamalla tehtävä asia. Cachen koon muuttaminen voi ollakin helppoa mutta prosessorin rakenteeseen sen vaikutus on suuri. Jos Piledriveriin/Steamrolleriin saa helposti lisää IPC:ta kun tuosta vain naps kasvatetaan L1 cachea, miksi se tehtiin vasta Excavatoriin? Miksi Phenom II sarjassa on yhtä nopea L1 cache mutta suurempi? Täysin selvä heikkous joka jätetään vaikka voisi helposti korjata, OK.

Erilainen rakenne tai ei, on aina helpompaa muokata olemassa olevaa kuin kehittää täysin uutta tyhjästä.

.. paitsi Bobcatissä, Pumassa ja Jaguarissa :facepalm:

Niinkuin oikeasti. Olet pihalla kuin lumiukko ja jankutat vaikka mitä päätöntä.

Joiden kellotaajuudet luokassa 2 GHz, eli turha verrata kovempiin kiviin.

Mistähän kokemuksesta nyt oikein puhut? Nämä on numerollisia parametreja, ei algoritmeja. Niiden suunnittelu/valmistaminen menee siten että otetaan kahkdensa kappaletta 4 kiB cache waytä ja laitetaan ne rinnakkain. Eteen ehkä way prediction-logiikka, mutta se varmaan on ollut jo ennestään että sen 4-way -välimuistin on saanut toimimaan pienellä virrankulutuksella, ihan sama way prediction-logiikka toinii kahdeksallekin kuin neljälle waylle.

Ja sen osumatarkkuuden kannalta taas tämän simuloimiseen kykenevän välimuistisimulaattorin koodaa muutamassa päivässä. Tai siis kun se välimuistisimulaattori on jo olemassa niiden kaikkien aiempien prosessoreiden kehittämistä varten, siihen olemassaolevaan välimuistisimulaattoriin syöttää parissakymmenessä sekunnissa sen uuden välimuistin parametrit.

Ja niin, se kokemus tosiaankin juuri tällaisita parametreista oli jo ennestään niistä pikkukissoista.

Pikemminkin kysymys on, että miksei tätä tehty jo aiemmin? Varmaan, koska oletettiin kellotaajuuden kärsivän tästä enemmän, kuin mitä tästä saatiin IPC-hyötyjä. Excavatorissa tähdättiin enemmän energiatehokkuuteen kuin aiemmissa, joten tämä ehkä sen takia koettiin tässä vaiheessa järkeväksi muutokseksi.
Tai sitten tässä vaiheessa vihdoin tajuttiin, että arkkitehtuurissa on muualla pahempia kriittisiä polkuja, ja että tämä ei lopulta hidastakaan sitä kellotaajuutta.

Historiaa taaksepäin katsomalla on helppo nähdä AMD:lla olleen hitaita, pienen kaistanleveyden, pienen assosiatiivisuuden tai kaikkien edellisten cacheja. Zenin kohdalla AMD sanoi suoraan kehittävänsä nopean cache systeemin. Eli AMD:n kokemus nopeiden cachejen vaikutuksesta prosessoriarkkitehtuuriin, nopeita cacheja sisältävien prosessorien valmistuksesta jne oli pitkälti nollissa. Yhdistelmä kiire, uusi asia, vähän kokemusta ja uusi valmistustekniikka ei välttämättä lupaa hyvää.

Bulldozerin kellotaajuus kärsi tiettävästi L2 cachesta joka rajoitti kellotaajuutta. Sitä ei taidettu koskaan korjata kunnolla.

:facepalm:

Tuotekehitysajan kannalta ei todellakaan. Tuotekehitysajan kannalta se L1D oli käytännössä triviaaleimmasta päästä olevia muutoksia. Sen sijaan siellä lisättiin tuki monille sellaisille käskyille, joita steamrollerissa ei ollut tuettu, ja näiden toteutus oli

Mutta ihan turha tästä L1Dstä on jankuttaa kun pitäisi olla jo tehty täysin selväksi, että se on zenissä oikeasti täysin erilainen kuin excavatorissa, vaikka ulkoiset kokoparametrir onkin samat.

Vähän sama, kun väittäisi 1.5l maitopurkkia ja 1.5 limsapurkkia samoiksi purkeiksi sen takia, että molempien tilavuus on 1.5 litraa ja molemmat säilöö nestettä.

Sitä triviaaleinta muutosta ei tehty ennen kuin Bulldozer sarja oli käytännössä kuopattu ja sillä ei ollut käytännössä mitään käytännön merkitystä. Hassua.

Yksi huolenaihe vähemmän "worst case scenariossa" kun ei tarvitse kehittää täysin tyhjästä vaan ratkaisu pohjimmiltaan tiedetään toimivaksi ja sellainen saadaan valmistettuakin.

Jotain lähdettä excavatorin haarautumisenennustusparannuksille? vai mutuiletko vaan jälleen?

AMD Launches Carrizo: The Laptop Leap of Efficiency and Architecture Updates
AMD's Carrizo architecture detailed and explored - ExtremeTech
AMD Carrizo Mainstream APUs Overview

Sandy bridgessä ytimen oleellinen toimintaperiaate muuttui täysin.

Jälleen palataan siihen, että ignoraat sellaiset pointit, mitä et ymmärrä.

Ei vaan määrittelet uudet arkkitehtuurit aika monella eri tavalla.

Ei. "kaikki mahdolliset asiat" olisi tarkoittanut sitä että ei olisi tehty zeniä vaan olisi tehty joku viides hiukan viilattu maanrakennuskone, joka olisi näyttänyt hyvin selvästi maanrakennuskoneelta lliukuhihnansa pituudelta ja laskentayksiköiden määrältä ja monisäikeistystavalataan jne. Zen ei ole maanrakennuskone vaan täysin erilainen arkkitehtuuri.

Tällä logiikalla: Jos Zenistä olisi tehty prosessori joka näyttäisi hyvin selvästi maanrakennuskoneelta liukuhihnan pituuden jne takia mutta jonka ytimen toimintaperiaate olisi muuttunut täysin, Zen olisi ollut uusi arkkitehtuuri.

:facepalm:

BMI2 on uusi käskykantalaajennos, jota äärimmäisen harvat softat käyttää.

Eikä sinulla ole mitään tietoa siitä, kuinka nopa PEXT-käsky on excavatorilla.

Se vasta kummaa olisikin, jos joku uusi hyvin harvinaisen käyttötarkoitukseen tehty erikoiskäsky yleistyisi kahdessa vuodessa sillai että yhtäkkiä se olisi hirveä pullonkaula koko prosessorin nopeudelle.

Kaikkia uusia käskykantalaajennoksia käyttää harvat softat, normaalia. Yleensä kun suunnitellaan prosessoria uusiksi, niitä "turhiakin" uusia käskyjä nopeutetaan, elleivät ole vanhentuneita.

Ei ole tietoa mutta Ryzenissä on hidas.

Kyllä tuon käskyn hitaus shakkiohjelmissa on hirveä pullonkaula koko prosessorin nopeudelle.

Excavatoriin ei tehty mitään "huomattavia muutoksia steamrollerista", ja ne muutokset, mitä tehtiin, tehtiin pääosin ENNEN Zenin kehitystä.

Muutokset välillä Piledriver->Steamroller olivat paljon merkittävämpiä ja vaativat paljon enemmän tuotekehitystyötä.

Ja zen2 taas on suoraa jatkokehitelmää zenistä. Kaikki sellaiset ideat, mitä ei ole aikaa toteuttaa ajoissa zeniin siirrettiin sinne.

Toisekseen, Zenin kehityksen aikana tuotekehitysporukkaa siirrettiin GPU-puolella CPU-puolelle, että zen saatiin aikaiseksi sillä aikataululla kuin se nyt saatiin aikaiseksi. Tämän huomaa hyvin AMDn GPUiden viimeaikaisessa kehityksessä-

Tämä lienee myös oleellinen syy siihen, miksi Lisa Su:lla ja Raja Kodurilla meni sukset ristiin, raja koko että hän ei saa tarpeeksi resursseja kehittää tehokkaita näyttiksiä joita hän olisi halunnut kehittää. ja Vega myöhästyi selvästi ja oli alitehoinen.

Ei välttämättä. Excavatorin kehitys saatettiin aloittaa uudelleen samalla kun Zenin kehitys aloitettiin.

Zen2:sta ei tälläkään hetkellä tiedetä juuri muuta kuin "7 nm ja ehkä PCI Express 4.0", siinäpä se. Joten katsotaan mitä tulee.

Sitä suuremmalla syyllä, miksi tehdä Excavatoriin mitään panostusta joka ei hyödytä Zeniä? Tämä on se avainkysymys.

Resurssipulasta voi olla samaa mieltä.

... paitsi että se sama tiimi siinä välissä suunnitteli ainakin myös ivy bridgen, eikä projektit muutenkaan toimi siten, että projekti julistetaan valmiiksi ja loppuu kuin seinään ja samalla hetkellä kaikki siirtyvät seuraavaan projektiin.

Ivy Bidgen muutokset olivat enemmän valmistus ja näytönohjainpuolella. Ei se tietenkään ihan noin suoraviivaisesti menekään mutta jonkinlaista arviota voi tehdä.

Ensinnäkin, excavatorin arkkitehtuurisuunnittelu oli käytännössä jo melkein valmis kun zen-projekti alkoi, joten arkkitehtuurisuunnittelun osalta excavator ei ollut paljoa zenistä pois.

Piirisuunnittelun osalta taas, siinä vaiheessa kun excavatorin piirisuunnittelua tehtiin, zenin arkkitehtuurista ei ollut paljoa vielä niin lukossa, että sen piirisuunnittelu olisi voinut kunnolla edetä.

Ja kolmannekseen.. jos vaikka tiedetään, että "vuoden päästä tarvitaan paljon piirisuunnittelijoita seuraavalle, hyvälle arkkitehtuurille", niin paras tapa varmistaa niiden piirisuunnittelijoiden osaaminen silloin vuoden päästä on laittaa ne tekemään jotain oikeaa siksi vuodeksi. Se, että piirisuunnittelijat olisivat pyöritelleen peukaloitaan odotellessaan, koska pääsevät zeniä kehittämään olisi tarkoittanut selvästi bugisempaa ja mahdollisesti myös kellotaajuudeltaan hitaampaa zeniä.

Ja se kaikkein tärkein: AMD tarvi myytäviä uusia (Steamrolleria/kaveria/Godavaria parempia) tuotteita myös välille 2015-2016.

Piledriver-Steamrolleriin meni yhtä kauan kuin Steamroller-Excavatoriin huolimatta jälkimmäisen huomattavasti pienemmistä muutoksista. On täysin mahdollista että AMD heitti Excavatorin alkuperäiset suunnitelmat oskiin ja alkoi kehittää Excavatoria Zenin kanssa samaan aikaan.

Pätevä pointti mutta ei olisi ollut ensimmäinen kerta kun arkkitehtuuri heitetään roskiin. Bulldozer tuskin oli ensimmäinen CMT arkkitehtuuri jota AMD kehitti. Athlon64:n ja Bulldozerin välissä oli vain pikkuviritelty K10. Johonkin siellä AMD:lla hassattiin vuosia.

Aika kumma juttu jos AMD tarvitsi Carrizon kaltaista tuotetta siinä missä työpöytä ja serveripuoli saivat olla miten olivat. Serveripuolelle ei paljoa laittamista ollut mutta katteet siellä ovat ihan eri tasoa.

Excavator ei ollut turha. Se vaan ei pärjännyt intelin piirejä vastaan kovin hyvin, mihin oli syynä sekä
1) bulldozer-kuona (läpikirjoittava L1D, pitkät viiveet monilla käskyillä, liian hidas viive L2-kakussa, liian pieni määrä kokonaislukuliukuhihnoja, ...
2) huono valmistustekniikka
3) intelin liian kova suoriutuminen noihin aikoihin
4) sen matalan tason piirisuunnittelussa optimoitiin vähemmän kellotaajuutta, enemmän tiheyttä ja pienen kellotaajuuden sähkönkulutusta. Päätös tästä tehtiin todennäköisesti myöhemmin kuin aivan arkkitehtuurisuunnittelun alkuvaiheessa.

Aivan ja Excavatorin kanssa oli silti selvää jo suunnittelun alkuvaiheessa ettei siitä ole haastamaan edes Intelin 2010 vuoden prosessoreita pl. monisäikeiset ohjelmat. Juuri siksi ei käy järkeen karsia porukkaa joka paikasta jotta saadaan Carrizo markkinoille ellei siitä ollut jotain hyötyä.

Pääasialliset pointtisi ovat pintapuolisia virheellisiä oletuksia excavatorin ja zenin mikroarkkitehtuureista.

Olen jo selittänyt hyvin selvästi nämä pointtisi vääriksi, mutta silti jaksat jankuttaa niiden pohjalta tekemiäsi virhepäätelmiä.

Olen esittänyt aika monta pointtia siitä miten huonosti AMD:n resurssipulaan sopii kehittää Excavatoria edes osittain samaan aikaan ja erillään Zenistä kun Zen pitäisi saada nopeasti valmiiksi. Zen valmistui todella nopeasti ollakseen täysin puhtaalta pöydältä kehitetty. Koska Excavatorista vedettiin pitkälti copypastella prosessorin ulkoiset osat Ryzeniin (joista varsinkin piirisarjassa oli vanhentunutta kamaa jo tullessaan), miksi arkkitehtuuripuolella ei voitu tehdä samaa?

On erittäin hyvä kysymys miksi AMD resurssipulainen AMD ei olisi säästänyt aikaa kopioimalla Excavatorista (tai epätodennäköisemmin kehittämällä samaan aikaan Zenin kanssa) kun edellinen "tehoprosessori" tuli 2012?

Arkkitehtuuriltaan Zen muistuttaa itse asiassa kissasarjan ytimiä paljon enemmän kuin Bulldozer-sarjaa. Kun ensimmäiset tiedot zenin arkkitehtuurista tuli, luulin sitä kissa-sarjan jatkokehitelmäksi, mutta sitten myöhemmin kun arkkitehtuurista tuli tarkempia tietoja, kävi ilmi, että se on oikeasti puhtaalta pöydältä tehty, eikä vain paljon lihotettu(tai lihastettu) kissa.

Luonnollisesti Zen muistuttaa enemmän kissaa kuin kaivinkonetta, ei siihen tarvita muuta kuin "normaali" rakenne eikä moduuleja CMT:lla.

Onhan tämä taas vänkäystä. Voisi jo ennustaa seuraavaa: Kerran Zen oli jeesusteipillä kasattattu ja pikkufiksattu excavator ja zen2 on se oikeasti uusi arkkitehtuuri, joten jos pikkufikseillä ja tekemällä aito 8/8 - 8/4 prosun sijaan saatiin 40% ipc nousu, niin zen2 räjäyttää pankin ja keulii kauas Intelin ohi.

Sitten kun zen2 tuo sen 3-15% IPC parannuksen, niin alkaa tarina siitä, miten zen2 oli osoitus siitä, että AMD siirtyikin TICK/TOCK malliin ja Zen3 on se kokonaan uusi arkkitehtuuri, jossa ei ole enää mitään excavator palikoita.

Se oli 52%. Alunperin AMD tavoitteli 40%:a. Muuten ennustit asian ihan oikein, noin siinä tulee käymään.
 

... eli siis, haarautumisennustusalgoritmit pidettiin täysin samoina, mutta puskurin kokoa vain suurennettiin puolitoista kertaa suuremmaksi.

Zenissä tuli täysin eri toimintaperiaatteella toimiva haarautumisenennustus (perceptroni, hypetettiin neuroverkkona, vaikka yhdestä kerroksesta ei kovin suurta verkkoa saa)


Ei vaan määrittelet uudet arkkitehtuurit aika monella eri tavalla.


Tällä logiikalla: Jos Zenistä olisi tehty prosessori joka näyttäisi hyvin selvästi maanrakennuskoneelta liukuhihnan pituuden jne takia mutta jonka ytimen toimintaperiaate olisi muuttunut täysin, Zen olisi ollut uusi arkkitehtuuri.

niin olisi.

Mutta ei tullut. Molemmat ovat PRF ja rakenne on liukuhihnojen osalta täysin erilainen.



Yrität tuijottaa ulkoisia seikkoja, kun et ymmärrä, mitä siellä on sisällä.

Arkkitehtuuri on vanhan jatkokehitelmää, jos se kehitetään muokkaamalla vanhaa. Jos toimintaperiaate on täysin erilainen, ei sitä VOI olla kehitetty vanhan pohjalta.

Arkkitehtuuri on puhtaalta pöydältä tehty uusi, jos sen kehittäminen aloitetaan tyhjästä, ja vanhasta korkeintaan otetaan pieniä yksittäisiä paloja, ja katsotaan vähän mallia.

Kaikkia uusia käskykantalaajennoksia käyttää harvat softat, normaalia. Yleensä kun suunnitellaan prosessoria uusiksi, niitä "turhiakin" uusia käskyjä nopeutetaan, elleivät ole vanhentuneita.

Ei. Kun tehdään puhtaalta pöydältä, niihin tehdään jonkinlainen toteutus. Se voi olla nopeampi tai hitaampi kuin jossain eri prosessorissa.

Esimerkiksi P4ssa ja bulldozerissa oli todella paljon käskyjä, jotka ajautuviat hitaammin kuin edeltäjässään.

Kun tehdään vanhasta parannettu malli, joko pidetään ennallaan(ei katsota tarpeelliseksi nopeuttaa) tai päätetään, että tätä tarvii nopeuttaa, ja nopeutetaan.

Kyllä tuon käskyn hitaus shakkiohjelmissa on hirveä pullonkaula koko prosessorin nopeudelle.

Shakkiohjelmien nopeus on EVVK. Ei mitään väliä millekän, tarviiko tietokoneen miettiä siirtoaan 100 vai 110 millisekuntia että se pieksee ihmisen, joka miettii siirtoaan minuutin.

Ei välttämättä. Excavatorin kehitys saatettiin aloittaa uudelleen samalla kun Zenin kehitys aloitettiin.

:facepalm:

Voitko vielä typerämpiä skenaarioita keksiä?

Mikään fakta ei tue näitä täysin naurettavia fantasioitasi.

Zen2:sta ei tälläkään hetkellä tiedetä juuri muuta kuin "7 nm ja ehkä PCI Express 4.0", siinäpä se. Joten katsotaan mitä tulee.

PCI express 4.0lla ei ole mitään tekemistä ytimen kanssa. Se on täysin "uncore"-puolta.


Ivy Bidgen muutokset olivat enemmän valmistus ja näytönohjainpuolella. Ei se tietenkään ihan noin suoraviivaisesti menekään mutta jonkinlaista arviota voi tehdä.

Pääosin kyllä, mutta tuli siinä myös esimerkiksi rekisteristä-rekisteihin kopioiden suoritus frontendissä, 0-viiveellä. Tämä on selvä mikroarkkitehtuurillinen parannus itse CPU-ytimeen.

Lisäksi siihen tuli uusi satunnaislukugeneraattorikäsky, fp16(half)-konversiokäskyt ja tavukopiointikäskyjen looppausta (rep) stosb/movsb nopeutettiin selvästi. Lisäksi tuli jotain uutta virtualisointi-tietoturvajuttua.

Kaikki näistä on ytimessä olevia asioita.

Piledriver-Steamrolleriin meni yhtä kauan kuin Steamroller-Excavatoriin huolimatta jälkimmäisen huomattavasti pienemmistä muutoksista. On täysin mahdollista että AMD heitti Excavatorin alkuperäiset suunnitelmat oskiin ja alkoi kehittää Excavatoria Zenin kanssa samaan aikaan.

:facepalm:

Aivan naurettavia skenaarioita jälleen. Ja väitteesi "yhtä kauan" ei pidä paikkaansa.

Piledriver (Trinity) julkaistiin toukokuussa 2012. Steamroller (Kaveri) tammikuussa 2014, eli 20 kuukautta myöhemmin. Excavator (Carrizo) julkaistiin kesäkuussa 2015, 16 kuukautta myöhemmin.

Kaverin julkaisusta Excavatorin julkaisuun meni siis 4 kuukautta, tai 20% vähemmän aikaa kuin Piledriverin julkaisusta Kaverin julkaisuun.

Pätevä pointti mutta ei olisi ollut ensimmäinen kerta kun arkkitehtuuri heitetään roskiin. Bulldozer tuskin oli ensimmäinen CMT arkkitehtuuri jota AMD kehitti. Athlon64:n ja Bulldozerin välissä oli vain pikkuviritelty K10. Johonkin siellä AMD:lla hassattiin vuosia.

Niin, silloin menee hukkaan VUOSI tai VUOSIA eikä puolta vuotta joka paljastuukin miinus neljäksi kuukaudeksi :facepalm:


K8n jälkeen AMD kehitti K9ä, jonka piti olla hyvin järeä ja iso prosessori. Siitä, perustuiko tämä CMThen vai ei ei ole varmaa tietoa, Ainaot tiedot mitä tähän liittyen on Andy Glewin kommentit joista voi tulkita tilannetta kummin päin tahansa:

Andy glew@comp.arch sanoi:
I brought MCMT back to Intel in 2000, and to AMD in 2002.

I was beginning to despair of MCMT ever seeing the light of day. I
thought that when I left AMD in 2004, the MCMT ideas may have left with
me. Apparently not. I must admit that I am surprised to see that the
concept endured so many years - 5+ years after I left, 7+ years to
market. Apparently they didn't have any better ideas.


K9n kuoppaamisen jälkeen AMD tarvitsi nopeasti hiukan K8a paremman ytimen, ja K8n pohjalta kehitettiin K10.

Toinen AMDn kuopattu ydin on Zenin ARM-sisarydin K12.

Kolmas AMDn kuopattu arkkiethtuuri on alkuperäinen K5n seuraaja 1990-luvulla. Tosin tämä ei ollut kokonaan uusi arkkitehtuuri vaan K5n jatkokehitelmä.
AMD ostikin nexgenin ja nexgenin keskeneräinen nx6x86 vaihdettiin käyttämään Pentiumin kanssa samaa väyllää ja julkaistiin K6na, ja AMDn oma vanha K5n jatkokehitelmä haudattiin.


Aika kumma juttu jos AMD tarvitsi Carrizon kaltaista tuotetta siinä missä työpöytä ja serveripuoli saivat olla miten olivat. Serveripuolelle ei paljoa laittamista ollut mutta katteet siellä ovat ihan eri tasoa.

Käytännössä kukaan ei osta huonoa serveriprossua, vaikka se olisi kuinka halpa. Palvelimen pitäää tarjota hyvää suorituskykyä ja hyvää energiatehokkuutta. Lisäksi AMDn markkinointi oli mokannut serverimarkkinansa ydinmäärä-markkinoinnillaan;

Monet palvelinsoftat lisensoidaan sen mukaan, montako ydintä prosessorilla on. AMDn tapa markkinoida yhtä clusteria kahtena ytimenä tarkoitti, että AMDn prossujen käyttäjien piti maksaa paljon kalliimpaa lisenssimaksua monista palvelinsoftistaan. Ei oikein houkuttanut ostamaan näitä.

Että ei, prossu joka ei ole kilpailukykyinen ei tarjoa kovia katteita. Se tarjoaa vain nollatulojaja tappiota.


Sen sijaan gigantit on väärällään 500 euron kuluttajakuraläppäreitä, joihin kelpaa huonokin prossu, kunhan se vain on halpa. Ja näitä ostetaan paljon. Carrizo oli oikein kelpo piiri tähän kategoriaan, ja tarjosi AMDlle tuloja.

Ja niin, Carrizoa tarvittiin tässä senkin takia, että se oli selvästi pienempi ja halvempi piiri valmistaa kuin Kaveri, joten sitä pystyttiin myymään halvemmalla paremmalla katteella.

Aivan ja Excavatorin kanssa oli silti selvää jo suunnittelun alkuvaiheessa ettei siitä ole haastamaan edes Intelin 2010 vuoden prosessoreita pl. monisäikeiset ohjelmat. Juuri siksi ei käy järkeen karsia porukkaa joka paikasta jotta saadaan Carrizo markkinoille ellei siitä ollut jotain hyötyä.

Mistä ihmeen karsimisesta nyt oikein höpiset?

AMD teki vain valinnan, että loppuun kehitetään ja markkinoille tuodaan carrizo (tuote jolle on markkinoita) eikä sen serveri-/HEDT-malli (jolle ei olisi ollut markkinoita). Mitään muuta ei tämän johdosta karsittu.

Olen esittänyt aika monta pointtia siitä miten huonosti AMD:n resurssipulaan sopii kehittää Excavatoria edes osittain samaan aikaan ja erillään Zenistä kun Zen pitäisi saada nopeasti valmiiksi.

Kaikki pointtisi perustuvat täysin vihreelliseen käsitykseen näiden aikataukluista sekä siitä, miten mikropiirien kehitys toimii.

Ihan sama, kuinka monta pointtia esität, jos kaikki pointtisi on täysin puhdasta huuhaata.

Zen valmistui todella nopeasti ollakseen täysin puhtaalta pöydältä kehitetty. Koska Excavatorista vedettiin pitkälti copypastella prosessorin ulkoiset osat Ryzeniin (joista varsinkin piirisarjassa oli vanhentunutta kamaa jo tullessaan), miksi arkkitehtuuripuolella ei voitu tehdä samaa?

:facepalm:

Tämä kommentti osoittaa jälleen m lkoista ymmärtämättömyyttä siitä, mitä (mikro)arkkitehtuurilla tarkoitetaan.

Väännetäänpä rautalangasta esimerkki, että kehitetään vaikka kehittää uusi mikroarkkitehtuurin, jossa on neljä laskentayksikköä, mutta sitten otetaankin vaikka käyttöön vanha rekisterifile, jossa on lukuportit vain kahden laskentayksikön ruokkimiseen. Tällöin kahta niistä laskentayksiköistä ei voi käyttää, (paitsi äärimmäisen harvoin kun molemmat operandit tulee bypassina edelliseltä kellojaksolta.) . Tällöin käytännössä ne kaksi "uutta" laskentayksikköä on täysin turhat.

Mikroarkkitehtuuri muodostaa kokonaisuuden. Se kokonaisuus implementoi jonkun käskykannan. Ei sieltä voi ottaa palasia sieltä, palasia täältä, vaan se koko käskykanta täytyy implementoida, eikä sinne piirille voi jättää mitään "ilmassa roukkuvia johtoja".

Toki joitain hyvin erillisiä osia voidaan lainata, mutta sitten aletaan yleensä mennä joku ytimen ulkopuolelle tai matalan tason toteutukseen jossa ei enää ole kyse (mikro)arkkitehtuurista vaan ihan piirisuunnittelusta.

On erittäin hyvä kysymys miksi AMD resurssipulainen AMD ei olisi säästänyt aikaa kopioimalla Excavatorista (tai epätodennäköisemmin kehittämällä samaan aikaan Zenin kanssa) kun edellinen "tehoprosessori" tuli 2012?

Arkkitehtuurin palasia ei voi kovin järkevästi yleisesti kopioida, koska kaiken pitää sopia yhteen.
 
Excavator nimenä esiintyi silloin. Nyt jo esiintyy nimi Zen4 ja Zen5, jotka tulevat joskus 2020+.

Jos Excavatorin kehitys alkoi 2011, 4 vuoden kehitysaika käy järkeen mutta Zen 4,5 vuodessa on todella nopeaa. On myös mahdollista ettei Excavatorin ensimmäistä versiota lopulta käytetty.

Ei ole.

Sitähän ei tiedä milloin julkaistun Excavatorin suunnittelu aloitettiin. Resurssien kannalta voisi käydä järkeen myös suunnitella samaan aikaan kuin Zen.

:facepalm:

Nyt tulee jälleen niin ristiriitaista fantasisointia että hohhoijaa.

Perustelet zenbin resurssipulaa sillä, että se muka kehitettiin samaan aikaan excagvatorin koansssa ja sitten alat väittämään että excavato kehitettii myöhemmin kuin se kehittettiin jotta saataisiin jotain synergiaetuja sen kehittämisestä yhtä aikaa zenin kanssa

:facepalm:

Samalla cachen koko tuplattiin. Mitä muita suuria muutoksia Carrizoon tehtiin? Ei juuri muuta.

Lisätiin tuki niille jo aiemmin mainitsemillesi BMI2-käskyille, sekä AVX2-käskyille.

Ja se BTBn koon puolitoistakertaistuminen minkä alempana jostain onnistuit kaivamaan.

Noiden uusien käskyjen tukeminen tarkoitti käytännössä selvästi suurempaa tuotekehitystyötä kuin välimuistin tai BTBn koon kasvattaminen.

Eiköhän tuolla cachella ollut aika suuri merkitys siinä IPC:n parantamisessa.

Kyllä, paitsi niillä softilla jotka käyttää esimerkiksi AVX2sta.

Se välimuistin koon kasvattaminen on samalla saattanut myös laskea piirin kellotaajuuta jonkin verran prosentteja, joten sen kokonaisvaikutusesta ei ole varmaa tietoa.

Bulldozerissa tiedettiin varmasti heti alussa pienen L1 cachen olevan ongelma koska L2 cache on hidas. Sen korjaamiseen meni 4 vuotta. Lisäksi L1 cachen koko vaikuttaa prosessorin rakenteeseen suurella skaalalla, ei se ole mikään ihan pikkujuttu historiankaan valossa.

Bulldozerissa oli hyvin kehittynyt ja aggressivinen prefetcheri, joka prefetchaili kamaa L1D-välimuistiin. Bulldozerin arkkitehdit luottivat siihen. Se vaan ei ollut tarpeeksi hyvä, maailma on täynnä softaa jonka muistiaccess-patternit ovat liian epäsäännöllisiä.

Lisäksi tämä aggressiivinen prefetcheri myös kulutti sähköä lataillessaan kamaa jatkuvasti L1D-kakkuun.

Resurssipulassa oleva AMD tekee Excavatoriin DDR4 muistiohjaimen, SATA ohjaimen, USB ohjaimen ja PCI Express ohjaimen. Miksi ja millä resursseilla? Vastaus: käytännössä samat liitännät löytyvät vielä 2018 Ryzenistä. Hyvä syy julkaista Carrizo.

Nämä ovat kaiikki ytimen ulkopuolisia osia. Näillä ei ole mitään tekemistä ytimen mikroarkkitehtuurin kanssa.

Miksi ei voi lepsuilla? AMD:lla oli selkeä visio kehittää Zeniä täysillä, ei siinä ole varaa tehdä mitään turhaa Excavatoriin.

Excavator kehitettiin pääosin aiemmin, kuten jo selitin.

Koko ajan jauhetaan kuinka AMD:lla ei ole varaa kehittää useaa arkkitehtuuria samaan aikaan. Miten tuo sovelletaan Excavatorin ja Zenin samanaikaiseen kehittämiseen?

Kuinka monta kertaa pitää selittää samat asiat?

Siten, että niistä ei kehitetty samaa vaihetta samaan aikaan. Ne eivät juuri kilpailleet samoista resursseista

Excavatorin arkkitehtuuri oli jo käytännössä valmis ennen kuin zenin arkkitehtuurisuunnittelu alkoi, ja siinä vaiheessa kun excavatorin piirisuunnittelua tehtiin, zenin arkkitehtuuri ei ollut vielä niin valmiissa tilassa, että sen piirisuunnittelua olisi voinut kunnolla aloittaa.

Annat ymmärtää L1 cachen kasvattamisen olevan joku sormia napsauttamalla tehtävä asia. Cachen koon muuttaminen voi ollakin helppoa mutta prosessorin rakenteeseen sen vaikutus on suuri. Jos Piledriveriin/Steamrolleriin saa helposti lisää IPC:ta kun tuosta vain naps kasvatetaan L1 cachea, miksi se tehtiin vasta Excavatoriin?

Selitin tämän jo aiemmassa viestissäni, juuri siinä, mitä quottasit.

hkultala sanoi:
Pikemminkin kysymys on, että miksei tätä tehty jo aiemmin? Varmaan, koska oletettiin kellotaajuuden kärsivän tästä enemmän, kuin mitä tästä saatiin IPC-hyötyjä. Excavatorissa tähdättiin enemmän energiatehokkuuteen kuin aiemmissa, joten tämä ehkä sen takia koettiin tässä vaiheessa järkeväksi muutokseksi.
Tai sitten tässä vaiheessa vihdoin tajuttiin, että arkkitehtuurissa on muualla pahempia kriittisiä polkuja, ja että tämä ei lopulta hidastakaan sitä kellotaajuutta.

threadripper sanoi:
Miksi Phenom II sarjassa on yhtä nopea L1 cache mutta suurempi? Täysin selvä heikkous joka jätetään vaikka voisi helposti korjata, OK.

Mitä nyt tarkoitat "yhtä nopealla" ? Phenomeissa oli kellojaksoissa mitattuna NOPEAMPI L1D kuin bulldozerissa. (3c vs 4c)

Ja Phenomissa assosiatiivisuus oli vain 2-way, siellä ei varmaan tarvittu way predictionia ollenkaan vaan molempia waytä accessoitiin rinnakkain ja kärsittiin siitä tuleva sähkönkulutus. (tällä säästettiin ehkä yksi kellojakso). Lisäksi Phenomit kävivät selvästi pienemmällä kellotaajuudella kuin bulldozer (tämä varmaan mahdollisti sen suuremman koon).

Toki phenomissa sitten tarvittiin logiikka niiden aiemmissa viestissäni mainitsemieni aliasointiongelmien hanskaamiseen.

Ja käytännössä 2-way on sen verran huono asosiatiivisuus että 8-way 32 kiB tyypillisesti tarjonnee paremman osumatarkkuuden kuin 2-way 64 kiB, hyvin moni koodi käsittelee kolmea eri taulukkoa (kaksi inputtia, yksi output) ja 2-way cache voi johtaa suureen määrään assoatiivisuuskonflikteja jos taulukoiden alkuosoite on alignoitu sopivasti. Joillain koodeilla jopa 16 kiB 4-way on selvästi nopeampi kuin 64 kiB 2-way.)

Erilainen rakenne tai ei, on aina helpompaa muokata olemassa olevaa kuin kehittää täysin uutta tyhjästä.

Ei ole. Se, että on olemassa joku referenssidesign josta vähän katsoa mallia auttaa aina, mutta vanhan liian suuri muokkaus johtaa todella roskaiseen tulokseen.

Joiden kellotaajuudet luokassa 2 GHz, eli turha verrata kovempiin kiviin.

Hienosti yrität siirrellä maalitolppiasi. Pidetäänpäs ne kuitenkin paikallaan.

Puhuit paskaa siitä ettei AMD ole tehnyt 8-way 32kiB cacheä ja osoitin tämän väiteesi vääräksi kertomalla kissasarjasta.
Siitä, millä kellotaajudella ne kisasasrjassa toimii ei tämän kannalta ole mitään merkitystä.

Historiaa taaksepäin katsomalla on helppo nähdä AMD:lla olleen hitaita, pienen kaistanleveyden, pienen assosiatiivisuuden tai kaikkien edellisten cacheja.

Pääpiirteiltään näin, tosin:

Amdn 486ssa oli kehittyneempi välimuisti (takaisinkirjoittava) kuin Intelin 486ssa (läpikirjoittava).

Ja L2-välimuisti on ollut ihan hyvällä assosiatiivisuudella Thunderbirdistä lähtien, mutta siinäkin se oli tosiaan selvästi hitaampi kuin copperminessä.

Zenin kohdalla AMD sanoi suoraan kehittävänsä nopean cache systeemin. Eli AMD:n kokemus nopeiden cachejen vaikutuksesta prosessoriarkkitehtuuriin, nopeita cacheja sisältävien prosessorien valmistuksesta jne oli pitkälti nollissa.

Ei se mitenkää nollissa ollut. Oli vaan vähän Inteliä jäljessä. Koko maailman mittapuulla hyvin lähellä kärkeä, varmuudella edellä vain Intel ja IBM, esim tyypillisen keskimääräisen Android-SoCn välimuistit oli paljon AMDtä jäljessä.

Yhdistelmä kiire, uusi asia, vähän kokemusta ja uusi valmistustekniikka ei välttämättä lupaa hyvää.

.. ja melko hyvin onnistuttiin. L2een vaan jäi jotain pieniä epämääräisyyksiä, joiden takia sitä piti ekoissa piiriversiossa hidastaa.

Bulldozerin kellotaajuus kärsi tiettävästi L2 cachesta joka rajoitti kellotaajuutta. Sitä ei taidettu koskaan korjata kunnolla.

Näin ilmeisesti.
 
Viimeksi muokattu:
AMD kertoi osavuosikatsauksessaan 7 nanometrin prosessin tuoreimmat kuulumiset - io-tech.fi tossa jotakin Amd stä Tilanne parantunut viimeaikoina myynnit kasvaneet osittain kaiketi jopa huomattavasti. AMD piti tällä viikolla viimeisimmän osavuosikatsauksensa varsin positiivisissa merkeissä. Yhtiön liikevaihto kasvoi yli 50 % vuoden takaiseen nähden ja esimerkiksi kannettaviin suunnattujen Ryzen-prosessoreiden myynti yli kaksinkertaistui. Hyvin sujuvien myyntien myötä yhtiö myös kasvatti panostustaan tuotekehitykseen 25 prosentilla keskittyen etenkin ohjelmistopuolen kehitystyöhön. Liikevaihto kasvanut 50 prosnettia tuntuis että aika paljon vuodessa nousua

5 Nanometrin prosessiakin kehitellään jo Amd n leirissä
yhtiö uskoo 7 nanometrin olevan erittäin merkittävä valmistusprosessi markkinoiden kannalta ja sen kantavan pitkään paranneltujen valmistusprosessien (esimerkiksi ”7 nanometer plus” ja niin edelleen) myötä. Huolimatta 7 nanometrin odotetusta pitkäikäisyydestä, AMD on saanut puolijohdevalmistajilta jo ensimmäiset kuulumiset 5 nanometrin valmistusprosessistakin. Lisa Sun mukaan prosessi vaikuttaa 7 nanometrin tapaan erittäin kilpailukykyiseltä ja yhtiön tulevan käyttämään lähitulevaisuudessa kulloinkin parasta saatavilla olevaa valmistusprosessia mahdollisuuksiensa mukaan.
 
... eli siis, haarautumisennustusalgoritmit pidettiin täysin samoina, mutta puskurin kokoa vain suurennettiin puolitoista kertaa suuremmaksi.

Zenissä tuli täysin eri toimintaperiaatteella toimiva haarautumisenennustus (perceptroni, hypetettiin neuroverkkona, vaikka yhdestä kerroksesta ei kovin suurta verkkoa saa)

Ei ole paljon mutta eipä paljon muutakaan tullut.

niin olisi.

Mutta ei tullut. Molemmat ovat PRF ja rakenne on liukuhihnojen osalta täysin erilainen.

Yrität tuijottaa ulkoisia seikkoja, kun et ymmärrä, mitä siellä on sisällä.

Arkkitehtuuri on vanhan jatkokehitelmää, jos se kehitetään muokkaamalla vanhaa. Jos toimintaperiaate on täysin erilainen, ei sitä VOI olla kehitetty vanhan pohjalta.

Arkkitehtuuri on puhtaalta pöydältä tehty uusi, jos sen kehittäminen aloitetaan tyhjästä, ja vanhasta korkeintaan otetaan pieniä yksittäisiä paloja, ja katsotaan vähän mallia.

Tuo on yksi näkökulma asiaan. Siinä on se huono puoli ettei uusi arkkitehtuuri välttämättä anna mitään suorituskykyparannuksia. Nykyiset prosessorit ovat sen verran monimutkaisia ettei niistä ole helppo tutkia piiritasolla mitä on tehty. Siksi tapauksissa joissa suorituskyky on edeltäjään nähden käytännössä sama ollaan pitkälti valmistajan sanomisten varassa arkkitehtuurin suhteen. Jos taas suorituskyky on ihan erilainen, on varmasti tehty suuria muutoksia.

Ei. Kun tehdään puhtaalta pöydältä, niihin tehdään jonkinlainen toteutus. Se voi olla nopeampi tai hitaampi kuin jossain eri prosessorissa.

Esimerkiksi P4ssa ja bulldozerissa oli todella paljon käskyjä, jotka ajautuviat hitaammin kuin edeltäjässään.

Kun tehdään vanhasta parannettu malli, joko pidetään ennallaan(ei katsota tarpeelliseksi nopeuttaa) tai päätetään, että tätä tarvii nopeuttaa, ja nopeutetaan.

Kun tehdään puhtaalta pöydältä, yleensä hidastetaan (tai tiputetaan kokonaan pois) vanhimpia ja turhimpia käskyjä (3D-NOW! pois, MMX hitaammaksi jne). Uudempien käskyjen kohdalla yleensä nopeutetaan (mikäli helposti onnistuu) koska on vaikea tietää keksitäänkö käskylle jotain hyödyllistä käyttöä.

Tässä tapauksessa AMD päätti pitää käskyn monta kertaa hitaampana kuin Intel, se on mielenkiintoinen ratkaisu.

Shakkiohjelmien nopeus on EVVK. Ei mitään väliä millekän, tarviiko tietokoneen miettiä siirtoaan 100 vai 110 millisekuntia että se pieksee ihmisen, joka miettii siirtoaan minuutin.

Shakkiohjelmissa tarvitaan tehoa mm. aseman analysointiin. Mikä olisi paras siirto asemassa, kun siirettiin näin oliko kyseessä hyvä vai huono siirto ja kumpi on asemassa johdossa jne.

:facepalm:

Voitko vielä typerämpiä skenaarioita keksiä?

Mikään fakta ei tue näitä täysin naurettavia fantasioitasi.

Mikä fakta tukee sinun teorioitasi?

PCI express 4.0lla ei ole mitään tekemistä ytimen kanssa. Se on täysin "uncore"-puolta.

Ei olekaan mutta mitä muuta on kerrottu? 7nm ja hirveä määrä spekulaatiota ytimien määrästä. Tuokin perustuu olettamukseen, jonka mukaan Vega 20 tukee ja siten myös Epyc.

Pääosin kyllä, mutta tuli siinä myös esimerkiksi rekisteristä-rekisteihin kopioiden suoritus frontendissä, 0-viiveellä. Tämä on selvä mikroarkkitehtuurillinen parannus itse CPU-ytimeen.

Lisäksi siihen tuli uusi satunnaislukugeneraattorikäsky, fp16(half)-konversiokäskyt ja tavukopiointikäskyjen looppausta (rep) stosb/movsb nopeutettiin selvästi. Lisäksi tuli jotain uutta virtualisointi-tietoturvajuttua.

Kaikki näistä on ytimessä olevia asioita.

Toki mutta Intelkin luokittelee sen Tick:n.

:facepalm:

Aivan naurettavia skenaarioita jälleen. Ja väitteesi "yhtä kauan" ei pidä paikkaansa.

Piledriver (Trinity) julkaistiin toukokuussa 2012. Steamroller (Kaveri) tammikuussa 2014, eli 20 kuukautta myöhemmin. Excavator (Carrizo) julkaistiin kesäkuussa 2015, 16 kuukautta myöhemmin.

Kaverin julkaisusta Excavatorin julkaisuun meni siis 4 kuukautta, tai 20% vähemmän aikaa kuin Piledriverin julkaisusta Kaverin julkaisuun.

4 kuukautta voi laittaa satunnaisten valmistusongelmien piikkiin. Pitkälti saman verran, ei puhuta mistään vuosista.

Niin, silloin menee hukkaan VUOSI tai VUOSIA eikä puolta vuotta joka paljastuukin miinus neljäksi kuukaudeksi :facepalm:

K8n jälkeen AMD kehitti K9ä, jonka piti olla hyvin järeä ja iso prosessori. Siitä, perustuiko tämä CMThen vai ei ei ole varmaa tietoa, Ainaot tiedot mitä tähän liittyen on Andy Glewin kommentit joista voi tulkita tilannetta kummin päin tahansa:

K9n kuoppaamisen jälkeen AMD tarvitsi nopeasti hiukan K8a paremman ytimen, ja K8n pohjalta kehitettiin K10.

Toinen AMDn kuopattu ydin on Zenin ARM-sisarydin K12.

Kolmas AMDn kuopattu arkkiethtuuri on alkuperäinen K5n seuraaja 1990-luvulla. Tosin tämä ei ollut kokonaan uusi arkkitehtuuri vaan K5n jatkokehitelmä.
AMD ostikin nexgenin ja nexgenin keskeneräinen nx6x86 vaihdettiin käyttämään Pentiumin kanssa samaa väyllää ja julkaistiin K6na, ja AMDn oma vanha K5n jatkokehitelmä haudattiin.

Joidenkin huhujen mukaan K9:n jälkeen tuli vielä yksi arkkitehtuuri joka ei ollut K10. Mutta ymmärrettävästi näistä ei pidetä hirveästi meteliä.

Käytännössä kukaan ei osta huonoa serveriprossua, vaikka se olisi kuinka halpa. Palvelimen pitäää tarjota hyvää suorituskykyä ja hyvää energiatehokkuutta. Lisäksi AMDn markkinointi oli mokannut serverimarkkinansa ydinmäärä-markkinoinnillaan;

Monet palvelinsoftat lisensoidaan sen mukaan, montako ydintä prosessorilla on. AMDn tapa markkinoida yhtä clusteria kahtena ytimenä tarkoitti, että AMDn prossujen käyttäjien piti maksaa paljon kalliimpaa lisenssimaksua monista palvelinsoftistaan. Ei oikein houkuttanut ostamaan näitä.

Että ei, prossu joka ei ole kilpailukykyinen ei tarjoa kovia katteita. Se tarjoaa vain nollatulojaja tappiota.

Sen sijaan gigantit on väärällään 500 euron kuluttajakuraläppäreitä, joihin kelpaa huonokin prossu, kunhan se vain on halpa. Ja näitä ostetaan paljon. Carrizo oli oikein kelpo piiri tähän kategoriaan, ja tarjosi AMDlle tuloja.

Ja niin, Carrizoa tarvittiin tässä senkin takia, että se oli selvästi pienempi ja halvempi piiri valmistaa kuin Kaveri, joten sitä pystyttiin myymään halvemmalla paremmalla katteella.

Tiedän tuon serveripuolen ongelman. Silti siellä olisi voinut saada edes vähän markkinaosuutta (vaikka puhuttaisiin prosentin osista) panostamalla ja samalla pitää nimeä pinnalla.

Niihin halpisläppäreihin kelpasi paremmin kissaytimillä varustetut ruput. Carrizo oli vähän liian kallis.

Mistä ihmeen karsimisesta nyt oikein höpiset?

AMD teki vain valinnan, että loppuun kehitetään ja markkinoille tuodaan carrizo (tuote jolle on markkinoita) eikä sen serveri-/HEDT-malli (jolle ei olisi ollut markkinoita). Mitään muuta ei tämän johdosta karsittu.

Carrizollekin oli markkinoita niin vähän ettei sen hinnalla olisi esim. näytönohjaimista kannattanut tinkiä. Tai ehkä tilanne oli niin paha että pienikin tulo kelpasi.

Kaikki pointtisi perustuvat täysin vihreelliseen käsitykseen näiden aikataukluista sekä siitä, miten mikropiirien kehitys toimii.

Ihan sama, kuinka monta pointtia esität, jos kaikki pointtisi on täysin puhdasta huuhaata.

Mitäs jos eivät olekaan? Vieläkään ei Zen2:sta tiedetä yhtään mitään ja mitäs jos siellä on oikeasti laitettu vähän kaikkea uusiksi? Sen näkee sitten.

:facepalm:

Tämä kommentti osoittaa jälleen m lkoista ymmärtämättömyyttä siitä, mitä (mikro)arkkitehtuurilla tarkoitetaan.

Väännetäänpä rautalangasta esimerkki, että kehitetään vaikka kehittää uusi mikroarkkitehtuurin, jossa on neljä laskentayksikköä, mutta sitten otetaankin vaikka käyttöön vanha rekisterifile, jossa on lukuportit vain kahden laskentayksikön ruokkimiseen. Tällöin kahta niistä laskentayksiköistä ei voi käyttää, (paitsi äärimmäisen harvoin kun molemmat operandit tulee bypassina edelliseltä kellojaksolta.) . Tällöin käytännössä ne kaksi "uutta" laskentayksikköä on täysin turhat.

Mikroarkkitehtuuri muodostaa kokonaisuuden. Se kokonaisuus implementoi jonkun käskykannan. Ei sieltä voi ottaa palasia sieltä, palasia täältä, vaan se koko käskykanta täytyy implementoida, eikä sinne piirille voi jättää mitään "ilmassa roukkuvia johtoja".

Toki joitain hyvin erillisiä osia voidaan lainata, mutta sitten aletaan yleensä mennä joku ytimen ulkopuolelle tai matalan tason toteutukseen jossa ei enää ole kyse (mikro)arkkitehtuurista vaan ihan piirisuunnittelusta.

Suunnitellaan uusi rekisterifile ja käytetään sitä vanhaa laskentayksikköä tai mieluummin siihen päälle muokataan myös laskentayksikköä sopivammaksi.

Lainaamalla ja muokkaamalla säästää aikaa verrattuna täysin tyhjästä luotuun. Ja Zenin kanssa oli kiire, isolla K:lla.

Arkkitehtuurin palasia ei voi kovin järkevästi yleisesti kopioida, koska kaiken pitää sopia yhteen.

Kopioida ja muokata kylläkin.

Aikatauluanalyysiä lopussa.


AMD on ennenkin jättänyt käyttämättä suurempia arkkitehtuureita. Komodo ja K12 jäi kokonaan julkaisematta.

:facepalm:

Nyt tulee jälleen niin ristiriitaista fantasisointia että hohhoijaa.

Perustelet zenbin resurssipulaa sillä, että se muka kehitettiin samaan aikaan excagvatorin koansssa ja sitten alat väittämään että excavato kehitettii myöhemmin kuin se kehittettiin jotta saataisiin jotain synergiaetuja sen kehittämisestä yhtä aikaa zenin kanssa

:facepalm:

Ne olivat kaksi eri vaihtoehtoa. Molemmissa tapauksissa resursseja säästyy. Parempia tapoja säästää resursseja?

Lisätiin tuki niille jo aiemmin mainitsemillesi BMI2-käskyille, sekä AVX2-käskyille.

Ja se BTBn koon puolitoistakertaistuminen minkä alempana jostain onnistuit kaivamaan.

Noiden uusien käskyjen tukeminen tarkoitti käytännössä selvästi suurempaa tuotekehitystyötä kuin välimuistin tai BTBn koon kasvattaminen.

Sitä suuremmalla syyllä miksi lisätä käskykantatuki Excavatoriin ja sen jälkeen tehdä täysin tyhjästä Zen johon lisätään käskykantatuki kyseisille käskyille?

Kyllä, paitsi niillä softilla jotka käyttää esimerkiksi AVX2sta.

Se välimuistin koon kasvattaminen on samalla saattanut myös laskea piirin kellotaajuuta jonkin verran prosentteja, joten sen kokonaisvaikutusesta ei ole varmaa tietoa.

En usko että AVX:a ylipäätään otettiin huomioon AMD:n mainitsemassa IPC parannuksessa.

Kellotaajuudet näyttivät nousevan tai pysyneet samana.

Nämä ovat kaiikki ytimen ulkopuolisia osia. Näillä ei ole mitään tekemistä ytimen mikroarkkitehtuurin kanssa.

Niin ovat mutta ne ovat silti samat. Sitä kutsutaan resurssipulaksi. Ytimen ulkopuoliset osat vuoden 2018 prosessorissa samat kuin 2015 prosessorissa.

Excavator kehitettiin pääosin aiemmin, kuten jo selitin.

Vaikka olisi kehitetty pääosin aiemmin, ei silti kokonaan.

Kuinka monta kertaa pitää selittää samat asiat?

Siten, että niistä ei kehitetty samaa vaihetta samaan aikaan. Ne eivät juuri kilpailleet samoista resursseista

Excavatorin arkkitehtuuri oli jo käytännössä valmis ennen kuin zenin arkkitehtuurisuunnittelu alkoi, ja siinä vaiheessa kun excavatorin piirisuunnittelua tehtiin, zenin arkkitehtuuri ei ollut vielä niin valmiissa tilassa, että sen piirisuunnittelua olisi voinut kunnolla aloittaa.

Vaikka tuo pitäisi paikkaansa, ei tarkoita etteikö Excavatorista olisi voitu silti karsia Zenin eduksi. Tai vaihtoehtoisesti hylätä Excavator ja kehittää Zenin kanssa. Molemmat ovat mahdollisia skenaarioita.

Mitä nyt tarkoitat "yhtä nopealla" ? Phenomeissa oli kellojaksoissa mitattuna NOPEAMPI L1D kuin bulldozerissa. (3c vs 4c)

Ja Phenomissa assosiatiivisuus oli vain 2-way, siellä ei varmaan tarvittu way predictionia ollenkaan vaan molempia waytä accessoitiin rinnakkain ja kärsittiin siitä tuleva sähkönkulutus. (tällä säästettiin ehkä yksi kellojakso). Lisäksi Phenomit kävivät selvästi pienemmällä kellotaajuudella kuin bulldozer (tämä varmaan mahdollisti sen suuremman koon).

Toki phenomissa sitten tarvittiin logiikka niiden aiemmissa viestissäni mainitsemieni aliasointiongelmien hanskaamiseen.

Ja käytännössä 2-way on sen verran huono asosiatiivisuus että 8-way 32 kiB tyypillisesti tarjonnee paremman osumatarkkuuden kuin 2-way 64 kiB, hyvin moni koodi käsittelee kolmea eri taulukkoa (kaksi inputtia, yksi output) ja 2-way cache voi johtaa suureen määrään assoatiivisuuskonflikteja jos taulukoiden alkuosoite on alignoitu sopivasti. Joillain koodeilla jopa 16 kiB 4-way on selvästi nopeampi kuin 64 kiB 2-way.)

Lähde oli väärässä, 3 ja 4 ne olivatkin eikä 3 ja 3.

Ei ole. Se, että on olemassa joku referenssidesign josta vähän katsoa mallia auttaa aina, mutta vanhan liian suuri muokkaus johtaa todella roskaiseen tulokseen.

Roskainenkin tulos voi olla riittävä kun lähtökohta on tarpeeksi huono.

Hienosti yrität siirrellä maalitolppiasi. Pidetäänpäs ne kuitenkin paikallaan.

Puhuit paskaa siitä ettei AMD ole tehnyt 8-way 32kiB cacheä ja osoitin tämän väiteesi vääräksi kertomalla kissasarjasta.
Siitä, millä kellotaajudella ne kisasasrjassa toimii ei tämän kannalta ole mitään merkitystä.

En edes jaksanut katsoa kissaytimiä. Sillä voi olla merkitystä koska Bulldozerin L2 cachen kellotaajuusrajoitus tuskin olisi ollut ongelma 2 GHz:n kelloilla, 4 GHz:n kelloilla se oli paha asia. Ehkä
valmistustekninen ongelma mutta kuitenkin.

Tähän aikataulupuoleen liittyen tässä teoriaa. Jim Keller, tunnettu arkkitehtuurisuunnittelija joka suunnittelee prosessorin perusarkkitehtuurin ja kun se on valmis, lähtee uusiin hommiin jättäen toteutuksen muille.

Mihin hommaan Jim Keller palkattiin AMD:lla? Jos Kellerin tehtävänä oli suunnitella puhtaalta pöydältä uusi arkkitehtuuri ja Zen on puhtaalta pöydältä suunniteltu uusi arkkitehtuuri, miksi Keller oli AMD:lla vielä kauan sen jälkeen kun Zenin arkkitehtuuri valmistui? K12 piti alunperin tulla ulos samoihin aikoihin kuin Zenin, joten Kelleriä ei AMD:lla pitänyt K12. Mikä siis? Zen2 on hyvä vastaus. Jos Zen oli se kokonaan uusi arkkitehtuuri, miksi Keller ei lähtenyt silloin? Hänen työnsä oli tehty ja Keller viimeksikin lähti AMD:lta siinä vaiheessa kun saa hommansa valmiiksi. Lisäksi: miksi AMD suunnittelisi kokonaan uuden arkkitehtuurin tyhjästä kun markkinoille tarvitaan nopeasti jotain? Kaavaan sopii: Zen2 on kokonaan uusi arkkitehtuuri, Zen ei. Mikäli Zen ei ole kokonaan tyhjästä luotu arkkitehtuuri, mistä se "ei tyhjästä" tuli Zeniin?

AMD myös alunperin lupaili Zeniä 2016 "back to schooliin" syksyksi, olisi tarkoittanut täysin tyhjästä tehdyn arkkitehtuurin saamista kauppoihin tasan 4 vuodessa suunnittelun aloittamisesta. Olisi voinut onnistuakin ellei valmistuksen kanssa olisi ollut ongelmia koska uusi prosessi. Zenin tape out oli 10/2015 eli realistinen arvio.

Aika suunnittelun aloituksesta valmiiksi tuotteeksi ("jos Zen olisi tehty tutulla prosessilla"):

Excavator: Aloitus 2011 "puoliväli"?, julkaisu 2015 kesäkuu = 4 vuotta
Skylake: aloitus "2011", julkaisu 2015 elokuu = 4 vuotta
Zen: aloitus 2012 elokuu, julkaisu 2016 elokuu = 4 vuotta

:confused::confused::confused:
 
Ikävä aina nuhdella, mutta minusta @Threadripper heittää ihan hyvää analyysiä ja puhuu ihan hyvin AMD:n valintojen ja tuotteiden puolesta, mutta sitten vastapuoli tai muut keskustelijat vastaavat lopulta vain haukkumalla takaisin, että jos tässä jotain alinta tasoa haetaan niin se ei todellakaan ole Threadripperillä, mutten ole väittänytkään että Threadripper olisi tasoltaan alhainen vaan minusta iso osa hänen viesteistään on ihan mielenkiintoisia. Tätä ketjua on näin ollen mukava seurailla.
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
258 764
Viestejä
4 495 533
Jäsenet
74 288
Uusin jäsen
Luopari

Hinta.fi

Back
Ylös Bottom