Totta kai siinä on eroa. Täysin uusi arkkitehtuuri ei perustu vanhaan arkkitehtuuriin (kuin ehkä pieneltä osin).
Bulldozer-Piledriver on uusi arkkitehtuuri muttei täysin uusi arkkitehtuuri.
K10-Bulldozer on täysin uusi arkkitehtuuri kuten myös Excavator-Zen.
Mitä ihmettä oikein höpiset excavatorista?
Se on ihan selvää bulldozer-jatkumoa. Vähän säädetty steamrollerin välimuistien kokoja, ja FPUn liukuhihnojen organoisointia. Kaikki muu ytimen sisällä toimii ihan kuin steamrollerissa.
Sandy Bridgeen toinen mielipide. Sandy Bridge edustaa ennemminkin uutta arkkitehtuuritoteutusta kuin täysin uutta arkkitehtuuria. Sandy Bridgen suorituskykyprofiili* (tähän asiaan keksitty termi) on lähes 1:1 edeltäjän kanssa eikä se olekaan mikään ihme koska korkealla tasolla tarkasteltuna Sandy Bridgen arkkitehtuurissa on paljon samaa tai lähes samaa kuin edeltäjässään. Samankokoiset L1 ja L2 välimuistit, sama määrä suoritusyksiköitä ja niin edelleen. Kun taas verrataan AMD:n tuotoksia:
Välimuistien kokojen viilaaminen on asia, joka on todella helppo ja olematon muutos,
kun se tehdään tavalla että sinne vaan lisätään lisää samanlaisia teitä.
Sen sijaan se, että välimuistien
muita parametreja muutetaan on suuri muutos.
L1I-välimuistin assosiatiivisuus muuttui Nehalemin neljästä Sandy bridgen kahdeksaan.
Eli siis nehalemissa on 4 rinnakkaista 8 kiB tietä, sandy bridgessä taas 8 rinnakkaista 4 kiB tietä.
L1I-välimuisti oli siis sandy bridgessä oikeasti
täysin erilainen.
Ja: L1D-välimuistin lukuporttien määrä on tuplaantunut yhdestä kahteen. Tämä tarkoittaa että kyseinen välimuisti on täysin erilainen, vaikka sen koko ja assosiatiivisuus onkin samat.
Nehalemissa ei ollut myöskään ollenkaan looppipuskuria, joka Sandy Bridgessä on.
L2-välimuisti onkin käytännössä
ainoita osia joiden osalta Nehalem ja Sandy Bridge olivat hyvin samanlaisia, kun asiaa tarkastelee syvemmin eikä vain tuijottele pintapuolisia numeroita.
Väite samasta suoritusyksiköiden määrästäkään ei oikeastaan pitä paikkaansa - niissä oli sama määrä portteja suoritusyksiköihin, mutta itse laskentayksiköissä oli huomattavia eroja, esim. LEA-yksiköiden määrä tuplattiin. Ja koska ero PRF vs Tomasulo, niin kaikki siinä miten se data saatiin niille laskentayksiköille meni
täysin eri tavalla, joten ne portitkin on täysin erilaisia.
Ja latausyksiköidenkin määrä tosiaan tuplattiin yhdestä kahteen.
K6-K7: pelkästään FPU tekee suorituskykyprofiilista täysin erilaisen
Se FPU oli tosin niitä
pienimpiä eroja K6n ja K7n arkkitehtuurissa.
K10-Bulldozer: CMT, panostus kokonaislukuyksiköihin jne tarkoittaa Bulldozerin pärjäävän paremin monessa asiassa kuin edeltäjän (ja monessa taas ei)
CMTn ohella oleellisin muutos oli vaihto Tomasulo -> PRF.
Myös Bulldozerin liukuhihna oli selvästi pidempi, ja sillä tavoiteltiin selvästi suurempia kelloja, ja näiden takia siihen piti tehdä monta temppua, joita K7-johdannaisissa ei ollut. Esim. tämän takia L1D-kakun kirjoituspolitiikka oli läpikirjoittava. Ilmeisesti myös käskyt skeduloitiin niin aikaisessa vaiheessa, että ytimelle tarvittiin replay-logiikka kuten P4ssa.(ja tämä lisäsi virrankulutusta jonkin verran)
Zen: SMT selvästi nopempi FPU tekevät melkoisen eron edeltäjään
SMT on pikkujuttu lisätä sen jälkeen kun meillä on nykyaikainen PRF-periaatteella toimiva OoOE-ydin.
95% sen tarvitsemasta logiikasta löytyy raudalta jo sen takia että saadaan se PRF-OoOE toteutettua.
(Tomasulo-OoOE:hen pitäisi lisätä hiukan enemmän kamaa, duplikoida myös rekisterifilee)
Tarkoittaa: Jos eri AMD:n täysin uusista arkkitehtuureista tehdään suorituskykyprofiili* (käyttäen käskykantoja joita kaikki prosessorit tukevat), on naurettavan helppo (mm. Bulldozer vs mikä tahansa muu, K6 vs mikä tahansa muu) tai helppo (mm. Zen vs K7/K10) erottaa mikä arkkitehtuuri on kyseessä. Jos taas sama tehdään Nehalemista ja Sandy Bridgestä, erottaminen on todella vaikeaa.
Ei tarvi tuijottaa mitään "suorituskykyprofiileita" kun yksityiskohdat niiden ytimien arkkitehtuurista
on saatavilla julkisesti . Voidaan suoraan katsoa
millainen se arkkitehtuuri on Ja sisältä löytyy pääosin täysin erilainen rakenne.
(Lake-sarjasta sen sijaan Intel ei ole julkaissut yksityiskohtaisia tietoja, eikä ole varmuutta, paljonko Lake-sarja eroaa Well-sarjasta)
Sen takia en pidä Sandy Bridgeä täysin uutena arkkitehtuurina, sille pitäisi keksiä oma terminsä. Sen suunnitteluperiaate oli kärjistäen: tehkää prosessorin sisuskalut uusiksi mutta älkää koskeko mm. suoritusyksiköiden määrään mitenkään ja välimuisteihin vain hyvin vähän. Eli vielä kärjistetymmin: Suunnitelkaa täysin uusi arkkitehtuuri mutta kopioikaa vanhasta kaikkein olennaisimmat osat ja jos osaa muutatte, muuttakaa hyvin vähän.
Niin, "suunnitelkaa täysin uusi arkkitehtuuri mutta voitte ottaa mallia vanhasta niiltä osin kun pystyy/siitä on apua"
Ei tuossa väitteessä ole mitään epäloogista. Ainoa kiistakapula on se lasketaanko Sandy Bridge täysin uudeksi arkkitehtuuriksi vai ei. En laske sitä syistä jotka yllä on mainittu. Nehalemin ja Sandy Bridgen erot ovat todella arkkitehtuurin osalta todella pienet jos verrataan muihin edeltäjiin nähden täysin uusiin arkkitehtuureihin (P6-P4, K6-K7, K10-FX, FX-Zen) ja siksi en sitä laske täysin uudeksi arkkitehtuuriksi.
Nehalemin ja Sandy Bridgen erot näytää
pintapuolisesti pieniltä kun tuijottaa vain jotain yksinkertaistettuja lukuja, mutta kun tutkii asioita tarkemmin, sieltä löytyy paljon suurempia eroja "pellin alta".