Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
hyvinhän tuo pärjää, kun suhteuttaa kivien hinnat toisiinsa :tup:
 
Mutta peli-fps merkittävästi huonompi kuin 9900K:lla? Sieluun vähän sattuu jos vieressä Intel-vlei pelaa ja striimaa samaa peliä +40% paremmalla FPS:llä :beye:

:sori:

Aika harvassa noista tapauksista nopeuserolla on oikeasti merkitystä. Esim. Dotassa kaikki prosessorit ovat liian hitaita, koska ei noin kevyessä pelissä 0.1% LOW voi olla alle 60 FPS.

Fortnitessa 9900K 10 MBps Fast tekee ainoan merkittävän eron Ryzeniin.

Huvittavaa ettei noinkaan kevyitä kasuaalipelejä pysty hyvällä laadulla streamaamaan edes Intelin 8-ytimisellä "superpeliprossulla" :rolleyes: Testaisivat jollakin kunnon pelillä.

Sitäpaitsi kuinka moni 9900K:n omistaja pelaa Fortnitea tai Dota kakkosta? Tuskin edes 0.1%.
 
Aika harvassa noista tapauksista nopeuserolla on oikeasti merkitystä. Esim. Dotassa kaikki prosessorit ovat liian hitaita, koska ei noin kevyessä pelissä 0.1% LOW voi olla alle 60 FPS.

Fortnitessa 9900K 10 MBps Fast tekee ainoan merkittävän eron Ryzeniin.

Huvittavaa ettei noinkaan kevyitä kasuaalipelejä pysty hyvällä laadulla streamaamaan edes Intelin 8-ytimisellä "superpeliprossulla" :rolleyes: Testaisivat jollakin kunnon pelillä.

Sitäpaitsi kuinka moni 9900K:n omistaja pelaa Fortnitea tai Dota kakkosta? Tuskin edes 0.1%.

Totta, ja täytyy muistaa että AMD:lla freimit on paljon sulavampia!
 
TSMC:n 16nm prosessilla on valmistettu Nvidian näytönohjainpiirejä ja saman perusarkkitehtuurin piirejä (GT 1030 ja jotain muita) on tehty myös Samsungin 14nm LPP prosessilla.

GPU ei ole CPU joten ei voida olettaa että kellottuvuus olisi verrattavissa.

14nm++ on 10nm myöhästymiselle seuraus, ei syy.

Se on sekä että. Mikäli se 10nm olisi saatu toimimaan ajallaan, niin ei olisi niin suuria suorituskyky paineita mitä nyt on ja jokainen 14nm viilaus hilaa sitä rimaa ylös.
 
AMD tarjoaa enemmän ytimiä samaan hintaan ja kun IPC ja kellot ovat tarpeeksi lähellä Intelin vastaavia, niin se tarkoittaa enemmän suorituskykyä samalla rahalla säikeistyvissä tehtävissä.

Ei, vaan jos intel on 25% edellä ydinkohtaisessa suorituskyvyssä niin AMD tarvii kymmenen ydintä intelin kahdeksaa vastaan, että pääsee tasoihin intelin kanssa monen säikeen suorituskyvyssä. Tai jos intel on 12.5% edellä, AMD tarvii yhdeksän ydintä intelin kahdeksaa vastaan.

Ja on paljon workloadeja, jotka eivät säikeisty erityisen hyvin.
 
Ei, vaan jos intel on 25% edellä ydinkohtaisessa suorituskyvyssä niin AMD tarvii kymmenen ydintä intelin kahdeksaa vastaan, että pääsee tasoihin intelin kanssa monen säikeen suorituskyvyssä. Tai jos intel on 12.5% edellä, AMD tarvii yhdeksän ydintä intelin kahdeksaa vastaan.

Ja on paljon workloadeja, jotka eivät säikeisty erityisen hyvin.

Yhtälössä kannattaa myös huomioida AMD:n parempi SMT suorituskyky. Eihän se nyt mikään järisyttävän suuri ole, mutta kaikki lasketaan.
 
Ei mutta kun mennään suurempiin ydinmääriin (esim. 32-core AMD vs 28-core Intel), ero kasvaa todella suureksi.

32-ytiminen EPYC/Threadripper 4*213mm = 852mm^2, intel Skylake-SP XCC ~700 mm^2.

Intelin 28 ydintä vie siis selvästi vähemmän pinta-alaa kuin AMDn 32 ydintä.

Kun laskee reunahävikin mukaan, 300mm^2 kiekolta saa n. 75 skylake-SP-XCCtä, ja n. 260 zeppeliniä eli n. 65 32-ytimistä EPYCiä/threadripperiä.

Eli AMDn tarvii zeppelinillensä n. 15% paremmat saannot että pääsee tasoihin intelin kanssa siinä, montako toimivaa piiriä samankokoiselta piikiekolta saadaan.

Käytännössähän AMD kyllä saa enemmän kuin 15% paremmat saannot, mutta kuinka paljon, on hyvä kysymys. Ei se ero kuitenkaan AMDn hyväksi mikään todella suuri ole, kun kuitenkin piireistä voidaan kuitenkin osa ytimistä kytkeä pois päältä, jos niiden kohdalle osuu valmistusvika, piiri on totaalisen pilalla vain jos valmsitusvika osuu vaikka johonkin muisti- tai IO-ohjaimeen tai väylälogiikkaan.


Intelin pienempään kokoon on kaksi selvää syytä:

1) Intelin "14nm" prosessi on todellisuudessa pienempi eli tiheämpi kuin Globalfoundriesin "14nm" prosessi
2) Zeppelin-piirillä paljon enemmän pinta-alaa haaskataan IO:hon A) jolla ne eri piilastut kommunikoivat keskenenään B) koska joka piilastulla on myös eteläsilta eli SATA- ja USB-ohjaimet jne. joita näissä monen piilastunkonfiguraatiossa ei joka piiriltä tarvisi, ainakaan niin suuressa määrin.

Jos AMDllä olisi monoliittinen 32-ytiminen piilastu, jossa olisi vain 8 CCXää samalla piilastulla, se olisi hiukan pienempi kuin intelin 28-ytiminen piilastu, muistaakseni AMD taisi joskus julkaista jonkun sliden jossa sellaisen kooksi sanottiin jotain 660mm^2 luokkaa.

Muistin väärin. AMDn slidessä sanottiinkin 777mm^2. Mutta ilmeisesti tässä oli laskettu sen mukaan, että siellä olisi kuitenkin sama määrä IOta ulospäin.


edit: korjattu nuo montako piilastua saa kiekolta, meni halkaisija ja säde sekaisin. Lisäksi laskettu uusiksi käyttäen tuota laskuria eikä omaa arviota reunojen hukasta. Laskuriin yritetty syöttää suurinpiirtein piirien oikeat mitat eikä sqrt(pinta-ala) mitoiksi.
 
Viimeksi muokattu:
Yhtälössä kannattaa myös huomioida AMD:n parempi SMT suorituskyky. Eihän se nyt mikään järisyttävän suuri ole, mutta kaikki lasketaan.

Käytin termiä "ydinkohtainen suorituskyky" enkä "säiekohtainen suorituskyky". Eli tuo on jo huomioitu.
 
Käytin termiä "ydinkohtainen suorituskyky" enkä "säiekohtainen suorituskyky". Eli tuo on jo huomioitu.

Niin ja sitten kuitenkin puhuit monen säikeen suorituskyvystä. Toki SMT off kaikilla coreilla ajettuna on myös monen säikeen suorituskykyä, mutta kyllä yleensä oletuksena on että se SMT on päällä.
 
Niin ja sitten kuitenkin puhuit monen säikeen suorituskyvystä. Toki SMT off kaikilla coreilla ajettuna on myös monen säikeen suorituskykyä, mutta kyllä yleensä oletuksena on että se SMT on päällä.

Pitääkö vääntää rautalangasta:

Yhden ytimen suorituskyky on yhdellä ytimellä saavutettava monen(zenillä ja intelin prossuilla kahden) säikeen suorituskyky. SMT on luonnollisesti tässä päällä.

Yhden säikeen suorituskyky on maksimaalinen suortituskyky, mikä saadaan yhdelle säikeelle. (käytännössä silloin, kun ytimellä ajetaan vain yhtä säiettä)

Kaikissa noissa laskelmissani puhuin näistä vain ensimmäisestä. Se SMTn vaikutus sisältyy siihen jo.
 
Viimeksi muokattu:
Pitääkö vääntää rautalangasta:

Yhden ytimen suorituskyky on yhdellä ytimellä saavutettava monen(zenillä ja intelin prossuilal kahden) säikeen suorituskyky. SMT on luonnollisesti tässä päällä.

Yhden säikeen suorituskyky on maksimaalinen suortituskyky, mikä saadaan yhdelle säikeelle. (käytännössä silloin, kun ytimellä ajetaan vain yhtä säiettä)

SMT off ero 25%, SMT on ero alle 25% koska AMD:llä parempi SMT suorituskyky.
 
SMT off ero 25%, SMT on ero alle 25% koska AMD:llä parempi SMT suorituskyky.

SMT OFF on täysin EVVK. Minä en ole koskaan tänään puhunut mistään "SMT off"-tilanteesta. Kun puhun ydinpohjaisesta suorituskyvystä prosessorilla jossa on SMT niin silloin kyse on tietysti tilanteesta jossa SMT on päällä. Tämän pitäisi olla itsestäänselvää.
 
SMT OFF on täysin EVVK. Minä en ole koskaan tänään puhunut mistään "SMT off"-tilanteesta. Kun puhun ydinpohjaisesta suorituskyvystä prosessorilla jossa on SMT niin silloin kyse on tietysti tilanteesta jossa SMT on päällä.

Se on yks ja sama onko se päällä vai ei kun se yhden ytimen suorituskyky yhdellä säikeellä on sama oli se päällä tai ei. Mutta monen säikeen kuormalla ero sitten näkyy. Ja koska ilmeisesti kokonaissuorityskykyä vänkytit että 25% ero niin se toteutuu ainoastaan SMT off tilanteessa kun ajetaan pelkillä coreilla. Mutta SMT on tilanteessa se ero kutistuu koska AMD:llä on edelleen parempi SMT.
 
Se on yks ja sama onko se päällä vai ei kun se yhden ytimen suorituskyky yhdellä säikeellä on sama oli se päällä tai ei.

Minä en edelleenkään ole puhunut mitään yhden säikeen suorituskyvystä joten jatkat vaan samaa typerää olkiukkoiluasi jossa höpötät yhden säikeen suorituskyvystä.

Mutta monen säikeen kuormalla ero sitten näkyy.

:facepalm:

SE OLETETTU 25% TARKOITTI NIMENOMAAN SITÄ MONEN (KAHDEN) SÄIKEEN SUORITUSKYKYÄ, KUN KÄYTETÄÄN VAIN YHTÄ YDINTÄ. KUINKA MONTA KERTAA TÄTÄ PITÄÄ VÄÄNTÄÄ RAUTALANGASTA????

Ja koska ilmeisesti kokonaissuorityskykyä vänkytit että 25% ero niin se toteutuu ainoastaan SMT off tilanteessa kun ajetaan pelkillä coreilla. Mutta SMT on tilanteessa se ero kutistuu koska AMD:llä on edelleen parempi SMT.

Mitä ihmettä nyt oikein horiset "pelkistä coreista".


Ja lauseessani oli "jos"-sana nimenomaan sen takia, että tuo oli esimerkki, että JOS se lukema toteutuu. Sen takia laitoin siihen toisen esimerkin pienemmillä luvuilla, että jos 25%ia ei saavuteta, 12.5% ainakin saavutetaan.



Ja sitä paitsi se "AMD hyötyy SMT"stä enemmän on myös täysin workload-kohtaista. AMDn SMT-implementaatiossa ei ole mitään fundamentaalsiesti erilaista joka tekee siitä paremman. Prosessorissa vaan tietyt yksikkömäärät ja puskurien koot jne. tekee sen, että kokonaislukuworkloadeilla hyöty on yleensä (muttei aina) suurempi kuin intelillä.
 
Viimeksi muokattu:
SE OLETETTU 25% TARKOITTI NIMENOMAAN SITÄ MONEN (KAHDEN) SÄIKEEN SUORITUSKYKYÄ, KUN KÄYTETÄÄN VAIN YHTÄ YDINTÄ. KUINKA MONTA KERTAA TÄTÄ PITÄÄ VÄÄNTÄÄ RAUTALANGASTA????

No pakottamallako sinä meinasit 2 säiettä ajaa yhdellä corella ja SMT:llä? Jos se kone ei käy 100% kuormalla niin kyllä sitä 2 säiettä käsittääkseni mieluummin ajetaan kahdella oikealla corella, ei corella ja SMT:llä.

Ja et puhunut yhtään mitään alkujaan kahdesta säikeestä, mutta koska menit sotkemaan ns. single core suorituskyvyn ja monen säikeen suorityskyvyn samaan soppaan niin olihan se luontevaa vetästä kani hatusta ja alkaa selitellä että tarkoitin kahden säikeen suorituskykyä. :)
 
No pakottamallako sinä meinasit 2 säiettä ajaa yhdellä corella ja SMT:llä? Jos se kone ei käy 100% kuormalla niin kyllä sitä 2 säiettä käsittääkseni mieluummin ajetaan kahdella oikealla corella, ei corella ja SMT:llä.

Ja et puhunut yhtään mitään alkujaan kahdesta säikeestä, mutta koska menit sotkemaan ns. single core suorituskyvyn ja monen säikeen suorityskyvyn samaan soppaan niin olihan se luontevaa vetästä kani hatusta ja alkaa selitellä että tarkoitin kahden säikeen suorituskykyä. :)

Sinä tässä ainoa joka on sotkenut asioita. Et meinaa millään ymmärtää eroa ydinkohtaisen ja säiekohtaisen suorituskyvyn välillä, ja sitten kun alan vääntämään näistä rautalankaa, alat vain ymmärtämään väärin rautalankaanikin ja keksimään siitä uusia olkiukkoja. (tämä "kaksi säiettä". Kaksi säiettä oli vaan esimerkki siitä että yksi ydin voi ajaa kohta säiettä, jolloin maksimaalinen suorituskyky saavutetaan yhdellä ytimellä (jo) kahdella säikkeellä)

Jos verrataan sitä, montako ydintä tarvitaan johonkin (monen säikeen) suorituskykyyn , niin silloin ydinkohtainen suorituskyky on se ainoa järkevä tapa laskea sitä. Tämänkin pitäisi olla itsestäänselvää, mutta joillekin näköjään ei.
 
32-ytiminen EPYC/Threadripper 4*213mm = 852mm^2, intel Skylake-SP XCC ~700 mm^2.

Intelin 28 ydintä vie siis selvästi vähemmän pinta-alaa kuin AMDn 32 ydintä.

Kun laskee reunahävikin mukaan, 300mm^2 kiekolta saa n. 370 skylake-SP-XCCtä, ja n. 1300 zeppeliniä eli n. 325 32-ytimistä EPYCiä/threadripperiä. (reunahävikki ei laskettu kovin tarkkaan)
Nämä numerot on kyllä pahasti pielessä. 300mm kiekossa on pinta-alaa 70686mm^2 ja 370 x 700mm^2 on 259000mm^2. Toiseksi jos kuuden tonnin waferistä saisi 370 lastua pihalle niin hintaa jäisi 16 taalaa per pala eikä noiden jättilastujen valmistus maksaisi juuri mitään.

https://caly-technologies.com/die-yield-calculator/
Tällä saa 700mm^2 lastuja 100% yieldillä noin 70.
210mm^2 lastuja saa noin 260. Jaettuna 4:llä tekee 65.

Todelliset yieldit menee arvailuksi mutta ei ne voi olla kovin hyviä jättilastuilla. Laskimeen voi lätkiä defect density arvoja sinnepäin vertailuksi.
 
Itse asiassa vertailukohta löytyy. TSMC:n 16nm prosessilla on valmistettu Nvidian näytönohjainpiirejä ja saman perusarkkitehtuurin piirejä (GT 1030 ja jotain muita) on tehty myös Samsungin 14nm LPP prosessilla. Samsungin 14nm LPP on tarkalleen sama mitä GF käyttää Ryzen ykkösissä. TSMC:n tekemät piirit kellottuvat vähän korkeammalle kuin Samsungin tekemät, joten TSMC:n prosessin voidaan sanoa venyvän kovemmille kelloille näytönohjainpiiressä.

Lähdettä näille?

Itselle tulee mieleen vain yksi ikivanha vertailu jossain verrattiin iphonejen piiriä(A9?) samsungin "14nm" LPE-prosessilla ja TSMCn kypsyneemmällä prosessilla, ja saatiin TSMClle pienempi virrankulutus tms. AMD ei kuitenkaan käytä tätä LPE-versiota prosessista prosessoreissaan.

On hyvin epätodennäköistä ettei tilanne olisi prosessoreissa vastaava.

Prosessoreita käytetään aivan erilaisilla jännitteillä ja kellotaajuuksilla kun GPUilta. Eri prosessien kellottuvuus ja sähkönkulutus skaalautuu hyvin eri tavalla jännitteen mukaan. Mobiilioptimoidut prosessit ovat optimoitu toimimaan hyvin pienillä jännitteillä pienillä kellotaajuuksilla, mutta jos niistä yritetään ottaa enemmän kelloa irti, pitää alkaa lisätä jännitettä rankemmin ja pian sekään ei riitä, suurempaa kelloa ei vaan millään saavuteta. CPU-optimoitu prosessi taas toimii hyvin suurehkoilla jännitteillä suurilla kelloilla, mutta vaikka sen kellotaajuutta pudotettaisiin, piiriä ei siltikään voi ajaa kovin pienillä jännitteillä ja se joka tapauksessa vuotaa paljon.

GPUissa mennään käyrällä sellaisessa kohdassa, että ollaan käytännössä rajoittuneita siihen, paljonko sähkön piiri kuluttaa ja lämpöä koko piiri tuottaa. Mitä energiatehokkaammalla prosessilla piiri valmistetaan, sitä ylemmäs voidaan kelloa nostaa ilman että lämmöntuotto ja sähkönkulutus karkaa pilviin.

CPUissa taas maksimikelloa rajoittava tekijä on paljon enemmän kriittiset polut sekä hyvin paikalliset kuumat kohdat piriin sisällä, mutta ei niinkään koko piirin kuumiaminen ja sähkönkulutus.

Mikäli näyttikset kellottuvat TSMCn "16nm" prosessilla korkeammalle kuin GFn/Samsungin "14nm" prosessilla, niin todennäköistä toki on, että myös prosessorit kellottuisivat TSMCn "16nm" prosessilla hiukan ylemmäs kuin GFn/Samsungin "14nm" prosessilla, mutta mitenkään äärimmäisen varmaa tämä ei ole.

Esimerkiksi Intelin "14nm++" prosessi tarjoaa CPUille selvästi paremmat kellot kuin GFn "14nm" prosessi, mutta todennäköisesti sillä ei saisi aikaiseksi kovin hyviä GPUita, koska virrankulutus GPU-luokan jännitteillä tai kellotaajuuksilla ei varmaan olisi yhtään sen pienempi kuin GFn prosessilla, todennäköisesti hiukan huonompi, jolloin virransyöttö- ja lämpörajoitteet helposti pakottaisivat ajamaan sitä pienemmällä kellolla.

14nm++ on 10nm myöhästymiselle seuraus, ei syy. Inteliltä loppuu kapasiteetti ja joutuvat myymään eioota joten 10nm kamalle olisi käyttöä aika monessakin käyttökohteessa mutta mitään toimivaa ei saada ulos.

Core i3-8121U on ollut jo jonkin aikaa myynnissä. Joten "mitään toimivaa ei saada ulos" on paskapuhetta.

"10nm"llä vaan saadaan ulos huonompia piirejä kuin "14nm++"lla. Tällöin se "14nm++"-prosessin hyvyys nimenomaan johtaa siihen, että "10nm" prosessia ei kopioida muihin tehtaisiin ennen kuin sillä saadaan tehtyä parempia piirejä ja/tai halvemmalla kuin "14nm++"lla.

Mikäänhän ei estä tekemästä 14nm prosessilla niitä 5 GHz piirejä ja laittamasta 10nm piirejä kannettaviin ym. Paitsi se ettei 10nm prosessilla saada mitään toimivaa.

Core i3-8121U toimii. Ja sitä valmistetaan kannettaviin.

Nyt kun 10nm myöhästyy pari vuotta lisää,

höpöhöpö. Se on jo myöhästynyt ne pari vuotta, mutta on jo pienessä mittakaavassa tuotannossa.
 
Nämä numerot on kyllä pahasti pielessä. 300mm kiekossa on pinta-alaa 70686mm^2 ja 370 x 700mm^2 on 259000mm^2. Toiseksi jos kuuden tonnin waferistä saisi 370 lastua pihalle niin hintaa jäisi 16 taalaa per pala eikä noiden jättilastujen valmistus maksaisi juuri mitään.

Die Per Wafer Calculator -
Tällä saa 700mm^2 lastuja 100% yieldillä noin 70.
210mm^2 lastuja saa noin 260. Jaettuna 4:llä tekee 65.

Todelliset yieldit menee arvailuksi mutta ei
ne voi olla kovin hyviä jättilastuilla. Laskimeen voi lätkiä defect density arvoja sinnepäin vertailuksi.


Joo, hups, meni säde ja halkaisija sekaisin, kiitos. Tämän siitä saa kun alkaa laskemaan asoita yhden jälkeen yöllä..

Editoinpa tuonne uudet tuolla laskurilla tehdyt luvut. Tuntuu menevän tuolle skylake-SP-XCClle n. 70 sijaan n. 75 kun laittaa tuo piirin oikean muodon eikä neliötä.
 
Viimeksi muokattu:
Nämä numerot on kyllä pahasti pielessä. 300mm kiekossa on pinta-alaa 70686mm^2 ja 370 x 700mm^2 on 259000mm^2. Toiseksi jos kuuden tonnin waferistä saisi 370 lastua pihalle niin hintaa jäisi 16 taalaa per pala eikä noiden jättilastujen valmistus maksaisi juuri mitään.

Suunnittelu ja prosessin kehityshän ne enimmät kulut tekee hommassa. Pii itsessään on melkein ilmaista
 
Sinä tässä ainoa joka on sotkenut asioita. Et meinaa millään ymmärtää eroa ydinkohtaisen ja säiekohtaisen suorituskyvyn välillä, ja sitten kun alan vääntämään näistä rautalankaa, alat vain ymmärtämään väärin rautalankaanikin ja keksimään siitä uusia olkiukkoja. (tämä "kaksi säiettä". Kaksi säiettä oli vaan esimerkki siitä että yksi ydin voi ajaa kohta säiettä, jolloin maksimaalinen suorituskyky saavutetaan yhdellä ytimellä (jo) kahdella säikkeellä)

Jos verrataan sitä, montako ydintä tarvitaan johonkin (monen säikeen) suorituskykyyn , niin silloin ydinkohtainen suorituskyky on se ainoa järkevä tapa laskea sitä. Tämänkin pitäisi olla itsestäänselvää, mutta joillekin näköjään ei.

Tiedän varsin hyvin mitä eroa on ydin ja säiekohtaisella suorituskyvyllä. Se että poltat päreet siitä kun esität asian huonosti ja aletaan kyselemään ei ole mitään olkiukkoilua.
Se yksi ydin voi ajaa vaikka 100 säiettä mutta suorituskyky on kyllä varsin heikko kun niitä säikeitä aletaan ajamaan paljon yhdellä ytimellä oletuksena että ne säikeet on aktiivisia kuormittaen maksimaalisesti.

Mutta jos nyt oletetaan että tarkoitit 25% yksi ydin ja SMT päällä molemmilla kun ajossa on 2 säiettä ja on pakotettu ne 2 säiettä käyttämään yhtä ydintä + SMT, niin silloin toki Intelillä se yhden pelkän ytimen suorituskyky ero yhdellä säikeellä on enemmän kuin 25%.
 
Core i3-8121U on ollut jo jonkin aikaa myynnissä. Joten "mitään toimivaa ei saada ulos" on paskapuhetta.

"10nm"llä vaan saadaan ulos huonompia piirejä kuin "14nm++"lla. Tällöin se "14nm++"-prosessin hyvyys nimenomaan johtaa siihen, että "10nm" prosessia ei kopioida muihin tehtaisiin ennen kuin sillä saadaan tehtyä parempia piirejä ja/tai halvemmalla kuin "14nm++"lla.

Core i3-8121U toimii. Ja sitä valmistetaan kannettaviin.
Tämä i3-8121U:n tapaus on kyllä outo. Intel ei listaa sille edes hintaa omilla sivuillaan:
Intel® Core™ i3-8121U Processor (4M Cache, up to 3.20 GHz) Product Specifications
Samoin vaikka se on kategorisoitu luokkaan "8th Generation Intel® Core™ i3 Processors", sen luokan listauksessa sitä ei näy:
8th Generation Intel® Core™ i3 Processors Product Specifications
Oma veikkaus, että ainoa syy siihen, miksi se on markkinoilla, on se, että joku pomo on saanut bonuksia kun on saatu edes jonkinlainen 10 nm tekele markkinoille, vaikka myymisessä ei olekaan suuremmin järkeä.
 
GPU ei ole CPU joten ei voida olettaa että kellottuvuus olisi verrattavissa.

Kyllä voidaan kuten hkultala tuossa myöhemmin kertoi.

Se on sekä että. Mikäli se 10nm olisi saatu toimimaan ajallaan, niin ei olisi niin suuria suorituskyky paineita mitä nyt on ja jokainen 14nm viilaus hilaa sitä rimaa ylös.

Tavallaan noinkin mutta nytkään ei ole niinkään suorituskykypaineita vaan paineita saada jotain ulos ettei tarvitse lisätä 14nm tuotantoa.

32-ytiminen EPYC/Threadripper 4*213mm = 852mm^2, intel Skylake-SP XCC ~700 mm^2.

Intelin 28 ydintä vie siis selvästi vähemmän pinta-alaa kuin AMDn 32 ydintä.

Kun laskee reunahävikin mukaan, 300mm^2 kiekolta saa n. 75 skylake-SP-XCCtä, ja n. 260 zeppeliniä eli n. 65 32-ytimistä EPYCiä/threadripperiä.

Eli AMDn tarvii zeppelinillensä n. 15% paremmat saannot että pääsee tasoihin intelin kanssa siinä, montako toimivaa piiriä samankokoiselta piikiekolta saadaan.

Käytännössähän AMD kyllä saa enemmän kuin 15% paremmat saannot, mutta kuinka paljon, on hyvä kysymys. Ei se ero kuitenkaan AMDn hyväksi mikään todella suuri ole, kun kuitenkin piireistä voidaan kuitenkin osa ytimistä kytkeä pois päältä, jos niiden kohdalle osuu valmistusvika, piiri on totaalisen pilalla vain jos valmsitusvika osuu vaikka johonkin muisti- tai IO-ohjaimeen tai väylälogiikkaan.

Kyllähän tuosta käytännössä tulee järkyttävä ero. Ensinnäkin Intelin 28-ytiminen prosessori ei ole enää 28-ytiminen jos siitä kytketään yksikin ydin pois päältä. Suuremmassa mittakaavassa:

Intel:

- Intel valmistaa XCC:n josta pitää toimia noin 2/3 osaa ytimistä, muuten menee roskiin. Tiettävästi Intel ei myy XCC:ta kovin pienillä ydinmäärillä.
- Kaikkien toimivien ytimien pitää olla "sopivasti toimivia" palvelinkäyttöön.
- Edellisen takia 28-ytimisen speksien pitää olla aika laveat jotta kaikki toimivat piirit sopivat niihin.

AMD:

- Valmistetaan vain yhtä 8-ytimistä mallia, valmistuneet sirut voidaan speksata toimivuuden JA kellottuvuuden mukaan erikseen.
- Huonosti kellottuvat (tai toimivat pienillä kelloilla pienellä lämmöntuotolla) Epycceihin, parhaiten kellottuvat Threadrippereihin, siitä väliltä Ryzeneihin.
- Kaikki 8 ydintä toimivat suuren ydinmäärän prosessoreihin (32-ydin Epyc, 32-ydin Threadripper, 8-ydin Ryzen jne), 6 ytimellä toimivat vähän pienemmän määrän prosessoreihin, 4 ytimellä toimivat Epycceihin (aiemmin Ryzeneihin myös), 2 ytimellä toimivat Epycceihin.
- Koska valikointia voi harrastaa, sirujen speksaukset voivat olla paljon tiukemmat kuin Intelillä.
- Hukkaa tulee todella vähän ja siruja on helppo valmistaa varastoon. Kokonaisuutena ero on huikea.

Ja vaikka pysyttäisiin vain 28-ytimisissä, AMD:lle riittää kun saa valmistettua 4 kappaletta 213 mm2 siruja joissa kaikissa toimii 8 ydintä. Intel tarvitsee valmistaa 700 mm2 siru jossa pitää toimia kaikki 28 ydintä. Löytyy varmasti monta mielipidettä siitä kuinka paljon saannot huononevat sirukoon kasvaessa, mutta lonkaltakin heitettynä ero on todella suuri AMD:n hyväksi myös speksauksen takia.

Lähdettä näille?

Itselle tulee mieleen vain yksi ikivanha vertailu jossain verrattiin iphonejen piiriä(A9?) samsungin "14nm" LPE-prosessilla ja TSMCn kypsyneemmällä prosessilla, ja saatiin TSMClle pienempi virrankulutus tms. AMD ei kuitenkaan käytä tätä LPE-versiota prosessista prosessoreissaan.

GeForce GT1030 ja jotain muita vastaavan luokan piirejä tehdään Samsungilla ja tiettävästi juuri 14nm LPP käytössä. GP107 ja GP108 ilmeisesti.

Juuri tuon takia en ottanut Applea mukaan.

Prosessoreita käytetään aivan erilaisilla jännitteillä ja kellotaajuuksilla kun GPUilta. Eri prosessien kellottuvuus ja sähkönkulutus skaalautuu hyvin eri tavalla jännitteen mukaan. Mobiilioptimoidut prosessit ovat optimoitu toimimaan hyvin pienillä jännitteillä pienillä kellotaajuuksilla, mutta jos niistä yritetään ottaa enemmän kelloa irti, pitää alkaa lisätä jännitettä rankemmin ja pian sekään ei riitä, suurempaa kelloa ei vaan millään saavuteta. CPU-optimoitu prosessi taas toimii hyvin suurehkoilla jännitteillä suurilla kelloilla, mutta vaikka sen kellotaajuutta pudotettaisiin, piiriä ei siltikään voi ajaa kovin pienillä jännitteillä ja se joka tapauksessa vuotaa paljon.

GPUissa mennään käyrällä sellaisessa kohdassa, että ollaan käytännössä rajoittuneita siihen, paljonko sähkön piiri kuluttaa ja lämpöä koko piiri tuottaa. Mitä energiatehokkaammalla prosessilla piiri valmistetaan, sitä ylemmäs voidaan kelloa nostaa ilman että lämmöntuotto ja sähkönkulutus karkaa pilviin.

CPUissa taas maksimikelloa rajoittava tekijä on paljon enemmän kriittiset polut sekä hyvin paikalliset kuumat kohdat piriin sisällä, mutta ei niinkään koko piirin kuumiaminen ja sähkönkulutus.

Mikäli näyttikset kellottuvat TSMCn "16nm" prosessilla korkeammalle kuin GFn/Samsungin "14nm" prosessilla, niin todennäköistä toki on, että myös prosessorit kellottuisivat TSMCn "16nm" prosessilla hiukan ylemmäs kuin GFn/Samsungin "14nm" prosessilla, mutta mitenkään äärimmäisen varmaa tämä ei ole.

Esimerkiksi Intelin "14nm++" prosessi tarjoaa CPUille selvästi paremmat kellot kuin GFn "14nm" prosessi, mutta todennäköisesti sillä ei saisi aikaiseksi kovin hyviä GPUita, koska virrankulutus GPU-luokan jännitteillä tai kellotaajuuksilla ei varmaan olisi yhtään sen pienempi kuin GFn prosessilla, todennäköisesti hiukan huonompi, jolloin virransyöttö- ja lämpörajoitteet helposti pakottaisivat ajamaan sitä pienemmällä kellolla.

Aivan. Entä jos kysymys muotoillaan seuraavasti: Kellottuisiko Intelin 14nm++:lla tehty GPU korkeammalle kuin TSMC 16nm prosessilla tehty? Jos pysytään vain kellottuvuudessa ja unohdetaan lämpörajoitteet sun muut. Voisin vahvasti veikata kellottuvan. Tulihan AMD:lla ongelmaa RX- ja Vega-sarjojen lämmöntuoton kanssa kun piti saada piirit kellottumaan ja/tai saannot koviksi mutta prosessi ei tarjonnut hyviä mahdollisuuksia kellottaa korkealle. Toimii se noinkin päin.

Core i3-8121U on ollut jo jonkin aikaa myynnissä. Joten "mitään toimivaa ei saada ulos" on paskapuhetta.

"10nm"llä vaan saadaan ulos huonompia piirejä kuin "14nm++"lla. Tällöin se "14nm++"-prosessin hyvyys nimenomaan johtaa siihen, että "10nm" prosessia ei kopioida muihin tehtaisiin ennen kuin sillä saadaan tehtyä parempia piirejä ja/tai halvemmalla kuin "14nm++"lla.

Halvemmalla sillä todennäköisesti saisikin tehtyä, jos toimisi kunnolla.

Core i3-8121U toimii. Ja sitä valmistetaan kannettaviin.

Saatavuus oli Q2/2018, en löytänyt mistään myynnistä kannettavaa jossa kyseinen prosessori olisi. Ehkei kirjaimellisesti päde tuo lausahdus "mitään toimivaa", hyvin lähellä käytäntöä se kuitenkin on.

höpöhöpö. Se on jo myöhästynyt ne pari vuotta, mutta on jo pienessä mittakaavassa tuotannossa.

Todella pienessä kun on yksi tuote jota ei saa mistään. NUC:n myös tungettu samaa piiriä ja sama homma: ei saa juuri mistään.

Mittakaava on siis marginaalisen pieni puhuttaessa prosessorin saatavuuden tasolla. Puhuttaessa valmistusprosessin tasolla, voidaan sanoa ettei mitään saatavuutta ole.

Tämä i3-8121U:n tapaus on kyllä outo. Intel ei listaa sille edes hintaa omilla sivuillaan:
Intel® Core™ i3-8121U Processor (4M Cache, up to 3.20 GHz) Product Specifications
Samoin vaikka se on kategorisoitu luokkaan "8th Generation Intel® Core™ i3 Processors", sen luokan listauksessa sitä ei näy:
8th Generation Intel® Core™ i3 Processors Product Specifications
Oma veikkaus, että ainoa syy siihen, miksi se on markkinoilla, on se, että joku pomo on saanut bonuksia kun on saatu edes jonkinlainen 10 nm tekele markkinoille, vaikka myymisessä ei olekaan suuremmin järkeä.

Aivan, Q2'18 launch datella tuotteita luulisi olevan reilusti myynnissä jo mutta ei ole käytännössä ollenkaan. Mikä tietenkin viittaa siihen ettei valmistusprosessi toimi edes vähää alusta. Riskituotannon riskituotannon riskituotanto tasolla korkeintaan.
 
Kyllä voidaan kuten hkultala tuossa myöhemmin kertoi.

Lähinnä kertoi että ei voida mitään varmaksi sanoa.

Kyllähän tuosta käytännössä tulee järkyttävä ero. Ensinnäkin Intelin 28-ytiminen prosessori ei ole enää 28-ytiminen jos siitä kytketään yksikin ydin pois päältä. Suuremmassa mittakaavassa:

Siis hkultala oli laskuissaan missannut kokonaan defect density arvon. Kun tuohon laskuriin mättää Intelin isoimman piirin arvoilla 21,6x32,3 ja defect density arvoksi 0,1 joka käsittääkseni on jo todella hyväksi viilatun prosessin arvo niin täysin toimivia piirejä saadaan 37 ja puutteellisia 35. Noista 35 voi osasta saada jotain pienemmän core määrän lastuja ja osa on kokonaan rikki.
Vastaavasti 9,8x21,7 samalla 0,1 arvolla antaa 211 täysin toimivaa zeppeliniä eli 52 epyc. Lisäksi 49 zeppeliniä josta osasta saa jotain tehtyä.
Eli yhdeltä pizzalta saa noin 40% enemmän epyciä pihalle joka on mielestäni varsin merkittävä määrä. Ja jos asiaa vielä pyörittelee siltä kantilta että AMD saa yhdestä pizzasta täysien epyc:n myötä 1664 corea maailmalle kun vastaava luku Intelillä on 1036 niin ero alkaa olla aika jäätävä AMD:n hyväksi.
 
Niin kauan kuin AMD:llä yhden ytimen suorituskyky on niin tuhnu kuin se on tällä hetkellä niin tuolla koolla ei ole mitään merkitystä. Varsinkin pelikäytössä yhden ytimen nopeus ratkaisee vielä tänäkin päivänä todella isosti niin ei ihme, että Intel dominoi ja AMD vikisee.
Palvelinpuolella se yhden ytimen suorituskyky on jo vielä pienemmässä osassa kuin pelipuolella. Suurinosa maailman palvelimista hankitaan periaatteella kuinka paljon saa tehoa yhteen räkkiin ja paljonko se tarttee sähköä ja paljonko se tuottaa lämpöä.
 
Palvelinpuolella se yhden ytimen suorituskyky on jo vielä pienemmässä osassa kuin pelipuolella. Suurinosa maailman palvelimista hankitaan periaatteella kuinka paljon saa tehoa yhteen räkkiin ja paljonko se tarttee sähköä ja paljonko se tuottaa lämpöä.

Voisin veikata että se paras teho per räkki suhde on AMD:llä. EPYC on energiatehokas ja eihän tuo palvelinprosessoriksi mikään järkyttävä kiuaskaan ole. :hungry:
 
Oracle AMD 3.jpg


Oracle puts AMD EPYC in the Cloud

Nyt sitten nähtiin tällainenkin käänne. Tuollainen pieni ja tuntematon palveluntarjoaja on sitä mieltä että AMD leiristä löytyy tuote jonka voi ottaa oman brandin alle.
 
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.


Serveripuolella taitaa intelille käydä vielä ohrasemmin kuin työpöydillä. 7nm Epyc jyrää kohta kovaa. :)
 
Mutta peli-fps merkittävästi huonompi kuin 9900K:lla? Sieluun vähän sattuu jos vieressä Intel-vlei pelaa ja striimaa samaa peliä +40% paremmalla FPS:llä :beye:

:sori:
8700k on tuossa vahvana jo hintansa puolesta eikä paljoa häviä 9900K:lle ja voittaa kirkkaasti Ryzen 2700X:n. Jos haluaa uudet ominaisuudet niin 9700k on edullisempi vaihtoehto kuin 9900K. Itse pysyisin yhä intelin parissa jos päivittäisin.

Hyötykäytössä harvalla on suurta hyötyä nopeudessa ellei puhuta palvelimista jolloin valitaan muu kuin kuluttajaprossu.
 
8700k on tuossa vahvana jo hintansa puolesta eikä paljoa häviä 9900K:lle ja voittaa kirkkaasti Ryzen 2700X:n. Jos haluaa uudet ominaisuudet niin 9700k on edullisempi vaihtoehto kuin 9900K. Itse pysyisin yhä intelin parissa jos päivittäisin.

Hyötykäytössä harvalla on suurta hyötyä nopeudessa ellei puhuta palvelimista jolloin valitaan muu kuin kuluttajaprossu.
Näin näkisin itsekin, jos pelikonetta tähän hätään puhtaalta pöydältä kasailee, niin 8700K tai 9700K on paras valinta. 9900K:ssa en näe oikeastaan mitään järkeä pelikoneeseen. 8xxx-sarjalaisten hinnat tosin tainneet jo hieman nousta ja tuskin laskevatkaan, häviävät vaan myynnistä sitä mukaa kun tavara loppuu varastoista.
 
Näin näkisin itsekin, jos pelikonetta tähän hätään puhtaalta pöydältä kasailee, niin 8700K tai 9700K on paras valinta. 9900K:ssa en näe oikeastaan mitään järkeä pelikoneeseen. 8xxx-sarjalaisten hinnat tosin tainneet jo hieman nousta ja tuskin laskevatkaan, häviävät vaan myynnistä sitä mukaa kun tavara loppuu varastoista.
Budjetilla kasatessa 8600k. Maksaa 249 eur gigantissa. Uskoisin että hinta/laatu on kovin tämän hetken prosessoreista.
 
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.


Serveripuolella taitaa intelille käydä vielä ohrasemmin kuin työpöydillä. 7nm Epyc jyrää kohta kovaa. :)

Ei Jim ihan hätäseen noita videoita tee. Jos pitää tulokset edes 90% kutinsa niin tulevat 2 vuotta intel tulee ottamaan pahasti takkiin jos eivät 10nm kehitystä saa valmiiksi. Amdllä on kyllä ihan tajuton tohina päällä.
 
Ei Jim ihan hätäseen noita videoita tee. Jos pitää tulokset edes 90% kutinsa niin tulevat 2 vuotta intel tulee ottamaan pahasti takkiin jos eivät 10nm kehitystä saa valmiiksi. Amdllä on kyllä ihan tajuton tohina päällä.

Juu kyllä se ihan valideja liikkejä saa kuten RTX osoitti. Itte en ensin tähän chiplet hommaan oikein uskonut perustin oman ajatusmallin sille että rome menee SP3 kantaan mutta nyt oli jossain huhuja että romen myötä tulisi myös uusi kanta jolloin tuo muuttuukin jo ihan mahdolliseksi skenaarioksi.

Mutta tää tarkottaa varmaan samalla sitä että työpöytä rojut tulee ihan uudella ytimellä, en oikein näe järkeä että työpöydälle aletaan julkaisemaan tuolla samalla systeemillä.
Ja tää ainakin itsellä on vähän sellainen epäilyksiä herättävä edelleen, että olisiko sittenkään totta.
 
Mutta tää tarkottaa varmaan samalla sitä että työpöytä rojut tulee ihan uudella ytimellä, en oikein näe järkeä että työpöydälle aletaan julkaisemaan tuolla samalla systeemillä.
Ja tää ainakin itsellä on vähän sellainen epäilyksiä herättävä edelleen, että olisiko sittenkään totta.
Zen 1 oli vain budjetin takia yksi paketti kaikkialle. Nyt budjetti antaa taas myöten useammallikin piirille niin en näe tässä ongelmaa. En tosin tiedä estääkö chiplet sen hyödyntämisen työpöytäprossuissakaan. IO yms voisi hyvin olla erillisellä piirillä, kuten noissa epyc tulee olemaan. Mielenkiintoiset ajat kyllä edessä.

Niin ja taitaa olla niin järkyttävä etumatka tällä arkkitehtuurilla että voi hyvin olla että vanha sanonta menee kiertoon. Eli se että "kukaan ei ole saanut potkuja ostettuaan inteliä". ;)
 
Viimeksi muokattu:
Zen 1 oli vain budjetin takia yksi paketti kaikkialle. Nyt budjetti antaa taas myöten useammallikin piirille niin en näe tässä ongelmaa. En tosin tiedä estääkö chiplet sen hyödyntämisen työpöytäprossuissakaan. IO yms voisi hyvin olla erillisellä piirillä, kuten noissa epyc tulee olemaan. Mielenkiintoiset ajat kyllä edessä.

Niin ja taitaa olla niin järkyttävä etumatka tällä arkkitehtuurilla että voi hyvin olla että vanha sanonta menee kiertoon. Eli se että "kukaan ei ole saanut potkuja ostettuaan inteliä". ;)

Itte en kyllä Inteliä heittäisi vielä täysin susille. Intelillä on kuitenkin olemassa jo EMIB jota voivat omassa MCM ratkaisussaan käyttää ja eiköhän sen kehitykseen ole panostettu heti EPYC:n julkaisun jälkeen lisää resursseja vaikka julkisesti toki kaikenmaailman liima meemejä viskoivatkin.
Tai jos ei ole kehitys ollut käynnissä jo pitkään niin sitten on kyllä Intelillä jäykkää touhua ja ihan ansaitusti tippuuvat joksikin aikaa pois kilpailusta.
 
Itte en kyllä Inteliä heittäisi vielä täysin susille. Intelillä on kuitenkin olemassa jo EMIB jota voivat omassa MCM ratkaisussaan käyttää ja eiköhän sen kehitykseen ole panostettu heti EPYC:n julkaisun jälkeen lisää resursseja vaikka julkisesti toki kaikenmaailman liima meemejä viskoivatkin.
Tai jos ei ole kehitys ollut käynnissä jo pitkään niin sitten on kyllä Intelillä jäykkää touhua ja ihan ansaitusti tippuuvat joksikin aikaa pois kilpailusta.
Joo siis aivan varmasti on kehitykseen lyöty maksimivauhti päälle. Ei tuollaista (toimivaa) arkkitehtuuria kuitenkaan ihan hetkessä kehitetä. 1-2 vuotta tästä hetkestä voi hyvin olla realistinen aika sille ensimmäiselle versiolle. Siinä kohtaa AMD on jo pitkään tehnyt piirejä ja kokemusta on karttunut.

Niin ja unohtamatta sitä että kauanko serveripuolen suunnanvaihdot kestää. Epyc julkaistiin jo vuosi sitten, mutta vasta pikkuhiljaa alkaa firmat siihen vaihtamaan. Intelin täysin uudella arkkitehtuurilla menee yhtä lailla ~vuosi julkaisusta että kukaan uskaltaa siihen kunnolla hypätä. Nykyiset xeonit perustuu kuitenkin ihan samaan arkkitehtuuriin kuin edeltävät x versiota. Niissä ei tarvitse niin isoja testauksia enää suorittaa. Uusi MCM ratkaisu olisikin sitten täysin eri asia. Siinä testaus aloitettaisiin taas nollasta.
 
Juu kyllä se ihan valideja liikkejä saa kuten RTX osoitti. Itte en ensin tähän chiplet hommaan oikein uskonut perustin oman ajatusmallin sille että rome menee SP3 kantaan mutta nyt oli jossain huhuja että romen myötä tulisi myös uusi kanta jolloin tuo muuttuukin jo ihan mahdolliseksi skenaarioksi.

Mutta tää tarkottaa varmaan samalla sitä että työpöytä rojut tulee ihan uudella ytimellä, en oikein näe järkeä että työpöydälle aletaan julkaisemaan tuolla samalla systeemillä.
Ja tää ainakin itsellä on vähän sellainen epäilyksiä herättävä edelleen, että olisiko sittenkään totta.
Ryzen olikin vain päänavaus. Nimikin sen kertoo. Olisi typerää jäädä taas telineisiin juuri kun pöytämyynnissä ollaan intelille aiheutettu palovamma.
 
No nyt se on varmaa. Zen 2 on chiplet jossa coret 7nm ja niille yhteinen 14nm IO Die. Uskottava se on ja jälleen todettava että Adoredtv osui täysin nappiin jo melkein puol vuotta sitten. Lisäksi 256-avx tulossa.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.
 
Sieltähän tuli melkoinen määrä muutoksia. Itse asiassa tuli niin suuri määrä isoja muutoksia etten ota ainakaan tässä vaiheessa takaisin ennustustani. Aiemminhan sanoin Zenin olleen tehty periaatteella "lainataan osia Excavatorista jotta saadaan nopeasti markkinoille jotain" ja Zen2:n olleen puhtaalta pöydältä suunniteltu.

Ainakin tuo chiplet rakenne on I/O:n puolesta pitkälti (pl Infinity Fabric) jotain ihan uutta eikä mikään Excavator with steroids kuten Zenissä. Ja nyt kun sieltä tuli melko odotetusti myös AVX yksiköiden remontti (Zenissä olivat lähes samat mitä Excavatorissa) niin aika nopeasti tekivät kaikki muutokset mikäli Zen piti tehdä kokonaan valmiiksi ensin.
 
Tosin se on todettava että ei näillä edelleenkään mennä Intelistä ohitte niin että hujahtaa. Intelillä edelleen AVX-512 etu ja vasta taas lisäsivät jotain tehoäly juttuja että tietyillä kuormilla Intelin etu säilyy.
 
Mutta pääasia, että todellisia uudistuksia pinnan alla tapahtuu, eikä vaan hieman korkeampia kelloja/parempaa IPC:tä (toki odotan näitäkin). Intel kaipaa prossupuolella melkein yhtä pahasti oikeaa kirittäjää, kuin nVidia näyttispuolella.
 
Tosin se on todettava että ei näillä edelleenkään mennä Intelistä ohitte niin että hujahtaa. Intelillä edelleen AVX-512 etu ja vasta taas lisäsivät jotain tehoäly juttuja että tietyillä kuormilla Intelin etu säilyy.
Veikkaan, että joillakin kuormilla nimenomaan mennään Intelista ohi että hujahtaa. Joillakin ei. Energiatehokkuudessa AMD on varmasti myös reilusti edellä kunnes Intel saa 10 nm prosessinsa toimimaan, eli serverimarkkinoilla aikaisintaan 2020.
 
Tosin se on todettava että ei näillä edelleenkään mennä Intelistä ohitte niin että hujahtaa. Intelillä edelleen AVX-512 etu ja vasta taas lisäsivät jotain tehoäly juttuja että tietyillä kuormilla Intelin etu säilyy.

Aika pieni tuo etu on. Tarvitaan erillinen ohjelmistotuki ja käytännössäkään hyödyt eivät kovin järisyttäviä ole. Tietenkin jollain synteettisellä testillä tulee huikeita lukemia, ihan esim. kuten testaamalla pelkkää muistikaistaa.

Ihan sama vaikka Intel olisi nopeampi 30% kuormista jos muilla 70%:lla AMD menee heittämällä ohi.

Veikkaan, että joillakin kuormilla nimenomaan mennään Intelista ohi että hujahtaa. Joillakin ei. Energiatehokkuudessa AMD on varmasti myös reilusti edellä kunnes Intel saa 10 nm prosessinsa toimimaan, eli serverimarkkinoilla aikaisintaan 2020.

Ennemminkin 2022 koska vasta silloin on tulossa kunnollista arkkitehtuuriparannusta.
 
Mutta pääasia, että todellisia uudistuksia pinnan alla tapahtuu, eikä vaan hieman korkeampia kelloja/parempaa IPC:tä (toki odotan näitäkin). Intel kaipaa prossupuolella melkein yhtä pahasti oikeaa kirittäjää, kuin nVidia näyttispuolella.

Juu uudistuksia tuli kyllä ja käytännössä koko Zen 2 meni kokonaan remonttiin ollen täysin erilainen toteutukseltaan kuin Zen. Mielenkiintoista nähdä millainen desktop toteutus tulee olemaan.

Toi video jonka linkkasin loppuu kesken että koko shöw ei siinä ole, mutta ainakaan tuossa ei vielä kerrottu Zen 2 coremääristä mitään. Ehkä kerrottiin myöhemmin jos asiaan vielä palattiin tai sitten ihan tarkoituksella pimittäävät tuota tietoa. Intelillä voidaan nyt hikoilla ;)

EDIT: Jaah olihan siellä vielä palattu Zen 2 ja esiteltiin 64-coren EPYC 2
1541532227330.JPEG
 
Viimeksi muokattu:
Varsin positiivisilta (ja välttämättömiltä) vaikuttaa Zen 2 uudistukset :tup:

Veikkaisin kuluttajamallien sisältävän yhden prosessori-chipletin ja kevennetyn version tosta IO-yksiköstä.
Toivottavasti muistiohjain on pistetty täysin uusiksi ja muistilatenssi sekä yhteensopivuus on kunnossa, sillä nykyinen muistiohjain on niin huono että se antaa koko alustalle huonon maineen.
 
Varsin positiivisilta (ja välttämättömiltä) vaikuttaa Zen 2 uudistukset :tup:

Veikkaisin kuluttajamallien sisältävän yhden prosessori-chipletin ja kevennetyn version tosta IO-yksiköstä.
Toivottavasti muistiohjain on pistetty täysin uusiksi ja muistilatenssi sekä yhteensopivuus on kunnossa, sillä nykyinen muistiohjain on niin huono että se antaa koko alustalle huonon maineen.

Juu olisi ollut kyllä pettymys jos ei AVX-256 olisi tullut. Kyllä toi AVX käyttö vaan lisääntyy jatkuvasti ja AMD:n on pakko siihen lähteä mukaan jos meinaa kestää pykälässä. Intelin osuus on niin suuri että kyllä sitä vielä Intelin tahdissa tanssia vedetään monta vuotta.
 
En tiedä menikö ihan nappiin kuvan suoraan oikaiseminen mutta tämä nyt oli pikainen rykäisy.
upload_2018-11-6_23-20-20.png

Yhtä pikaisesti rykäistyt mittaukset:
14nm I/O-die ~ 15.5mm x 28.2mm > 437mm^2
7nm chiplet ~ 7.55mm x 10.45mm > 78.9mm^2

Joku voinee tehdä sanity checkit. Omaan korvaan ainakin kuulostaa suurinpiirtein oikealta.

Edit: TR4:n (nominal) mitat siis on tämän mukaan 58.5mm x 75.4mm johon nuo ylläolevat perustuu.
Socket TR4 (sTR4) - Packages - AMD - WikiChip

Edit2: Ian Cuttressin Twitteristä löytyi korkeammalla resoluutiolla kuva. Tuosta kun mittaili niin chipletti on siellä ~80mm^2 luokassa ja I/O ~437-438mm^2. Yhteensä siis reipas tonni.
upload_2018-11-6_23-41-26.png
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
295 922
Viestejä
5 056 428
Jäsenet
81 005
Uusin jäsen
veikko123

Hinta.fi

Back
Ylös Bottom