Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Hyvähän se olisi jos Intel saisi vähän kilpailua taas pystyyn ettei AMD voi chillailla. Jollain tapaa voisi melkein sanoa että 9000-sarja oli turhan lepsu upgrade edellisestä kun ei ollut paineita
Zen 5 oli loistava palvelimiin. Sitä ei oltu suunniteltu pelaajille.
 
Kuin suoraan Intelin mainosmateriaalista. 285k ei kyllä ole kuluttajaprossujen mestari ja Intelin low power coret johtunevat ihan siitä, että Intel ei saa tehonkulutusta alas kelloja laskemalla kuten AMD. Muutenkin ihmettelen, että joku ehdottaa tehorajojen poistoa kun Intelin cpu:t tuntuvat hapertuvan vakionakin
Onpa hauska sattuma, jos viestini kuulosti joltain mainosmateriaalilta. :D En nimittäin muista muita Intelin mainoksia kuin Intel Inside Pentium-ajoilta. Muutenkin yritän aina vältellä ja kelata mainokset parhaani mukaan. Postilaatikossakin on yli 20 vuotta lukenut "Ei mainoksia".

Kunhan vaan kiinnitin huomiota siihen, että CB 2024 MC:een on näillä näkymin tulossa kaikkien aikojen suurin harppaus (viimeistään tehorajoja avaamalla) kuluttajaprossuissa.Yhdessä sukupolvessa voi tehorajat avaamalla tulla parhaassa tapauksessa jopa lähemmäs +100 %, jos emo tai jäähdytys ei ota vastaan.


Kirjoitin:
"Harvemmin tuollaista loikkaa CB MC:ssa on tapahtunut. Vai onko koskaan? Kuluttajaprossujen hallitsevaan mestariin (vakiona) nähden (285K) sekä P- että E-coret tuplattu ja kaupan päälle 4 LP-E -ydintä.".

Tuo hallitsevaan mestariin vakiona tarkoitti, että CB MC:ssa, minkä kirjoitin pariin kertaan kyseisessä kappaleessa. Sekä IO-Tech että Techpowerup ovat samaa mieltä, että 285K on vakiona nopein kuluttajakannan suoritin CB MC:ssa.




Tehorajojen poistosta kirjoittaessani olin vain objektiivinen. Jotkut oikeasti ajavat Cinebench-tuloksia väljemmin tehorajoin. Tällöin voi parhaassa tapauksessa toteutua se ennennäkemätön lähemmäs +100 % yhdessä sukupolvessa.

Tein tuollaisen havainnon, vaikka muuten olenkin energiansäästön kannalla, kuten autokeskusteluista (Auriksen ~3 000 km@3,78 l/100 km tai Miin viime syksyn yli 340 km yhdellä akullisella ja jäi vielä 20 km rangea) voi päätellä. Tietokoneessakin Ryzen 5900X-keskusyksikkö vie työpöydällä seinästä alle 40 W (12c/24t, erillis-GPU, 64 GB RAM, viisi Noctuaa, wifi, NVMe), mikä on keskimääräistä vähemmän. Kaksi uusinta näytönohjainta ovat pihejä, 1050 Ti (75 W) ja RX 6600 (132 W), vaikka pelaan lähes kaikkia pelejä (vanhoja) 2160p@60 fps. Virtalähdekin on vain 550 W 10 v takuulla, vaikka silloin 2020 muut ostivat 750:ä. En tule kotonani käyttämään yli 200 W näytönohjainta, joten siksi 550 W riittää.

Screenshot_2025-06-18-19-06-44-89_40deb401b9ffe8e1df2f1cc5ba480b12.jpg


Screenshot_2025-06-18-19-07-57-96_40deb401b9ffe8e1df2f1cc5ba480b12.jpg


Edit. Tarkennus, että lähes +100 % CB MC voi toteutua tehorajat avaamalla, jos emo/jäähdytys eivät ota vastaan.
 
Viimeksi muokattu:
Saa nähdä onko välimuistipuolella jotain kikkoja jotta AMDn X3D prossuille tulisi kilpailua :hmm:

Myös teoriassa voisi löytyä joku kourallinen pelejä jotka hyötyvät 16 P-ytimestä ilman kahden CCD aiheuttamia "ongelmia", mutta AMDlla taitaa tulla myös seuraavassa sukupolvessa 16 corea CCDlle, joten sekään ei pitkään ole intelin kilpailuetuna.
 
Kunhan vaan kiinnitin huomiota siihen, että CB 2024 MC:een on näillä näkymin tulossa kaikkien aikojen suurin harppaus (viimeistään tehorajoja avaamalla) kuluttajaprossuissa.Yhdessä sukupolvessa parhaassa tapauksessa jopa lähemmäs +100 %.

No ei tule tuplaantumaan vaikka core määrä tuplaantuu. Siellä kun tulee tehorajat vastaan ja kyky jäähdyttää loppupelissä. Jossain LN2 leikeissä joo voi olla mahdollista, mutta jos nyt otetaan 285K niin siellä on Prosessor Base Power 125W ja Max Turbo Power 250W jota vasten toi 285K jurnuttaa noi "jumalaiset" cinepeli tulokset.
Base Power tulee nousemaan hiukan eli 150W mutta toi jälkimmäinen tuskin tulee nousemaan tai jos noisee niin ei paljoa. Ei ainakaan minnekään 450W jonka se vaatisi että tehot saataisin lähes tuplattua.

Tai jos Intel onnistuu jonkun kanin vetämään hatusta että 250W turbo limitillä tuplaavat suorituskyvyn niin syön hatullisen suklaata.

Paljon suurempi todennäköisyys on että kilpailu jatkuu varsin tasaisena koska AMD:ltä tulee suurella todennäköisyydellä 32c64t tuolle vastineeksi.

Tuo hallitsevaan mestariin vakiona tarkoitti, että CB MC:ssa, minkä kirjoitin pariin kertaan kyseisessä kappaleessa. Sekä IO-Tech että Techpowerup ovat samaa mieltä, että 285K on vakiona nopein kuluttajakannan suoritin CB MC:ssa.

Se että jossain yhdessä asiassa on parempi ei kyllä mielestäni tee tuosta mitään hallitsevaa mestaria. Kyllä CPU puolella vaaditaan mestaruuteen vähän muutakin kuin voitto cinepelissä.
 
No ei tule tuplaantumaan vaikka core määrä tuplaantuu. Siellä kun tulee tehorajat vastaan ja kyky jäähdyttää loppupelissä. Jossain LN2 leikeissä joo voi olla mahdollista, mutta jos nyt otetaan 285K niin siellä on Prosessor Base Power 125W ja Max Turbo Power 250W jota vasten toi 285K jurnuttaa noi "jumalaiset" cinepeli tulokset.
Base Power tulee nousemaan hiukan eli 150W mutta toi jälkimmäinen tuskin tulee nousemaan tai jos noisee niin ei paljoa. Ei ainakaan minnekään 450W jonka se vaatisi että tehot saataisin lähes tuplattua.

Tai jos Intel onnistuu jonkun kanin vetämään hatusta että 250W turbo limitillä tuplaavat suorituskyvyn niin syön hatullisen suklaata.

Paljon suurempi todennäköisyys on että kilpailu jatkuu varsin tasaisena koska AMD:ltä tulee suurella todennäköisyydellä 32c64t tuolle vastineeksi.



Se että jossain yhdessä asiassa on parempi ei kyllä mielestäni tee tuosta mitään hallitsevaa mestaria. Kyllä CPU puolella vaaditaan mestaruuteen vähän muutakin kuin voitto cinepelissä.
Tuota edeltävässä viestissäni kirjoitin tarkemmin, että tehorajat avattuna voi tuplata, eli saada noin 5k pts. Vakiona veikkailin jäävän reilusti alle 4k pts (koska tehoraja kasvaa niin vähän suhteessa ydinmäärän kasvuun):
"Se tullee olemaan tehorajat avattuna tuplanopea Cinebench 2024 MC:ssa vs. 9950X/9950X3D/285K. Vakiona todennäköisesti jää reilusti alle 4 000 pts, mutta rajat auki voi saada noin 5k pts.".

Kirjoittelin myös emolevyn virransyötön ja prossun jäähdytyksen haasteista liittyen tuohon suorituskyvyn tuplaukseen tehorajat avaamalla:
"Jos jollain emolla saa nuo ruokittua ja vielä jäähdytettyäkin, niin kyllä on kovaa suorituskykyä luvassa.".

Jos olisit lukenut viimeistä lainaustasi seuraavan kappaleen: "Tehorajojen poistosta kirjoittaessani olin vain objektiivinen. Jotkut oikeasti ajavat Cinebench-tuloksia väljemmin tehorajoin. Tällöin voi parhaassa tapauksessa toteutua se ennennäkemätön lähemmäs +100 % yhdessä sukupolvessa.", olisi sinulle selvinnyt tuostakin viestistä, että lähemmäs +100 % voi toteutua, jos:
1. ajetaan väljemmin tehorajoin
2. Parhaassa tapauksessa (=emo tai jäähdytys eivät ota vastaan)


En ole nähnyt vastaavaa listausta AMD:n tulevista suorittimista, mutta jos tosiaan vihdoinkin tulee 32c/64t, niin CB-kilpailu jatkuisi tasaisena. Johan AMD on junnannut 16c/32t:ssä 3000-, 5000-, 7000- ja 9000-sarjan ajan.


Hieman muutettuna:
Se että jossain yhdessä seiväshypyssä on parempi ei kyllä mielestäni tee Duplantiksesta mitään hallitsevaa mestaria. Kyllä yleisurheilupuolella vaaditaan mestaruuteen vähän muutakin kuin voitto seipäässä.

Minun ei ollut tarkoitus sanoa, että 285K olisi mikään kymmenottelija, vaan juuri tuossa yhdessä lajissa (CB MC, josta kirjoitin koko kyseisen kappaleen ajan) hallitseva mestari, kun puhutaan vakiona toimivista kuluttajaprossuista.


Ehkä minun pitää jotenkin tarkentaa viestejäni, kun tuntuu tulevan vänkäystä sellaisesta mitä en ole tarkoittanut. Nyt muuten tajusin, että tämähän onkin väittelyketju. Sellainen ei nappaa, joten poistun muihin ketjuihin.
 
9800x3D mennä porskuttaa vaan. Saa nähdä saako intel pelisuorituskyvyssä enää AMD:tä kiinni. (En usko että saa)
 
9800x3D mennä porskuttaa vaan. Saa nähdä saako intel pelisuorituskyvyssä enää AMD:tä kiinni. (En usko että saa)

Pelisuorituskyky on todella paljon kiinni muistiviiveistä (lähinnä L3-välimuistin koko sekä DRAMin viive).

Intelilla L3-välimuisti on jaettu kaikkien ytimien välillä mutta sen määrä kasvaa silti ytimien määrän mukaan, jokainen P-ydin tai neljän E-ytimen rypäle tuo yhden viipaleen verran L3-kakkua lisää.

Arrow Lakessa jokaisen viipaleen koko on 3 megaa L3-kakkua, ja näitä viipaleita on maksimissaan 8+(16/4) = 12 kpl, eli L3-kakkua on maksimissaan 36 megaa.

Seuraavaan sukupolveen huhutaan 16+32+4 ydintä (tosin nuo LP-E-ytimet ilmeisesti ovat normaalin L3-kakkuhierarkian ulkopuolella koska niiden idea on toimia vaikka normaali CPU-piilastu olisi kokonana power gatettu alas), eli L3-viipaleita olisi 16+(32/4) = 24 kpl

Mikäli L3-viipaleen koko pysyy samana, L3:n koko kasvaa 72 megaan. Tämä olisi jo aika lähellä AMDn vcache-mallien 96 megaa.

Tosin on myös mahdollista(ja ehkä jopa todennäköistä), että zen6-sukupolvessa AMD kasvattaa L3-välimuistinsa kokoa.

L3n kasvattamisessa ongelmallista on se, että uusilla valmistustekniikoilla välimuistin koko skaalautuu huonosti, ja SRAM josta välimuisti on tehty muuttuu vaan kalliimmaksi (koska piipinta-alan hinta kasvaa enemmän kuin SRAM pienenee)

Käytännössä isot välimuistit pitäisi valmistaa jollain vanhemmalla valmistustekniikalla että ne saataisiin tehtyä edullisesti. Mutta se taas väistämättä tekee niistä hitaampia ja enemmän virtaa kuluttavia (ei niinkään sen vanhan valmistustekniikan hitauden ja suuremman virrankulutuksen takia takia, vaan enemmän sen takia, että se data pitää sitten hakea eri piilastuja yhdistävän linkin kautta, ja se hidastaa ja lisää virrankulutusta)

Ja jos L3:n käyttö on hitaahkoa ja kuluttaa paljon virtaa, sitten L2sta pitää tehdä suurempi (joka taas lisää hintaa). Tällä hetkellähän zen5ssa on megan L2-kakku, Arrow Lakessa P-ytimillä 3 megaa, E-ytimillä 4 ydintä jaettuna neljää ydintä kohden. Käytännössä Intel joutuu jo nyt käyttämään suurempaa L2-välimuistia koska sen kaikkien ytimien kanssa jaettu L3-kakku on selvästi hitaampi kuin AMDn CCX-kohtaiset L3-välimuistit.

Toisaalta, AMDllä sitten tällä hetkellä >8 ytimen vcache-kokoonpanoissa vain osa L3-välimuistista on käytettävissä kullekin säikeelle, vain 8 ytimelle on se 96 megan L3-välimuisti ja toisella 8lle on vain 32 megan välimuisti. Toimii hyvin jos peli käyttää pientä määrää säikeitä, mutta jos peli käyttää suurta määrää säikeitä, homma menee epäoptimaaliseksi.

Huhuttu CCX:n koon kasvattaminen 12 ytimeen zen6-sukupolvessa voi olla kiva nimenomaan sen kannalta, että sitten 12 ydintä saa käyttöönsä sen suuren vcachen (kaksi isoa vcacheä tulisi hyvin kalliiksi). Toisaalta tämä CCXn koon kasvattaminen myös lisää L3n viivettä hiukan (ei silti lähellekään Intelin L3-viiveen tasolle) mikä myös lisää painetta suurentaa L2-kakkua (joka taas nostaa valmistuskustannuksia)

Intel on käsittääkseni siirtymässä piireihin jotka koostuvat suuresta määrästä pieniä piilastuja vierekkäin.

AMDn tapa integroida iso välimuisti eri piilastulle logiikkapiilastun päälle tai alle taas vähentää tuon erillisen L3-piilastun haittoja, pystysuoraan matka isolta välimuistilta sitä käyttävälle logiikalle voi olla hyvin lyhyt.

Summa summarum: Näkisin että Intelin on mahdollista saada AMD kiinni pelisuorituskyvyssä ja se voi realistisesti tapahtua jo seuraavassa sukupolvessa, mutta se tullee kalliiksi piirien valmistuskustannuksissa. Nopeimpien peliprossujen hinnat eivät ole ainakaan laskemassa, kummallakaan valmistajalla.


Vähän villimpää spekulaatiota ja toivetta vielä:
Itse toivoisin, että AMD luopuisi kokonaan noista "ei-vcache-malleista" ja kaikki L3-välimuisti olisi aina erillisellä piilastulla pääpiirin alla/päällä. (ja siitä välimuistipiiristä voisi sitten ehkä olla isompi ja pienempi malli, tai niitä voisi pinota eri määriä sen logiikkapiilastun alle/päälle eri välimuistimäärien saavuttamiseksi). Kun se L3-välimuisti poistuisi kokonaan itse CCD-piilastulta, siitä CCD-piilastusta voisi tehtyä halvemman tai sen tilan voisi käyttää sellaiseen logiikkaan joka hyötyy siitä sen uudemmasta valmistustekniikasta.
 
Pelisuorituskyky on todella paljon kiinni muistiviiveistä (lähinnä L3-välimuistin koko sekä DRAMin viive).

Intelilla L3-välimuisti on jaettu kaikkien ytimien välillä mutta sen määrä kasvaa silti ytimien määrän mukaan, jokainen P-ydin tai neljän E-ytimen rypäle tuo yhden viipaleen verran L3-kakkua lisää.

Arrow Lakessa jokaisen viipaleen koko on 3 megaa L3-kakkua, ja näitä viipaleita on maksimissaan 8+(16/4) = 12 kpl, eli L3-kakkua on maksimissaan 36 megaa.

Seuraavaan sukupolveen huhutaan 16+32+4 ydintä (tosin nuo LP-E-ytimet ilmeisesti ovat normaalin L3-kakkuhierarkian ulkopuolella koska niiden idea on toimia vaikka normaali CPU-piilastu olisi kokonana power gatettu alas), eli L3-viipaleita olisi 16+(32/4) = 24 kpl

Mikäli L3-viipaleen koko pysyy samana, L3:n koko kasvaa 72 megaan. Tämä olisi jo aika lähellä AMDn vcache-mallien 96 megaa.

Tosin on myös mahdollista(ja ehkä jopa todennäköistä), että zen6-sukupolvessa AMD kasvattaa L3-välimuistinsa kokoa.

L3n kasvattamisessa ongelmallista on se, että uusilla valmistustekniikoilla välimuistin koko skaalautuu huonosti, ja SRAM josta välimuisti on tehty muuttuu vaan kalliimmaksi (koska piipinta-alan hinta kasvaa enemmän kuin SRAM pienenee)

Käytännössä isot välimuistit pitäisi valmistaa jollain vanhemmalla valmistustekniikalla että ne saataisiin tehtyä edullisesti. Mutta se taas väistämättä tekee niistä hitaampia ja enemmän virtaa kuluttavia (ei niinkään sen vanhan valmistustekniikan hitauden ja suuremman virrankulutuksen takia takia, vaan enemmän sen takia, että se data pitää sitten hakea eri piilastuja yhdistävän linkin kautta, ja se hidastaa ja lisää virrankulutusta)

Ja jos L3:n käyttö on hitaahkoa ja kuluttaa paljon virtaa, sitten L2sta pitää tehdä suurempi (joka taas lisää hintaa). Tällä hetkellähän zen5ssa on megan L2-kakku, Arrow Lakessa P-ytimillä 3 megaa, E-ytimillä 4 ydintä jaettuna neljää ydintä kohden. Käytännössä Intel joutuu jo nyt käyttämään suurempaa L2-välimuistia koska sen kaikkien ytimien kanssa jaettu L3-kakku on selvästi hitaampi kuin AMDn CCX-kohtaiset L3-välimuistit.

Toisaalta, AMDllä sitten tällä hetkellä >8 ytimen vcache-kokoonpanoissa vain osa L3-välimuistista on käytettävissä kullekin säikeelle, vain 8 ytimelle on se 96 megan L3-välimuisti ja toisella 8lle on vain 32 megan välimuisti. Toimii hyvin jos peli käyttää pientä määrää säikeitä, mutta jos peli käyttää suurta määrää säikeitä, homma menee epäoptimaaliseksi.

Huhuttu CCX:n koon kasvattaminen 12 ytimeen zen6-sukupolvessa voi olla kiva nimenomaan sen kannalta, että sitten 12 ydintä saa käyttöönsä sen suuren vcachen (kaksi isoa vcacheä tulisi hyvin kalliiksi). Toisaalta tämä CCXn koon kasvattaminen myös lisää L3n viivettä hiukan (ei silti lähellekään Intelin L3-viiveen tasolle) mikä myös lisää painetta suurentaa L2-kakkua (joka taas nostaa valmistuskustannuksia)

Intel on käsittääkseni siirtymässä piireihin jotka koostuvat suuresta määrästä pieniä piilastuja vierekkäin.

AMDn tapa integroida iso välimuisti eri piilastulle logiikkapiilastun päälle tai alle taas vähentää tuon erillisen L3-piilastun haittoja, pystysuoraan matka isolta välimuistilta sitä käyttävälle logiikalle voi olla hyvin lyhyt.

Summa summarum: Näkisin että Intelin on mahdollista saada AMD kiinni pelisuorituskyvyssä ja se voi realistisesti tapahtua jo seuraavassa sukupolvessa, mutta se tullee kalliiksi piirien valmistuskustannuksissa. Nopeimpien peliprossujen hinnat eivät ole ainakaan laskemassa, kummallakaan valmistajalla.


Vähän villimpää spekulaatiota ja toivetta vielä:
Itse toivoisin, että AMD luopuisi kokonaan noista "ei-vcache-malleista" ja kaikki L3-välimuisti olisi aina erillisellä piilastulla pääpiirin alla/päällä. (ja siitä välimuistipiiristä voisi sitten ehkä olla isompi ja pienempi malli, tai niitä voisi pinota eri määriä sen logiikkapiilastun alle/päälle eri välimuistimäärien saavuttamiseksi). Kun se L3-välimuisti poistuisi kokonaan itse CCD-piilastulta, siitä CCD-piilastusta voisi tehtyä halvemman tai sen tilan voisi käyttää sellaiseen logiikkaan joka hyötyy siitä sen uudemmasta valmistustekniikasta.

Cache-pyramidiin voisi laittaa vielä L4 siihen keskusmuistin väliin :)
1 GB L4:sta ei menisi hukkaan pelien kanssa ja sen voisi tehdä niillä vanhoilla valmistustekniikoilla.
 
Kaippa L3-kakun koon lisäksi vaikuttaa pelisuorituskykyyn miten se on toteutettu? Jos Intel kasvattaisi nykyisellä L3-toteutuksellaan vain L3:n kokoa niin olisiko vaikutus yhtä dramaattinen kuin AMD:n X3D -lisävälimuistilla?

Tämän Hardware Unboxed videon perusteella Raptor Lake ei hyötyisi kovin paljoa suuremmasta L3-kakusta.
 
Pelikäyttöön lähes jokainen moderni cpu on riittävä. Työkäyttöön on sitte nää nopeat ja 3dmark pelaajille.
 
Kaippa L3-kakun koon lisäksi vaikuttaa pelisuorituskykyyn miten se on toteutettu? Jos Intel kasvattaisi nykyisellä L3-toteutuksellaan vain L3:n kokoa niin olisiko vaikutus yhtä dramaattinen kuin AMD:n X3D -lisävälimuistilla?

Ei ole. AMD:llä iso välimuisti peittää korkeita viiveitä keskusmuistin suuntaan, tai toisin päin ilmaistuna Intelin pienemmät viiveet ramiin aiheuttavat sen, että isompi L3 välimuisti ei tuo niin paljon lisää suorituskykyä, varsinkin jos Intelillä ajetaan erittäin nopeita muisteja.
 
Cache-pyramidiin voisi laittaa vielä L4 siihen keskusmuistin väliin :)
1 GB L4:sta ei menisi hukkaan pelien kanssa ja sen voisi tehdä niillä vanhoilla valmistustekniikoilla.

Intelillä joissain malleissa tuollainen on ollutkin, siten että se on ollut muistiohjaimen puolella piirin väyläverkkoa, ja sen tehtävä on ollut enemmän toimia välimuistina integroidulle näyttikselle ja muulle IO-logiikalle kuin CPU-puolelle. Mutta koska kaikki muistiaccessit menevät sen kautta, se toimi välimuistina myös CPUlle ja auttoi myös CPU-suorituskykyyn.

Ja aikoinaan se tehtiin joissain mobiilimalleissa eDRAMilla, joka oli tehty vanhemmalla valmistustekniikalla

Koot oli tuossa muistaakseni mallista riippuen 64 tai 128 megaa, ajalla kun 8 megaa oli yleisin L3-välimuistin koko.


Applella on myös tuollainen muistiohjaimeen integroitu välimuisti, nimellä "system level cache", mutta se on ihan SRAMia samalla piilastulla kuin kaikki logiikkakin.
 

Statistiikka

Viestiketjuista
281 814
Viestejä
4 841 545
Jäsenet
78 303
Uusin jäsen
kebabranskalaisilla

Hinta.fi

Back
Ylös Bottom