Virallinen: AMD vs Intel keskustelu- ja väittelyketju

demu · 10.06.2025

Nokia on luopunut Intel Xeon -riippuvuudesta (joka Intelin pitkään jatkuneiden viivästysten vuoksi melkein kaatoi firman) ja valinnut uuteen 5G pilvi-infraansa 5. sukupolven AMD EPYC -prosessorit.

AMD EPYC Processors Now Power Nokia Cloud Infrastructure for Next-Gen Telecom Networks

AMD today announced that Nokia has included 5th Gen AMD EPYC processors to power the Nokia Cloud Platform, bringing the leadership performance and performance per watt to next-generation telecom infrastructure. "Telecom operators are looking for infrastructure solutions that combine performance...

www.techpowerup.com

mlackke · 18.06.2025

Nova Lake huhuja:
www.techpowerup.com/338060/intel-nova-lake-s-series-seven-skus-up-to-52-cores-and-150-w-tdp%3famp

Hellsinki · 18.06.2025

mlackke sanoi:
Nova Lake huhuja:
www.techpowerup.com/338060/intel-nova-lake-s-series-seven-skus-up-to-52-cores-and-150-w-tdp%3famp

saunankiukaita tulossa e-jäte ytimillä. siltä omaan silmään näyttää

Joku_242 · 18.06.2025

Hellsinki sanoi:
saunankiukaita tulossa e-jäte ytimillä. siltä omaan silmään näyttää

Ihan hyviähän noi E-ytimet on kaikenlaisissa tuotantohommissa. Peleihin taas vieläkin riittää 6 P-ydintä, ja 8:ssa on jo varmasti tulevaisuuden varaakin.

pulshu · 18.06.2025

Onko se HT luopuminen muuten jotenkin parantanu intelin prossujen toimintaa jossakin asioissa?

aop · 18.06.2025

pulshu sanoi:
Onko se HT luopuminen muuten jotenkin parantanu intelin prossujen toimintaa jossakin asioissa?

Tietoturva lienee parantunut. Muistelisin, että suuri osa Intelin prossujen haavoittuvaisuuksista liittyi nimenomaan tuohon useamman säikeen yhtäaikaiseen suorittamiseen samalla ytimellä.

TommiZeliard · 18.06.2025

Hellsinki sanoi:
saunankiukaita tulossa e-jäte ytimillä. siltä omaan silmään näyttää

Melkoinen "ydinsota" käynnissä. Tuo Core ultra 9 on omaan silmään melkein kuin threadripper.

Se tullee olemaan tehorajat avattuna tuplanopea Cinebench 2024 MC:ssa vs. 9950X/9950X3D/285K. Vakiona todennäköisesti jää reilusti alle 4 000 pts, mutta rajat auki voi saada noin 5k pts. Noilla pisteillä saakin olla jo vähän kiuas. Harvemmin tuollaista loikkaa CB MC:ssa on tapahtunut. Vai onko koskaan? Kuluttajaprossujen hallitsevaan CB MC -mestariin (vakiona) nähden (285K) sekä P- että E-coret tuplattu ja kaupan päälle 4 LP-E -ydintä. Jos jollain emolla saa nuo ruokittua ja vielä jäähdytettyäkin, niin kyllä on kovaa suorituskykyä luvassa.

Edit. Tarkennus, että 285K on hallitseva mestari CB MC:ssa, kun puhutaan vakioista kuluttajaprossuista.

Nerkoon · 18.06.2025

TommiZeliard sanoi:
Melkoinen "ydinsota" käynnissä. Tuo Core ultra 9 on omaan silmään melkein kuin threadripper.

Se tullee olemaan tehorajat avattuna tuplanopea Cinebench 2024 MC:ssa vs. 9950X/9950X3D/285K. Vakiona todennäköisesti jää reilusti alle 4 000 pts, mutta rajat auki voi saada noin 5k pts. Noilla pisteillä saakin olla jo vähän kiuas. Harvemmin tuollaista loikkaa CB MC:ssa on tapahtunut. Vai onko koskaan? Kuluttajaprossujen hallitsevaan mestariin (vakiona) nähden (285K) sekä P- että E-coret tuplattu ja kaupan päälle 4 LP-E -ydintä. Jos jollain emolla saa nuo ruokittua ja vielä jäähdytettyäkin, niin kyllä on kovaa suorituskykyä luvassa.

Kuin suoraan Intelin mainosmateriaalista. 285k ei kyllä ole kuluttajaprossujen mestari ja Intelin low power coret johtunevat ihan siitä, että Intel ei saa tehonkulutusta alas kelloja laskemalla kuten AMD. Muutenkin ihmettelen, että joku ehdottaa tehorajojen poistoa kun Intelin cpu:t tuntuvat hapertuvan vakionakin

Jarnis · 18.06.2025

You get a core and you get a core and... everyone gets all the cores.

Tuo on yksi tapa voittaa AMDin oletettavasti 24 core / 48 thread desktop lastut ensi generaatiossa kun pinotaan miljardi corea. Jos per-core perffi riittää. Avointa on että riittääkö.

Hyvähän se olisi jos Intel saisi vähän kilpailua taas pystyyn ettei AMD voi chillailla. Jollain tapaa voisi melkein sanoa että 9000-sarja oli turhan lepsu upgrade edellisestä kun ei ollut paineita.

Saa nähdä tuleeko jo muistikaista näpeille tuollaisilla core counteilla. Aikoinaan ensimmäiset 64-core Threadripperit ainakin olivat todella pahoin muistipullonkaulaisia monessa duunissa kunnes tuli Pro-versiot jossa muistikanavien määrä tuplattiin.

Timo 2 · 18.06.2025

Jarnis sanoi:
Hyvähän se olisi jos Intel saisi vähän kilpailua taas pystyyn ettei AMD voi chillailla. Jollain tapaa voisi melkein sanoa että 9000-sarja oli turhan lepsu upgrade edellisestä kun ei ollut paineita

Zen 5 oli loistava palvelimiin. Sitä ei oltu suunniteltu pelaajille.

TommiZeliard · 18.06.2025

Nerkoon sanoi:
Kuin suoraan Intelin mainosmateriaalista. 285k ei kyllä ole kuluttajaprossujen mestari ja Intelin low power coret johtunevat ihan siitä, että Intel ei saa tehonkulutusta alas kelloja laskemalla kuten AMD. Muutenkin ihmettelen, että joku ehdottaa tehorajojen poistoa kun Intelin cpu:t tuntuvat hapertuvan vakionakin

Onpa hauska sattuma, jos viestini kuulosti joltain mainosmateriaalilta.

En nimittäin muista muita Intelin mainoksia kuin Intel Inside Pentium-ajoilta. Muutenkin yritän aina vältellä ja kelata mainokset parhaani mukaan. Postilaatikossakin on yli 20 vuotta lukenut "Ei mainoksia".

Kunhan vaan kiinnitin huomiota siihen, että CB 2024 MC:een on näillä näkymin tulossa kaikkien aikojen suurin harppaus (viimeistään tehorajoja avaamalla) kuluttajaprossuissa.Yhdessä sukupolvessa voi tehorajat avaamalla tulla parhaassa tapauksessa jopa lähemmäs +100 %, jos emo tai jäähdytys ei ota vastaan.

Kirjoitin:
"Harvemmin tuollaista loikkaa CB MC:ssa on tapahtunut. Vai onko koskaan? Kuluttajaprossujen hallitsevaan mestariin (vakiona) nähden (285K) sekä P- että E-coret tuplattu ja kaupan päälle 4 LP-E -ydintä.".

Tuo hallitsevaan mestariin vakiona tarkoitti, että CB MC:ssa, minkä kirjoitin pariin kertaan kyseisessä kappaleessa. Sekä IO-Tech että Techpowerup ovat samaa mieltä, että 285K on vakiona nopein kuluttajakannan suoritin CB MC:ssa.

Testissä AMD Ryzen 9 9950X3D - io-tech.fi

Testissä AMD:n 2. sukupolven 3D V-Cache -välimuistilla varustettu Zen 5 -arkkitehtuuriin perustuva 16-ytiminen Ryzen 9 9950X3D -lippulaivaprosessori.

www.io-tech.fi

AMD Ryzen 9 9950X3D Review - Great for Gaming and Productivity

The new AMD Ryzen 9 9950X3D brings Zen 5 with 3D V-Cache to the high-end. This new $700 flagship offers the best application performance, beating even the 9950X, and at the same time you get a fantastic gaming experience that's better than any other non-X3D processor on the market.

www.techpowerup.com

Tehorajojen poistosta kirjoittaessani olin vain objektiivinen. Jotkut oikeasti ajavat Cinebench-tuloksia väljemmin tehorajoin. Tällöin voi parhaassa tapauksessa toteutua se ennennäkemätön lähemmäs +100 % yhdessä sukupolvessa.

Tein tuollaisen havainnon, vaikka muuten olenkin energiansäästön kannalla, kuten autokeskusteluista (Auriksen ~3 000 km@3,78 l/100 km tai Miin viime syksyn yli 340 km yhdellä akullisella ja jäi vielä 20 km rangea) voi päätellä. Tietokoneessakin Ryzen 5900X-keskusyksikkö vie työpöydällä seinästä alle 40 W (12c/24t, erillis-GPU, 64 GB RAM, viisi Noctuaa, wifi, NVMe), mikä on keskimääräistä vähemmän. Kaksi uusinta näytönohjainta ovat pihejä, 1050 Ti (75 W) ja RX 6600 (132 W), vaikka pelaan lähes kaikkia pelejä (vanhoja) 2160p@60 fps. Virtalähdekin on vain 550 W 10 v takuulla, vaikka silloin 2020 muut ostivat 750:ä. En tule kotonani käyttämään yli 200 W näytönohjainta, joten siksi 550 W riittää.

Screenshot_2025-06-18-19-06-44-89_40deb401b9ffe8e1df2f1cc5ba480b12.jpg

Screenshot_2025-06-18-19-07-57-96_40deb401b9ffe8e1df2f1cc5ba480b12.jpg

Edit. Tarkennus, että lähes +100 % CB MC voi toteutua tehorajat avaamalla, jos emo/jäähdytys eivät ota vastaan.

swttii · 18.06.2025

Saa nähdä onko välimuistipuolella jotain kikkoja jotta AMDn X3D prossuille tulisi kilpailua :hmm:

Myös teoriassa voisi löytyä joku kourallinen pelejä jotka hyötyvät 16 P-ytimestä ilman kahden CCD aiheuttamia "ongelmia", mutta AMDlla taitaa tulla myös seuraavassa sukupolvessa 16 corea CCDlle, joten sekään ei pitkään ole intelin kilpailuetuna.

JiiPee · 18.06.2025

TommiZeliard sanoi:
Kunhan vaan kiinnitin huomiota siihen, että CB 2024 MC:een on näillä näkymin tulossa kaikkien aikojen suurin harppaus (viimeistään tehorajoja avaamalla) kuluttajaprossuissa.Yhdessä sukupolvessa parhaassa tapauksessa jopa lähemmäs +100 %.

No ei tule tuplaantumaan vaikka core määrä tuplaantuu. Siellä kun tulee tehorajat vastaan ja kyky jäähdyttää loppupelissä. Jossain LN2 leikeissä joo voi olla mahdollista, mutta jos nyt otetaan 285K niin siellä on Prosessor Base Power 125W ja Max Turbo Power 250W jota vasten toi 285K jurnuttaa noi "jumalaiset" cinepeli tulokset.
Base Power tulee nousemaan hiukan eli 150W mutta toi jälkimmäinen tuskin tulee nousemaan tai jos noisee niin ei paljoa. Ei ainakaan minnekään 450W jonka se vaatisi että tehot saataisin lähes tuplattua.

Tai jos Intel onnistuu jonkun kanin vetämään hatusta että 250W turbo limitillä tuplaavat suorituskyvyn niin syön hatullisen suklaata.

Paljon suurempi todennäköisyys on että kilpailu jatkuu varsin tasaisena koska AMD:ltä tulee suurella todennäköisyydellä 32c64t tuolle vastineeksi.

TommiZeliard sanoi:
Tuo hallitsevaan mestariin vakiona tarkoitti, että CB MC:ssa, minkä kirjoitin pariin kertaan kyseisessä kappaleessa. Sekä IO-Tech että Techpowerup ovat samaa mieltä, että 285K on vakiona nopein kuluttajakannan suoritin CB MC:ssa.

Se että jossain yhdessä asiassa on parempi ei kyllä mielestäni tee tuosta mitään hallitsevaa mestaria. Kyllä CPU puolella vaaditaan mestaruuteen vähän muutakin kuin voitto cinepelissä.

TommiZeliard · 19.06.2025

JiiPee sanoi:
No ei tule tuplaantumaan vaikka core määrä tuplaantuu. Siellä kun tulee tehorajat vastaan ja kyky jäähdyttää loppupelissä. Jossain LN2 leikeissä joo voi olla mahdollista, mutta jos nyt otetaan 285K niin siellä on Prosessor Base Power 125W ja Max Turbo Power 250W jota vasten toi 285K jurnuttaa noi "jumalaiset" cinepeli tulokset.
Base Power tulee nousemaan hiukan eli 150W mutta toi jälkimmäinen tuskin tulee nousemaan tai jos noisee niin ei paljoa. Ei ainakaan minnekään 450W jonka se vaatisi että tehot saataisin lähes tuplattua.

Tai jos Intel onnistuu jonkun kanin vetämään hatusta että 250W turbo limitillä tuplaavat suorituskyvyn niin syön hatullisen suklaata.

Paljon suurempi todennäköisyys on että kilpailu jatkuu varsin tasaisena koska AMD:ltä tulee suurella todennäköisyydellä 32c64t tuolle vastineeksi.

Se että jossain yhdessä asiassa on parempi ei kyllä mielestäni tee tuosta mitään hallitsevaa mestaria. Kyllä CPU puolella vaaditaan mestaruuteen vähän muutakin kuin voitto cinepelissä.

Tuota edeltävässä viestissäni kirjoitin tarkemmin, että tehorajat avattuna voi tuplata, eli saada noin 5k pts. Vakiona veikkailin jäävän reilusti alle 4k pts (koska tehoraja kasvaa niin vähän suhteessa ydinmäärän kasvuun):
"Se tullee olemaan tehorajat avattuna tuplanopea Cinebench 2024 MC:ssa vs. 9950X/9950X3D/285K. Vakiona todennäköisesti jää reilusti alle 4 000 pts, mutta rajat auki voi saada noin 5k pts.".

Kirjoittelin myös emolevyn virransyötön ja prossun jäähdytyksen haasteista liittyen tuohon suorituskyvyn tuplaukseen tehorajat avaamalla:
"Jos jollain emolla saa nuo ruokittua ja vielä jäähdytettyäkin, niin kyllä on kovaa suorituskykyä luvassa.".

Jos olisit lukenut viimeistä lainaustasi seuraavan kappaleen: "Tehorajojen poistosta kirjoittaessani olin vain objektiivinen. Jotkut oikeasti ajavat Cinebench-tuloksia väljemmin tehorajoin. Tällöin voi parhaassa tapauksessa toteutua se ennennäkemätön lähemmäs +100 % yhdessä sukupolvessa.", olisi sinulle selvinnyt tuostakin viestistä, että lähemmäs +100 % voi toteutua, jos:
1. ajetaan väljemmin tehorajoin
2. Parhaassa tapauksessa (=emo tai jäähdytys eivät ota vastaan)

En ole nähnyt vastaavaa listausta AMD:n tulevista suorittimista, mutta jos tosiaan vihdoinkin tulee 32c/64t, niin CB-kilpailu jatkuisi tasaisena. Johan AMD on junnannut 16c/32t:ssä 3000-, 5000-, 7000- ja 9000-sarjan ajan.

Hieman muutettuna:
Se että jossain yhdessä seiväshypyssä on parempi ei kyllä mielestäni tee Duplantiksesta mitään hallitsevaa mestaria. Kyllä yleisurheilupuolella vaaditaan mestaruuteen vähän muutakin kuin voitto seipäässä.

Minun ei ollut tarkoitus sanoa, että 285K olisi mikään kymmenottelija, vaan juuri tuossa yhdessä lajissa (CB MC, josta kirjoitin koko kyseisen kappaleen ajan) hallitseva mestari, kun puhutaan vakiona toimivista kuluttajaprossuista.

Ehkä minun pitää jotenkin tarkentaa viestejäni, kun tuntuu tulevan vänkäystä sellaisesta mitä en ole tarkoittanut. Nyt muuten tajusin, että tämähän onkin väittelyketju. Sellainen ei nappaa, joten poistun muihin ketjuihin.

IHS · 10.07.2025

9800x3D mennä porskuttaa vaan. Saa nähdä saako intel pelisuorituskyvyssä enää AMD:tä kiinni. (En usko että saa)

hkultala · 10.07.2025

IHS sanoi:
9800x3D mennä porskuttaa vaan. Saa nähdä saako intel pelisuorituskyvyssä enää AMD:tä kiinni. (En usko että saa)

Pelisuorituskyky on todella paljon kiinni muistiviiveistä (lähinnä L3-välimuistin koko sekä DRAMin viive).

Intelilla L3-välimuisti on jaettu kaikkien ytimien välillä mutta sen määrä kasvaa silti ytimien määrän mukaan, jokainen P-ydin tai neljän E-ytimen rypäle tuo yhden viipaleen verran L3-kakkua lisää.

Arrow Lakessa jokaisen viipaleen koko on 3 megaa L3-kakkua, ja näitä viipaleita on maksimissaan 8+(16/4) = 12 kpl, eli L3-kakkua on maksimissaan 36 megaa.

Seuraavaan sukupolveen huhutaan 16+32+4 ydintä (tosin nuo LP-E-ytimet ilmeisesti ovat normaalin L3-kakkuhierarkian ulkopuolella koska niiden idea on toimia vaikka normaali CPU-piilastu olisi kokonana power gatettu alas), eli L3-viipaleita olisi 16+(32/4) = 24 kpl

Mikäli L3-viipaleen koko pysyy samana, L3:n koko kasvaa 72 megaan. Tämä olisi jo aika lähellä AMDn vcache-mallien 96 megaa.

Tosin on myös mahdollista(ja ehkä jopa todennäköistä), että zen6-sukupolvessa AMD kasvattaa L3-välimuistinsa kokoa.

L3n kasvattamisessa ongelmallista on se, että uusilla valmistustekniikoilla välimuistin koko skaalautuu huonosti, ja SRAM josta välimuisti on tehty muuttuu vaan kalliimmaksi (koska piipinta-alan hinta kasvaa enemmän kuin SRAM pienenee)

Käytännössä isot välimuistit pitäisi valmistaa jollain vanhemmalla valmistustekniikalla että ne saataisiin tehtyä edullisesti. Mutta se taas väistämättä tekee niistä hitaampia ja enemmän virtaa kuluttavia (ei niinkään sen vanhan valmistustekniikan hitauden ja suuremman virrankulutuksen takia takia, vaan enemmän sen takia, että se data pitää sitten hakea eri piilastuja yhdistävän linkin kautta, ja se hidastaa ja lisää virrankulutusta)

Ja jos L3:n käyttö on hitaahkoa ja kuluttaa paljon virtaa, sitten L2sta pitää tehdä suurempi (joka taas lisää hintaa). Tällä hetkellähän zen5ssa on megan L2-kakku, Arrow Lakessa P-ytimillä 3 megaa, E-ytimillä 4 ydintä jaettuna neljää ydintä kohden. Käytännössä Intel joutuu jo nyt käyttämään suurempaa L2-välimuistia koska sen kaikkien ytimien kanssa jaettu L3-kakku on selvästi hitaampi kuin AMDn CCX-kohtaiset L3-välimuistit.

Toisaalta, AMDllä sitten tällä hetkellä >8 ytimen vcache-kokoonpanoissa vain osa L3-välimuistista on käytettävissä kullekin säikeelle, vain 8 ytimelle on se 96 megan L3-välimuisti ja toisella 8lle on vain 32 megan välimuisti. Toimii hyvin jos peli käyttää pientä määrää säikeitä, mutta jos peli käyttää suurta määrää säikeitä, homma menee epäoptimaaliseksi.

Huhuttu CCX:n koon kasvattaminen 12 ytimeen zen6-sukupolvessa voi olla kiva nimenomaan sen kannalta, että sitten 12 ydintä saa käyttöönsä sen suuren vcachen (kaksi isoa vcacheä tulisi hyvin kalliiksi). Toisaalta tämä CCXn koon kasvattaminen myös lisää L3n viivettä hiukan (ei silti lähellekään Intelin L3-viiveen tasolle) mikä myös lisää painetta suurentaa L2-kakkua (joka taas nostaa valmistuskustannuksia)

Intel on käsittääkseni siirtymässä piireihin jotka koostuvat suuresta määrästä pieniä piilastuja vierekkäin.

AMDn tapa integroida iso välimuisti eri piilastulle logiikkapiilastun päälle tai alle taas vähentää tuon erillisen L3-piilastun haittoja, pystysuoraan matka isolta välimuistilta sitä käyttävälle logiikalle voi olla hyvin lyhyt.

Summa summarum: Näkisin että Intelin on mahdollista saada AMD kiinni pelisuorituskyvyssä ja se voi realistisesti tapahtua jo seuraavassa sukupolvessa, mutta se tullee kalliiksi piirien valmistuskustannuksissa. Nopeimpien peliprossujen hinnat eivät ole ainakaan laskemassa, kummallakaan valmistajalla.

Vähän villimpää spekulaatiota ja toivetta vielä:
Itse toivoisin, että AMD luopuisi kokonaan noista "ei-vcache-malleista" ja kaikki L3-välimuisti olisi aina erillisellä piilastulla pääpiirin alla/päällä. (ja siitä välimuistipiiristä voisi sitten ehkä olla isompi ja pienempi malli, tai niitä voisi pinota eri määriä sen logiikkapiilastun alle/päälle eri välimuistimäärien saavuttamiseksi). Kun se L3-välimuisti poistuisi kokonaan itse CCD-piilastulta, siitä CCD-piilastusta voisi tehtyä halvemman tai sen tilan voisi käyttää sellaiseen logiikkaan joka hyötyy siitä sen uudemmasta valmistustekniikasta.

hsalonen · 10.07.2025

hkultala sanoi:
Pelisuorituskyky on todella paljon kiinni muistiviiveistä (lähinnä L3-välimuistin koko sekä DRAMin viive).

Intelilla L3-välimuisti on jaettu kaikkien ytimien välillä mutta sen määrä kasvaa silti ytimien määrän mukaan, jokainen P-ydin tai neljän E-ytimen rypäle tuo yhden viipaleen verran L3-kakkua lisää.

Arrow Lakessa jokaisen viipaleen koko on 3 megaa L3-kakkua, ja näitä viipaleita on maksimissaan 8+(16/4) = 12 kpl, eli L3-kakkua on maksimissaan 36 megaa.

Seuraavaan sukupolveen huhutaan 16+32+4 ydintä (tosin nuo LP-E-ytimet ilmeisesti ovat normaalin L3-kakkuhierarkian ulkopuolella koska niiden idea on toimia vaikka normaali CPU-piilastu olisi kokonana power gatettu alas), eli L3-viipaleita olisi 16+(32/4) = 24 kpl

Mikäli L3-viipaleen koko pysyy samana, L3:n koko kasvaa 72 megaan. Tämä olisi jo aika lähellä AMDn vcache-mallien 96 megaa.

Tosin on myös mahdollista(ja ehkä jopa todennäköistä), että zen6-sukupolvessa AMD kasvattaa L3-välimuistinsa kokoa.

L3n kasvattamisessa ongelmallista on se, että uusilla valmistustekniikoilla välimuistin koko skaalautuu huonosti, ja SRAM josta välimuisti on tehty muuttuu vaan kalliimmaksi (koska piipinta-alan hinta kasvaa enemmän kuin SRAM pienenee)

Käytännössä isot välimuistit pitäisi valmistaa jollain vanhemmalla valmistustekniikalla että ne saataisiin tehtyä edullisesti. Mutta se taas väistämättä tekee niistä hitaampia ja enemmän virtaa kuluttavia (ei niinkään sen vanhan valmistustekniikan hitauden ja suuremman virrankulutuksen takia takia, vaan enemmän sen takia, että se data pitää sitten hakea eri piilastuja yhdistävän linkin kautta, ja se hidastaa ja lisää virrankulutusta)

Ja jos L3:n käyttö on hitaahkoa ja kuluttaa paljon virtaa, sitten L2sta pitää tehdä suurempi (joka taas lisää hintaa). Tällä hetkellähän zen5ssa on megan L2-kakku, Arrow Lakessa P-ytimillä 3 megaa, E-ytimillä 4 ydintä jaettuna neljää ydintä kohden. Käytännössä Intel joutuu jo nyt käyttämään suurempaa L2-välimuistia koska sen kaikkien ytimien kanssa jaettu L3-kakku on selvästi hitaampi kuin AMDn CCX-kohtaiset L3-välimuistit.

Toisaalta, AMDllä sitten tällä hetkellä >8 ytimen vcache-kokoonpanoissa vain osa L3-välimuistista on käytettävissä kullekin säikeelle, vain 8 ytimelle on se 96 megan L3-välimuisti ja toisella 8lle on vain 32 megan välimuisti. Toimii hyvin jos peli käyttää pientä määrää säikeitä, mutta jos peli käyttää suurta määrää säikeitä, homma menee epäoptimaaliseksi.

Huhuttu CCX:n koon kasvattaminen 12 ytimeen zen6-sukupolvessa voi olla kiva nimenomaan sen kannalta, että sitten 12 ydintä saa käyttöönsä sen suuren vcachen (kaksi isoa vcacheä tulisi hyvin kalliiksi). Toisaalta tämä CCXn koon kasvattaminen myös lisää L3n viivettä hiukan (ei silti lähellekään Intelin L3-viiveen tasolle) mikä myös lisää painetta suurentaa L2-kakkua (joka taas nostaa valmistuskustannuksia)

Intel on käsittääkseni siirtymässä piireihin jotka koostuvat suuresta määrästä pieniä piilastuja vierekkäin.

AMDn tapa integroida iso välimuisti eri piilastulle logiikkapiilastun päälle tai alle taas vähentää tuon erillisen L3-piilastun haittoja, pystysuoraan matka isolta välimuistilta sitä käyttävälle logiikalle voi olla hyvin lyhyt.

Summa summarum: Näkisin että Intelin on mahdollista saada AMD kiinni pelisuorituskyvyssä ja se voi realistisesti tapahtua jo seuraavassa sukupolvessa, mutta se tullee kalliiksi piirien valmistuskustannuksissa. Nopeimpien peliprossujen hinnat eivät ole ainakaan laskemassa, kummallakaan valmistajalla.

Vähän villimpää spekulaatiota ja toivetta vielä:
Itse toivoisin, että AMD luopuisi kokonaan noista "ei-vcache-malleista" ja kaikki L3-välimuisti olisi aina erillisellä piilastulla pääpiirin alla/päällä. (ja siitä välimuistipiiristä voisi sitten ehkä olla isompi ja pienempi malli, tai niitä voisi pinota eri määriä sen logiikkapiilastun alle/päälle eri välimuistimäärien saavuttamiseksi). Kun se L3-välimuisti poistuisi kokonaan itse CCD-piilastulta, siitä CCD-piilastusta voisi tehtyä halvemman tai sen tilan voisi käyttää sellaiseen logiikkaan joka hyötyy siitä sen uudemmasta valmistustekniikasta.

Cache-pyramidiin voisi laittaa vielä L4 siihen keskusmuistin väliin

1 GB L4:sta ei menisi hukkaan pelien kanssa ja sen voisi tehdä niillä vanhoilla valmistustekniikoilla.

Infy · 10.07.2025

Kaippa L3-kakun koon lisäksi vaikuttaa pelisuorituskykyyn miten se on toteutettu? Jos Intel kasvattaisi nykyisellä L3-toteutuksellaan vain L3:n kokoa niin olisiko vaikutus yhtä dramaattinen kuin AMD:n X3D -lisävälimuistilla?

Tämän Hardware Unboxed videon perusteella Raptor Lake ei hyötyisi kovin paljoa suuremmasta L3-kakusta.

Hellsinki · 10.07.2025

Pelikäyttöön lähes jokainen moderni cpu on riittävä. Työkäyttöön on sitte nää nopeat ja 3dmark pelaajille.

ratkakapu · 10.07.2025

Infy sanoi:
Kaippa L3-kakun koon lisäksi vaikuttaa pelisuorituskykyyn miten se on toteutettu? Jos Intel kasvattaisi nykyisellä L3-toteutuksellaan vain L3:n kokoa niin olisiko vaikutus yhtä dramaattinen kuin AMD:n X3D -lisävälimuistilla?

Ei ole. AMD:llä iso välimuisti peittää korkeita viiveitä keskusmuistin suuntaan, tai toisin päin ilmaistuna Intelin pienemmät viiveet ramiin aiheuttavat sen, että isompi L3 välimuisti ei tuo niin paljon lisää suorituskykyä, varsinkin jos Intelillä ajetaan erittäin nopeita muisteja.

hkultala · 10.07.2025

hsalonen sanoi:
Cache-pyramidiin voisi laittaa vielä L4 siihen keskusmuistin väliin
1 GB L4:sta ei menisi hukkaan pelien kanssa ja sen voisi tehdä niillä vanhoilla valmistustekniikoilla.

Intelillä joissain malleissa tuollainen on ollutkin, siten että se on ollut muistiohjaimen puolella piirin väyläverkkoa, ja sen tehtävä on ollut enemmän toimia välimuistina integroidulle näyttikselle ja muulle IO-logiikalle kuin CPU-puolelle. Mutta koska kaikki muistiaccessit menevät sen kautta, se toimi välimuistina myös CPUlle ja auttoi myös CPU-suorituskykyyn.

Ja aikoinaan se tehtiin joissain mobiilimalleissa eDRAMilla, joka oli tehty vanhemmalla valmistustekniikalla

Koot oli tuossa muistaakseni mallista riippuen 64 tai 128 megaa, ajalla kun 8 megaa oli yleisin L3-välimuistin koko.

Crystal Well - Intel - WikiChip

Crystal Well is the codename for the L4 cache, a discrete eDRAM silicon die, which is featured in the high-end Iris Pro-equipped Intel Haswell microprocessors. The eDRAM silicon die is separate from the main Haswell die but is packaged together with it. Crystal Well based processors started...

en.wikichip.org

Applella on myös tuollainen muistiohjaimeen integroitu välimuisti, nimellä "system level cache", mutta se on ihan SRAMia samalla piilastulla kuin kaikki logiikkakin.

Moilaps · 23.07.2025

Vähän ihmetyttää tuo amd strategia strix halon ja mahdollisesti perutun medusan kanssa. Luulisi että kysyntää olisi isolle muistimäärälle kohtuu tehon kanssa pienessä paketissa. Mutta hinnoittelu on korkea vaikka kustannus kaiketi pienempi kuin kasattu pc torni

hkultala · 23.07.2025

Moilaps sanoi:
Vähän ihmetyttää tuo amd strategia strix halon ja mahdollisesti perutun medusan kanssa. Luulisi että kysyntää olisi isolle muistimäärälle kohtuu tehon kanssa pienessä paketissa. Mutta hinnoittelu on korkea vaikka kustannus kaiketi pienempi kuin kasattu pc torni

Strix Halossa on käsittääkseni (viiveiden minimoimiseksi) kalliihko paketointi, se on kalliimpi kuin melko samantyyliset piilastut perinteisemmällä paketoinnilla.

Toisekseen: Strix Halo on high-end-tuote jolla on high-end hinnoittelu. Koska kysyntää on, hinta voidaan laittaa korkeammalle, ja silti saada piiriä kaupaksi. Jollain ne tuotekehityskustannukset pitää kattaa ja myös tehdä voittoa sijoittajille vastineena heidän sijoituksistaan.

pomk · 23.07.2025

hkultala sanoi:
Strix Halossa on käsittääkseni (viiveiden minimoimiseksi) kalliihko paketointi, se on kalliimpi kuin melko samantyyliset piilastut perinteisemmällä paketoinnilla.

Toisekseen: Strix Halo on high-end-tuote jolla on high-end hinnoittelu. Koska kysyntää on, hinta voidaan laittaa korkeammalle, ja silti saada piiriä kaupaksi. Jollain ne tuotekehityskustannukset pitää kattaa ja myös tehdä voittoa sijoittajille vastineena heidän sijoituksistaan.

Ja halpahan toi strix halo on, jopa satoja prosentteja nopeampi ku joku paljon kalliimpi 5090. Niillä kuormilla missä toi on ylipäänsä nopea laisinkaan.

demu · 25.07.2025

Intel myöntää, että sen tulevien piirinvalmistusprosessien kohtalo on aika lailla veitsen terällä.
Jos Intel ei löydä ulkoisia asiakkaita 14A ja sitä seuraaville prosesseille, se saattaa luopua kokonaan uusien piirinvalmistustekniikoiden kehittämisesta. Tästä seuraisi se, että tulevien sukupolvien piirinvalmistus siirrettäisiin kokonaan ulkoisille toimittajille (TSMC, Samsung) .

Intel will cancel 14A and following nodes if it can't win a major external customer

Intel will cancel 14A and following nodes if it can't win a major external customer — move would cede leading-edge nodes to TSMC and Samsung

Then exit the leading-edge process technologies completely.

www.tomshardware.com

Dudem · 25.07.2025

On kyllä Intel saanut itsensä aikamoiseen kuoppaan kaivettua. Toki omaa syytänsä ovat tässä tilanteessa.

Mitenköhän TSMC:llä riittää kapasiteettia jos Intelkin siirtyisi täysin heidän asiakkaaksi plus siihen päälle kaikki muut. Ei jotenkin tunnu järkevältä tilanteelta tämäkään, liian paljon yhden firman varassa.

hkultala · 25.07.2025

demu sanoi:
Intel myöntää, että sen tulevien piirinvalmistusprosessien kohtalo on aika lailla veitsen terällä.
Jos Intel ei löydä ulkoisia asiakkaita 14A ja sitä seuraaville prosesseille, se saattaa luopua kokonaan uusien piirinvalmistustekniikoiden kehittämisesta. Tästä seuraisi se, että tulevien sukupolvien piirinvalmistus siirrettäisiin kokonaan ulkoisille toimittajille (TSMC, Samsung) .

Intel will cancel 14A and following nodes if it can't win a major external customer

Intel will cancel 14A and following nodes if it can't win a major external customer — move would cede leading-edge nodes to TSMC and Samsung

Then exit the leading-edge process technologies completely.

www.tomshardware.com

Ei oikeastaan yllätä sen jälkeen kun Gelsinger efektiivisesti potkittiin pihalle. Kvartaalitaloussijoittajat haluavat säästöjä ja pikavoittoja, ja Gelsingerin pysyminen Intelin pitkän tähtäimen strategiassa jossa Intel saa (yleensä) kilpailuetua omista valmistajistusprosesseistaan ei niitä pikavoittoja seuraavan muutaman vuoden aikana tarjoa.

Intelin strategia siitä, että se saa kilpailuetua paremmista prosesseistaan on keskimäärin toiminut hyvin, mutta se failasi P1274-prosessin ("10nm") kanssa ja kun plan B puuttui takataskusta niin aika paljon asioita meni pieleen ja intel hetken aikaa kärsikin siitä että käyttää omia tehtaitaan.

IMHO omien tehtaiden valmistamien ja omien prosessien kehittäminen on Inteliltä fiksua, mutta plan B pitää aina olla takataskussa, että jos välillä omat tehtaat onkin huonompia, ei silloin asiat mene totaalisen pieleen niin kuin ne n. viitisen vuotta sitten meni.

Ilman omia tehtaita en oikein näe Intelillä mitään etulyöntiasemaa AMDhen nähden - AMDllä on parempi näyttispuoli, ja parempi tuotemanagerointi joka tekee vähemmän typeriä päätöksiä markkinasegmentoinnin ja lyhyen tähtäimen voittojen metsästämisen/rahastamisen takia.

Varsinaiset suunnitteluporukat jotka ytimiä suunnittelevat taas tuntuvat olevan melko yhtä päteviä molemmilla, Intelillä vaan johtoportaalla on tapana enemmän sitoa suunnitteluporukoiden käsiä ja tuoda ulos cripplattuja tuotteita, kun taas perinteisesti AMD kärsi siitä että oli altavastaajana ja joutui toimimaan pienemmillä resursseilla ja huonommalla softatuella jne (mikä ei käytännössä enää juurikaan pidä paikkaansa)

hkultala · 25.07.2025

Ja tosiaan AVX-512 on erinomainen esimerkki tästä Intelin sähläyksestä lähinnä markkinasegmentoinnin suhteen:

AVX-512 kehitettiin alunperin "Larrabee"-projektin sivutuotteena, Larrabeen piti olla x86-pohjainen näyttis mutta kun todettiin että ei sitä saada toimimaan tarpeeksi hyvin näyttiksenä, siitä tehtiin vaan yleinen hvyin rinnakkaistuvan laskennan kiihdytin(Xeon Phi).

AVX-512 tuotiin kuitenkin myös normaaleihin CPU-ytimiin(Skylake) mutta se kytkettiin päälle ainoastaan serverimalleissa (Skylake-X, Skylake-SP ja Skylake-W). Ja tämä taas totaalisesti pilasi softatuon yleistymisen sille, kun käytännössä sitä ei ollut keskimääräisen softankehittäjän työkoneessa.

Lisäksi Skylake-sukupolvessa AVX-512-tuessa oli myös yksi paha tekninen ongelma: Niissä prossun virransyöttö ei ollut tarpeeksi järeä ruokkimaan sen AVX512-yksiköitä suurilla kellotaajuuksilla, ja prossujen kellotaajuuden dynaaminen skaalaus oli liian hidas; Jos prossu olisi suurella kellotaajuudella kohdannut useamman AVX-512-käskyn nopeasti peräkkäin, sen jännite olisi suuren hetkellisen kulutuksen takia laskenut liian alas ja se olisi käynyt epävakaaksi. Tähän sitten purkkavirityksenä tehtiin moodi, että kun yllättäen suurella kellotaajuudella pyöriessä kohdataan AVX-512-käskyjä, pitääkseen virrankulutuksen tarpeeksi pienenä prossu vaan alkoi stallailla suuressa määrin kunnes kellotaajuus saadaan laskettua turvallisen alas, ja vasta sitten kellojen laskettua alas sallitaan AVX-512-käskyjen normaali suoritus, ja valitettavasti tämä kellotaajuuksien laskeminen kesti aivan liian kauan että suorituskyky oli totaalisen pilalla jos haluttiin suorittaa vain pieni määrä AVX-512-käskyjä.

Eli tämä käytännössä pilasi totaalisesti AVX-512-käskyjen suorituskyvyn "satunnaiskäytössä".

Ja sitten kun Skylake-sukupolvesta kehitettiin vaikka kuinka monta viilattua uudempaa versiota (Kaby Lake, Coffee Lake, Whiskey Lake, Comet Lake), niin missään tätä ongelmaa ei saatu korjattua. Virransyötöstä ei saatu tehtyä järeämpää että prossu olisi kestänyt useamman AVX-512-käskyn suorituksen suurella kellolla ilman virransyöttöongelmia eikä kellotaajuuden laskemista saatu nopeutettua että stallailuaika olisi lyhentynyt.

Joten yhdistelmä markkinasegmenttiperseilyä (ei AVX512sta normaalissa halvahkossa työpöytäkoneessa tai läppärissä) sekä teknistä ongelmaa johti siihen, että käytännössä mitään softia ei optimoitu AVX-512lle, vaikka AVX-512 olisi voinut tarjota Intelille selvää kilpailuetua AMDhen nähden jos se olisi yleistynyt ennen kuin AMD saa omat AVX-512:sta tukevat prossunsa pihalle.

AMD sai AVX-512:sta tukevan prossunsa ulos vasta 5 vuotta Intelin jälkeen (zen4 2022) mutta teki implementaation joka oli maksiminopeudeltaan hitaampi kuin Intelin implementaatio, mutta ei sisältänyt mitään stallausongelmia ja oli joka tilanteessa hyödyllinen vaikka hyödyt jäi usein pieniksi, ja sitten 7 vuotta intelin jälkeen (2024) AMDllä on zen5ssaan markkinoiden paras(nopein) AVX512-tuki.

Ja mitä teki Intel... pari vuotta sen jälkeen kun se oli lopulta saanut tuon oman AVX512-virransyöttö-/stallausongelmansa ratkottua, ja myös tuotua markkinoille joitain uusia kuluttajaprossuja joissa AVX-512 on päällä, ja juuri kun AMDltä oli pian tulossa markkinoille AVX-512sta tukevia prossuja kaikissa markkinasegmenteissä(mikä parantaa softatukea selvästi), päättikin Intel kokonaan luopua AVX-512sta kuluttajaprossuissaan.

Ja nyt tilanne on, että AVX-512, Intelin oma teknologia, joka ei käytännössä koskaan tarjonnut merkittävää kilpailuetua Intelille AMDtä vastaan, tarjoaakin AMD:lle kilpailuedun AMD:tä vastaan.

Mercho · 25.07.2025

Dudem sanoi:
On kyllä Intel saanut itsensä aikamoiseen kuoppaan kaivettua. Toki omaa syytänsä ovat tässä tilanteessa.

Mitenköhän TSMC:llä riittää kapasiteettia jos Intelkin siirtyisi täysin heidän asiakkaaksi plus siihen päälle kaikki muut. Ei jotenkin tunnu järkevältä tilanteelta tämäkään, liian paljon yhden firman varassa.

Intel suurimman osan viime vuosikymmenestä ylimielisesti kitsaili ytimien ja säikeiden kanssa sekä teki 0-10 prosentin parannuksia prosessoreihinsa unohtamatta että emolevyjen kannat vaihtuivat tiuhaan täysin turhaan kun kokivat että Amd ei ole kilpailijaksi ja kokivat että nyt vuollaan kultaa.

Ei kuitenkaan ole tervettä että yksi iso kilpailija jää liikaa jälkeen ja onneksi ARM perustuvia prosessoreita on tulossa varteenotettavia vaihtoehtoja useammalta valmistajalta kohta myös pöytäkoneisiin ja kannettaviin jotka eivät ole Applen tekemiä, toki Amd on iso tekijä kaikilla rintamilla paitsi mobiilissa.

Kaotik · 25.07.2025

Mercho sanoi:
Intel suurimman osan viime vuosikymmenestä ylimielisesti kitsaili ytimien ja säikeiden kanssa sekä teki 0-10 prosentin parannuksia prosessoreihinsa unohtamatta että emolevyjen kannat vaihtuivat tiuhaan täysin turhaan kun kokivat että Amd ei ole kilpailijaksi ja kokivat että nyt vuollaan kultaa.

Ei kuitenkaan ole tervettä että yksi iso kilpailija jää liikaa jälkeen ja onneksi ARM perustuvia prosessoreita on tulossa varteenotettavia vaihtoehtoja useammalta valmistajalta kohta myös pöytäkoneisiin ja kannettaviin jotka eivät ole Applen tekemiä, toki Amd on iso tekijä kaikilla rintamilla paitsi mobiilissa.

Ei Intelin ongelmat prosessorien heikosta kehityksestä kumpua, vaan valmistusprosessien ongelmista, joiden kanssa se on paininut pian vuosikymmenen (10 nm piti alun perin tulla massatuotantoon 2016)

demu · 25.07.2025

Rikkana tähän Intelin rokkaan, SMT on tulossa takaisin tulevissa prosessorisukupolvissa ainakin palvelinprosessoreihin.
Vielä ei ole tietoa siitä, tuleeko se takaisin koko prosessorikantaan.

Eiköhän se AVX-512 myös jossakin vaiheessa tule takaisin kuluttajaprosessoreihinkin.

Intel CEO Confirms SMT To Return to Future CPUs

Intel today announced its Q2 results, and it was a bit of a mixed bag, with the earnings largely down and projections showing little overall growth for the foreseeable future. Ahead of this announcement, though, Intel's CEO, Lip Bu Tan, sent an internal memorandum to employees, which has since...

www.techpowerup.com

hkultala · 25.07.2025

Mercho sanoi:
Intel suurimman osan viime vuosikymmenestä ylimielisesti kitsaili ytimien ja säikeiden kanssa

Ei ihan näin.

Ensinnäkin, koko viime vuosikymmenen Intel nosti tasaisesti server-/HEDT-prossujensa ydin- ja säiemäärää eikä kitsaillut niiden ytimissä.

Mutta vaikka keskitytään vain kuluttajatuotteisiin, niin intel ei todellakaan kitsaillut ylimielisesti:

Vuodet 2010-2016 Intelillä oli jatkuvasti kuluttajamarkkinoilla suorittimia jotka ajoivat yhtä aikaa vähintään yhtä montaa säiettä kuin AMDnkin prossuilla, ja monena näistä vuosista Intel johti joko säie- tai ydinmäärässä AMDtä:

Jos tarkastellaan uusinta julkaistua tuotesukupolvea joka vuoden aikana ehti pihalle ja jota myytiin kuluttaja-työpöydälle, niin:

2010: Intel 6 ydintä, 12 säiettä, AMD 6 ydintä, 6 säiettä (intelillä enemmän säikeitä)
2011: Intel 4 ydintä, 8 säiettä, AMD 4 todellista ydintä, 8 säiettä, mutta markkinointi laski yhden ytimen kahdeksi
2012: Intel 4 ydintä, 8 säiettä, AMD 4 todellista ydintä, 8 säiettä, mutta markkinointi laski yhden ytimen kahdeksi
2013: Intel 4 ydintä, 8 säiettä, AMD 4 todellista ydintä, 8 säiettä, mutta markkinointi laski yhden ytimen kahdeksi
2014: Intel 4 ydintä, 8 säiettä, AMD 2 todellista ydintä, 4 säiettä, mutta markkinointi laski yhden ytimen kahdeksi (Intelillä enemmän säikeitä sekä todellisia ytimiä)
2015: Intel 4 ydintä, 8 säiettä, AMD 2 todellista ydintä, 4 säiettä, mutta markkinointi laski yhden ytimen kahdeksi (Intelillä enemmän säikeitä sekä todellisia ytimiä)
2016: Intel 4 ydintä, 8 säiettä, AMD 2 todellista ydintä, 4 säiettä, mutta markkinointi laski yhden ytimen kahdeksi (Intelillä enemmän säikeitä sekä todellisia ytimiä)
2017: Intel 6 ydintä, 12 säiettä, AMD 8 ydintä, 16 säiettä
2018: Intel 8 ydintä, 16 säiettä, AMD 8 ydintä, 16 säiettä
2019: Intel 10 ydintä, 20 säiettä, AMD 16 ydintä, 32 säiettä

sekä teki 0-10 prosentin parannuksia prosessoreihinsa

Säiekohtainen suorituskykyparannus jostain Westmerestä Sandy Bridgeen oli aika paljon parempi.

Mutta kun Sandy Bridge oli todella hyvä arkkitehtuuri niin sen jälkeen siitä oli paljon vaikeampi parantaa suuria parannuksia.

Ja samaan aikaan kun Intel teki erinomaisen Sandy Bridgen, AMD lähinnä vaan huononsi suorituskykyään Bulldozerillaan.

Eikä se Piledriverkaan bulldozerin päälle parantanut suorituskykyä juuri sen enempää, ja Piledriverin jälkeen seuraavat pari vuotta AMDllä mentiin vaan takapakkia suorituskyvyssä, Steamrollerista ja Excavatorista tuli pelkkiä läppäreihin optimoituja piirejä jotka olivat sekä yhden että monen säikeen suorituskyvyssä jopa piledriveria hitaampia (koska huonomman halvemman valmistustekniikan takia matalammat kellot, ja lisäksi vähemmän ytimiä koska ei edes yritetty tehdä työpöytäoptimoitua -end-piiriä koska ne olisivat olleet vaan sekä kalliita että hidaita eivätkä pärjännyt alkuunkaan Intelin high-end-työpöytä-piireille).

Intelillä taas joka sukupolvi Sandy Bridgen jälkeen oli silti selvää parannusta, vaikka Sandy Bridge oli ollut niin erinomainen kuin mitä se oli.

Mutta toki siinä vaiheessa (yli 5 vuotta Bulldozerin julkaisun jälkeen) kun AMD vihdoin pääsi eroon Bulldozer-johdannaisista, AMD pystyi kertaalleen tekemään suuren hypyn suorituskyvyssä - mutta edelleen se säiekohtainen suorituskyky oli zen1llä selvästi Skylaken takana.

AMD sai Intelin suurin piirtein kiinni säiekohtaisessa suorituskyvyssä vasta zen3lla, joka tuli loppuvuodesta 2020.

Ja lisäksi tosiaan intelin suunnitelmat meni pieleen siihen että tuo P1274-valmistusprosessi ei toiminut. Alkuperäisten suunnitelmien mukaan Cannon Laken (joka oli siis Skylake uudemmalla valmistustekniikalla) piti tulla jo 2016, ja työpöydälle viimeistään 2017, ja seuraavan aivan uuden arkkitehtuurin (Ice Lake/Sunny Cove) piti tulla työpöydälle 2018.

Mutta koska uusi valmistustekniikka sukkasi, kumpikaan näistä ei koskaan tullut työpöydälle ja sen sijaan työpöydälle (Skylaken viilattujen mallien lisäksi) pääsi ainoastaan Rocket Lake joka oli Ice Lake/Sunny Cove backportattuna vanhemmalle valmistustekniikalle, mikä viivästi sitä parilla vuodella ja huononsi sen suorituskyvyä alkuperäisestä suunnitelmasta.

Mikäli Intelillä valmistustekniikkakuviot ei olisi failanneet niin pahasti kuin ne failasivat, zen 2:sta vastassa olisi Inteliltä ollut Ice Lake/Sunny Cove joka ei olisi ollut vaan jonkin verran nopeampi (kuten 4 vuotta vanhaan Skylakeen pohjaava Comet Lake oli) vaan selvästi nopeampi, ja Zen3sta vastassa olisi ollut Tiger Lake (Ice laken jatkokehitelmä)

Mutta on melko typerää haukkua Inteliä siitä, että Intel ei Sandy Bridge-Skylake-välillä työpöydällä lisännyt ydinmäärää kun AMD tuolla välillä vaan vähensi omaa ydinmääräänsä koska pudotti high-end-työpöytä-mallit kokonaan pois parista sukupolvesta.

Intel keskittyi tuohon aikaan tekemään työpöytäprossuja jotka tarjoavat hyvän suorituskyvyn niillä softilla joita kuluttajat tositilanteessa työpöytäprossuillaaan ajamaan - tosimaailman softia, jotka oli huonosti säikeistetty, mutta tarjosi silti myös AMDtä paremmin suorituskyvyn myös niillä harvoilla hyvin säikeistetyillä softilla.

Vasta kun AMD Zen:llään hyppäsi kahdeksaan ytimeen meni AMD monen säikeen suorituskyvyssä ohi - mutta ne keskimääräiset kuluttajasoftat pyrivät silti Kaby lakella paremmin, koska ne eivät juurikaan hyötyneet kahdeksasta ytimestä.

Zen1 ei ollut kilpailukykyinen prossu joka pelasti AMDn koska siinä oli kahdeksan ydintä, vaan se oli kilpailukykyinen prossu ja pelasti AMDn koska sen yhden säikeen suorituskyky ei totaalisesti sukannut kuten AMDn aiemmilla bulldozer-johdannaisilla prossuilla yhden säikeen suorituskyky sukkasi, ja lisäksi se oli ihan pätevä energiatehokkuudeltaan. Sen suorituskyky oli riittävän lähellä Intelin suorituskykyä että kun AMD myi niitä jonkin verran Intelin prossuja halvemmalla hinnalla, se oli hyvä ostos (toisin kuin bulldozer, joka oli vaan liian hidas ja liian huono suoriotuskyky-virrankulutus-suhteeltaan)

Melko pieni osa myydyistä zen1stä oli niitä kahdeksan ytimen malleja. Itse toki yhden omistan, mutta sillä onkin oma tarinansa.

Ja oikeastaan tuo ensimmäinen zen1-piiri oli server-optimoitu piiri - kahden erillisen CCXn rakenne oli huono esim. pelejä ajatellen, mutta soveltui hyvin ajamaan suurta määrää erillisiä palvelinprosesseja jotka eivät jaa dataa keskenään. Mutta se saatiin myytyä myös työpöydälle koska se ei kuitenkaan sukannut työpöydälläkään ja osa kuluttajista halusi ostaa "moar coresia", ja osa ajoi oikeasti paljon monisäikeistettyä softaa jossa oikeasti hyötyi sen monesta ytimestä (mutta olisi hyötynyt enemmän, jos piirin L3-/CCX-arkkitehtuuri olisi ollut erilainen)

Vasta zen3n myötä AMD siirtyi L3-välimuistin osalta enemmän työpöytäoptimoituun rakenteeseen.

unohtamatta että emolevyjen kannat vaihtuivat tiuhaan täysin turhaan kun kokivat että Amd ei ole kilpailijaksi ja kokivat että nyt vuollaan kultaa.

Tämä on ihan paikkaansapitävää kritiikkiä.

Intel on perseillyt kun ei ole suunnitellut soketteihinsa käytännössä minkäänlaista yhteensopivuutta eri sukupolvien välillä. Soketti pitäisi vaihtaa/yhteensopivuus rikkoa vasta kun uusi sukupolvi oikeasti tarvii sitä, esim. uuden muistitekniikan tai erilaisen muistiväylän leveyden, tai uusien IO-väyläprotokollien takia.

Ei kuitenkaan ole tervettä että yksi iso kilpailija jää liikaa jälkeen ja onneksi ARM perustuvia prosessoreita on tulossa varteenotettavia vaihtoehtoja useammalta valmistajalta kohta myös pöytäkoneisiin ja kannettaviin jotka eivät ole Applen tekemiä, toki Amd on iso tekijä kaikilla rintamilla paitsi mobiilissa.

64-bittinen ARM on IMHO paras CPU-arkkitehtuuri, mutta Windows-ekosysteemissä se ei vaan toimi hyvin, koska kaikki softa on Windows-puolella käännetty x86lle ja ARM ei ole edes yrittänyt speksata viralliseen ARM-arkkitehtuurispeksiin sellaista muistin konsistenttiusmoodia joka tekisi x86n emuloinnista binäärikäännöksellä tehokasta ARMilla (Apple sen sijaan teki ihan itse omiin ARM-prossuihinsa oman x86-emulaatiota helpottavan toimintamoodin, mutta windows-puolella kukaan prossuvalmistaja ei käytännössä voi tehdä tällaista laajennosta itse koska windowsin pitäisi tukea sitä, ja microsoft käytännössä tukee sitä binäärikääntäjässään/emulaatiojärjestelmässään vain jos sen speksi tulee ARMilta)

Että ARM voisi oikeasti haastaa x86sta windows-puolella, ARMin pitäisi ottaa x86-emulointi tosissaan.

Jarnis · 25.07.2025

hkultala sanoi:
Että ARM voisi oikeasti haastaa x86sta windows-puolella, ARMin pitäisi ottaa x86-emulointi tosissaan.

Kiinnostavaa nähdä miten NVIDIA / Mediatek hoitavat tämän N1X:n kanssa...

Kaotik · 25.07.2025

Jarnis sanoi:
Kiinnostavaa nähdä miten NVIDIA / Mediatek hoitavat tämän N1X:n kanssa...

MediaTek käyttää standardeja Arm-ytimiä, en liikaa odottaisi siltä puolelta

hsalonen · 25.07.2025

hkultala sanoi:
Zen1 ei ollut kilpailukykyinen prossu joka pelasti AMDn koska siinä oli kahdeksan ydintä, vaan se oli kilpailukykyinen prossu ja pelasti AMDn koska sen yhden säikeen suorituskyky ei totaalisesti sukannut kuten AMDn aiemmilla bulldozer-johdannaisilla prossuilla yhden säikeen suorituskyky sukkasi, ja lisäksi se oli ihan pätevä energiatehokkuudeltaan. Sen suorituskyky oli riittävän lähellä Intelin suorituskykyä että kun AMD myi niitä jonkin verran Intelin prossuja halvemmalla hinnalla, se oli hyvä ostos (toisin kuin bulldozer, joka oli vaan liian hidas ja liian huono suoriotuskyky-virrankulutus-suhteeltaan)

AMD jumitti 5 vuotta jossain 28nm-32nm prosesseissa, koska Global Foundries ei vaan pystynyt parempaan. Ja joskus silloin muroaikoina/tämän foorumin syntyaikoina sinä vielä uskoit, että aina seuraava windowsin scheduleri vielä korjaa AMD:n prosessorin ongelmat. Kirjoitin muistaakseni ensimmäiseen näkemääni diaan, että jaettu fetch/decode on tyhmä idea, ja siitä on kohta 15v..

..mutta siis AMD jumitti tosiaan paikallaan 5 kokonaista vuotta ihan valmistusprosessienkin kanssa ja Zen nelinkertaisti transistorien määrän (tämä laskettu tyhmästi pinta-alasta ja nm skaalautumisesta lineaarisesti) . Olisi aika pahasti pitänyt mokata, jos tällä ei olisi saatu aitoa 8-ydintä. Lisäksi arkkitehtuuri uusittiin (ja ne maansiirtokoneet oli huonosti suunniteltu).

Sitten Intelille kävi suunnilleen sama ja ne jumittivat 14nm++(++) prosesseissa 5 vuotta, kun AMD puski eteenpäin. Niin Inteli käytännössä menetti etumatkansa, kun AMD:n PCIE 4.0 Ryzenit tulivat markkinoille ja Ryzen 5800X3D oli peleihinkin parempi.

Tässä AI:lla luotu taulukko, josta napsin osan pois. Tämä on täysin keskustelua tukemaan ja kuvituskuva. AI ei nyt argumentoi puolestani, selventää vaan sekavaa tekstiäni:

finWeazel · 26.07.2025

Huhumyllyn vuotaneita(ehkä todellisia, ehkä ei) nvidia/mediatek n1x cpu benchmarkkeja. Eihän tuo huhutulle 2026 julkaisulle enää mikään parhain mahdollinen tilanne ole, toisaalta läppäreistä kun puhutaan niin enemmän kiinnostaa reaalimaailman suorituskyky akunvarassa kuin maksimaalinen nopeus letkuruokinnassa

Nvidia's 20-core N1X leaks with 3000+ single-core Geekbench score — Arm chip could rival Intel and AMD's laptop offerings

But it's no match for Apple's M4 Max, yet...

www.tomshardware.com

Kai win11 arm emulaatio alkaa olemaan melkoisen hyvä. Päivityksessähän tuli simd käskyille(kin) tuki. Se mikä puuttuu niin kyky emuloida ajureita ja peleihin huijauksenestoja. Epic gamesiltä tulossa syksyllä fortnite win11 arm versio ja fortniten vaatiman huijaukseneston win11 arm versio. Mitä olen win11+arm:ia seurannut niin hyötysoftat mitä käytän taitaa kaikki löytyä jo arm-versioina.

At a technical level, the virtual CPU used by x64 emulated applications through Prism will now have support for additional extensions to the x86 instruction set architecture. These extensions include AVX and AVX2, as well as BMI, FMA, F16C, and others, that are not required to run Windows but have become sufficiently commonplace that some apps expect them to be present. You can see some of the new features in the output of a tool like Coreinfo64.exe.

Announcing Windows 11 Insider Preview Build 27744 (Canary Channel)

Hello Windows Insiders, today we are releasing Windows 11 Insider Preview Build 27744 to the Canary Channel. We are also not planning to release SDKs for 27xxx series builds for the time being. What’s

blogs.windows.com

hkultala · 26.07.2025

finWeazel sanoi:
Huhumyllyn vuotaneita(ehkä todellisia, ehkä ei) nvidia/mediatek n1x cpu benchmarkkeja. Eihän tuo huhutulle 2026 julkaisulle enää mikään parhain mahdollinen tilanne ole, toisaalta läppäreistä kun puhutaan niin enemmän kiinnostaa reaalimaailman suorituskyky akunvarassa kuin maksimaalinen nopeus letkuruokinnassa

Nvidia's 20-core N1X leaks with 3000+ single-core Geekbench score — Arm chip could rival Intel and AMD's laptop offerings

But it's no match for Apple's M4 Max, yet...

www.tomshardware.com

Kai win11 arm emulaatio alkaa olemaan melkoisen hyvä.

"kai". Ei ole, koska sitä oikasti hyvää emulaatiota on mahdotonta tehdä standardille ARMv8/ARMv9-käskykannalle.

finWeazel sanoi:
Päivityksessähän tuli simd käskyille(kin) tuki. Se mikä puuttuu niin kyky emuloida ajureita ja peleihin huijauksenestoja. Epic gamesiltä tulossa syksyllä fortnite win11 arm versio ja fortniten vaatiman huijaukseneston win11 arm versio. Mitä olen win11+arm:ia seurannut niin hyötysoftat mitä käytän taitaa kaikki löytyä jo arm-versioina.

Kun emuloitavalla arkkitehtuurilla on tiukemmat muistin konsistenttiussäännöt kuin arkkitehtuurilla, jolle se koodi binäärikäännetään, on binäärikääntäjän pakko lisätä koodin sekaan paljon fence-käskyjä että koodi ei hajoa.

Ja nämä fence-käskyt hidastavat koodia selvästi.

Eikä tähän ole mitään "tehdään vaan emulaattorista parempi"-ratkaisuita. Jos niitä fence-käskyjä yritetään lisätä sinne vähemmän, niin sitten kaikki koodi ei vaan toimi oikein.

Ainoa oikea (hyvän suorituskyvyn tarjoava) ratkaisu on se, että binäärikäännetään koodi sellaiselle arkkitehtuurille, jossa muistin konsistenttiussäännöt on vähintään yhtä tiukat kuin emuloitavassakin arkkitehtuurissa, eli siis lisätään arkkitehtuuriin uusi toimintamoodi jossa nämä konsistenttiussäännöt on vähintään yhtä tiukat kuin emuloitavassa arkkitehtuurissa

Apple teki tämän, ja sillä suorituskyky on hyvä myös x86-emulaatiolla.

Mutta alkaa mennä kausas säikeen aiheesta.

JiiPee · 27.07.2025

finWeazel sanoi:
Kai win11 arm emulaatio alkaa olemaan melkoisen hyvä. Päivityksessähän tuli simd käskyille(kin) tuki. Se mikä puuttuu niin kyky emuloida ajureita ja peleihin huijauksenestoja. Epic gamesiltä tulossa syksyllä fortnite win11 arm versio ja fortniten vaatiman huijaukseneston win11 arm versio.

Eli se emulaatio ei vaan yksinkertaisesti riitä koska sekaan väännetään ihan natiivia käännöksiä. Muutenkin tämä postaus vaikuttaa taas kerran siltä tyypillisestä: Minä luputan Papa J tissiä ja tulin kertomaan miten hienoja systeemeitä Papa J osaa tehdä."

finWeazel · 27.07.2025

hkultala sanoi:
"kai". Ei ole, koska sitä oikasti hyvää emulaatiota on mahdotonta tehdä standardille ARMv8/ARMv9-käskykannalle.

Täydellinen on riittävän hyvän pahin vihollinen. Mun käytössä ei tule mieleen pelien ulkopuolelta softaa mitä käytän josta ei löydy arm win11:lle natiiviversiota. Tämä ei minua haittaa kun en pelaa läppärillä, jos pelaisin läppärillä niin geforce now ennemmin kuin peliläppäri. Mulle läppäri on akunvarassa käytettävä laite, ei desktop korvike. Mun linkkaama tuki "erikoiskäskyille" oli kirsikka kakun päälle, kun se mahdollisti ison määrän softia joita aikaisemmin ei voitu emuloida.

Qualcomin statistiikkaa puolen vuoden takaa. 90% ajasta käyttäjät käyttävät natiivisoftaa qualcomin arm win11 läppäreissä: Qualcomm Snapdragon X Series: 90% of app usage now native - Technobaboy

hkultala · 27.07.2025

finWeazel sanoi:
Täydellinen on riittävän hyvän pahin vihollinen. Mun käytössä ei tule mieleen pelien ulkopuolelta softaa mitä käytän josta ei löydy arm win11:lle natiiviversiota. Tämä ei minua haittaa kun en pelaa läppärillä, jos pelaisin läppärillä niin geforce now ennemmin kuin peliläppäri. Mulle läppäri on akunvarassa käytettävä laite, ei desktop korvike. Mun linkkaama tuki "erikoiskäskyille" oli kirsikka kakun päälle, kun se mahdollisti ison määrän softia joita aikaisemmin ei voitu emuloida.

Qualcomin statistiikkaa puolen vuoden takaa. 90% ajasta käyttäjät käyttävät natiivisoftaa qualcomin arm win11 läppäreissä: Qualcomm Snapdragon X Series: 90% of app usage now native - Technobaboy

Melkoista maalitolppien siirtelyä.

Ensin postasit paskaa siitä, että emulaatio on muka hyvä, ja kun selitin teknisen syyn, miksei se ei voi olla hyvä, aloit siirtelemään maalitolppia että sillä emulaation laadulla ei olekaan väliä.

Ja tosiaan, jos koneella ajaa lähinnä pelkkää webbiselainta, sähköposticlienttia ja pikaviestintä, voi siinä aivan hyvin ajaa jotain muuta käyttistä kuin windowsia, esim. chromeOSää, Androidia tai jotain normaalia Linux-distribuutiota tms. Windowsia käytetään nimenomaan sen takia, että siinä pyörii ne vanhat windows-softat (jotka on lähinnä vain x86-binääreinä)

Ja tosiaan totaalisen offtopiccia tässä säikeessä.

Lebensraum · 27.07.2025

Eikös tuo Geekbench ole ihan romu testi osoittamaan yhtään mitään? Senkö takia sitä aina esitellään, kun ainoa jossa hedelmä pärjää?

finWeazel · 29.07.2025

Lebensraum sanoi:
Eikös tuo Geekbench ole ihan romu testi osoittamaan yhtään mitään? Senkö takia sitä aina esitellään, kun ainoa jossa hedelmä pärjää?

Onhan tuo hedelmä ihan nopea esim. cinebench:ssa myös. Allekirjoittaneen cinebench tulos 14" macbook pro m4 max:lla kuvassa. Jos jotain reaalimaailman juttuja haluaa niin upean nopea tuo m4 max kääntämään koodia,... myös akun varassa ilman että suorituskyky tankkeroi tai akku tyhjä puolessa tunnissa.

Toki omena jää jälkeen kun laitetaan lisää watteja&coreja ja mennään raskaisiin pöytä/serverikoneisiin. Työkalu tarpeen mukaan, kaikki työkalut ei ole vasaroita. Toisinaan on myös ruuveja ja muttereita kuviossa mukana.

hkultala · 29.07.2025

Lebensraum sanoi:
Eikös tuo Geekbench ole ihan romu testi osoittamaan yhtään mitään? Senkö takia sitä aina esitellään, kun ainoa jossa hedelmä pärjää?

Ei; Se on ihan kohtalaisen hyvä testisetti mittaamaan suorituskykyä natiivikoodilla. Siellä on testisetissä monta ihan oikeaa järkevää algoritmia ja kokonaistulos lasketaan niistä järkevästi.

Paljon kattavampi kuin joku Cinebench, joka on vain yksi softa jonka optimoinnit on useaan otteeseen olleet kyseenalaisella tasolla.

Mutta Windows-maailmassa pitää huomioida, että huomattava osa softista on x86-softia ja binäärikäännöksessäkin on huomattava hidastus. Se, että geekbench antaa hyvää tulosta ei vielä takaa mitään niiden omien softien pyörimisestä hyvin, jos omat softat löytyykin vain x86-binääreinä. Mutta ihan sama ongelma on vaikka natiivina ajaisi mitä tahansa benchmarkkia.

Ja Userbenchmark on se totaalisen biasoitunut, tyhmiä testejä sisältävä ja typerästi/epärehellisesti kokonaistuloksen laskeva testi jonka tuloksia ei pitäisi käyttää yhtään mihinkään vertailuihin.

finWeazel · 29.07.2025

hkultala sanoi:
Mutta Windows-maailmassa pitää huomioida, että huomattava osa softista on x86-softia ja binäärikäännöksessäkin on huomattava hidastus.

Tämä ei taida kuitenkaan olla mikään iso ongelma arm win11 yleistymiselle kun miettii miten pieni markkinaosuus laitteilla on suhteessa asiakasmäärään joille laite kelpaisi teoriassa. Win11 arm lähinnä(qualcom) myydään läppäreihin eikä desktop-käyttöön. Käyttäjäryhmä jolle win11+arm tällaisenaan on jo hyvä vaihtoehto on melko iso. Loput niche-käyttötapaukset aika hoitaa jos arm lähtee yleistymään.

Mulle tärkeät softat ja ominaisuudet joita haluan ajaa läppärissä löytyy 100% win11+arm

käyttis+ajurit löytyy. Ei ole jotain iänvanhaa skanneria, printteriä tms. jolle olisi vain x86 ajuri
Selain, google docs yms.
vscode, cursor ai, kääntäjät, python, 7zip yms.
unreal engine ja unity natiiviversiot
Skylum luminar neo ja affinity photo 2 valokuvien käsittelyyn
davinci resolve studio videoihin
steam peleistä riittävän iso osa toimii arm-versioina ettei se ole ongelma. Pelit joka tapauksessa pelaan pumpump laatikolla missä 5090:en, läppärillä vain jotain erittäin kevyttä kasuaalipeliä
- Pelipuolelle fortnite+epic anti cheat tulossa syksyllä, tämä lienee monelle tärkeä peli mitä pelataan myös läppäreillä.

Ei nyt ihan heti tule mieleen softaa mitä käyttäisin ja mikä olisi show stopper kun löytyy vain x86-versio. Jos joku hassu softa on mitä tarvii erittäin harvoin niin emulaatio riittänee.

Lebensraum · 29.07.2025

hkultala sanoi:
Ei; Se on ihan kohtalaisen hyvä testisetti mittaamaan suorituskykyä natiivikoodilla. Siellä on testisetissä monta ihan oikeaa järkevää algoritmia ja kokonaistulos lasketaan niistä järkevästi.

Paljon kattavampi kuin joku Cinebench, joka on vain yksi softa jonka optimoinnit on useaan otteeseen olleet kyseenalaisella tasolla.

Mutta Windows-maailmassa pitää huomioida, että huomattava osa softista on x86-softia ja binäärikäännöksessäkin on huomattava hidastus. Se, että geekbench antaa hyvää tulosta ei vielä takaa mitään niiden omien softien pyörimisestä hyvin, jos omat softat löytyykin vain x86-binääreinä. Mutta ihan sama ongelma on vaikka natiivina ajaisi mitä tahansa benchmarkkia.

Ja Userbenchmark on se totaalisen biasoitunut, tyhmiä testejä sisältävä ja typerästi/epärehellisesti kokonaistuloksen laskeva testi jonka tuloksia ei pitäisi käyttää yhtään mihinkään vertailuihin.

Appleshillien youtubevideot väsyttää. Siellä kun etsii jotain, vaikkapa M4 vs Nvidia videorevikkaa, jokaisessa videossa tismalleen sama käsikirjoitus ja piilotellaan useita asioita.

Sekä ajetaan vaikkapa softan ilmaisversiota, jossa ei CUDAt käytössä. :kahvi:

Noita saman käsikirjoituksien ja tyylin videoita kymmeniä. Kai noihinkin jotkut lankeaa sitten, eivätkä näe mikä on maksettu mainos ja mikä ns. puolueetonta testaamista.

finWeazel · 29.07.2025

Lebensraum sanoi:
Appleshillien youtubevideot väsyttää. Siellä kun etsii jotain, vaikkapa M4 vs Nvidia videorevikkaa, jokaisessa videossa tismalleen sama käsikirjoitus ja piilotellaan useita asioita. Sekä ajetaan vaikkapa softan ilmaisversiota, jossa ei CUDAt käytössä.

Noita saman käsikirjoituksien ja tyylin videoita kymmeniä. Kai noihinkin jotkut lankeaa sitten, eivätkä näe mikä on maksettu mainos ja mikä ns. puolueetonta testaamista.

Shilli tai ei mutta mun käytössä m4 max macbook pro:n gpu aavistuksen hitaampi/samaa tasoa kuin 3070fe desktop versio. Mittareina topaz video ai, topaz photo ai, davinci resolve, skylum luminar neo. Suurinpiirtein samoja odotusaikoja eri operaatioihin. Ero niin pieni että käyttäjän perspektiivistä tuntuvat samalta.

Sinällään kun tämä on CPU ketju niin cuda:lla ja gpu:lla ei pitäisi hirveästi olla oikeasti merkitystä.

Voi hyvin olla, että vaihdan seuraavan läppärin macbook pro:sta arm+win11/win12:een. Sillä hetkellä kun olin konetta ostamassa niin ei ollut sellaista win11 läppäriä olemassa missä olis sekä tehot riittänyt ja akku kestänyt. Nyt voi olla jo toisin kun amd:lta on tullut järeä apu ja tietty nvidia n1x tulee 2026 alkupuolella. Qualcomilla taitaa olla ajuripuolessa tehtävää mitä lukenut käyttäjien kokemuksia kuva ja videoeditoinnista. Tosin ei macbookkia varmaan tule päivitettyä todella pitkään aikaan kun sen mitä macbook ei jaksa hoitaa matkan varrella hoitaa pumpum-laatikko 5090:lla kotiin päästyä.

Infy · 30.07.2025

Applen hyvästä suorituskyvystä osa tulee siitä, että Applen softat käännetään Applen optimoimalla kääntäjällä joka optimoi koodin juuri nimenomaan Applen omalle ARM-ytimille parhaaksi mahdolliseksi.

Windows softat (ml. Geekbench ja Cinebench) käännetään yleensä Microsoftin geneerisellä Visual Studiolla. Intelillä ja AMD:lla toki on omat kääntäjänsä, jotka tuottavat optimaalista koodia heidän omalle raudalleen, muuta niitä harvemmin näkee käytettävän.

hkultala · 04.08.2025

Infy sanoi:
Applen hyvästä suorituskyvystä osa tulee siitä, että Applen softat käännetään Applen optimoimalla kääntäjällä joka optimoi koodin juuri nimenomaan Applen omalle ARM-ytimille parhaaksi mahdolliseksi.

Ei. Nykyaikaisilla OoOE-prossuilla kääntäjän käskyskedulerin vaikutus suorituskykyyn jää hyvin pieneksi, ja Apple käyttää kääntäjänä ihan LLVMää.

Ja muutokset mitä Apple on omaan LLVM-versioonsa backend-puolelle tehnyt on käsittääkseni hyvin pieniä.

Infy sanoi:
Windows softat (ml. Geekbench ja Cinebench) käännetään yleensä Microsoftin geneerisellä Visual Studiolla. Intelillä ja AMD:lla toki on omat kääntäjänsä, jotka tuottavat optimaalista koodia heidän omalle raudalleen, muuta niitä harvemmin näkee käytettävän.

AMDllä ei ole kymmeniin vuosiin ollut CPUillensa omaa kääntäjää, ja Intelin oma kääntäjä ei ole pitkiin aikoihin tehnyt merkittävästi nopeampaa koodia kuin muut kääntäjät. Lähinnä Intelin kääntäjään saattaa tulla tuki intelin uusille käskykantalaajennoksilla vähän muita kääntäjiä aiemmin.

Barbarossa · 04.08.2025

Infy sanoi:
Windows softat (ml. Geekbench ja Cinebench) käännetään yleensä Microsoftin geneerisellä Visual Studiolla. Intelillä ja AMD:lla toki on omat kääntäjänsä, jotka tuottavat optimaalista koodia heidän omalle raudalleen, muuta niitä harvemmin näkee käytettävän.

Intelin ReiluPeli™-kääntäjällä käännetty softa perinteisesti myös käytti minimaalisesti optimoitua koodia kun sitä ajettiin muulla kun Intelin prossulla.. saattoivat poistaa ko. ominaisuuden vähin äänin jäätyään kiinni mutta en näe ongelmana että tällaista sontaa ei käytetä yleisesti jaettuun softaan.

hkultala · 04.08.2025

finWeazel sanoi:
Shilli tai ei mutta mun käytössä m4 max macbook pro:n gpu aavistuksen hitaampi/samaa tasoa kuin 3070fe desktop versio. Mittareina topaz video ai, topaz photo ai, davinci resolve, skylum luminar neo.

Eli listallasi ei siis yhtään ole 3d-graffa-benchmarkkia.

finWeazel sanoi:
Suurinpiirtein samoja odotusaikoja eri operaatioihin. Ero niin pieni että käyttäjän perspektiivistä tuntuvat samalta.

Itse GPU on selvästi hitaampi, mutta kun se on paljon nopeamman väylän päässä ja käyttää samaa muistia kuin CPU, kaikki overheadit datansiirtelyyn on paljon pienemmät, ja GPGPU-käytössä jossa CPU- ja GPU-puolen pitää ronkkia paljon samaa dataa, päästään käytännössä saman luokan kokonaisnopeuksiin, kun se 3070 idlaa huomattavan osan ajasta odotellessaan dataa CPU:lta.

Itse graffanpiirrossa se applen integroitu näyttis on kuitenkin selvästi hitaampi, siinä näillä overheadeilla on vähemmän väliä.

Jos viitsisit kokeilla pelata sillä jotain tai ajaa jotain puhtaita graffabenchmarkkeja, huomaisit kyllä tämän.

Applen GPU on siis enemmän optimoitu rinnakkaislaskennan kiihdyttimeksi kuin GPUksi.

Virallinen: AMD vs Intel keskustelu- ja väittelyketju

Conducător & Geniul din Carpați

Kapteeni pienkonekorjaaja

Se ainoa oikea

BANNATTU

Kapteeni pienkonekorjaaja

BANNATTU

BANNATTU

Conducător & Geniul din Carpați

Intel will cancel 14A and following nodes if it can't win a major external customer​

BANNATTU

Intel will cancel 14A and following nodes if it can't win a major external customer​

BANNATTU

Banhammer

Conducător & Geniul din Carpați

BANNATTU

Banhammer

BANNATTU

BANNATTU

BANNATTU

BANNATTU

BANNATTU

BANNATTU

BANNATTU

Uutiset

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi

Intel will cancel 14A and following nodes if it can't win a major external customer

Intel will cancel 14A and following nodes if it can't win a major external customer