Intel kutisti 12. sukupolven Core-prosessoreiden kanssa toimimattomien pelien listan kolmeen

Diizzel

Ylläpidon jäsen
Liittynyt
29.10.2016
Viestejä
2 233
intel-12th-gen-core-preorder-20211028.jpg


Diizzel kirjoitti uutisen/artikkelin:
Uutisoimme marraskuussa Intelin julkaisemasta listasta pelejä, joiden kopiosuojauksilla oli yhteensopivuusongelmia uusien 12. sukupolven Core-prosessoreiden kanssa. Tuolloin listauksessa oli vielä useita kymmeniä pelejä, mutta nyt tilanne on kuitenkin selvästi paranemaan päin.

Reilussa kuukaudessa Intel ja pelinkehittäjät ovat onnistuneet korjaamaan kopiosuojauksen ongelmat uusien prosessoreiden kanssa useimmista alun perin listalta löytyneistä peleistä ja tällä hetkellä tiedossa olevia ongelmia on enää Assassin’s Cree Valhallassa, Fernbus Simulatorissa ja Madden 22:ssa. Noidenkin pelien pelaaminen on kuitenkin mahdollista edelleen myös ennen niiden päivittymistä niin sanotulla Scroll Lock -menetelmällä, joka kytkee prosessorin vähävirtaisemmat E-ytimet pois käytöstä.

Yhteensopivuusongelmien taustalla on ollut Intelin uutuusprosessorien rakenne, joka pohjautuu kahden tyyppisiin prosessoriytimiin – tehokkaampiin P-ytimiin ja vähävirtaisempiin E-ytimiin. Osa pelien kopiosuojauksista tulkitsi virheellisesti nämä E-ytimet toiseksi tietokoneeksi, minkä myötä kopiosuojaus esti pelien pelaamisen tai aiheutti niiden satunnaista sammumista.

Lähde: Intel

Linkki alkuperäiseen juttuun
 
Techspotin Rob Thubronin mukaan myös Valhalla toimii ilman BIOS pätsejä / säätämistä
"I have been enjoying AC: Valhalla on my new Core i7-12700K (Windows 11) system since the weekend—it runs like a dream, by the way—and without using the workaround, so it seems that Intel hasn’t updated the list yet "
 
Hatunnosto Intelille ja pelinkehittäjille. Kun tahtoa vain on, niin kaikki on mahdollista. Tämä korjausliike nähtävästi kattaa myös Intelin tulevatkin arkkitehtuurit, sillä Intel on luultavasti todennut Alder Lake-S:n olleen kaikin puolin menestys ja Raptor Lake-S:ssäkin on samankaltainen ydinjärjestelmä.
 
En ymmärrä miksi Intel on päätynyt työpöytäpuolella toteuttamaan osan prosessoriytimistä eri tekniikalla.
Onko tehty vain sen takia, että Intelin valmistustekniikalla virrankulutus ampuu katosta läpi, jos laitetaan esim. 16-24 P-ydintä?
Ehkäpä näillä heikommilla ytimillä saadaan tuotteesta parempaa katetta?

AMD:lla kellotaajudet skaalaavat ja tehonkulutus laskee kevyellä rasituksella tai idlenä ihan riittävästi. Saa nähdä päätyykö AMD kuitenkin jatkossa samankaltaisiin ratkaisuihin vai jääkö tuo Intelin omituisuudeksi.

Älypuhelimissa ymmärrän tuon ratkaisun kun tehonkulutus pitää saada minimoitua esim. silloin kun puhelin on käyttämättömänä.

Haluan jatkossakin ostaa semmoisia prosessoreita, joissa olisi pelkästään "täysiverisiä" ytimiä.
 
En ymmärrä miksi Intel on päätynyt työpöytäpuolella toteuttamaan osan prosessoriytimistä eri tekniikalla.
Onko tehty vain sen takia, että Intelin valmistustekniikalla virrankulutus ampuu katosta läpi, jos laitetaan esim. 16-24 P-ydintä?
Ehkäpä näillä heikommilla ytimillä saadaan tuotteesta parempaa katetta?
Enemmän suorituskykyä samalla energiankulutuksella ja piipinta-alalla. Muutenkin tuollainen 16-24 P-ydintä on mahdotonta tehdä. Lastu olisi valtavan kokoinen, nykyinen on 215mm^2 ja tuo tuplaantuisi. Watteja kuluisi 400-600W maksimibuustilla(25W per ydin) eikä edes ringbus veny noin moneen ytimeen. E-ytimet ovat neljän clustereissa, yksi cluster korvaa yhden P-ytimen pinta-alan ja tehonkulutuksen suhteen mutta tuottaa 50% enemmän monisäikeistyvää suorituskykyä. Alder Laken seuraaja Raptor Lake lisää juurikin E-ytimien määrää, P-ytimien lukumäärä pysyy samana.
 
Uutista sivuten, onko nuo e-ytimet pois kytkettävissä?
On.
En ymmärrä miksi Intel on päätynyt työpöytäpuolella toteuttamaan osan prosessoriytimistä eri tekniikalla.
Onko tehty vain sen takia, että Intelin valmistustekniikalla virrankulutus ampuu katosta läpi, jos laitetaan esim. 16-24 P-ydintä?
Ehkäpä näillä heikommilla ytimillä saadaan tuotteesta parempaa katetta?
Niitä E-ytimiä menee neljä about samaan tilaan kuin yksi P-ydin. Kuluttavat helvetisti vähemmän eikä se suorituskykyero ole mikään maailman isoin tosiaan, kellolla kellolle noi E:t on Skylakea nopeampia
 
Viimeksi muokattu:
Enemmän suorituskykyä samalla energiankulutuksella ja piipinta-alalla. Muutenkin tuollainen 16-24 P-ydintä on mahdotonta tehdä. Lastu olisi valtavan kokoinen, nykyinen on 215mm^2 ja tuo tuplaantuisi. Watteja kuluisi 400-600W maksimibuustilla(25W per ydin) eikä edes ringbus veny noin moneen ytimeen. E-ytimet ovat neljän clustereissa, yksi cluster korvaa yhden P-ytimen pinta-alan ja tehonkulutuksen suhteen mutta tuottaa 50% enemmän monisäikeistyvää suorituskykyä. Alder Laken seuraaja Raptor Lake lisää juurikin E-ytimien määrää, P-ytimien lukumäärä pysyy samana.
Mahdotonta? AMD Ryzen 9 5950X, AM4, 3.4 GHz, 16-Core, Boxed - 819,00€
 
Lukutaidossa parantamisen varaa? Kysyttiin miksei Alder Lakessa voisi olla 16-24P-ydintä. Vastasin miksei ole ja sinä postailet raiseni linkkejä. Ei mitään tekemistä asian kanssa.
Tarkkaan kun lukee viestejä niin niissä ei spesifioida Alder Lakea suoraan. Puhutaan vain miksei voisi olla enemmän P-ytimiä (jotka siis ennen Alder Lakea kutsuttiin ihan vain ytimiksi).
 
Tarkkaan kun lukee viestejä niin niissä ei spesifioida Alder Lakea suoraan. Puhutaan vain miksei voisi olla enemmän P-ytimiä (jotka siis ennen Alder Lakea kutsuttiin ihan vain ytimiksi).
Ihanko oikeasti kuvittelet etten ole tietoinen 16-ydin prossujen olemassaolosta, kaupoissa on 64-ydin threadrippereitäkin. Järki nyt käteen.
 
Tarkkaan kun lukee viestejä niin niissä ei spesifioida Alder Lakea suoraan. Puhutaan vain miksei voisi olla enemmän P-ytimiä (jotka siis ennen Alder Lakea kutsuttiin ihan vain ytimiksi).
Ihan samalla tavalla niitä E-ytimiä kutsuttiin ihan vain ytimiksi aiemmin.
Ei ole mitään "p-ydinten kategoriaa" tai "e-ydinten kategoriaa" tms, on vain ytimiä. Intel päätyi käyttämään näitä nimiä koska samassa piirissä on kahdenlaisia ytimiä. Yhtä hyvin se olisi voinut puhua Cove- ja Mont-ytimistä tai vaikka ihan Golden Cove- ja Gracemont-ytimistä.
 
Ihan samalla tavalla niitä E-ytimiä kutsuttiin ihan vain ytimiksi aiemmin.
Ei ole mitään "p-ydinten kategoriaa" tai "e-ydinten kategoriaa" tms, on vain ytimiä. Intel päätyi käyttämään näitä nimiä koska samassa piirissä on kahdenlaisia ytimiä. Yhtä hyvin se olisi voinut puhua Cove- ja Mont-ytimistä tai vaikka ihan Golden Cove- ja Gracemont-ytimistä.
Normaaleita täyttä tehoa tarjoavia ytimiä ja virransäästöytimiä. Ei mun 8700K:ssa mitään virransäästöytimiä ole.
 
Normaaleita täyttä tehoa tarjoavia ytimiä ja virransäästöytimiä. Ei mun 8700K:ssa mitään virransäästöytimiä ole.
Ne "virransäästöytimet" on yhtä nopeita tai nopeampia kuin sinun 8700K:n ytimet kellolla kellolle.
Bonuksena ne tarjoavat helvetisti enemmän tehoa per transistori ja watti, negatiivisena niihin ei ole lisätty HT-tukea tai tähdätty mihinkään prosessin rajoilla oleviin 5 GHz kelloihin (mikä söisi lisää transistoreja)
 
Bonuksena ne tarjoavat helvetisti enemmän tehoa per transistori ja watti, negatiivisena niihin ei ole lisätty HT-tukea tai tähdätty mihinkään prosessin rajoilla oleviin 5 GHz kelloihin (mikä söisi lisää transistoreja)

Negatiivisena voi myös pitää (hidasta) ratkaisua joilla ne E-ytimet on yhteydessä toisiinsa, pinta-alaa ja virtaa säästääkseen. Vaikka silloin toki puhutaan enemmän koko kompleksin suunnittelusta eikä vain ytimistä.
 
Ne "virransäästöytimet" on yhtä nopeita tai nopeampia kuin sinun 8700K:n ytimet kellolla kellolle.
Eli pidät hyvänä asiana sitä että vuonna 2021 lippulaivaprossusta puolet toimii neljä vuotta vanhan prossun nopeudella?
 
Eli pidät hyvänä asiana sitä että vuonna 2021 lippulaivaprossusta puolet toimii neljä vuotta vanhan prossun nopeudella?

Näin vastausvuoron varastaen: Jos se kokonaisuus on sen takia nopeampi, niin ehdottomasti.

Ellen ihan väärässä ole, niin tuo Intelin uusi iso ydin on selvästi markkinoiden tehokkain yksittäinen ydin. Ja, aika monessa käyttökohteessa tarvitaan myös tuota maksimaalista yhden ytimen suorituskykyä.

Koska se maksimitehonkulutus on ihan oikea rajoite myös työpöydällä, niin oikeasti vaihtoehtoina ei ole sitä 16 erittäin tehokasta ydintä, vaan vaikkapa:

- 8 erittäin tehokasta ydintä ja 8 siedettävän tehokasta ydintä
tai
- 10 erittäin tehokasta ydintä
tai
- 16 tehokasta ydintä

Tässä esimerkissä vaikkapa mielivaltaisesti, näistä ensimmäinen tarjoaa ilmeisen usein parhaan suorituskyvyn 1–8 ja viimeistään 12+ säikeellä, häviten vain tuossa noin 9–11 säikeen välillä tuolle toiselle (ja joskus jääden vain tasoihin 25–32 säikeen välillä viimeisen kanssa, mutta ollen selvästi nopeampi 1–8 säikeellä).

Minkä valitset?

Siihen on ihan syynsä miksi nuo hybridiarkkitehtuurit ovat viime vuosina yleistyneet.

PS. Itse en myöskään ole yllättynyt siitä, että noissa siedettävän tehokkaissa ytimissä ei ole turhaan SMT-teknologiaa. Ideana on maksimihyötysuhde järkevällä suorituskyvyllä. Ja, tuolla kriteerillä enemmän noita ”pieniä” ytimiä on parempi kuin vähemmän mutta SMT:llä.
 
16 erittäin tehokasta ydintä, kiitos.

Mihin tarvii 16 tehokasta ydintä? Jos miettii rinnakkaistuvia taskeja kuten koodin kääntämistä tai vaikka renderöintiä niin paremman reaalimaailman suorituskyvyn saa niiden pienempien ytimien ja tehoytimien sekoituksella. Oletan toki, että transistorimäärä ja jäähdytysbudjetti eivät muutu. 8 tehocorea riittänee huonosti rinnakkaistuville taskeille ja loput ryynätään rinnakkaisesti pienemmillä ytimillä energia ja transistoribudjettia tehokkaasti hyödyntäen.

Siihe on hyvä syy, että raptorlaken huhutaan olevan 8+16 ratkaisu.
 
Viimeksi muokattu:
Mihin tarvii 16 tehokasta ydintä? Jos miettii rinnakkaistuvia taskeja kuten koodin kääntämistä tai vaikka renderöintiä niin paremman reaalimaailman suorituskyvyn saa niiden pienempien ytimien ja tehoytimien sekoituksella. Oletan toki, että transistorimäärä ja jäähdytysbudjetti eivät muutu. 8 tehocorea riittänee huonosti rinnakkaistuville taskeille ja loput ryynätään rinnakkaisesti pienemmillä ytimillä energia ja transistoribudjettia tehokkaasti hyödyntäen.

Siihe on hyvä syy, että raptorlaken huhutaan olevan 8+16 ratkaisu.
Paremman reaalimaailman suorituskyvyn (ja erityisesti suorituskyvyn/Watti) saa laittamalla paljon tehoytimiä mutta laskemalla yhden tehoytimen kelloja.
Intel Core i9-12900K kuluttaa esim. POV-Ray-testissä liki saman wattimäärän (pahimmillaan 272W) kuin Threadripper 3990X tai EPYC 7763 (molemmat 280W). Jäähdytysbudjetti siis käytännössä sama.

Kummankohan ratkaisun arvion olevan tehokkaampi?

Toki prosessorin hinnat (ja transistorimäärät) ovat aika eri kategoriassa, mutta kun renderöintiä tehdään vakavasti (eikä vain foorumikeskustelussa peliprosessoreiden nokittelukisassa), ei silloin peliprosessoreita käytetä.
Eikä Intelkään tule tulevissa server/workstation Sapphire Rapids -prosessoreissa käyttämään kuin P-ytimiä vastaavia tehoytimiä.

1639167393385.png
 
Paremman reaalimaailman suorituskyvyn (ja erityisesti suorituskyvyn/Watti) saa laittamalla paljon tehoytimiä mutta laskemalla yhden tehoytimen kelloja.

Ei saa.

Niitä pikkuytimiä saa samaan tilaan 4x enemmän joten samalla hinnalla on aina varaa laittaa niitä pikkuytimiä vaikka 4x enemmän,
jolloin on varaa laskea niidenkin kelloa - vieläpä vielä enemmän kuin niiden isojen ytimien.

Ja se energiatehokkuusero niiden pikkuytimien ja isojen välillä on muutenkin niin moninkertainen että pienellä kellotaajuuksien laskulla ei sitä saada kiinni.

Intel Core i9-12900K kuluttaa esim. POV-Ray-testissä liki saman wattimäärän (pahimmillaan 272W) kuin Threadripper 3990X tai EPYC 7763 (molemmat 280W). Jäähdytysbudjetti siis käytännössä sama.

Kummankohan ratkaisun arvion olevan tehokkaampi?

Sen, jossa on vähemmän todella järeitä ja todella paljon energiaa kuluttavia Golden Cove-ytimiä ja enemmän pienempiä ja vähävirtaisempia zen2/zen3-ytimiä?

Toki prosessorin hinnat (ja transistorimäärät) ovat aika eri kategoriassa, mutta kun renderöintiä tehdään vakavasti (eikä vain foorumikeskustelussa peliprosessoreiden nokittelukisassa), ei silloin peliprosessoreita käytetä.
Eikä Intelkään tule tulevissa server/workstation Sapphire Rapids -prosessoreissa käyttämään kuin P-ytimiä vastaavia tehoytimiä.

1639167393385.png

Oleellista on se, että Intel on ottanut asenteen, että työpöytäprossun ei tarvi tukea AVX-512sta, mutta serveriprossun täytyy tukea AVX-512sta.

Koska järjestelmän kaikkien ytimien pitää tutkea samaa käskykantaa, ja Intelillä ei ole valmiina AVX-512aa tukevaa pikkuydintä, piti AVX-512 disabloida kuluttajaprossuista, ja jättää pikkuytimet pois serveriprossuista.
 
Mihin tarvii 16 tehokasta ydintä? Jos miettii rinnakkaistuvia taskeja kuten koodin kääntämistä tai vaikka renderöintiä niin paremman reaalimaailman suorituskyvyn saa niiden pienempien ytimien ja tehoytimien sekoituksella. Oletan toki, että transistorimäärä ja jäähdytysbudjetti eivät muutu. 8 tehocorea riittänee huonosti rinnakkaistuville taskeille ja loput ryynätään rinnakkaisesti pienemmillä ytimillä energia ja transistoribudjettia tehokkaasti hyödyntäen.

Siihe on hyvä syy, että raptorlaken huhutaan olevan 8+16 ratkaisu.
Miksi intel tuo markkinoille jopa yli 30 tehoytimen prossuja jos niille ei ole mitään käyttöä?
 
Miksi intel tuo markkinoille jopa yli 30 tehoytimen prossuja jos niille ei ole mitään käyttöä?

Jollakin on kuorma, joka ei rinnakkaistu ja on pakko käyttää tehoytimiä rinnakkaistamisen sijaan? Äkkiseltään tulee mieleen pilvipalvelu missä on monta ei rinnakkaistuvaa taskia samalla kun taskien suoritusaika halutaan minimoida.

Oletan, että ne high performance coret vaativat oleellisesti enemmän transistoreja(pinta-alaa) kuin high efficiency coret. Jos mietitään tietynkokoista==hintaista piiriä niin voi kysyä, että kumpi on juuri sinulle parempi vaihtoehto, vähemmän coreja, jotka ovat nopeampi vai enemmän coreja, jotka ovat hitaampia? Mä uskon, että samaan hintaan saan paremmin koodia kääntävän piirin esim. 8+16:lla kuin 12+0:lla.
 
16 erittäin tehokasta ydintä, kiitos.
Se ei ollut vaihtoehtona.

Se ei edes olisi mahdollista, jos erittäin tehokas tarkoittaa 12900K:n P-ytimiä ja nopeuksia. Tuon Alderin 8P + 8E vie sähköä (~250 W) suunnilleen saman kuin 10P + 0E veisi. Haaveilemasi 16P veisi sähköä noin 16P / 10 P * 250 W = 400 W. Piirin koko olisi 8P + 8E:n noin 210 mm2 sijaan lähes 280 mm2, eli 26,5 * 10,5 mm. Noin pienen 400 W:n kiven jäähdytys ei oikein enää luonnistu ilmajäähyiltä ja AIO:lta.

Alikellottamalla toki onnistuisi 16P:kin, mutta sitten ne eivät enää olisi erittäin tehokkaita kuten 12900K:ssa.


Jos leikitään, että 16P onnistuisi, niin silloin viivalle astuisi samoilla piirikustannuksilla ja sähkönkulutuksilla 12P + 16E (tai 8P + 32E).

Tilanne nykyään:
A) Kun 12P riittää (nykyiset pelit ja monet ohjelmat), niin molemmat ovat yhtä nopeita. Joskus voi joutua kytkemään E:t pois, koska ovat vielä liian uutta rautaa softalle. Tasapeli.

B) Ne sovellukset, jotka nykyään osaavat hyödyntää enemmän kuin 12P tarjoaa, niin ne osaavat yleensä hyödyntää myös yli 16P:n (rendaus, pakkaaminen). Tällöin 12P + 16E = 12P + (16 / 2)P = 20P. Hybridisuoritin on 20 / 16 * 100 % - 100 = 25 % nopeampi kuin 16P.


Tulevaisuudessa:
C) Siinä vaiheessa kun pelit vaativat 12P-16P, niin hybridisuorittimet ovat pelintekijöille tuttua kauraa. Peleissä on nykyään ja tulevaisuudessa raskaiden pääsäikeiden lisäksi kevyempiä säikeitä. Näiden ansiosta 12P + 16E suoriutuu yhtä nopeasti kuin 16P. Tasapeli.

D) Pelien hyötyessä yli 16P-ytimen alkaa hybridisuoritin kasvattaa kaulaa ja lähestyä B-kohdan 25 prosenttia. Hybridisuoritin voittaa 16P:n 0-25 prosentilla.



@pomk niissä yli 30 tehoytimen prossuissa ei olekaan yhtä suuria ja nopeasti tikittäviä prossuja kuin 12900K:ssa. Lisäksi piitä on voitu käyttää reilummalla kädellä, koska firmoilla on varaa maksaa työkaluistaan paljon enemmän kuin kuluttajilla. Arvelen ammattimalliston kuitenkin näyttävän aika erilaiselta muutaman vuoden päästä. Eivätköhän hybridisuorittimet/pikkuytimet viiveellä löydä tiensä sinnekin. En ole uutisia seurannut, mutta noin minä tekisin. Näin saisin samasta rajallisesta piikiekkotuotannosta leivottua asiakkaille enemmän laskentatehoa, eli enemmän rahnulia itselleni.
 
Se ei edes olisi mahdollista, jos erittäin tehokas tarkoittaa 12900K:n P-ytimiä ja nopeuksia. Tuon Alderin 8P + 8E vie sähköä (~250 W) suunnilleen saman kuin 10P + 0E veisi. Haaveilemasi 16P veisi sähköä noin 16P / 10 P * 250 W = 400 W. Piirin koko olisi 8P + 8E:n noin 210 mm2 sijaan lähes 280 mm2, eli 26,5 * 10,5 mm. Noin pienen 400 W:n kiven jäähdytys ei oikein enää luonnistu ilmajäähyiltä ja AIO:lta.
Ja 30+ ytimen xeonit vie sähköä pari kilowattia?!?
 
Ja 30+ ytimen xeonit vie sähköä pari kilowattia?!?
Ei vaan sama kuin: "Alikellottamalla toki onnistuisi 16P:kin, mutta sitten ne eivät enää olisi erittäin tehokkaita kuten 12900K:ssa.".

Ja: "niissä yli 30 tehoytimen prossuissa ei olekaan yhtä suuria ja nopeasti tikittäviä prossuja kuin 12900K:ssa.".

Ne palvelinprossut on säädetty huomattavasti matalammille kellotaajuuksille kuin 12900K, jotta jäähdytys onnistuu.
 
Aika turhaa sinänsä ihmetellä mihin tarvii enemmän yhtä sun toista, harrastaminen parasta ja MOAR POWER. :geek:

unlimited-power-star-wars.gif
 
Aika turhaa sinänsä ihmetellä mihin tarvii enemmän yhtä sun toista, harrastaminen parasta ja MOAR POWER. :geek:

unlimited-power-star-wars.gif

Mutta kun se teoreettinen 400W 16 P-ytimen prosessori ei ole missään työpöytä/kuluttajakäyttöskenariossa nopeampi kuin teoreettinen 12P + 16E -ytiminen 400W prosessori olisi
 
HUB testasi E-ytimiä pelikäytössä ja aika yhtä tyhjän kanssa siinä ovat. Toki vaikka Cinebenchissä niistä sitten on hyötyä.
 
HUB testasi E-ytimiä pelikäytössä ja aika yhtä tyhjän kanssa siinä ovat. Toki vaikka Cinebenchissä niistä sitten on hyötyä.

Olipa todella huonosti valittu pelit/asetukset/GPU, koska yksikään peli ei vaatinut yli 2P + 8E tai 4P + 0E!

Näin testaten E-ytimien hyöty ei tietenkään näy enää 4P + 0E ja 4P + 8E välillä, koska suorituskyky on jo tapissa 4P + 0E:llä. Noilla asetuksilla/peleillä/GPU:lla olisi pitänyt testata 2P + 0E vs. 2P + 4E/2P + 8E.

Vielä parempi olisi ollut testata enemmän suoritinta rasittavalla Nvidialla, eli vaikkapa RTX 3080 Ti/3090:lla.

Ehdin jo melkein ilahtua, kun näin Cyberpunkin, mutta mitä vielä. Se oli testattu high-preset + non-RT, jolloin 2P + 8E/4P + 0E pyöritti jo liki tapissa.

Jos CP olisi testattu Nvidia + ultra + RT, niin 4P + 0E ja 4P + 8E välillä olisi näkynyt ero. Nyt Radeon + high + non-RT:llä eron olisi saanut näkyviin vain 2P + 0E vs. 2P + 8E:llä, mutta sitähän ei testattu -> eroa ei saatu näkyville.


Prossuja käytetään monta vuotta ja niiden kainalossa ehtii piipahtaa monesti useampikin näytönohjain. Jos ja kun halutaan saada suorittimien tänään enimmäkseen piilossa pysyttelevä ero näkyville, pitää testata seuraavasti:

1. Nvidian tehokkain GPU (suurempi driver overhead -> rasittaa enemmän prossua)

2. Ultra-preset, jotta kaikki prossua rasittavat asetukset ovat täysillä

3. Resoluutio 720p/1080p, jotta tämän päivän GPU ei tukehdu kakkoskohdan takia.

4. RT päälle, jotta saadaan suorittimen tappirajaa vielä pari ydintä ylemmäs.


Etenkin tuo 720p/1080p on epärealistinen lippulaivanäyttiksen omistajalle (Tai jos sellainen jostain löytyykin, niin hänellä ollee kilpailusyistä muuta kuin ultra + RT). Lippulaivailija Ultrailijalla (=ei kilpapelaaja) ollee yleensä vähintään 1440p, jolloin suorittimien erot piiloutuvat.

Tulevaisuuden RTX 4090/5090 kyllä lopulta kaivavat sen eron päivänvaloon ihan 1440p:lläkin. Meillä ei valitettavasti ole sellaisia vielä käytettävissä, joten siksi 720p/1080p + muuten tappiraskaat suorittimelle.


Edit. Poistettu ylimääräinen "X".

Edit2. Mahdollisia syitä HUB:n erot häivyttävälle testitavalle:
1. Univelat tolkuttomasta työtahdista johtuen. (mahdollista)

2. Ammattitaidottomuus (enpä usko)

3. Jotain kränää Intelin kanssa -> dissaa heidän esittelemää hybridisuoritinta (mahdollista)
 
Viimeksi muokattu:
HUB testasi E-ytimiä pelikäytössä ja aika yhtä tyhjän kanssa siinä ovat. Toki vaikka Cinebenchissä niistä sitten on hyötyä.

Niin, tämähän on koko homman pointti. Tehokkaat ytimet pelikäyttöön ja pienemmät ytimet mukaan kun tarvitaan tehoa monisäikeiseen kuormaan (CB, renderöinti, ym). Kuten tuossa ylhäällä sanottiin niin samalla tehoikkunalla voidaan tehdä 8P+8E, tai 10P. Tässä tapauksessa 10P voisi olla hieman nopeampi pelikäytössä mikäli näytönohjain ei ole pullonkaulana (RTX 3070 + 1440p riittää pullonkaulaksi), tai peli oikeasti hyödyntää kaikkia P-ytimiä. Oikeassa elämässä kuitenkin 8P+8E on paljon fiksumpi ratkaisu.
 
HUB testasi E-ytimiä pelikäytössä ja aika yhtä tyhjän kanssa siinä ovat. Toki vaikka Cinebenchissä niistä sitten on hyötyä.

Sanokaa mun sanoneen, että E-ytimien hyöty 6P:n kaverina pelikäytössä nähdään todennäköisesti jo 2022/2023, mutta viimeistään 2024.

Tämän eron voi nähdä i5-12400 (6P + 0E) ja i5-12600K:n (6P + 4E) välillä, kun:

1. pelataan kyseisten vuosien raskaimpia pelejä ultra + RT

JA

2. GPU on >=3090/>=4080/>=5070 RTX


Isommat 8P:t jaksanevat hieman pidempään ilman E-ytimiä, ehkä jopa 2024-2026 asti, mutta pahimmissa peleissä E-ytimistä ollee hyötyä jo 2023-2024. Kyllä aika moni silloin vielä ajelee nyt ostetulla 12700K/12900K:lla.

Se on totta, että juuri tänään E-ytimien hyöty ilmenee vain Cinebenchissä ja pakkaamisissa jne. Jos vaihtaa suoritinta vuoden välein ja vain pelaa koneella, niin E:t ovat turhuutta. Jos taas pitää useamman vuoden, niin hyöty ehtii tulla esille.
 
Olipa todella huonosti valittu pelit/asetukset/GPU, koska yksikään peli ei vaatinut yli 2P + 8E tai 4P + 0E!

Näin testaten E-ytimien hyöty ei tietenkään näy enää 4P + 0E ja 4P + 8E välillä, koska suorituskyky on jo tapissa 4P + 0E:llä. Noilla asetuksilla/peleillä/GPU:lla olisi pitänyt testata 2P + 0E vs. 2P + 4E/2P + 8E.

Vielä parempi olisi ollut testata enemmän suoritinta rasittavalla Nvidialla, eli vaikkapa RTX 3080 Ti/3090:lla.

Ehdin jo melkein ilahtua, kun näin Cyberpunkin, mutta mitä vielä. Se oli testattu high-preset + non-RT, jolloin 2P + 8E/4P + 0E pyöritti jo liki tapissa.

Jos CP olisi testattu Nvidia + ultra + RT, niin 4P + 0E ja 4P + 8E välillä olisi näkynyt ero. Nyt Radeon + high + non-RT:llä eron olisi saanut näkyviin vain 2P + 0E vs. 2P + 8E:llä, mutta sitähän ei testattu -> eroa ei saatu näkyville.


Prossuja käytetään monta vuotta ja niiden kainalossa ehtii piipahtaa monesti useampikin näytönohjain. Jos ja kun halutaan saada suorittimien tänään enimmäkseen piilossa pysyttelevä ero näkyville, pitää testata seuraavasti:

1. Nvidian tehokkain GPU (suurempi driver overhead -> rasittaa enemmän prossua)

2. Ultra-preset, jotta kaikki prossua rasittavat asetukset ovat täysillä

3. Resoluutio 720p/1080p, jotta tämän päivän GPU ei tukehdu kakkoskohdan takia.

4. RT päälle, jotta saadaan suorittimen tappirajaa vielä pari ydintä ylemmäs.


Etenkin tuo 720p/1080p on epärealistinen lippulaivanäyttiksen omistajalle (Tai jos sellainen jostain löytyykin, niin hänellä ollee kilpailusyistä muuta kuin ultra + RT). Lippulaivailija Ultrailijalla (=ei kilpapelaaja) ollee yleensä vähintään 1440p, jolloin suorittimien erot piiloutuvat.

Tulevaisuuden RTX 4090/5090 kyllä lopulta kaivavat sen eron päivänvaloon ihan 1440p:lläkin. Meillä ei valitettavasti ole sellaisia vielä käytettävissä, joten siksi 720p/1080p + muuten tappiraskaat suorittimelle.


Edit. Poistettu ylimääräinen "X".

Edit2. Mahdollisia syitä HUB:n erot häivyttävälle testitavalle:
1. Univelat tolkuttomasta työtahdista johtuen. (mahdollista)

2. Ammattitaidottomuus (enpä usko)

3. Jotain kränää Intelin kanssa -> dissaa heidän esittelemää hybridisuoritinta (mahdollista)
Ultra-asetukset rasittaa käsittääkseni enemmänkin näyttistä, ei niinkään prossua. Sen vuoksi "oikeissa" prossutesteissä vedetään asetukset minimiin. Ne ei tietysti sitten kuitenkaan vastaa tyypillistä pelitilannetta, kun suurin osa pelaa vähintään medium-asetuksilla.
Niin, tämähän on koko homman pointti. Tehokkaat ytimet pelikäyttöön ja pienemmät ytimet mukaan kun tarvitaan tehoa monisäikeiseen kuormaan (CB, renderöinti, ym). Kuten tuossa ylhäällä sanottiin niin samalla tehoikkunalla voidaan tehdä 8P+8E, tai 10P. Tässä tapauksessa 10P voisi olla hieman nopeampi pelikäytössä mikäli näytönohjain ei ole pullonkaulana (RTX 3070 + 1440p riittää pullonkaulaksi), tai peli oikeasti hyödyntää kaikkia P-ytimiä. Oikeassa elämässä kuitenkin 8P+8E on paljon fiksumpi ratkaisu.
"Oikea elämä" = renderöinti? Eikös yksi P-ydin vastaa rykälettä E-ytimiä, eli yleisimmässä käytössä riittäisi myös tuo 10P.
 
Ultra-asetukset rasittaa käsittääkseni enemmänkin näyttistä, ei niinkään prossua. Sen vuoksi "oikeissa" prossutesteissä vedetään asetukset minimiin. Ne ei tietysti sitten kuitenkaan vastaa tyypillistä pelitilannetta, kun suurin osa pelaa vähintään medium-asetuksilla.

"Oikea elämä" = renderöinti? Eikös yksi P-ydin vastaa rykälettä E-ytimiä, eli yleisimmässä käytössä riittäisi myös tuo 10P.
Suurin osa asetuksista rasittaa enemmän näyttistä, mutta ainakin ajopeleissä (Forza 4, Dirt) jokunen asetus rasittaa prossua. Kun näitä ei kukaan jaksa pelikohtaisesti selvittää, niin raskaampi eli parempi prossutesti saadaan ajamalla ultra + 720p/1080p, kuin low + 720p/1080p/1440p. Silloin myös ne prossua kurittavat ovat ultralla, mutta normaalia alhaisemman resoluution ansiosta nykypäivän hidas RTX 3090 ei kuitenkaan muodosta eroja piilottelevaa pullonkaulaa.


Yksi P vastaa suorituskyvyltään kahta E:tä. Neljä E:tä vie suunnilleen saman verran piitä ja tehoa kuin yksi P.

Tuon 10P:n hinnalla ja tehobudjetilla voisi tehdä 0P + 40E (=100 % nopeampi kuin 10P) tai 6P + 16E (=40 % nopeampi kuin 10P) tai 8P + 8E (=20 % nopeampi kuin 10P). Pelaajalle viimeinen on paras, vaikka sen multi-core on heikoin (toki silti 20 % parempi kuin 10P:n MC).
 
Ultra-asetukset rasittaa käsittääkseni enemmänkin näyttistä, ei niinkään prossua. Sen vuoksi "oikeissa" prossutesteissä vedetään asetukset minimiin. Ne ei tietysti sitten kuitenkaan vastaa tyypillistä pelitilannetta, kun suurin osa pelaa vähintään medium-asetuksilla.
Grafiikka-asetuksissa on säätöjä jotka lisäävät prossukuormaa. Esim LoD, erilaiset tiheysasetukset, renderöintietäisyys. Nuo kaikki muuttaa drawcallien määrää per freimi. Siksi low-asetusten käyttäminen prossutesteissä on kyseenalaista. Maksimiasetukset tarpeeksi alhaisella resoluutiolla on oikea tapa testata pelejä prossukuorman suhteen.
 
Suurin osa asetuksista rasittaa enemmän näyttistä, mutta ainakin ajopeleissä (Forza 4, Dirt) jokunen asetus rasittaa prossua. Kun näitä ei kukaan jaksa pelikohtaisesti selvittää, niin raskaampi eli parempi prossutesti saadaan ajamalla ultra + 720p/1080p, kuin low + 720p/1080p/1440p. Silloin myös ne prossua kurittavat ovat ultralla, mutta normaalia alhaisemman resoluution ansiosta nykypäivän hidas RTX 3090 ei kuitenkaan muodosta eroja piilottelevaa pullonkaulaa.


Yksi P vastaa suorituskyvyltään kahta E:tä. Neljä E:tä vie suunnilleen saman verran piitä ja tehoa kuin yksi P.

Tuon 10P:n hinnalla ja tehobudjetilla voisi tehdä 0P + 40E (=100 % nopeampi kuin 10P) tai 6P + 16E (=40 % nopeampi kuin 10P) tai 8P + 8E (=20 % nopeampi kuin 10P). Pelaajalle viimeinen on paras, vaikka sen multi-core on heikoin (toki silti 20 % parempi kuin 10P:n MC).
Grafiikka-asetuksissa on säätöjä jotka lisäävät prossukuormaa. Esim LoD, erilaiset tiheysasetukset, renderöintietäisyys. Nuo kaikki muuttaa drawcallien määrää per freimi. Siksi low-asetusten käyttäminen prossutesteissä on kyseenalaista. Maksimiasetukset tarpeeksi alhaisella resoluutiolla on oikea tapa testata pelejä prossukuorman suhteen.
Ok. Juu, en toki väittänytkään, että kaikki asetukset olisi pelkästään näyttikselle, sen vuoksi laitoin sinne sen "enemmänkin".
 
Onko kukaan vielä testannut että miten hyvin tämä pitää paikkansa? Eli jos katsotaan vaikka 5 vuoden takaisia prossuja 720P testissä niin onko nopeusjärjestys nyt sama 1440p / RTX3090 skenariossa
 
Ultra-asetukset rasittaa käsittääkseni enemmänkin näyttistä, ei niinkään prossua. Sen vuoksi "oikeissa" prossutesteissä vedetään asetukset minimiin. Ne ei tietysti sitten kuitenkaan vastaa tyypillistä pelitilannetta, kun suurin osa pelaa vähintään medium-asetuksilla.

"Oikea elämä" = renderöinti? Eikös yksi P-ydin vastaa rykälettä E-ytimiä, eli yleisimmässä käytössä riittäisi myös tuo 10P.
Ei, vaan monipuolisempi prosessori ja fiksummin hyödynnetty tehobudjetti, kuin vain ja ainoastaan pelaamiseen tarkoitettu.
 
Itse olen ymmärtänyt tämän P ja E ytimien pointin näin (ps, en ole mikään CPU expertti)

Koska P = C * V^2 * F jossa (P = tehonkulutus, C = kapasitanssi, V = jännite ja F = taajuus)

Kaavasta nähdään että taajuuden muuttaminen vaikuttaa tehonkulutukseen lineaarisesti, mutta jännite vaikuttaa neliönä (V^2).
Intelistä en tiedä, mutta prossut joita minä olen käpistellyt niin jos halutaan nostaa taajuutta, joudumaan myös nostamaan jännitettä, joten kellojen nostaminen vaikuttaa huomattavasti tehonkulutukseen.

Joten jos taajuuden nosto aiheuttaa jännitteen nousemista ja jännite nostaa tehonkulutusta neliössä, niin eikö kaikkien kannattaisi ajaa prossukuormansa minimijännitteella parhaan hyötysuhteen saavuttamiksi? Kyllä kannattaisi, mutta haittana on että se kestää pidempään kuin korkealla taajuudella suoritettaessa.

Tästä päästään siihen että riippuu hyvin paljon mikä on latenssivaatimus tehdylle työlle, jossain FPS pelissa laskutoimitus halutaan laskettavaksi hyvin nopeasti, jolloin on järkeä käyttää korkealla taajuudella pyörivää P-corea vaikka hyötysuhde onkin paljon heikompi koska corea joudutaan ajamaan korkeammilla volteilla.
Jos latenssivaatimusta ei ole tai se on suuri, niin tälläinen kuorma kannattaa ajaa E-ytimellä koska se suorittaa sen parhaalla energiatehokkuudella.

Oikeasssa elämässä näitä molempia on about aina, joten ymmärrän mitä intel ajaa takaa, mutta eikös ARM tehnyt vastaavaa jo aikaisemmin little big arkkitehtuurillaan?
 
Viimeksi muokattu:
Oikeasssa elämässä näitä molempia on about aina, joten ymmärrän mitä intel ajaa takaa, mutta eikös ARM tehnyt vastaavaa jo aikaisemmin little big arkkitehtuurillaan?
Kyllä, idea on sama.
 
Itse olen ymmärtänyt tämän P ja E ytimien pointin näin (ps, en ole mikään CPU expertti)

Koska P = C * V^2 * F jossa (P = tehonkulutus, C = kapasitanssi, V = jännite ja F = taajuus)

Kaavasta nähdään että taajuuden muuttaminen vaikuttaa tehonkulutukseen lineaarisesti, mutta jännite vaikuttaa neliönä (V^2).
Intelistä en tiedä, mutta prossut joita minä olen käpistellyt niin jos halutaan nostaa taajuutta, joudumaan myös nostamaan jännitettä, joten jännitteen nostaminen vaikuttaa huomattavasti tehonkulutukseen.

Joten jos taajuuden nosto aiheuttaa jännitteen nousemista ja jännite nostaa tehonkulutusta neliössä, niin eikö kaikkien kannattaisi ajaa prossukuormansa minimijännitteella parhaan hyötysuhteen saavuttamiksi? Kyllä kannattaisi, mutta haittana on että se kestää pidempään kuin korkealla taajuudella suoritettaessa.

Tästä päästään siihen että riippuu hyvin paljon mikä on latenssivaatimus tehdylle työlle, jossain FPS pelissa laskutoimitus halutaan laskettavaksi hyvin nopeasti, jolloin on järkeä käyttää korkealla taajuudella pyörivää P-corea vaikka hyötysuhde onkin paljon heikompi koska corea joudutaan ajamaan korkeammilla volteilla.
Jos latenssivaatimusta ei ole tai se on suuri, niin tälläinen kuorma kannattaa ajaa E-ytimellä koska se suorittaa sen parhaalla energiatehokkuudella.

Oikeasssa elämässä näitä molempia on about aina, joten ymmärrän mitä intel ajaa takaa, mutta eikös ARM tehnyt vastaavaa jo aikaisemmin little big arkkitehtuurillaan?

Oikeassa elämässä ei kyllä mene lineaarisesti virrankulutus, kun kelloja nostetaan. Korkeammat kellot tarvitsevat korkeamman jännitteen ja se kasvaa eksponentiaalisesti siellä kärkipäässä.
 
Oikeassa elämässä ei kyllä mene lineaarisesti virrankulutus, kun kelloja nostetaan. Korkeammat kellot tarvitsevat korkeamman jännitteen ja se kasvaa eksponentiaalisesti siellä kärkipäässä.

Enkös minä niin sano heti siinä alla että korkeammat kellot ja jännite on naimisissa keskenään?
 
Nyt niitä rikkinäisiä pelejä ei enää listalla ole:


Alle voi jättää kommentoimatta että "ei tiedetä mikä peli ei toimi" kun se on jo tuolla ylempänä sanottu. Niitä voi löytäessään viestiä Intelin suuntaan.
 
Nyt niitä rikkinäisiä pelejä ei enää listalla ole:


Alle voi jättää kommentoimatta että "ei tiedetä mikä peli ei toimi" kun se on jo tuolla ylempänä sanottu. Niitä voi löytäessään viestiä Intelin suuntaan.

On se jännää, kuinka yht'äkkiä löytyy miljoonaresurssit, kun prosessoreiden myynti on tästä kiinni. Lisäksi, ne E-corettomat halpaprosessorit tuli markkinoille halvemmalla, niin tämä piti aika äkäiseen korjata - ettei ihmiset vaan ostele niitä halvempia, vaan näille kärkipään prosessoreillekin löytyy ostajia.

Komppaan kyllä tuota, että raporttia Intelille vaan ja ne korjataan parissa viikossa. Ja foliohattuteoriana sanon, että jos seuraavalla iteraatiolla prosessoreita tätä ongelmaa ei enää ole, niin korjauksetkin loppuvat silloin.
 

Statistiikka

Viestiketjuista
258 667
Viestejä
4 495 498
Jäsenet
74 270
Uusin jäsen
Jautio

Hinta.fi

Back
Ylös Bottom