Intelin 10-ytiminen Core i9-10900K 3DMark-testivuodossa

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu
Varsinkin kun Intelin roadmapeissahan oli 7nm prosessin tuontanto jo ensivuodelle.
7nm tilanteesta ei ole tainnut kuitenkaan mitään vuotoja tai huhuja liikkua mutta voihan olla, että 10nm jää kokonaan työpöydällä välistä, jos tuo 7nm prosessi toimii odotetulla tavalla.
Tätähän on kuitenkin kehitetty täysin omana tuotekehityslinjanaan.
Ei kuitenkaan prosessoreissa, työpöydällä on 2021:kin vielä 14nm+:aa
 
Itse uskon Kellerin Jimin tuovan siniseen leiriin sellaista näkemystä, että cpu kehitys pompahtaa muutaman pykälän kerralla. Samalla toivon Jimin jatkavan uraansa seuraavaksi AMD:n leivissä.
 
Niinkauan kun rämpivät 14nm niin tilanne ei tule paranemaan.
Voi olla että ottaa kiinni jo vuoden parin sisälläkin, tiedä mitä siellä suunnitellaan mutta melkoisesti on rahaa pistetty haisemaan että ei siellä ihan hiljokseen olla.

Teoriassa Intel voi ottaa AMD:n kiinni jos AMD lakkaa suunnittelemasta prosessoreita pariksi vuodeksi, mutta kun tilanne tosiaan on se että uutta zeniä pukkaa jo tämän vuoden puolella. Mietin vain miten kovat boostit seuraavasta zenistä tulee, kun tämä 3xxx sarjakin jo ns. Räjäytti pankin.

14nm on tiensä päässä tämän intelin 10xxx sarjan myötä. Uuden valmistustekniikan käyttöönottokaan ei takaa sitä, että intel hanskaa homman yhtä hyvin kuin 5 vuotta 14nm prossuja jauhettuaan.

Sen lisäksi Intel on luvannut joka vuodelle uuden valmistustekniikan, joka itsessään jo kuulostaa aika kunnianhimoiselta tavoitteelta ottaen huomioon kuinka Intelillä on nykyiselläkin valmistustekniikalla jo toimitusongelmia.

Olen aprikoinut että onkohan Intel sen takia hionut 14nm valmistustekniikkansa niin pitkälle siksi, että uutta tuotetta saisi pienemmällä aikataululla lähetettyä suunnattomaksi paisuneelle asiakaskunnalle pienemmällä aikavälillä ? Nyt kun AMD kiilasi suorittimensa juuri tähän pahaan siirtymäväliin, se aiheutti Intelille kertaheitolla niin hintapaineita, kuin paineita siirtyä valmistustekniikasta seuraavaan.

Oli miten oli, niin kaikki (niin intel kuin amd fanit) hyötyy markkinoiden nykyisestä kilpailutilanteesta molemmin puolin.
 
Viimeksi muokattu:
Olen aprikoinut että onkohan Intel sen takia hionut 14nm valmistustekniikkansa niin pitkälle siksi, että uutta tuotetta saisi pienemmällä aikataululla lähetettyä suunnattomaksi paisuneelle asiakaskunnalle pienemmällä aikavälillä ? Nyt kun AMD kiilasi suorittimensa juuri tähän pahaan siirtymäväliin, se aiheutti Intelille kertaheitolla niin hintapaineita, kuin paineita siirtyä valmistustekniikasta seuraavaan.

Oli miten oli, niin kaikki (niin intel kuin amd fanit) hyötyy markkinoiden nykyisestä kilpailutilanteesta molemmin puolin.
Näihin löytyy kyllä ihan oikeatkin syyt jos on seuraillut/tutustunut/lukenut aiheesta joten ei tarvitse aprikoida.
 
Prossu, kuin prossu hyötyy enenevässä määrin nopeimmista muisteista, kun coremäärän kasvaessa muistikaistasta tulee kokoajan pahempi pullonkaula (hyvin säikeistyvissä tilanteissa).

... paitsi että välimuistimäärän kasvaessa sinne fyysiseen muistiin asti myös tarvii mennä entistä harvemmin.

Tilanteet, joissa DRAM-muistin KAISTA on pullonkaula on oikeasti CPUlla ajattavilla normikäyttäjän workloadeilla aika harvinainen.

Ja tämän näkee myös oikein hyvin siitä, kuinka hyvin esim. ryzen 3950x pärjää esim. Core i9-9980XE:tä ja Threadripper 2950X:ää vastaan; Molemmilla on tuplat siitä muistikaistasta mitä 3950X:llä, mutta threadripper häviää sitli kaikissa testeissä, ja 3950X voittaa lähinnä vain niissä joka käyttää AVX-512sta, piittaa paljon yhden säikeen suorituskyvystä tai soveltuu paremmin intelin mikroarkkitehtuurille. Ja suorituskyky monessa hyvin säikeistyvässä testissä hyivn lähellä tuplia 3700X:n suorituskykyä, skaalautuminn 8->16 ydintä oikein hyvä.
 
... paitsi että välimuistimäärän kasvaessa sinne fyysiseen muistiin asti myös tarvii mennä entistä harvemmin.

Tilanteet, joissa DRAM-muistin KAISTA on pullonkaula on oikeasti CPUlla ajattavilla normikäyttäjän workloadeilla aika harvinainen.

Ja tämän näkee myös oikein hyvin siitä, kuinka hyvin esim. ryzen 3950x pärjää esim. Core i9-9980XE:tä ja Threadripper 2950X:ää vastaan; Molemmilla on tuplat siitä muistikaistasta mitä 3950X:llä, mutta threadripper häviää sitli kaikissa testeissä, ja 3950X voittaa lähinnä vain niissä joka käyttää AVX-512sta, piittaa paljon yhden säikeen suorituskyvystä tai soveltuu paremmin intelin mikroarkkitehtuurille. Ja suorituskyky monessa hyvin säikeistyvässä testissä hyivn lähellä tuplia 3700X:n suorituskykyä, skaalautuminn 8->16 ydintä oikein hyvä.

Ohjelmat, munkaanlukien windows ovat kehittyneet ja kehittyvät kokoajan sen suhteen, että ne osaavat käyttää enemmän ja enemmän säikeitä. Lisäksi pöhöttymätauti vaivaa kokoajan pahemmin. Välimuistien määrä ei riitä kompensoimaan tällähetkellä massiivista muistipullonkaulaa ja se näkyy ihan selkeästi: Nopeimmilla muisteilla kone toimii nopeammin. Jos välimuistit toimisivat riittävästi, niin sillä muistinopeudella ei olisi niin väliä, niinkuin käytännössä tuntuu olevan.
 
Ohjelmat, munkaanlukien windows ovat kehittyneet ja kehittyvät kokoajan sen suhteen, että ne osaavat käyttää enemmän ja enemmän säikeitä.

Lisäksi pöhöttymätauti vaivaa kokoajan pahemmin. Välimuistien määrä ei riitä kompensoimaan tällähetkellä massiivista muistipullonkaulaa ja se näkyy ihan selkeästi: Nopeimmilla muisteilla kone toimii nopeammin. Jos välimuistit toimisivat riittävästi, niin sillä muistinopeudella ei olisi niin väliä, niinkuin käytännössä tuntuu olevan.

Se ei todellakaan näy juuri missään yleisesti käytössä olevissa työpöytäsoftissa, niissäkään jotka osaavat jo käyttää kaikkia säikeitä mitä prossu voi ajaa; Ne ajautuvat oikein nopeasti 3950X:llä ja skaalautuvat melkein täydellisesti 8lta ytimeltä 16 ytimelle vaikka muistikanavia on vain kaksi.

Tämä samalla nullifioi myös ekan pointtisi; Se muistikaista riittää, vaikka kaikki ytimet on hyvin työllistettyjä, koska vain hyvin harva muistiaccessi menee DRAMiin asti kun välimuistit hoitaa tehtävänsä.


(Ja lisäksi, ohjelmat kehittyvät myös siihen suuntaan, että niitä kirjoitetaan entistä enemmän kielellä, jossa monisäikeistys on MAHDOTONTA (Javascript)) (siinä on vain web workerit jotka on efektiivisesti prosesseja, ei säikeitä)
 
Viimeksi muokattu:
Teoriassa Intel voi ottaa AMD:n kiinni jos AMD lakkaa suunnittelemasta prosessoreita pariksi vuodeksi, mutta kun tilanne tosiaan on se että uutta zeniä pukkaa jo tämän vuoden puolella. Mietin vain miten kovat boostit seuraavasta zenistä tulee, kun tämä 3xxx sarjakin jo ns. Räjäytti pankin.

Riippuu vähän mitä tarkoitetaan. Jos katsoo vähän pelkistetysti niin 7nm prosessiin ja uuteen arkkitehtuuriin siirtyminen on esim. 2600 -> 3600 noin 20% lisää tehoa. Vähän vastaava ero on esim. i7-7700K vs i7-9700K. Eli pankki ei sinänsä performanssiloikalla erityisesti räjähtänyt, positiiviseen kehitykseen vaikutti nähdäkseni enemmän ns. muut syyt.

Suunta varmaan pysyy samana mutta vahvasti epäilen että suurimmat ryzen-kiimat on jo purkautunut eikä samanlaista boostia ole luvassa seuraavan iteraation kohdalla kun "ilmaiset" pisteet on jo voitettu.
 
Se ei todellakaan näy juuri missään yleisesti käytössä olevissa työpöytäsoftissa, niissäkään jotka osaavat jo käyttää kaikkia säikeitä mitä prossu voi ajaa; Ne ajautuvat oikein nopeasti 3950X:llä ja skaalautuvat melkein täydellisesti 8lta ytimeltä 16 ytimelle vaikka muistikanavia on vain kaksi.

Tämä samalla nullifioi myös ekan pointtisi; Se muistikaista riittää, vaikka kaikki ytimet on hyvin työllistettyjä, koska vain hyvin harva muistiaccessi menee DRAMiin asti kun välimuistit hoitaa tehtävänsä.


(Ja lisäksi, ohjelmat kehittyvät myös siihen suuntaan, että niitä kirjoitetaan entistä enemmän kielellä, jossa monisäikeistys on MAHDOTONTA (Javascript)) (siinä on vain web workerit jotka on efektiivisesti prosesseja, ei säikeitä)

Koneella voidaan ajaa montaa javascriptiä yhtäaikaa, s.e. kutakin ajetaan omalla corellaan / coreillaan. Ja jos JAVA on niin täyttä sontaa, ettei se mitenkään säikeisty, niin kun ottaa huomioon koneiden kehitysuunnan, niin siitä tullaan sitten luopumaan tässä jossain vaiheessa, sehän on täysin pakkorako.

Ja kuten totesin, nykyisin on kokoajan enemmän merkitystä, miten nopeat muistit koneessa on, eli nuo välimuistisysteemit eivät ole selkeästikään alkuunkaan riittävät, jos ne olisivat ok, kuten käsittääkseni väität, niin olisi aivan sama, vaikka ajaisi vain yhdellä muistikanavalla, hitaalla muistilla, jos prossussa ei ole näyttistä (käytössä). Ja ei se näyttiksen viemä kaistakaan mitään haittaisi.

Tietysti jos koneella ajetaan ei säikeistyvää softaa ja se käyttää Max 4 /16 ytimestä(yhtäaikaa) (Niinkuin esim pelit yleensä miltei aina), niin kyllähän se muistikaista riittää..
 
Java ja javascript ovat eri kielet, eivätkä edes läheistä sukua, vaikka vissiin syntaksi on samanlainen
 
Tuossa 4GHz clock-to-clock vertailua, 9900K voittaa kaikki muut pelitestit paitsi yhden, eli mitenkäs se nyt menikään?:think: Ei asioita tarvitse vääristellä vaikka se AMD nyt toki niskanpäällä yleisesti onkin.


Intel vie peleissä koska muistiohjain on parempi (toki kellojakin löytyy enemmän), pienempi latenssi joka heti vaikuttaa suorituskykyyn (ainakin näissä antiikin aikasissa peleissä jotka eivät osaa kunnolla käyttää ytimiä), IPC itsessään on AMD:lla on hieman parempi.
 
Intel vie peleissä koska muistiohjain on parempi (toki kellojakin löytyy enemmän), pienempi latenssi joka heti vaikuttaa suorituskykyyn (ainakin näissä antiikin aikasissa peleissä jotka eivät osaa kunnolla käyttää ytimiä), IPC itsessään on AMD:lla on hieman parempi.
Tässähän kävi juurikin, niin kuin joskus aikoinaan ennustin. Pitäisi ihan etsiä murosta, jos jaksaisi...:
Ennustus meni suurinpiirtein: Sillä ei ole niinkään väliä, kummalla on vähäsen paremmat ytimet (IPC). Se voittaa, jolla on parempi välimuistisysteemi ja muistiohjain. Olisi ihan mielenkiintoista nähdä kunnolla tehty HBM ratkaisu CPU+IG piirille..
 
Koneella voidaan ajaa montaa javascriptiä yhtäaikaa, s.e. kutakin ajetaan omalla corellaan / coreillaan. Ja jos JAVA on niin täyttä sontaa, ettei se mitenkään säikeisty, niin kun ottaa huomioon koneiden kehitysuunnan, niin siitä tullaan sitten luopumaan tässä jossain vaiheessa, sehän on täysin pakkorako.

Java säikeistyy oikein hyvin.

Mutta ei tässä olla puhuttu yhtään mitään Javasta, vaan Javasciptistä, ne ovat kaksi täysin eri kieltä.

Ja kuten totesin, nyklyisin on kokoajan enemmän merkitystä, miten nopeat muistit koneessa on, ele nuo valimuistisysteemit eivät ole selkeästikään alkuunkaan riittävät

:facepalm:

Se, että sinä väität jotain paikkaansapitämätäntä ei muuta sitä todeksi, vaikka kuinka jankutat sitä.

Benchmarkit softien suorituskyvystä eivät tue väitettäsi.

, jos ne olisivat ok, kuten käsittääkseni väität, niin olisi aivan sama, vaikka ajaisi vain yhdellä muistikanavalla, hitaalla muistilla, jos prossussa ei ole näyttistä (käytössä). Ja ei se näyttiksen viemä kaistakaan mitään haittaisi.

:facepalm:

Todella typerää olkiukkoilua.

Muistien KELLOTAAJUUS vaikuttaa myös sen muistin viiveeseen.

ja sillä viiveellä on selvästi väliä.

Koska sinne muistiin tulee kuotenkin niitä yksittäisiä accesseja huomattavasti.

Muistiaccessin kokonaisviive ytimelle on luokkaa 50ns.

Sillä on väliä, onko tämä 45ns, 50ns 55ns, että kuinka kauan niitä yksittäisiä accesseja joudutaan odottamaan.

Yhden välimuistilinjan datansiirtoaika on luokkaa 2.5ns(3200 T/s transfer rate, 64bit), ja koko välimuistilinja tulee nykyaikana samasta muistikanavasta

Se, että muistikanavien määrä tuplataan ei nopeuta yhtään sen yksittäisen välimuistilinjan siirtämistä, ei vaikuta yhtään siihen, kuinka kauan prosessori joutuu sitä tyypillisesti odottamaan.

Se vaikuttaa vaan siihen todennäköisyyteen, että sitä muistiaccessia ei voida aloittaa heti, koska juuri samaan aikaan joku muu haluaa aloitta samassa muistikanavassa toisen muistiaccessin.

Ja se, että välillä odotetaan sen 50ns päälle 2.5ns ylimääräistä ennen kuin päästän aloittamaan se access, ei ole kovin paha hidastus.

Sen sijaan, jos sen muistin viive onkin 50ns sijasta vaikka 55ns kun se käy pienemmällä kellotaajuudella - tässä on heti suurempi hidastus joka ikisellä muistiaccessilla.


Että saadaan edes kahden muistikanavan kaista saturoitua, tarkoittaa se sitä, että sitä pitää olla suuruusluokkaa 50ns/2.5ns * 2 = ~40 välimuistilinjan yhtäaikainen haku menossa. Eli 16 ytimelläkin jokaisen ytimen pitää hakea DRAM-muistista asti yhtä aikaa noin viittä välimuistilinjaa. Eli siis joka ytimellä pitää olla viisi L3-missiä menossa. Prossulta loppuu jo OoOE-ikkunakin aika nopeasti kesken että aika harvassa koodissa se löytää niitä viittä eri missaavaa loadia koodista. SMT tosin auttaa että niitä ei tarvi löytää samasta säikeestä, mutta samoista käskypuskureista ne kaksi säiettä kuitenkin tappelee.

(ja kun yhteen välimuistilinjaan mahtuu monta arvoa, peräkkäiset accessit samaan välimuisitlinjaan eivät johda uuden välimuistilinjan hakemista muistista, käytännössä niiden keskeneräisten accessien määrä on paljon suurempi).

Käytännössä softan pitää tehdä jotain melko puhdasta taulukon läpikäyntiä (sisältämättä juuri yhtän laskentaa) jostain todella isosta, välimuistiin mahtumattomasta taulukosta, että se kaista alkaa tulemaan pullonkaulaksi. Hyvin harvat työpöytäsoftat tekee tällaista. Ne datat, mitä yleisemmin käsitellään, mahtuu välimuisteihin, ja/tai ne isot melko puhtaat taulukkoaccessit tehdään hyvin harvoin esim. jossain softaa käynnistettäessä.
 
Viimeksi muokattu:
Intel vie peleissä koska muistiohjain on parempi (toki kellojakin löytyy enemmän), pienempi latenssi joka heti vaikuttaa suorituskykyyn (ainakin näissä antiikin aikasissa peleissä jotka eivät osaa kunnolla käyttää ytimiä), IPC itsessään on AMD:lla on hieman parempi.
Väittäisin myös että pelimoottorit on optimoitu paremmin intelille jo pitkän tovin. Olis mielenkiintoista tietää ero jos molemmissa olis samanlainen muistiohjain.
 
  • Tykkää
Reactions: VmH
Muistin viiveeseen vaikuttaa myös erittäin paljon se, jotta kun se on siirtämässä tarpeeksi muuta, niin se siirto joudutaan odottamaan ensin pois tai keskeyttämään. Ei sen kaistan tarvitse olla "täynnä", kun viiveet käy kasvamaan.. Toisinsanoen sillä kaistallakin on huomattavasti merkitystä, vaikka kultala haluaakin jänkätä asiasta loputtomuuksiin..
Ja kannattaa nyt hahmottaa, että nykysoftat säikeistyvät edelleen paskasti, joten ne hyvin harvoin käyttävät suurempia määriä coreista yhtäaikaa.
 
Muistin viiveeseen vaikuttaa myös erittäin paljon se, jotta kun se on siirtämässä tarpeeksi muuta, niin se siirto joudutaan odottamaan ensin pois tai keskeyttämään. Ei sen kaistan tarvitse olla "täynnä", kun viiveet käy kasvamaan.. Toisinsanoen sillä kaistallakin on huomattavasti merkitystä, vaikka kultala haluaakin jänkätä asiasta loputtomuuksiin..
Ja kannattaa nyt hahmottaa, että nykysoftat säikeistyvät edelleen paskasti, joten ne hyvin harvoin käyttävät suurempia määriä coreista yhtäaikaa.

Sen yhden välimuistilinjan siirto vie PC3200-muistilla aikaa 2.5 nanosekuntia.

Se muistin kokonaisviive on suuruusluokkaa 50 nanosekuntia.

Jos oletetaan, että muistikaista on 50% saturoitu, eli keskimäärin n, joka toinen muistiaccess joutuu odottamaan(mutta osa joutuu odottamaan pidempään), tarkoittaa se keskimäärin alle 2.5 nanosekunnin viivettä niihin muistiaccesseihin (todellinen keskiarvo tosin riippuu siitä mikä se accessien ajan jakauma tarkkaan ottaen on, ilman jakaumaa ei voi laskea mitään tarkkaa lukua)

Eli siis luokkaa selvästi alle 5% hidastumusta niihiin accesseihin. Melko merkityksetön vielä 50% käyttöasteella.

Ja kun tämä ei tarkoita mitään "CPUn suorituskyvyn putoamista vajaalla 5%"lla. Vaan sitä, että ne stallit jotka aiheutuu siitä että L3-cache missaa ja dataa joudutaan hakemaan musitista asti, eikä OoOE-logiikka pysty piilottamaan tää, pitenee.
 
Viimeksi muokattu:
  • Tykkää
Reactions: VmH

Statistiikka

Viestiketjuista
261 701
Viestejä
4 544 607
Jäsenet
74 831
Uusin jäsen
Panasonic

Hinta.fi

Back
Ylös Bottom