Virallinen: AMD vs Intel keskustelu- ja väittelyketju

ratkakapu · 03.12.2020

pomk sanoi:
Tuhnu tuli, jos ei yhden ytimen kuormissa mene ohi edes keskitason ryzenistä. Edellisetkään intelit eivät ole kellottamalla parantuneet tuolta osin.

edit: ja useamman säikeen kuormilla jos laitetaan huippupiirit vastakkain, niin tiedossa on selkäsauna joka tapauksessa. Milloinkohan inteliltä tulee seuraava lippulaivaluokan prosessori? 2023?

Kaikissa saman sarjan ryzeneissä on sama ydin, sama muistiohjain ja hyvin samanlaiset välimuistikonfiguraatiot ja nyt julkaistun halvimman mallin ja kalleimman mallin välissä on jotain 10% luokkaa kellontaajuuseroa käytännössä.

Eli jos ohittaa keskiluokan, niin ohittaa huippumallin ja vastaavasti jos jää huippumallin taakse, niin ei keskiluokan piiriä vastaankaan pärjää. Ne on takana ne päivät kun keskiluokka ja huippumalli erosivat merkittävästi muuten kuin ydinmäärältään.

Rune · 03.12.2020

pomk sanoi:
Tuhnu tuli, jos ei yhden ytimen kuormissa mene ohi edes keskitason ryzenistä. Edellisetkään intelit eivät ole kellottamalla parantuneet tuolta osin.

edit: ja useamman säikeen kuormilla jos laitetaan huippupiirit vastakkain, niin tiedossa on selkäsauna joka tapauksessa. Milloinkohan inteliltä tulee seuraava lippulaivaluokan prosessori? 2023?

Tuhnu? Intel:hän kellottuu tunnetusti paremmin. Ei tiedä yhtään vaikka olisi beast ylikellottuja. Niinkuin vemkki sanoi niin peleissä voi olla kova sana tuo r lake. Muistilatenssit pienemmät jne.
Hyvä vaan ettei intel keskity tekemään 859€ (jimms hinta) maksavia 16 core "huippupiirejä". Todennäköisesti hinta ei ole kovin korkea kun kyseessä on 8 core. Eli ihan hyvillä mielin voi verrata vaikkapa 5800x prosessoriin. Hinta ratkaisee sitten. Jos nyt maksaa intelin 8 core alle 400€ niin tuskin tuo rlakekaan hirveästi sen enempää ainakaan.

jkm · 03.12.2020

Vito sanoi:
Tuhnu? Intel:hän kellottuu tunnetusti paremmin. Ei tiedä yhtään vaikka olisi beast ylikellottuja. Niinkuin vemkki sanoi niin peleissä voi olla kova sana tuo r lake. Muistilatenssit pienemmät jne.
Hyvä vaan ettei intel keskity tekemään 859€ (jimms hinta) maksavia 16 core "huippupiirejä". Todennäköisesti hinta ei ole kovin korkea kun kyseessä on 8 core. Eli ihan hyvillä mielin voi verrata vaikkapa 5800x prosessoriin. Hinta ratkaisee sitten. Jos nyt maksaa intelin 8 core alle 400€ niin tuskin tuo rlakekaan hirveästi sen enempää ainakaan.

Olishan se hieno juttu, jos pelkkä kellotaajuus olisi kiven nopeuden mittari. Eli mitä isompi sitä parempi...

Rune · 03.12.2020

jkm sanoi:
Olishan se hieno juttu, jos pelkkä kellotaajuus olisi kiven nopeuden mittari. Eli mitä isompi sitä parempi...

Ipc kasvaa myös "(Double Digit IPC Gains Over Skylake) ".

moukula · 03.12.2020

Itse taas veikkaan että Rocket Laket ovat jo kaupasta ulos kannettuna suunnilleen maksimeihin asti kellotettuja ja hirveitä kiukaita, mutta sehän nähdään sitten joskus ens vuoden puolella että mikä se totuus on.

pomk · 03.12.2020

Vito sanoi:
Tuhnu? Intel:hän kellottuu tunnetusti paremmin. Ei tiedä yhtään vaikka olisi beast ylikellottuja. Niinkuin vemkki sanoi niin peleissä voi olla kova sana tuo r lake. Muistilatenssit pienemmät jne.
Hyvä vaan ettei intel keskity tekemään 859€ (jimms hinta) maksavia 16 core "huippupiirejä". Todennäköisesti hinta ei ole kovin korkea kun kyseessä on 8 core. Eli ihan hyvillä mielin voi verrata vaikkapa 5800x prosessoriin. Hinta ratkaisee sitten. Jos nyt maksaa intelin 8 core alle 400€ niin tuskin tuo rlakekaan hirveästi sen enempää ainakaan.

8700k:n jälkeen ei ole huippuprossut kellottunu yli vakion 1t kellontaajuuden. Vaikea kuvitella että intel tälläkään kertaa jättäisi mitään pöydälle sen suhteen. Useamman säikeen kuormilla taas AMD on kiistatta edellä. Ei tuo kellottamalla parane niin paljoa että siitä olisi mitään hyötyä missään muussa kuin joissain peleissä ja se siitä.

ja siinä olet kyllä ihan oikeassa, että ei se intel yritä näillä kilpailla kuin keskiluokassa. Ei taida olla paukkuja muuhun.

Rune · 03.12.2020

pomk sanoi:
8700k:n jälkeen ei ole huippuprossut kellottunu yli vakion 1t kellontaajuuden. Vaikea kuvitella että intel tälläkään kertaa jättäisi mitään pöydälle sen suhteen. Useamman säikeen kuormilla taas AMD on kiistatta edellä. Ei tuo kellottamalla parane niin paljoa että siitä olisi mitään hyötyä missään muussa kuin joissain peleissä ja se siitä.

ja siinä olet kyllä ihan oikeassa, että ei se intel yritä näillä kilpailla kuin keskiluokassa. Ei taida olla paukkuja muuhun.

Mistä sen tietää vaikka kellottuisi 5.5 ghz. Sehän ny on selvää, että amd on varmastikin r lakea parempi jos tekee jotain tuottavaa. Mutta koti pc:hen, pelikoneeseen r lake voi hyvinkin olla parempi. Kuinka moni oikeasti tekee kotona jotain tuottavaa koti pc:llä. Työkone erikseen. Voin väittää että pelaaminen on se isompi juttu kotikoneeseen kuin, että oikeasti tekisi jotain tuottavaa kotikoneella mikä vaatii prossulta paljoa. Sellaista missä intel ei pärjäisi. Amd tuottava työ työkoneella ja intel koti pc pelaaminen.

pomk · 03.12.2020

Vito sanoi:
Mistä sen tietää vaikka kellottuisi 5.5 ghz.

Oletettavasti jo toi linkkaamasi testitulos on jotakuinkin noilla kelloilla ajettu. Tuskin se kuuteen gigahertsiin asti kulkee millään järkevällä jäähyllä. Kulkisi edes 5GHz kaikilla ytimillä alle 300W kulutuksella

hese_e · 03.12.2020

Vito sanoi:
Mistä sen tietää vaikka kellottuisi 5.5 ghz.

Yleensä IPC:tä nostavat temput on haitallisia kellotaajuuden noston kannalta. Iso hidas cache taitaa olla se harvinainen poikkeus, mutta sekin on kallis toteutettava (vie transistoreja).

Jos molempiin luvataan kovaa nousua huhupajoissa, niin yleensä on aika poistaa hypepistoolin varmistin.

Lepakomäyrä · 03.12.2020

Ei siihen pelaamiseen mitään 5.5GHz tarvita..
Eikä edes 5GHz
Pelit pyörii mallikkaasti ilman sitä nopeinta tai tappiin kellotettua prossuakin.

Harrastus ja hifistelyt sitten erikseen, eli kun pistetään kovaa rautaa ja kellotellaan jne..

pomk sanoi:
Oletettavasti jo toi linkkaamasi testitulos on jotakuinkin noilla kelloilla ajettu. Tuskin se kuuteen gigahertsiin asti kulkee millään järkevällä jäähyllä. Kulkisi edes 5GHz kaikilla ytimillä alle 300W kulutuksella

Sitten kun höpötellään kulutuksista niin koittakaa erotella puhutteko hyöty vaiko peli käytöstä.

Jos aiheena on pelit niin prosessorien kulutukset on hyvinkin maltilliset ja käyvät niillä 5GHz allcore kelloilla todella viileenä.
Jos kyse hyötykäytöstä/100% kuormituksista niin ero pelaamiseen on massiivinen niin kulutuksen/lämpöjenkin osalta.

Pieni esimerkki kun käytössä sama jäähy/asetukset.
Valhallassa Allcore 5GHz prossu ~60c nurkilla pomppaakin lyhyessä hyötykäytössä nopeasti +80c

Janne_83 · 03.12.2020

pomk sanoi:
Oletettavasti jo toi linkkaamasi testitulos on jotakuinkin noilla kelloilla ajettu. Tuskin se kuuteen gigahertsiin asti kulkee millään järkevällä jäähyllä. Kulkisi edes 5GHz kaikilla ytimillä alle 300W kulutuksella

Mistäköhän nämä 300w kulutukset aina repäistään? Itse laittanut 10850k voltit käsin ja yllätyin suuresti miten vähän tämä syö watteja. Tässä esimerkiksi juuri ajamani Shadow Of The Tomb Raiderin benchmark: Kaikki detailit täysillä, paitsi DLSS off, Ray tracing off, motion blur off, 1080P ja Vsync off: Core 4.7GHz, Cache 4.4GHz. Tuostakin voisi vielä vähän nipistää watteja poissa, IBT menee jo 1.14v:llä läpi, mutta pidän varmuuden vuoksi 1.17v, että on ihan varmasti kaikessa vakaa.

Lepakomäyrä · 03.12.2020

Janne_83 sanoi:
Mistäköhän nämä 300w kulutukset aina repäistään? Itse laittanut 10850k voltit käsin ja yllätyin suuresti miten vähän tämä syö watteja. Tässä esimerkiksi juuri ajamani Shadow Of The Tomb Raiderin benchmark: Kaikki detailit täysillä, paitsi DLSS off, Ray tracing off, motion blur off, 1080P ja Vsync off: Core 4.7GHz, Cache 4.4GHz.

Ei ne peleissä kulutakkaan sellaisia..

Se on joku pilkan aihe liittyen Intelin kovempaan kulutukseen hyötykäytössä jota sitten hyödynnetään ja yritetään liittää näihin peleissä tapahtuviin kulutuksiin.

Eli se on ns. pientä provosoimista jos se tehdään tarkoituksella.
Voi toki olla että joku ei sitä tiedä että pelikulutukset on hyvinkin maltilliset.

Eksuu · 03.12.2020

Lepakomäyrä sanoi:
Ei ne peleissä kulutakkaan sellaisia..

Se on joku pilkan aihe liittyen Intelin kovempaan kulutukseen hyötykäytössä jota sitten hyödynnetään ja yritetään liittää näihin peleissä tapahtuviin kulutuksiin.

Eli se on ns. pientä provosoimista jos se tehdään tarkoituksella.
Voi toki olla että joku ei sitä tiedä että pelikulutukset on hyvinkin maltilliset.

Nimenomaan. Johan iotechin testeistäkin näkyy, että kulutukset ovat melkolailla samaa luokkaa.

Janne_83 · 03.12.2020

Lepakomäyrä sanoi:
Ei ne peleissä kulutakkaan sellaisia..

Se on joku pilkan aihe liittyen Intelin kovempaan kulutukseen hyötykäytössä jota sitten hyödynnetään ja yritetään liittää näihin peleissä tapahtuviin kulutuksiin.

Eli se on ns. pientä provosoimista jos se tehdään tarkoituksella.
Voi toki olla että joku ei sitä tiedä että pelikulutukset on hyvinkin maltilliset.

Joo, aikalailla pelkkää provoomista. IBT:ssä jää myös alle 125w ja se jos joku vetää kaikki coret 100% loadiin. Tietty ymmärrän isot kulutukset, jos joku ajaa näitä default volteilla ja emo sattuu puskemaan 1.4v corelle, VCCIO:lle, SA:lle jne. Näistä saa tosi energiatehokkaita prosessoreita ja oletan että tämän foorumin ihmiset laittaa käsin nuo voltit kuntoon..

hese_e · 03.12.2020

Janne_83 sanoi:
Joo, aikalailla pelkkää provoomista. IBT:ssä jää myös alle 125w ja se jos joku vetää kaikki coret 100% loadiin. Tietty ymmärrän isot kulutukset, jos joku ajaa näitä default volteilla ja emo sattuu puskemaan 1.4v corelle, VCCIO:lle, SA:lle jne. Näistä saa tosi energiatehokkaita prosessoreita ja oletan että tämän foorumin ihmiset laittaa käsin nuo voltit kuntoon..

Pelikulutus on todellakin pienempi, mutta tuo sinun esimerkki oli myös poikkeava. 4.7Ghz ja sitä kautta maltilliset voltit ja oikein hyvä sijoitus voltti/kello käyrällä, oikeasti aika fiksu viritys. Yleensähän intelin peliylivoimaa kehutaan yli 5Ghz kelloilla ja sitte tulee niitä 300W kiuas kommentteja.

Janne_83 · 03.12.2020

hese_e sanoi:
Pelikulutus on todellakin pienempi, mutta tuo sinun esimerkki oli myös poikkeava. 4.7Ghz ja sitä kautta maltilliset voltit ja oikein hyvä sijoitus voltti/kello käyrällä, oikeasti aika fiksu viritys. Yleensähän intelin peliylivoimaa kehutaan yli 5Ghz kelloilla ja sitte tulee niitä 300W kiuas kommentteja.

Itse tykkään hiljaisesta tietokoneesta, kaikki 14cm tuulettimet hyrrää 700rpm (prossu 1x, kotelo 3x). Mutta samalla kaavalla tuo meni ainakin helposti 4.9GHz asti volttien noston suhteen, enempää en testannut (watit nousisi 10-15w IBT:ssä). Näkeekö sitten kukaan enään eroa 200-300MHz nostolla näissä lukemissa. Cachea olen siis nostanut 100MHz vakiosta, melkein tuntu olevan enemmän hyötyä siitä..

hese_e · 03.12.2020

Janne_83 sanoi:
Itse tykkään hiljaisesta tietokoneesta, kaikki 14cm tuulettimet hyrrää 700rpm (prossu 1x, kotelo 3x). Mutta samalla kaavalla tuo meni ainakin helposti 4.9GHz asti volttien noston suhteen, enempää en testannut (watit nousisi 10-15w IBT:ssä). Näkeekö sitten kukaan enään eroa 200-300MHz nostolla näissä lukemissa. Cachea olen siis nostanut 100MHz vakiosta, melkein tuntu olevan enemmän hyötyä siitä..

Joo, ei ole enää pitkään aikaan tehnyt mieli vetää kelloja maksimille, kun se voltti/kellokäyrä käy aika järjettömäksi. Se on just hihasta ravistetun 2% lisää tehoa ja 50W kulutusta älyttömyyksiä, kun se lämpö pitää saada kopasta uloskin.

Mechanical Man · 03.12.2020

Eksuu sanoi:
Nimenomaan. Johan iotechin testeistäkin näkyy, että kulutukset ovat melkolailla samaa luokkaa.

Tätä mielenkiintoisempi olisi se fps/w käppyrä. Jos cpu pullonkaula pienenee, gpu yleensä imaisee sitten enemmän.

moukula · 03.12.2020

Sillähän sitä vielä ennen Zen3-julkaisua perusteltiin Intel-kokoonpanojen suurempaa kulutusta, kun niillä "ei ole cpu-pullonkaulaa" niin GPU käyttää silloin enempi tehoa.

pomk · 03.12.2020

Mechanical Man sanoi:
Jos cpu pullonkaula pienenee, gpu yleensä imaisee sitten enemmän.

Tätähän nimenomaan toivotaan. Intelillä vaan watit valuu sinne CPU:lle GPU:n sijaan.

hese_e · 03.12.2020

pomk sanoi:
Tätähän nimenomaan toivotaan. Intelillä vaan watit valuu sinne CPU:lle GPU:n sijaan.

Ei tuossa nyt niin isoa eroa ollut: Io-techin testi W/fps:
5950: 2.41 w/fps
10900: 2.36 w/fps
10700: 2.31 w/fps
5800: 2.23 w/fps
5600: 2.17 w/fps

Huomaa miten tuo infinity fabric haukkaa voltteja, kun tulee se toinen chiplet mukaan.

jkm · 03.12.2020

Mindfactorylta CPU myyntistatseja marraskuulle:

AMD Sold Over 35,000 Ryzen 5000 & Ryzen 3000 CPUs While Intel Only Sold 5000 10th/9th Gen CPUs In November at MindFactory

AMD sold an insane 35,000 Ryzen 5000 & Ryzen 3000 CPUs in November at MindFactory compared to Intel's measely 5000 10th & 9th Gen Core CPUs.

wccftech.com

TL;DR R5 3600 myi yksinään lähes yhtä paljon kuin Intelit yhteensä. Samassa myös paljastuu hieman kuinka paljon 5000-sarjan kiviä on ollut tarjolla.

'As such, the Ryzen 5 3600 retained its popularity with over 5000 CPU sales. That's almost as much as all of Intel CPU sales combined for the same month. The Ryzen 5 3600XT, surprisingly, is the 2nd best CPU in terms of sales figures, shipping over 4600 units. These are followed by the 3700X which also managed over 4600 unit sales. The Ryzen 5 5600X sold over 3000 units, the Ryzen 9 5900X sold over 1500 units while the Ryzen 7 5800X sold over 1100 units. '

Obs2000 · 03.12.2020

Mielenkiintoisia lukuja Mindfactoryltä. Ei ihme että saa lukea näitä kärjistetysti "AMD prosessoriajurit ovat huonot ja vaativat kalliit muistit toimiakseen" ja "Intelit kulkee 5,5GHz kaikki ja tarttee vaan 50€ emot tähän" nettikommentteja oikein olan takaa englanninkielisillä foorumeilla. Ihan hauskoja nuo CS benchmarkit, kun niillä ei olekaan enää mitään väliä, kuten ei hattiwateillakaan. Hyvä että on päästy tähän pisteeseen, niin on saatu coreja ja suorituskykyä taas ennätysmäärä muutaman vuoden sisällä molemmilta valmistajilta :kippis:

pomk · 03.12.2020

hese_e sanoi:
Huomaa miten tuo infinity fabric haukkaa voltteja, kun tulee se toinen chiplet mukaan.

Ei se taida voltteja pahemmin haukata, noiden sisäinen resistanssi on aika pieni.

lisäksi väittäisin että kasvanut tehonkulutus tulee lähinnä epäoptimaalisesta säikeistämisestä ja on siten softaongelma eikä rautaongelma.

Griffin · 04.12.2020

pomk sanoi:
Ei se taida voltteja pahemmin haukata, noiden sisäinen resistanssi on aika pieni.

lisäksi väittäisin että kasvanut tehonkulutus tulee lähinnä epäoptimaalisesta säikeistämisestä ja on siten softaongelma eikä rautaongelma.

Kun dataa siirretään paljon ja nopeasti, siihen yksinkertaisesti töhräytyy tehoa jonkinverran. Sitä taas on hankala välttää, että eri corejen (välimuistien) välillä ei tarvitsisi tehdä siirtoja if:n kautta.

hkultala · 04.12.2020

Sami Riitaoja sanoi:
Näin tapahtuu, mutta osuma tulee L2:sta L2:m mukaisella viiveellä, 12 kellojaksoa vs 3 yms, ei vaikuta suorituskykyyn millään tapaa merkittävästi.

Ilmeisesti et nyt ymmärtänyt alkuunkaan tilannetta.

Se, että L2n viive on 12 kellojaksoa ei ole normaalisti "kovin paha" kun sieltä L2sta osuman tullen kerran ladataan koko välimuistilinja jota sitten käytetään todella monta kertaa.

Mutta jos siellä molempien molemmat virtuaaliytimet kilpailisivat siitä, kumpi saa pitää sitä välimuistilinja "itsellään", silloin sieltä ei voitaisi lukea niitä montaa lukua peräkkäin ilman misisä vaan se L1D missailisi JATKUVASTI kun välissä toinen kävisi nappaamassa sen itselleen ja sieltä tulisi moninkertainen määrä niitä huteja. Ja kun se 12 kellojakson viive tulee MONELLE accessille eikä joskus todella harvoin, sen vaikutus suorituskyvylle olisi todella paha.

Tätä kutsutaan ping-pong-efektiksi. Normaalisti sitä tapahtuu esim. pieleen optimoidulla softalla false sharingin tapauksessa, ja joskus muinaisuudessa sitä tapahtui usein esim. kolmen taulukon väillä välimuistin ollessa vain 2-tie-joukkoassosiatiivinen, ja kaikkien taulukoiden ollessa alignoitu vähintään välimuisti-wayn koon verran.

Se, että ihan normaalit luvut jo KAHDEN lukijan välillä jostain yhteisestä read-only-muuttujasta voisi aiheuttaa ping-pong-efektin olisi ihan älytön suunnitteluvirhe. AMDn insinöörit osaavat hommansa, ja sen huomaa myös Zenin testituloksista. Tällaisia ping-pong-efektejä ei ole datan lukemisessa Zenillä nähty.

Bonuksena poistuu sivukanava-vaara säikeiden välillä.

Jos ne säikeet on samasta prosessista, ei ne tarvi mitään suojaa sivukanavahyökkäyksiltä toisiaan vastaan, kun sen datan saa lukea ihan suoraankin.

Ja kun siellä välimuistissa on 4096kB wayt, sillä, käytetäänkö virtuaali- vai fyysisiä osoitteita ei ole mitään vaikutusta siihen, missä kohtaa välimuistia joku osoite voi olla.

Että ei poista mitään sivukanava-vaaraa säikeiden väliltä, kun oikeudet tarkastetaan ajoissa.

Asianhan näkee testeitä oikein hyvin, Intelin prosessorien threadien välinen viive SMT-ytimessä on huomattavasti pienempi kuin AMD:llä, ero on juuri kuten L1 vs L2 osumat.

Testeistä näkee oikein hyvin, että puhut taas ihan puhdasta paskaa. Kun testit nimenomaan näyttää, että mitään tällaista "huomattavaa" eroa ei Intelin ja AMDn välillä ole:

Kommunikaatioviiveissä saman ytimen eri säikeiden välillä Intelin ja AMDn välillä on n. 1-2 kellojakson ero. Ei >= 8 kellojakson eroa.

Ja meillä on myös Power9 esimerkkinä, joka käyttää myös way-predicted L1-cachea ja dokumentoidusti käyttää predikoitua dataa ennen varmistusta.

Missä tämä "dokumentoidusti käyttää predikoitua dataa ennen varmistusta" on dokumentoitu?
ja predikoitu on tuossa hyvin hämärä sana. Antaa hyvän mahdollisuuen siirrellä maalitolppia kun voi tarvittaessa vaihtaa sanan merkitystä

Itse löysin tällaisen dokumentin Power9in liittyen, kertoo jotain sen L1D-kakusta:

POWER9_um_OpenPOWER_v21_10OCT2019_pub.pdf | Powered by Box

ibm.ent.box.com

Oleellinen sivu on 42

POWER9 manual sanoi:
EA-based set predict is used to determine the initial hit information. RA-based directory and ERAT is used to define real hit information. A flush can occur on a set-predict hit, directory miss. – A dedicated 64-byte reload interface from the L2 cache can supply 64 bytes in every processor clock. – Effective address index, real address tags (hardware fix-up on alias cases). That is, two different EAs that map to the same RA are not allowed to co-exist in the D-cache.

Eli siis, tosiassa se dokumentoidusti
1) sisältää virtuaaliosoitteesene pohjaavan way predictionin
2) sisältää fyysiseen osoitteeseen perustuvat TAGit. Eli siis VIPT, kuten kaikki järkeväet L1D-välimuistit.

Ainakaan tuo dokumentti nimenomaan EI sano mitään siitä, että käyttäisi dataa ennen sen osoitteen varmistusta.

Ko. prosessori on 4-way SMT ja alkujaan L1D oli yhdistetty mutta Spectre/Meltdown-korjauksena tuli 2-bittinen thread ID jakamaan L1-datan per threadi.

Onko lähdetät tälle väitteelle?

Tuo löytämäni dokumentti ei kerro mitään tuollaisesta. Sen sijaan se kertoo, että siellä on thread-id TLBlle, ei L1D-välimuistille.

Intel myös tykkäisi kovasti L1-datan threadijakomahdollisuudesta mutta sen puuttuessa ratkaisuna on joissain tapauksissa disabloida koko SMT.

Mitä ihmettä nyt oikein horiset?

Ei tarvitse flushata L1:stä, vain utagit.

Datasta, johon ei pääse käsiksi ei ole mitään iloa. Zenissä L1D-välimuistissa olevaan dataan ei pääse käsiksi ilman matchäävää microtagia.

utagin flushaus implikoi itse välimuistin flushauksen Zenillä (paitsi ehkä silloin, kun aliasoitumistapauksissa vaihdetaan utag osoittamaan toiseen virtuaalisoiteeseen joka osoittaa samaan fyysiseen osoitteeseen, mutta tässäkin tapauksessa tähän menee ihan sama aika kuin täydellä L1-hudilla/L2-latauksella, tässä ei säästetä kuin virtaa)

Ja aivan kuten AMD:n dokumentaatio sanoo, L1-accessoidaan vain ja ainoastaan virtuaalisen utagin avulla joten context-switchissä L1 missaa ensimmäiset lataukset

AMDn dokumentaatio ei sano mitään tällaista. AMDn dokumentatio ainostaan sanoo, että way prediction tehdään sen avulla.

Tässä vielä koko kappale microtagiin liittyen AMDn optimointimanualaistai, siellä ei moisäsän sano mitään tuollaista, mitä väität:

AMD Optimizaiton manual sanoi:
The L1 data cache tags contain a linear-address-based microtag (utag) that tags each cacheline with the linear address that was used to access the cacheline initially. Loads use this utag to determine which way of the cache to read using their linear address, which is available before the load's physical address has been determined via the TLB. The utag is a hash of the load's linear address. This linear address based lookup enables a very accurate prediction of in which way the cacheline is located prior to a read of the cache data. This allows a load to read just a single cache way, instead of all 8. This saves power and reduces bank conflicts. It is possible for the utag to be wrong in both directions: it can predict hit when the access will miss, and it can predict miss when the access could have hit. In either case, a fill request to the L2 cache is initiated and the utag is updated when L2 responds to the fill request. Linear aliasing occurs when two different linear addresses are mapped to the same physical address. This can cause performance penalties for loads and stores to the aliased cachelines. A load to an address that is valid in the L1 DC but under a different linear alias will see an L1 DC miss, which requires an L2 cache request to be made. The latency will generally be no larger than that of an L2 cache hit. However, if multiple aliased loads or stores are in-flight simultaneously, they each may experience L1 DC misses as they update the utag with a particular linear address and remove another linear address from being able to access the cacheline. It is also possible for two different linear addresses that are NOT aliased to the same physical address to conflict in the utag, if they have the same linear hash. At a given L1 DC index (11:6), only one cacheline with a given linear hash is accessible at any time; any cachelines with matching linear hashes are marked invalid in the utag and are not accessible.

Että hienosti kyllä jatkuvasti väität omia väärintulkintojasi suurempien auktoriteettien sanomisiksi.

mutta osumien tullessa L2:sta ero on muutama kellojakso per access.

n. 8 kellojaksoa "muutama". Melko luova merkitys tuolle sanalla.

Mikä on suorituskykyvaikutus niin sen näkee esimerkiksi Intelin pätseistä joissa flushataan koko TLB context switchissä - on vaikutusta mutta ei merkittävää, puhutaan maksimissaan joistain prosenteista.

"puhutaan maksimissaan joistain prosenteista".

Se, että saadaan "joitain prosentteja" lisää suorituskykyä high-end-prosessoreihin maksaa ihan älyttömästi tuotekehitystä hyvin osaavilta ihmisiltä,

Sellaisia arkkitehtuurillisia ratkaisuja, jotka hukkaa "joitain prosentteja" ei todellakaan tehdä hepposiin perustein.

L1-TLB on prosessorin MMU:n cache. Eli haku ko. cachesta tapahtuu aivan kuten L1:stä itsestään, AMD:n L1-DTLB on 64 entry fully associative. Eli jos hakutulos tarvitaan mahdolisimman nopeasti täydellä osumutarkkuudella luetaan kaikki 64 48 bittistä TLB-tag bittiä ja vertaillaan niitä siihen 48:aan virtuaalibittiin jotta löydetään oikea TLB-entry.

Se virtuaalimuisti toimii minimissään 4 kilotavun sivuilla. Ne 12 alinta bittiä voidaan ignorate täysin sitä osoitemuunnosta tehdessä, eikä niitä koskaan tallenneta TLBhen, siellä TLBssä on varsinaisia tagibittejä 36 eikä 48. Tämän lisäksi sitten n. 3 tilabittiä, kokonaisbittimäärä n. 39.

Sen jälkeen kun oikea osuma on löydetty luetaan. ko TLB-cachesta nuo 30 bittiä joilla voidaan sitten tehdä vertailu cachelinjan fyysiseen tagiin.....
tässä joudutaan helposti lukemaan monikertainen määrä dataa cachesta verrattuna tilanteeseen jossa luetaan 8:n 8 bitin utagia ja 64 bittiä varsinaista haettavaa dataa. Säästöpotentiaali on valtava.

On aivan eri asia lukea jotain jostain ~tuhannen sana SRAM-arraystä ja reitittää se ziljoonan leveän muxin jonnekin kauas kuin lukea yksittäistä latchiä tarvitsematta reitittää sitä minnekään.

Tämä on taas näitä asioita jotka on aivan triviaaleja ihmiselle, joka on koskaan tehnyt tai opiskellut mitään digitaalisuunnitteluun liittyvää.

Sen TLBn TAGin lukeminen sinne vertailujalle on todella halpaa ja energiatehokastakoska kullakin vertailijalla on tasan yksi paikka mistä se data voi tulla, siihen ei tarvita väliin minkäänlaista muxia ja fyysisesti jokainen vertailuja voidaan sijoittaa aivan sen datan sisältävän latchin viereen, jolloin sen datan ei tarvi kulkeakaan montaasataa nanometriä.

Siellä on vastaavia latch-vertailijapareja ties kuinka monta kertaa enemmän esim. käskyskedulerissa, aktivoitumassa joka ikinen kellojakso, tosin niissä vertailijat on vähän kapeampia (~8 bittiä).

Stack overflowssa Payl A Clayton on kanssa sivunnut vähän aihetta

Way prediction in modern cache

We know that the direct-mapped caches are better than set-associative cache in terms of the cache hit time as there is no search involved for a particular tag. On the other hand, set-associative ca...

stackoverflow.com

Tekniikkahan ei ole uusi, näemmä Pentium4 on hyödyntänyt 5 bittisiä utageja jotta on saatu hyöty irti 16 nopeasti lasketusta bitistä osoitteenmuodostuksessa

Niin, sitä on käytetty way predictioniin. Ei mihinkään muuhun, eikä nytkään käytetä mihinkään muuhun.

- Zenissä yllättäen vastaavasti käytetään 8 bittisiä uTageja hashättynä toisella 8 bitillä mukaan, sattumoisin on juuri puolet tuetusta 56bitin virtuaalimuistiavaruudesta

Zen tukee 48-bittisiä virtuaaliosoitteita, ei 56-bittisiä.

Cove-sarja tukee 57-bittisiä. (Ja siihen, miksi se on 57 eikä 56 bittiä, on oikein hyvä tekninen syy, jonka ymmärtää, jos yhtään tuntee sitä miten (x86n) sivutaulut oikeasti matalalla tasolla toimii, eli siis se, että kunkin taulun koko on sivun kokoinen, ja kun kaikki on alignoitu kahden potenssien välein, tarkoittaa se sitä, että yksi taulukon tietue on PAE-/x86-64-moodissa 8 tavua (3 osoitebittiä) jolloin niitä mahtuu 4 kiB sivuun se 512 kpl (9 osoitebittiä). Yhden tason lisäämällä saatiin siis 9 osoitebittiä lisää.
Ja alkuperäinen 48 bittiä ei siis tule 6 * 8 tai 3*16 bitistä vaan siitä että se on 12 + 9 +9 +9 +9 bittiä, maksimi minkä saa nelitasoisella sivutaululla 4 kiB sivuilla)

joten melko varmaan myös AMD on optimoinut AGUT laskemaan ensin alemman puoliskon osoitteesta ja tekemään L1-muistihaun sen perusteella aivan kuten P4:ssä aikanaan.

Kiitos tästä, tässä oli jälleen erinomainen esimerkki siitä, miten teet vahvoja päätelmiä asioista täysin virheellisten "faktojen" perusteella.

Tämän päätelmäsi pohjatiedot on nimittäin parilla tapaa pielessä:
1) Kuten jo yllä mainitsin, se virtuaalimuistiavaruus Zenillä 48 bittiä, ja puolet 48 bitistä on 24 joka ei oikein toimikaan teoriasi kanssa.

2) Vaikka virtuaalimuistiavaruus on vain 48 bittiä. ne Zenin AGUt pystyy ihan 64-bittisiin laskutoimituksiin (koska niissä suoritetaan myös LEA-käskyjä ilman muistiaccessia). Puolet 64 bitistä taas onkin 32, joka on monta bittiä enemmän eikä olekaan sama kuin AMDn microtagin laskentaa käytetty bittimäärä.

3) Optimoidun yhteenlaskijan sekventiaalisen logiikkatasojen määrä skaalautuu logaritmisesti bittimäärään nähden, ei lineraarisesti, tosin sinne tulee jotain useampi-inputtisia portteja minkä takia kriittinen polku ei putoa ihan suoraan logaritmisesti, vaan hiukan vähemmän. Käytännössä se, että sen leveys putoaa 48-64 bitistä 24-32 bittiin tarkoittaa n. 20% säästöä sen varsinaisen laskennan kriittisessä polussa, ei sen puolittumista

Sen sijaan, JOS sinne laittaa kaksi täysin erillistä kapeaa adderiä peräkkäin kuten P4ssa, kokonaisviive matalista biteistä korkeisiin kasvaa selvästi suuremmaksi.

4) Ja ne matalat bitit nyt sattuu ihan luonnollisesti valmistumaan sieltä normaalilta yhteenlaskimesta nopeammin koska niille on vähemmän logiikkaa, sen hyödyntämiseen ei tarvi kikkailla mitään laskevien kellonreunojen tai tuplanopeus-kellosignaalin kanssa, vaan ne voi saman kellojakson sisällä esim. reitittää kaummas tai laittaa niiden ja seuraavien rekistereiden väliiin enemmän muuta logiikkaa, ja synteesityökalu osaa ihan automaattisesti ottaa tämän kaiken huomioon reitityksessä ja laskea että nyt pystytään suurempiin kelloihin jos yhteenlaskun tuloksesta käytetään vaan alempia bittejä johonkin.

Sen sijaan, jos tuloksen kaikki bitit menee rekisteriin, niiden kaikkein bittien pitää ehtiä valmistua sen kellojakson aikana.

hese_e · 04.12.2020

Rocketlake oli bongattu ashes of singularityn testissä. Artikkelin teksti oli niin lyhyt, että tässä se kokonaisuudessaan:

An alleged Ashes of the Singularity (AotS) benchmark results page for the top 11th Gen Core "Rocket Lake" processor leaked to the web courtesy TUM_APISAK. It's official now that Intel will keep its lengthy processor model number schemes, with the top part being the Core i9-11900K, a successor to the i9-10900K. It also confirms that the "Rocket Lake" silicon caps out at 8-core/16-thread, with performance on virtue of the IPC gains from the new "Cypress Cove" CPU cores."Cypress Cove" is believed to be a back-port of "Willow Cove" to the 14 nm silicon fabrication process that "Rocket Lake-S" is built on.

The screenshot also confirms the nominal clocks (base frequency) of the i9-11900K to be 3.50 GHz, as Intel tends to put base frequency in the name-string of its processors. Paired with a GeForce RTX 3080 and 32 GB of RAM, the i9-11900K-powered machine yielded 62.7 FPS CPU frame-rate at 1440p resolution, and 64.7 FPS CPU frame-rate at 1080p (a mere 3.18% drop in frame-rates from the increase in resolution). These numbers put the i9-11900K in the same league as the Ryzen 7 5800X in CPU frame-rates tested under similar conditions.

Julkaisuun on niin vähän aikaa, että eiköhän tuo ole jo tuotannon tavaraa, eikä engineering sample.

LumboKuikelo · 04.12.2020

Proscribo sanoi:
Voi vähän hiljaista olla, kun HEDT alustankin nopein on hätää kärsimässä kilpailijan nopeimmalle pikkukantaiselle prosessorille.

E.: eikö ketään enää kiinnosta isot kannat vai onko kaikki jutut vain menneet ohi?

Minua ainakin kiinnostaisi isommat kannat. Tai jos saisivat muutaman pcie-kaistan lisättyä näihin jokapojan prossuihin, niin sitten ei niin väliksi. Nopeuden puolestahan nämä nykyiset lga1200 härvelit on vähintäänkin riittäviä tai ainakin välttäviä, mutta mun mielestä ongelma on enemmänkin tuo laajennettavuus. Marisinkin asiasta jo tuolla toisessa ketjussa.

LumboKuikelo sanoi:
On tämä Z490-alusta kyllä melko rajoittunut. Jos sulla on yksi m.2-levy ja yksi näytönohjain, niin homma pelittää varmaankin ihan ok. Tuo pcie-kaistojen olematon määrä sylettää ainakin itseä. Tässä esimerkkinä kokemuksia Maximus Apexin parista.

Minulla on Windows asennettuna 256GB nvme-levylle. Tuo levy on nyt ja tulevaisuudessa pyhitetty pelkästään käyttöjärjestelmälle. Hommasin joku aika sitten peleille ja ohjelmille 1TB nvme-levyn. Läpsyttelin palikat kiinni Asuksen emolla olevaan Dimm.2 -paikkaan ja pelit käyntiin!

Tuloksena ihme nykimistä RDR2 pelatessa. Katsoin GPU-Z :lla näyttiksen tietoja ja kortti toimiikin iloisesti PCIE 3.0@x4 -tilassa täydessä rasituksessa. Otin toisen nvme-levyn irti ja nyt sain näyttiksen jo x8 -nopeuteen. Ihmettelin, että mikähän v**** tässä nyt maksaa..

Syyllinen löyty äänikortista joka oli asennettu emon pcie x4 -slottiin. Se vielä irti, niin johan pelittää! Tosin nyt ei ole sitten ääniä enää jollei asenna tuota äänikorttia emon toiseen pcie x16 -slottiin, jolloin näyttis tukehtuu lämpöihinsä. Toki eihän se taas täydellä x16 nopeudella toimisi muutenkaan, joten tuskin tuosta haittaa olisi.

Niin, ja sitten vielä tuo 1TB nvme-levy. Jos lykkään sen tuohon emolla olevaan m.2 -paikkaan, niin lopettaa x4 -slotti toimimasta ja äänikortti on taas näyttistä tukehduttamassa.

Kokeilin huvikseni säätää vielä Z490 MEG Unify -emolla ja siinä on ehkä vähän fiksummin aseteltu nuo pcie-paikat. Tosin eihän perusongelma, eli pcie-kaistojen vähäinen määrä, poistu silläkään. Nvme-levyt kiertää piirisarjan kautta. Tosin tässä on paikka myös tuolle toisellekkin levylle. Asuksessa tuo dimm.2 -kikotin on ilmeisesti vedetty suoraan prossulta, joten näyttiksen vauhti hyytyy sillä sekunnilla kun sinne jotakin asentaa. Sama siis käyttää perinteisiä sata-levyjä.

Omat kokemukset viimemmäksi ollut X570/B450/X99/X79 -sarjan härveleistä, niin jotenkin en tullut ollenkaan ajatelleeksi että tämä on näin hankalaa näillä kolskeilla. Ei jatkoon ja amd tai intelin hedt tilalle.

Proscribo · 04.12.2020

LumboKuikelo sanoi:
Minua ainakin kiinnostaisi isommat kannat. Tai jos saisivat muutaman pcie-kaistan lisättyä näihin jokapojan prossuihin, niin sitten ei niin väliksi. Nopeuden puolestahan nämä nykyiset lga1200 härvelit on vähintäänkin riittäviä tai ainakin välttäviä, mutta mun mielestä ongelma on enemmänkin tuo laajennettavuus. Marisinkin asiasta jo tuolla toisessa ketjussa.

Hieman huvittavaa kyllä, että liittimiä on vaikka muille jakaa ja vähän päälle, mutta sitten niiden kanssa joutuu pahimmassa tapauksessa käymään järjetöntä aivojumppaa jotta selviää, että mikä nyt toimii milläkin nopeudella, jos toimii lainkaan. Onneksi nyt taas PCIe 4.0 myötä sitä näytönohjainta ei oikeastaan kiinnosta, onko siellä 16 vai 8 linjaa käytössä.

Rune · 04.12.2020

Lisää tietoa rocket lakesta:

MSI mistakenly reveals 8-core/16-thread Intel Rocket Lake-S CPU-Z specifications - VideoCardz.com

MSI shows Rocket Lake-S CPU with 4.3 GHz clock speed In the latest press release where MSI showcases its Intel 400-series motherboard supporting the Re-Size BAR feature, the company mistakenly published a CPU-Z screenshot featuring Rocket Lake-S CPU. Intel 11th Gen Core series, aka Rocket...

videocardz.com

Msi z490 godlike emolevyllä 4.3 ghz. Lieneekö sitten täys rasituksessa blender tjsp, että hakkaa power limittiä: Vakiona 5 ghz kevyessä rasituksessa ja kun kuorma on suuri niin kellot tippuu 125w power limitin takia 4.3 ghz? Vaiko sitten vaan random kellojen vaihtelusta kuva?

finWeazel · 04.12.2020

LumboKuikelo sanoi:
Minua ainakin kiinnostaisi isommat kannat. Tai jos saisivat muutaman pcie-kaistan lisättyä näihin jokapojan prossuihin, niin sitten ei niin väliksi. Nopeuden puolestahan nämä nykyiset lga1200 härvelit on vähintäänkin riittäviä tai ainakin välttäviä, mutta mun mielestä ongelma on enemmänkin tuo laajennettavuus. Marisinkin asiasta jo tuolla toisessa ketjussa.

Mua ahdistaa nykyemojen chipset-cpu pcie kaistan leveys. Yksi nopea nvme levy pystyy syömään kaiken kaistan. Ei siitä nykytilantessa ole haittaa, mutta olisi parempi, jos pelivaraa olisi enemmän. Toivottavasti zen4:en kohdalla tulisi parannusta tähän asiaan. Saisi edes yhden supernopean ja yhden hitaamman levyn emolevyyn kiinni ja jäisi vielä kaistaa usb:lle jne.

Threadripper ei oikein mun käyttöön ole soveltuva. Sitähän aina tarjotaan vaihtoehdoksi, jos pcie kaista loppuu kesken.

Timo 2 · 04.12.2020

finWeazel sanoi:
Mua ahdistaa nykyemojen chipset-cpu pcie kaistan leveys. Yksi nopea nvme levy pystyy syömään kaiken kaistan. Ei siitä nykytilantessa ole haittaa, mutta olisi parempi, jos pelivaraa olisi enemmän. Toivottavasti zen4:en kohdalla tulisi parannusta tähän asiaan. Saisi edes yhden supernopean ja yhden hitaamman levyn emolevyyn kiinni ja jäisi vielä kaistaa usb:lle jne.

Threadripper ei oikein mun käyttöön ole soveltuva. Sitähän aina tarjotaan vaihtoehdoksi, jos pcie kaista loppuu kesken.

Siis eikö sulle riitä 2 kpl NVMe asemaa? Toinen suoraan prossuun kiinni ja toinen piirisarjaan kiinni? Ja lisäksi, x570 piirisarja mahdollistaa 2kpl nopeaa PCIe 3.0 SSD-levyä, sen yhden pci-e 4.0 SSD-LEVYN lisäksi, joka on prossussa kiinni. Tämä on todella paljon kuluttajakäyttöön. Jos ei riitä, niin silloin threadtripper on se valinta, sillä teet jotain jossa sen hinta ei paina niin paljoa, kuin säästetty aika.

finWeazel · 04.12.2020

Timo 2 sanoi:
Siis eikö sulle riitä 2 kpl NVMe asemaa? Toinen suoraan prossuun kiinni ja toinen piirisarjaan kiinni? Ja lisäksi, x570 piirisarja mahdollistaa 2kpl nopeaa PCIe 3.0 SSD-levyä, sen yhden pci-e 4.0 SSD-LEVYN lisäksi, joka on prossussa kiinni. Tämä on todella paljon kuluttajakäyttöön. Jos ei riitä, niin silloin threadtripper on se valinta, sillä teet jotain jossa sen hinta ei paina niin paljoa, kuin säästetty aika.

Kelpaa toki. Mutta, jos sulla on chipsetissä kiinni nopea nvme asema niin voiko se esim. aiheuttaa random lagaamista koneeseen, kun levy piikkikuormissa vie kaiken kaistan? Mieluummin rakentaisin pc:n, jossa on pelivaraa jäljellä kaistojen kanssa. Ja toki tämä on hyvin teoreettista, kun ei tuollaisia piikkikuormia synny nykypeleillä/softilla. Mun vinkkeli on siitä erikoinen, että mun nykyinen kone on 2013 vuodelta. Seuraava pc sais mennä myös erittäin pitkään. Odottelen jalat ämpärissä zen4:sta tai intelin vastinetta sille. 1-2v sisällä tämä nykyinen laatikko menee vaihtoon. Siinä kohtaa wanha 4670k sotaratsu on palvellut 8-9v.

edit. Olen miettinyt seuraavaan koneeseen intelin optanea bootti&applikaatiokäyttöön, jos/kun intel saa pcie4 optanensa myyntiin. Yksi ultranopea pcie4 nvme ssd pelilevyksi ja hitaampi(halvempi) nvme/sata ssd massamuistiksi/legacy peleille. Tuolleen harvakseltaan kun päivittelee konetta niin ei noiden osien hinta ole kovin iso, kun jakaa hinnan käyttövuosilla. Kerran se vain kirpaisee lompakossa ja toiveissa olisi mahdollisimman lagiton ja nopea kone.

Jos zen4:ssa olisi pcie gen5 väylä chipset-cpu välillä niin saisi tuplattua kaistan ilman sen leventämistä. amd on puhunut next gen io:sta zen4:en yhteydessä. Toivossa on hyvä elää sanoi lapamato.

pomk · 04.12.2020

finWeazel sanoi:
Kelpaa toki. Mutta, jos sulla on chipsetissä kiinni nopea nvme asema niin voiko se esim. aiheuttaa random lagaamista koneeseen, kun levy piikkikuormissa vie kaiken kaistan? Mieluummin rakentaisin pc:n, jossa on pelivaraa jäljellä kaistojen kanssa. Ja toki tämä on hyvin teoreettista, kun ei tuollaisia piikkikuormia synny nykypeleillä/softilla. Mun vinkkeli on siitä erikoinen, että mun nykyinen kone on 2013 vuodelta. Seuraava pc sais mennä myös erittäin pitkään. Odottelen jalat ämpärissä zen4:sta tai intelin vastinetta sille. 1-2v sisällä tämä nykyinen laatikko menee vaihtoon. Siinä kohtaa wanha 4670k sotaratsu on palvellut 8-9v.

edit. Olen miettinyt seuraavaan koneeseen intelin optanea bootti&applikaatiokäyttöön, jos/kun intel saa pcie4 optanensa myyntiin. Yksi ultranopea pcie4 nvme ssd pelilevyksi ja hitaampi(halvempi) nvme/sata ssd massamuistiksi/legacy peleille. Tuolleen harvakseltaan kun päivittelee konetta niin ei noiden osien hinta ole kovin iso, kun jakaa hinnan käyttövuosilla. Kerran se vain kirpaisee lompakossa ja toiveissa olisi mahdollisimman lagiton ja nopea kone.

Jos zen4:ssa olisi pcie gen5 väylä chipset-cpu välillä niin saisi tuplattua kaistan ilman sen leventämistä. amd on puhunut next gen io:sta zen4:en yhteydessä. Toivossa on hyvä elää sanoi lapamato.

Ei aiheuta lagaamista, asiat vaan hidastuu hieman. Se piirisarja osaa dynaamisesti allokoida kaistaa ja yksi laite ei saa estettyä muita toimimasta samanaikaisesti. Nyt esim. X570 alustalla saat kiinni just niin paljon rojua kiinni kuin kuvailet haluavasi ilman mitään käytännössä relevantteja kompromisseja.

esim. samanaikaisesti yhdeltä nvme levyltä 8 Gt/s kaistaa, toiselta 6 Gt/s ja USB liittimistä vielä 2 Gt/s. Saa olla aika villit käyttökohteet jos kuvittelet että pullonkaulaksi tulisi joku muu kuin prossuteho kyseisellä alustalla tulevaisuudessa.

vemkki · 11.12.2020

Nyt näyttää Intelilläkin olevan kehitteillä chiplet-ratkaisua ainakin Xeoneihin. Sapphire Rapidsia on lupailtu ensi vuodelle (lopulle?). Saa nähdä, että pitääkö aikataulu.

Two-Die Xeon? Leaked Sapphire Rapids Photo Appears to Show Chiplets

Intel's Sapphire Rapids seems to use two dies, early photos reveal.

www.tomshardware.com

pomk · 11.12.2020

vemkki sanoi:
Nyt näyttää Intelilläkin olevan kehitteillä chiplet-ratkaisua ainakin Xeoneihin. Sapphire Rapidsia on lupailtu ensi vuodelle (lopulle?). Saa nähdä, että pitääkö aikataulu.

Two-Die Xeon? Leaked Sapphire Rapids Photo Appears to Show Chiplets

Intel's Sapphire Rapids seems to use two dies, early photos reveal.

www.tomshardware.com

NUMAa pukkaa kuin ekan sukupolven epyceissä konsanaan. Oiskohan jo seuraava aito chiplettiratkaisu?

hkultala · 11.12.2020

finWeazel sanoi:
Mua ahdistaa nykyemojen chipset-cpu pcie kaistan leveys. Yksi nopea nvme levy pystyy syömään kaiken kaistan. Ei siitä nykytilantessa ole haittaa, mutta olisi parempi, jos pelivaraa olisi enemmän. Toivottavasti zen4:en kohdalla tulisi parannusta tähän asiaan. Saisi edes yhden supernopean ja yhden hitaamman levyn emolevyyn kiinni ja jäisi vielä kaistaa usb:lle jne.

Threadripper ei oikein mun käyttöön ole soveltuva. Sitähän aina tarjotaan vaihtoehdoksi, jos pcie kaista loppuu kesken.

Ei, levy ei syö kaistaa vaan se softa, joka haluaa lukea sieltä levyltä isoja sarjamuotoisia lukuja syö kaistaa.

Kotikäyttäjät tarvitsee suurta kaistaa levylle käytännössä ainoastaan

1) Siirrellessään isoja tiedostoja partitiolta toiselle (totaalisen EVVK)
2) Herättäessään konetta hibernatesta

Levyjärjestelmässä kaiken normaalikäytön sujuvuuden kannalta hakuajalla on ziljoona kertaa enemän väliä kuin sillä kaistalla.

Ja jos NVME-levy on kiinni suoraan CPUla lähtevässä omassa pcie-väylässää, ei se voi syödä "kenenkään muun" kaistaa muutenkaan.

hkultala · 11.12.2020

vemkki sanoi:
Nyt näyttää Intelilläkin olevan kehitteillä chiplet-ratkaisua ainakin Xeoneihin. Sapphire Rapidsia on lupailtu ensi vuodelle (lopulle?). Saa nähdä, että pitääkö aikataulu.

Two-Die Xeon? Leaked Sapphire Rapids Photo Appears to Show Chiplets

Intel's Sapphire Rapids seems to use two dies, early photos reveal.

www.tomshardware.com

Chiplet on vaan AMDn markkinoinnin keksimä nimi MCMlle, joka on ikivanha idea.

Ei tuossa ole kyse mistään "uudesta chiplet-ratkaisusta", vaan siitä että ikivanha MCM-ratkaisu tuodaan joihinkin tuotteisiiin jälleen.

Otetaan vaan kaksi piilastua jotka on alunperin suunniteltu kytkettäviksi kahteen erilliseen kantaan, ja kahden erillisen kannan sijasta tungetaankin ne saman kannan samaan pakettiin.

Vastaava (tosin jaetulla väylällä eikä NUMAlla) oli Intelillä jo

* P4-aikakaudella (Pentium Duo)
* Core2 -aikakaudella (Core 2 quad)

Ja NUMAlla se on nähty mm

* Cascade Lake-AP:ssa, tosin valmistus- ja myyntimäärät näillä jäi hyvin pieniksi; Nämä ei ollut kovin järkeviä tuotteita, kun tehorajojen takia kellot piti laskea todella alas.

Siinä vaiheessa, kun intel siirtyi jaetusta väylästä NUMAan, se lopetti näiden symmetristen MCM-ratkaisuiden tekemisen teodella moneksi vuodeksi, koska NUMAlla niissä on vähän huono keskimääräinen muistinnopeus/pinni; pakettiin tarvitaan pinnit kaikiin piilastuihin kytketyille muistiväylille, mutta toiseen piilastuun kytketyn muistin käyttäminen on on silti hidasta.

AMD joutui tekemään symmetrisia NUMA-MCMiä (16-ytimiset bulldozer-/piledriver-opteronit, 16-32-ytimiset zen1-EPYCit ja threadripperit) koska AMDllä ei ollut resursseja suunnitella erillistä useampiytimistä piiriä palvelinkäyttöön. Ja bonuksena saatiin hiukan paremmat saannot kuin mitä isossa piilastussa olisi ollut.

Zen2n myötä AMD sitten luopui integroidusta muistiohjaimesta ja sen myötä NUMAsta jolloin voitiin tehdä MCM ilman NUMAn epäoptimaalisuuksia, tosin sitten kärsitään kaikelle sitä suurempaa muistiviivettä.

vemkki · 11.12.2020

hkultala sanoi:
Chiplet on vaan AMDn markkinoinnin keksimä nimi MCMlle,. joka on ikivanha idea.

Meinasin käyttää itse ensin termiä MCM, mutta ajattelin että chipletit ovat tutumpi termi ketjun lukijoille. Noh, nillitystähän siitä sitten tuli.

demu · 11.12.2020

ServeTheHomen foorumilla on vuodettu Ice Lake SP:tä seuraavan sukupolven (Sapphire Rapids SP) Xeon prosessorin kuva.

Alleged Intel Sapphire Rapids Xeon Processor Image Leaks, Dual-Die Madness Showcased

Today, thanks to the ServeTheHome forum member "111alan", we have the first pictures of the alleged Intel Sapphire Rapids Xeon processor. Pictured is what appears to be a dual-die design similar to Cascade Lake-SP design with 56 cores and 112 threads that uses two dies. The Sapphire Rapids is a...

www.techpowerup.com

Lähiaikoina (mahdollisesti) myyntiin tulevassa Xeon Ice Lake -arkkitehtuurin myötä Intel julkistaa jopa 36-ytimisen version, mutta sitäkin seuraavassa Sapphire Rapids SP-sukupolvessa ollaan enemmän ytimiä sisältävien versioiden kanssa kuvan mukaan edelleen samassa tilanteessa kuin nykyisellä Cascade Lake-SP -huippumallilla (56 ytiminen proessori, jossa kaksi cores 28-ytimistä piiriä sijoitettu samaan prosessorikantaan).

Tässä 10 nm SuperFin -prosessilla valmistettavassa prosessorissa Intel yrittää edelleen tehdä massiivisiin piisiruihin perustuvia prosessoreita, ja kun ytimiä ei saada riittävästi, laitetan toinen massiivinen piisiru samaan prosessorikantaan.
Kuinkahan kauan Intel pystyy tällä tiella jatkamaan?

k1nggg · 11.12.2020

CP 2077 kurittaa prosessoreita mukavasti, vanhat 4c prossut hyytyy pahasti.

screenshot_20201211-144053_samsung-internet-jpg.501319

aop · 11.12.2020

Näyttää myös muistikaistalla olevan iso vaikutus, kun katsoo 10600K, 9900K ja 10700K tuloksia. Sinänsä ei yllätä, kun Red Enginen edellinen versio Witcher 3:ssa oli tähän mennessä julkaistuista peleistä muistikaistariippuvaisin.

k1nggg · 11.12.2020

PDEP käskyillä ei ole vaikutusta SAM suorituskykyyn, eli ainakaan se ei ole syynä miksi kyseinen tekniikka ei ole tuettuna tällä hetkellä vanhemmilla Zen prossuilla.

finWeazel · 11.12.2020

pdep on hyödyllinen sam:in kanssa, kun se mahdollistaa tietynlaisen datan mankeloinnin cpu:lla tehokkaasti ennen gpu:n muistiin siirtämistä. Pakollinen se ei ole, mutta hyödyllinen. Mitään iloahan pdep:sta ei ole ellei pelienginet sitä käytä datan käpistelyyn. Tuolla saa vähän säästettyä gpu:ta oleellisempiin taskeihin ja cpu:n käyttöastetta ylöspäin.

vaappu79 · 11.12.2020

k1nggg sanoi:
CP 2077 kurittaa prosessoreita mukavasti, vanhat 4c prossut hyytyy pahasti.

Katohan kun "ei säikeet riitä enää mihinkään" 9600k riittääkin ihan kivasti tässä.

TommiZeliard · 12.12.2020

vaappu79 sanoi:
Katohan kun "ei säikeet riitä enää mihinkään" 9600k riittääkin ihan kivasti tässä.

Tarkoitatko kivasti riittämisellä sitä, että se häviää minimeissä (1%) vain 1 fps:n verrattuna halvempaan ikätoveriinsa Ryzen 3600:een? Vai sitä, että 35 fps:n minimi on ihan kivasti pelikelpoinen? Säikeiden riittämättömyys näkyy ensimmäisenä minimeissä ja sitä myöten min/avg - suhteen romahtamisena. Pelikokemuksen sulavuuden rikkoo juuri heikko minimi, joten siihen kannattaa kiinnittää huomiota muutenkin.

Min/avg, %:
9600K (6/6) 58,6 %
9900K (8/16) 65,9 %

10600K (6/12) 64,3 %
10700K (8/16) 66,6 %
10900K (10/20) 66,3 %

Huomaatko noista luvuista 9600K:n alkaneen kärsiä vähistä säikeistä?

Otetaan malliksi esiin vielä enemmän kärsinyt malli:
4670K (4/4) 44,7 %

Entäpä core-hirmu:
5950X (16/32) 71,1 %

Kyseinen peli näyttäisi suosivan Inteliä. Esim. 5800X vs. 10700K ja 5600X vs. 10600K näyttäisi poikkeavan hatusta heittämällä 10 % laajan pelijoukon keskiarvoista. 5900X vs. 10900K ei ole yhtä suurta poikkeamaa, mutta se johtuu kahdesta lisäytimestä ja pelin erinomaisesta moniydintuesta.

Joko keskityit katselemaan vain keskimääräistä ruudunpäivitystä, tai sitten vertasit 9600K:ta vain Ryzeneihin, jolloin pelin Intelille suosiollisuus pääsi hämäämään. Katso mieluummin minimeitä ja vertaa useampisäikeisiin Inteleihin, niin näet selvemmin 6/6 -coren heikkouden tuossa pelissä.

Minimit:
9600K/9900K, 35 fps/53 fps (+51 %)

Ei noilla kahdella prossulla ilmestyessään ollut tuollaista 51 % eroa minimeissä. Valitettavasti 9600K alkaa uusien pelien myötä jäämään "ydinhirmujen" jalkoihin yhä enemmän. Sitten se näkyy ja tuntuu vielä tätäkin enemmän, kun se uusi peli sattuukin olemaan AMD-ystävällinen. Silloin ikätoverit 3600 ja 3700X jättävät ison hajuraon, jos nytkin niiden minimit olivat 36 fps ja 46 fps vs. 9600K:n 35 fps.

Proscribo · 12.12.2020

TommiZeliard sanoi:
Tarkoitatko kivasti riittämisellä sitä, että se häviää minimeissä (1%) vain 1 fps:n verrattuna halvempaan ikätoveriinsa Ryzen 3600:een? Vai sitä, että 35 fps:n minimi on ihan kivasti pelikelpoinen? Säikeiden riittämättömyys näkyy ensimmäisenä minimeissä ja sitä myöten min/avg - suhteen romahtamisena. Pelikokemuksen sulavuuden rikkoo juuri heikko minimi, joten siihen kannattaa kiinnittää huomiota muutenkin.

Min/avg, %:
9600K (6/6) 58,6 %
9900K (8/16) 65,9 %

10600K (6/12) 64,3 %
10700K (8/16) 66,6 %
10900K (10/20) 66,3 %

Huomaatko noista luvuista 9600K:n alkaneen kärsiä vähistä säikeistä?

Otetaan malliksi esiin vielä enemmän kärsinyt malli:
4670K (4/4) 44,7 %

Entäpä core-hirmu:
5950X (16/32) 71,1 %

Kyseinen peli näyttäisi suosivan Inteliä. Esim. 5800X vs. 10700K ja 5600X vs. 10600K näyttäisi poikkeavan hatusta heittämällä 10 % laajan pelijoukon keskiarvoista. 5900X vs. 10900K ei ole yhtä suurta poikkeamaa, mutta se johtuu kahdesta lisäytimestä ja pelin erinomaisesta moniydintuesta.

Joko keskityit katselemaan vain keskimääräistä ruudunpäivitystä, tai sitten vertasit 9600K:ta vain Ryzeneihin, jolloin pelin Intelille suosiollisuus pääsi hämäämään. Katso mieluummin minimeitä ja vertaa useampisäikeisiin Inteleihin, niin näet selvemmin 6/6 -coren heikkouden tuossa pelissä.

Minimit:
9600K/9900K, 35 fps/53 fps (+51 %)

Ei noilla kahdella prossulla ilmestyessään ollut tuollaista 51 % eroa minimeissä. Valitettavasti 9600K alkaa uusien pelien myötä jäämään "ydinhirmujen" jalkoihin yhä enemmän. Sitten se näkyy ja tuntuu vielä tätäkin enemmän, kun se uusi peli sattuukin olemaan AMD-ystävällinen. Silloin ikätoverit 3600 ja 3700X jättävät ison hajuraon, jos nytkin niiden minimit olivat 36 fps ja 46 fps vs. 9600K:n 35 fps.

Eikö olisi riittänyt mainita, että 6 vuotta vanha Haswell-E 8c/16t 5960X on hyvällä erolla 9600K:n edellä.

vaappu79 · 12.12.2020

TommiZeliard sanoi:
Tarkoitatko kivasti riittämisellä sitä, että se häviää minimeissä (1%) vain 1 fps:n verrattuna halvempaan ikätoveriinsa Ryzen 3600:een? Vai sitä, että 35 fps:n minimi on ihan kivasti pelikelpoinen? Säikeiden riittämättömyys näkyy ensimmäisenä minimeissä ja sitä myöten min/avg - suhteen romahtamisena. Pelikokemuksen sulavuuden rikkoo juuri heikko minimi, joten siihen kannattaa kiinnittää huomiota muutenkin.

Min/avg, %:
9600K (6/6) 58,6 %
9900K (8/16) 65,9 %

10600K (6/12) 64,3 %
10700K (8/16) 66,6 %
10900K (10/20) 66,3 %

Huomaatko noista luvuista 9600K:n alkaneen kärsiä vähistä säikeistä?

Otetaan malliksi esiin vielä enemmän kärsinyt malli:
4670K (4/4) 44,7 %

Entäpä core-hirmu:
5950X (16/32) 71,1 %

Kyseinen peli näyttäisi suosivan Inteliä. Esim. 5800X vs. 10700K ja 5600X vs. 10600K näyttäisi poikkeavan hatusta heittämällä 10 % laajan pelijoukon keskiarvoista. 5900X vs. 10900K ei ole yhtä suurta poikkeamaa, mutta se johtuu kahdesta lisäytimestä ja pelin erinomaisesta moniydintuesta.

Joko keskityit katselemaan vain keskimääräistä ruudunpäivitystä, tai sitten vertasit 9600K:ta vain Ryzeneihin, jolloin pelin Intelille suosiollisuus pääsi hämäämään. Katso mieluummin minimeitä ja vertaa useampisäikeisiin Inteleihin, niin näet selvemmin 6/6 -coren heikkouden tuossa pelissä.

Minimit:
9600K/9900K, 35 fps/53 fps (+51 %)

Ei noilla kahdella prossulla ilmestyessään ollut tuollaista 51 % eroa minimeissä. Valitettavasti 9600K alkaa uusien pelien myötä jäämään "ydinhirmujen" jalkoihin yhä enemmän. Sitten se näkyy ja tuntuu vielä tätäkin enemmän, kun se uusi peli sattuukin olemaan AMD-ystävällinen. Silloin ikätoverit 3600 ja 3700X jättävät ison hajuraon, jos nytkin niiden minimit olivat 36 fps ja 46 fps vs. 9600K:n 35 fps.

No totta ihmeessä vertaan lähinnä ryzenin 3600 malliin.
Noita ostettiin ihan tuskana nimenomaan pelikäyttöön.
Ei kait sitä voi ihan tosissaan verrata tuplasti tai triplasti kalliimpiin kiviin.

TommiZeliard · 12.12.2020

vaappu79 sanoi:
No totta ihmeessä vertaan lähinnä ryzenin 3600 malliin.
Noita ostettiin ihan tuskana nimenomaan pelikäyttöön.
Ei kait sitä voi ihan tosissaan verrata tuplasti tai triplasti kalliimpiin kiviin.

Ok, verrataan siihen. Syyskuussa 2019 Ryzen 3600:n tullessa 9600K maksoi noin 40-50 € enemmän kuin 3600, eli se oli noin 20 % kalliimpi tuote. Lisäksi nopeita muisteja halutessaan siihen piti ostaa kalliimpi Z-sarjan emolevy, kun Ryzenille riitti edullinen B450. Kyseinen Intel oli siis kalliimpi vaihtoehto, mutta toisaalta nimenomaan pelikäytössä hinnalle sai vastinetta 5-10 % paremman suorituskyvyn muodossa. IO-techin revikan mukaan minimeissä ero oli jopa 10-20 % Intelin hyväksi, jos CSGO:ta ei lasketa. Tuo oli tilanne 2019 syksyllä. AMD:n valttina oli SMT, mistä oli apua hyötyohjelmissa.

Nyt Cyberpunkin myötä voimasuhteet alkavat kääntyä myös peleissä. Halvempi AMD 3600 oli jo karvan verran parempi minimeissä, vaikka peli selvästi suosii Inteliä. Suosimisen määrä on noin 10 %, minkä näkee, kun vertaa 6- ja 8-ydin 10xxxK vs. 5x00X. Tuossa pelissä Intel voittaa 5 %, kun taas eri pelien keskiarvossa AMD voittaa noin 5 %. Jos lasketaan tuo Intelille suosiollisuus pois, niin minimeiksi saadaan 35 vs. 36 sijaan 35 fps (9600K) vs. 40 fps (3600). Tuossa olisi voimasuhteet neutraalissa pelissä, joka olisi yhtä vaativa kuin Cyberpunk. Yhtäkkiä se halvempi ja julkaisuhetkellään heikompi peliprossu alkaakin olla vahvempi, eikä tähän mennyt kuin reilu vuosi.

@Proscribo Olisi riittänyt 5960X:n maininta, jos olisin halunnut tarkastella vain onko pelissä hyvä moniydintuki, mutta senhän nyt näki heti, että on hyvä tuki. Halusin sen sijaan katsoa, tuleeko tuossa pelissä kunnon romahtaminen min/avg -suhteessa jo 6/6 -ytimisellä, kuten jo aiemmin on nähty 4/4:lle tapahtuvan. Cyberpunkissa tuo suhde on Intelillä noin 66 %, jos prossussa on säikeitä riittävästi. Rajatapaus on 6/12, jolla suhde on 64 %. Pelinopeus toki paranee lisäytimillä, mutta vasta tuon alle mentäessä minimi alkaa suhteellisestikin romahtaa. Siinä 6/6:ssa oli 58,6 % ja 4/4:ssä 44,7 %.

Japa · 12.12.2020

TommiZeliard sanoi:
Tarkoitatko kivasti riittämisellä sitä, että se häviää minimeissä (1%) vain 1 fps:n verrattuna halvempaan ikätoveriinsa Ryzen 3600:een? Vai sitä, että 35 fps:n minimi on ihan kivasti pelikelpoinen? Säikeiden riittämättömyys näkyy ensimmäisenä minimeissä ja sitä myöten min/avg - suhteen romahtamisena. Pelikokemuksen sulavuuden rikkoo juuri heikko minimi, joten siihen kannattaa kiinnittää huomiota muutenkin.

Min/avg, %:
9600K (6/6) 58,6 %
9900K (8/16) 65,9 %

10600K (6/12) 64,3 %
10700K (8/16) 66,6 %
10900K (10/20) 66,3 %

Huomaatko noista luvuista 9600K:n alkaneen kärsiä vähistä säikeistä?

Otetaan malliksi esiin vielä enemmän kärsinyt malli:
4670K (4/4) 44,7 %

Entäpä core-hirmu:
5950X (16/32) 71,1 %

Kyseinen peli näyttäisi suosivan Inteliä. Esim. 5800X vs. 10700K ja 5600X vs. 10600K näyttäisi poikkeavan hatusta heittämällä 10 % laajan pelijoukon keskiarvoista. 5900X vs. 10900K ei ole yhtä suurta poikkeamaa, mutta se johtuu kahdesta lisäytimestä ja pelin erinomaisesta moniydintuesta.

Joko keskityit katselemaan vain keskimääräistä ruudunpäivitystä, tai sitten vertasit 9600K:ta vain Ryzeneihin, jolloin pelin Intelille suosiollisuus pääsi hämäämään. Katso mieluummin minimeitä ja vertaa useampisäikeisiin Inteleihin, niin näet selvemmin 6/6 -coren heikkouden tuossa pelissä.

Minimit:
9600K/9900K, 35 fps/53 fps (+51 %)

Ei noilla kahdella prossulla ilmestyessään ollut tuollaista 51 % eroa minimeissä. Valitettavasti 9600K alkaa uusien pelien myötä jäämään "ydinhirmujen" jalkoihin yhä enemmän. Sitten se näkyy ja tuntuu vielä tätäkin enemmän, kun se uusi peli sattuukin olemaan AMD-ystävällinen. Silloin ikätoverit 3600 ja 3700X jättävät ison hajuraon, jos nytkin niiden minimit olivat 36 fps ja 46 fps vs. 9600K:n 35 fps.

Bronto Skylift sanoi:
Mitä vittua mä just katsoin??

Aivot ei prosessoi enää tässä vaiheessa iltaa, mutta maestrolle kysymys,

Pärjääkö 8700k:lla vielä 2-021? Hieman tulkinnan varaa oli noissa 3600/5600 taulukoissa.

Virallinen: AMD vs Intel keskustelu- ja väittelyketju

BANNATTU

Kiitos.

Chief Karpfen - ruoKalan C&R

Chief Karpfen - ruoKalan C&R

Conducător & Geniul din Carpați

Chief Karpfen - ruoKalan C&R

Kiitos.

BANNATTU

Uutiset

Statistiikka

Hinta.fi