AMD julkaisi odotetun Ryzen 7 9800X3D -prosessorin 2. sukupolven 3D V-Cache -välimuistilla

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 405
amd-ryzen-9000-x3d-reimagined-20241021.jpg

AMD ilmoitti aiemmin tässä kuussa julkaisevansa Ryzen 9000X3D:n 7. päivä marraskuuta. Yhtiön kalenterit ovat ilmeisesti halloweenin haamujen sotkemat, sillä yhtiö täräytti tänään julki Ryzen 7 9800X3D -prosessorin ilman ennakkovaroituksia.



Ryzen 7 9800X3D perustuu Zen 5 -arkkitehtuuriin ja toisen sukupolven 3D V-Cache -teknologiaan. Toisen sukupolven 3D V-Cache eroaa ensimmäisestä sukupolvesta siten, että nyt 64 megatavun kokoinen välimuistisiru on sijoitettu paketoinnissa CCD-prosessorisirun alapuolelle, kun aiemmin se on ollut sen päällä.

Ratkaisu mahdollistaa Zen 5 CCD-prosessorisirun aiempaa tehokkaamman jäähdytyksen ja sen myötä jo itsessään aiempaa korkeammat kellotaajuudet, mutta monelle harrastajalle iloisena yllätyksenä myös ylikellotuksen. AMD menee tiedotteessaan niin pitkälle, että puhuu jopa extreme-ylikellotuksesta, mikä yleensä viittaa nestemäisellä typellä tai heliumilla tehtäviin ennätysajoihin.

Ryzen 7 9800X3D:ssä on käytössä yksi CCD-siru ja sen myötä kahdeksan Zen 5 -prosessoriydintä, jotka kykenevät suorittamaan SMT-teknologian avulla 16 samanaikaista säiettä. Prosessoriydinten peruskellotaajuus on 4,7 ja maksimi Boost-kellotaajuus 5,2 GHz. CCD-sirulla on valmiiksi 32 Mt L3-välimuistia ja sen alle sijoitetun 2. sukupolven 3D V-Cache -sirun ansiosta yhteensä L3-välimuistia on käytössä 96 Mt. Prosessorin TDP-arvo on asetettu 120 wattiin.

AMD:n omien testien mukaan Ryzen 7 9800X3D on peleissä keskimäärin 8 % nopeampi, kuin yhtiön edeltävä Ryzen 7 7800X3D, ja jopa 20 % nopeampi kuin kilpailijan prosessorit. Lisäksi yhtiö nostaa esille Star Wars Outlawsin, jossa ero 7800X3D:hen on merkittävästi keskiarvoa suurempi, eikä sen pitäisi olla ainut vastaavalla tavalla käyttäytyvä peli.

Keskimääräisen suorituskyvyn paranemisen lisäksi yhtiö kehuu suuremman välimuistin mahdollistavan myös paremmat minimi FPS:t, vaikka keskimääräinen suorituskyky ei erottuisikaan joukosta. Yhtiön nostaa esimerkiksi Last of Us: Part 1:n, jossa uuden 9800X3D:n keskimääräinen suorituskyky vastaa i9-14900K:ta, mutta 1 %:n minimi FPS on jopa 31 % parempi.

AMD on hinnoitellut Ryzen 7 9800X3D:n verottomana 479 dollariin, minkä pitäisi Suomen verokannalla kääntyä noin 555-560 euroon. Prosessorin myynti alkaa 7. marraskuuta.

Lähde: AMD
 
Viimeksi muokattu:
Lievä pettymys, koska odotin että välimuistia olisi lisätty. Peleissä, mitkä hyötyvät välimuistista hyötyvät sen määrän takia, ja siinä ei parisataa mhz paljoa paina. Jatketaan 5700x3D:llä.
 
Eli pari kymppiä halvempi kuin 7800X3D tällä hetkellä. ( Ihmiset jotka lukevat arvosteluja, vertaavat kaupan hintoja, ei julkaisuhintoja. )
 
Milloinkahan mahdollisen 9950X3D julkistus on? Vai jääkö tältä erää ainoaksi X3D-malliksi?
 
Yritin etsiä noita endnoteja (GNR-21) jne. Mutta en löytänyt.
Tuo että joissain peleissä yli 50% nopeampi kuin 285K on todella hurja asia.
Saa nähdä miten paljon AMD on onnistunut näitä valmistamaan julkaisupäivään mennessä, suurella todennäköisyydellä saatavuus ei tule olemaan hyvä tämän vuoden puolella, sen verran hyvältä vaikuttaa pelaajille.
 
NDA taas loppuu 6.11, eli silloin tulevat testit. Ainakin Jayz tämän mainitsi.
Kyllä nää tiedossa on, kyse on siitä onko AMD antanut lupaa kertoa tota. Vuodosta se alun perin julki tuli muulle kuin medialle kuitenkin.
 
Ihan ok tuotteelle kuulostaa. Tuskin enää AMD menee ainakaan liikoja luoailemaan. Ihan kiva boosti tulossa, kun vaihdan 5800X3D --> 9800X3D.
 
Joo kait se pitää nyt sitten uskoa että "ylimääräinen" välimuisti on laitettu ns alapuolelle joka on kyllä hemmetin hyvä homma. Toivottavasti vielä julkaisuhinnat ei myöskään nouse spekuloituja korkeammiksi vaan mielummin alakanttiin.

EDIT: Itseasiassa tuossahan lähdesivun linkissähä ja artikkelin lopussakin se hintakin taitaa olla:
SEP
(USD)

479$
 
Viimeksi muokattu:
Toivottavasti 12 ja 16 ytimiset mallit tulevat molemmilla ccd sirun 3d välimuistiratkaisulla niin hyöty niissä olisi pelikäytösssä hieman parempi.
Testejä joutuu tietysti odottelemaan kun 9000 sarjan pelisuorituskyky on ollut aika ailahteleva tietyissä peleissä.
 
Niitä puolueettomia testejä odotellessa kaikki muu "uutisointi" on turhaa...
Ei aivan, pörssiyhtiön tiedotteiden on lähtökohtaisesti pidettävä paikkansa. Muutoin johdetaan harhaan osakkeenomistajia.
Tämän takia siellä oli myös huomattavasti lakitekstiä välissä.
 
ee
Toivottavasti 12 ja 16 ytimiset mallit tulevat molemmilla ccd sirun 3d välimuistiratkaisulla niin hyöty niissä olisi pelikäytösssä hieman parempi.
Testejä joutuu tietysti odottelemaan kun 9000 sarjan pelisuorituskyky on ollut aika ailahteleva tietyissä peleissä.
Miksi uskot että pelisuorituskyky olisi selvästi parempi jos molemmilla CCD:illä olisi iso cache? Nythän nimenomaan pelisuorituskyky heikkenee 12 ja 16 ytimisillä malleilla sen takia kun niitä säikeitä ajautuu sinne toiselle CCD:lle jolloin viive kasvaa selvästi. Tietääkseni toinen CCD ei voi lukea toisen CCD:n cachesta dataa muutenkaa, jolloin joudutaan data siirtää ihan RAM-muistin kautta? (hidasta)
 
ee

Miksi uskot että pelisuorituskyky olisi selvästi parempi jos molemmilla CCD:illä olisi iso cache? Nythän nimenomaan pelisuorituskyky heikkenee 12 ja 16 ytimisillä malleilla sen takia kun niitä säikeitä ajautuu sinne toiselle CCD:lle jolloin viive kasvaa selvästi. Tietääkseni toinen CCD ei voi lukea toisen CCD:n cachesta dataa muutenkaa, jolloin joudutaan data siirtää ihan RAM-muistin kautta? (hidasta)
Kyllä se varmaankin parempi olis tilanteissa vs ilman omaa lisättyä välimuistia. Mutta toisaalta enemmän tuossa varmasti vaikuttaa myös se miten pelit on optimoitu. Taitaa monet pelit edelleen olla optimoituja 6-8 ytimelle (vanhemmat neljälle ja alaspäin) ja siitä ylemmäs pitelee hiljasta. Ehkä jokunen peli saattaa löytyä. Oliko cyberpunk ja jokunen muu jotka käyttää enempää kuin 8 ydintä hyödyksi :hmm: Toki pitää myös kysyä onko edes ideaalia ajaa tällä hetkellä pelejä suurella määrällä ytimiä koska näytönohjaimillakin tulee vastavuoroisesti rajoitteita vastaan piirtää kuvaa riittävän nopeasti. Tuo suurempi määrä ytimiä siis tulee joka tapauksessa operoimaan parhaimmillaan tyyliin puolella teholla. Onko tämä sitten energian kulutuksen kannalta parempi kuin ajaa vähempää määrää ytimiä isommalla käyttöasteella. Ehkä ei riippuu hyötysuhteesta. Toki jos multitaskaa ja pyörittää vaikka kahta peliä samaan aikaan niin silloin luonnollisest tuollanen isompi ydinmäärä ja kaikilla omat lisätyt välimuistit toimii varmasti jouhevammin, mutta nämä on taas niitä erikois caseja.

Toki enemmän tämä ytimien välimuistin puute tai tarve taitaa käsittääkseni koskettaa jälleen windowsin paskaa scheduleria ja ytimien hallintaa ja allokointia prosesseille. Välimuistin ulottaminen kaikille ytimille varmasti ratkaisisi windowsin osalta tämän ytimillä kikkailun. Linuxissahan ei tunnetusti kyseistä ongelmaa ilmene kun ytimiä voi eristää huomattavasti yksinkertaisemmin ja jouhevammin.
 
Viimeksi muokattu:
Joo kait se pitää nyt sitten uskoa että "ylimääräinen" välimuisti on laitettu ns alapuolelle joka on kyllä hemmetin hyvä homma. Toivottavasti vielä julkaisuhinnat ei myöskään nouse spekuloituja korkeammiksi vaan mielummin alakanttiin.

EDIT: Itseasiassa tuossahan lähdesivun linkissähä ja artikkelin lopussakin se hintakin taitaa olla:
SEP
(USD)

479$
Olisi ollut ihan siinä uutisessa, ei olisi tarvinnut klikata mitään.
 
Kyllä se varmaankin parempi olis tilanteissa vs ilman omaa lisättyä välimuistia. Mutta toisaalta enemmän tuossa varmasti vaikuttaa myös se miten pelit on optimoitu. Taitaa monet pelit edelleen olla optimoituja 6-8 ytimelle (vanhemmat neljälle ja alaspäin) ja siitä ylemmäs pitelee hiljasta. Ehkä jokunen peli saattaa löytyä. Oliko cyberpunk ja jokunen muu jotka käyttää enempää kuin 8 ydintä hyödyksi :hmm: Toki pitää myös kysyä onko edes ideaalia ajaa tällä hetkellä pelejä suurella määrällä ytimiä koska näytönohjaimillakin tulee vastavuoroisesti rajoitteita vastaan piirtää kuvaa riittävän nopeasti. Tuo suurempi määrä ytimiä siis tulee joka tapauksessa operoimaan parhaimmillaan tyyliin puolella teholla. Onko tämä sitten energian kulutuksen kannalta parempi kuin ajaa vähempää määrää ytimiä isommalla käyttöasteella. Ehkä ei riippuu hyötysuhteesta. Toki jos multitaskaa ja pyörittää vaikka kahta peliä samaan aikaan niin silloin luonnollisest tuollanen isompi ydinmäärä ja kaikilla omat lisätyt välimuistit toimii varmasti jouhevammin, mutta nämä on taas niitä erikois caseja.

Toki enemmän tämä ytimien välimuistin puute tai tarve taitaa käsittääkseni koskettaa jälleen windowsin paskaa scheduleria ja ytimien hallintaa ja allokointia prosesseille. Välimuistin ulottaminen kaikille ytimille varmasti ratkaisisi windowsin osalta tämän ytimillä kikkailun. Linuxissahan ei tunnetusti kyseistä ongelmaa ilmene kun ytimiä voi eristää huomattavasti yksinkertaisemmin ja jouhevammin.

Lisätään vielä se että lisätty välimuisti ei aina lisää suorituskykyä- Jos tarvittava data jo valmiiksi mahtuu pienempään muistiin, on se sieltä myös nopeampi hakea koska pienemmässä cachessa on pienempi latenssi. Lisäksi välillä pelit ja ohjelmat 7950X3D ajavat sillä ei 3d chipsetillä koska ovat siinä nopeampi kovemman kellotaajuden ansiosta. Aika näyttää miten uusien prossujen todelliset kellotaajudet ovat verrattuna normaalin ja 3d variantin välillä.
 
Tuo että joissain peleissä yli 50% nopeampi kuin 285K on todella hurja asia.
Saa nähdä miten paljon AMD on onnistunut näitä valmistamaan julkaisupäivään mennessä, suurella todennäköisyydellä saatavuus ei tule olemaan hyvä tämän vuoden puolella, sen verran hyvältä vaikuttaa pelaajille.

Lähinnä se kertoo 285K surkeudesta. Tuskin nämä nyt ihan tolkuttomasti käy kaupaksi, kun monella on jo 7800X3D (tai vaikka 5800X3D), joihin he voivat edelleen olla varsin tyytyväisiä. 7800X3D verrattuna tämä ei vaikuta miltään kummoiselta jytkyltä. Sikäli uskon saatavuuden olevan hyvää tasoa.

Toisaalta Intel on sössinyt asioitaan lisää viime aikoina, että sieltä voi tullakin ostajia jotka ovat viimein kyllästyneet odottelemaan uusia parempia tuotteita. Mutta kyllä itse ainakin 7800X3D omistajana helposti jään odottamaan seuraavaa sukupolvea, toki harvoin muutenkaan kannattaa joka sukupolvessa päivitellä.
 
Ei aivan, pörssiyhtiön tiedotteiden on lähtökohtaisesti pidettävä paikkansa. Muutoin johdetaan harhaan osakkeenomistajia.
Tämän takia siellä oli myös huomattavasti lakitekstiä välissä.
Pörssiyhtiöt saavat valehdella aika rajusti, että sillä on oikeasti mitään todellisia seuraamuksia. Tässä ollaan myös sellaisen asian parissa, että totuutta voidaan värittää aika paljon ilman, että ainakaan todistettavasti valehdellaan. Esimerkiksi Inteliä on ajettu balancedilla tässä vertailussa, joka tiputtaa suorituskykyä. Toisaalta harrastelijalle se ainut tärkeä vertailu tässä on 7800x3d.
 
16-core malli kiinnostaa hieman, mutta saattaa silti jäädä tämä sukupolvi väliin.

7800X3D prossulla huomaa hieman hyytymisen merkkejä, kun on kovempaa moniajoa menossa. Edellisellä 5900X prosessorilla käyttö oli siinä mielessä sulavampaa.
 
Mielenkiintoinen julkaisu, koska cache on sirun alla. Voi vesikierrollakin ja directdie blokilla saada hyötyä. Jää nähtäväksi.
 
Riippuu mistä sirusta puhut, mutta CCD:n on. Ihan sama CCD mikä löytyy kaikista Zen 5 -prossuista (pl Strix Point koska monoliitti)
Io-die on N6 prosessilla, ytimet N4X prosessilla ("5nm" perhe) Ja sitä 3d välimuistiakaan ei kannata pienemmällä tehdä, koska SRAM ei enään skaalaudu kuten aiemmin.

Tosin kun tarkistin asian varmuuden vuoksi, tuli vastaan tälläinen artikkeli:


Ja sram saadaan 16,67 % pienennettyä N2 prosessissa.
 
Ihan kiva parannus peleissä varsinkin jos on tulossa vanhemmasta prosessorista tähän uuteen. Intelille jäi Arrow Lakesta tyhjä arpa.
 
16-core malli kiinnostaa hieman, mutta saattaa silti jäädä tämä sukupolvi väliin.

7800X3D prossulla huomaa hieman hyytymisen merkkejä, kun on kovempaa moniajoa menossa. Edellisellä 5900X prosessorilla käyttö oli siinä mielessä sulavampaa.
Sama, 9800x3d kyllä kiinnostaa hieman mutta mietityttää olisko 9950x3d keksitty jotain sellaista joka veisi voiton….

Edit. Siis järkevällä hintaerolla myös :)
 
Sama, 9800x3d kyllä kiinnostaa hieman mutta mietityttää olisko 9950x3d keksitty jotain sellaista joka veisi voiton….

Edit. Siis järkevällä hintaerolla myös :)
Veikkaan juslkasuhetkellä 900€ hintalappua. Ihan vaan sen takia koska ainakin oman kokemuksen mukaan julkasuhetkellä prossujen hinnat ollu jossain 820-850€ hintaluokkaa, prossusta ja paikasta riippuen. Ja nyt kun vielä suomen päässä verotusta muutettu se 1,5%, niin 900-930€ on hinta jolla oman veikkauksen mukaan tullaan myymään.
 
Mielenkiintoinen julkaisu, koska cache on sirun alla. Voi vesikierrollakin ja directdie blokilla saada hyötyä. Jää nähtäväksi.
No tippuihan noilla 7800X3D:nkin lämmöt parhaillaan liki 20 astetta. Toki tälle prossulle voi antaa ihan eri tavalla runtua nyt, kun se lämpö saadaan kivestä pihallekin.
 
GamersNexuksen x3d cache jutusta päätellen tulee vaikutelma että ihan pelkällä PBO:lla tuo uusi malli voisi kellottua melko helposti jonnekin 5.4 GHz. Siis kuinka noiden kaikkien aikaisempien mallien merkittävän rajoitteena oli se cache jäähyn ja ytimien välillä, ettei tyylin edes 5800x3d voinut ajaa kuin 5800x vakiona. Niin jos sille vakiona "luvataan" 5.2 GHz niin kai PBO nyt pari sataa antaa lisää kun se cache ei millään tavalla ilmeisesti rajoita mitään. (lämmöt tai jännite)

Tällöin tuo olisi hyvin selvä ja oikea parannus Zen 4 vastaavaan. Mikä ei ole paistanut noista 6 ja 8 ytimisten testeistä ainakaan. Vissiin noi ydinmöhköhirviöt saattoivat nähdä selvää parannusta moniydin suorituksessa.


Mielenkiintoinen julkaisu, koska cache on sirun alla. Voi vesikierrollakin ja directdie blokilla saada hyötyä. Jää nähtäväksi.

Kyse on kuitenkin 120W TDP prossusta. Ei se tule juuri hyötymään vesijäähystä yhtään yli sen mitä hyvä 6 lämpöputkinen ilmajäähy antaa.


ee

Miksi uskot että pelisuorituskyky olisi selvästi parempi jos molemmilla CCD:illä olisi iso cache? Nythän nimenomaan pelisuorituskyky heikkenee 12 ja 16 ytimisillä malleilla sen takia kun niitä säikeitä ajautuu sinne toiselle CCD:lle jolloin viive kasvaa selvästi. Tietääkseni toinen CCD ei voi lukea toisen CCD:n cachesta dataa muutenkaa, jolloin joudutaan data siirtää ihan RAM-muistin kautta? (hidasta)

Toi eka nyt on periaatteessa jossain määrin ihan käyttäjänkin autettavissa pakottamalla peli puoliksi molempiin CCD:hin. Sä siis puhut havainnoista sellaisella prosessorilla, jossa on kaksi CCD:tä, mutta vain yksi cache toisella. Kuitenkin siinä skenaarioprosessorissa olisi kaksi cachea. (Tai ehkä pikemminkin todellisuudessa yhteinen iso L4, jos sellainen tulisi jossa molemmat CCD:t sisältäisivät ylimääräisen cachen)

Ramin ja (L3) cachen suhde on sellainen, että cache ja/tai ram sisältää saman asian. Mä olettaisin että erilliset CCD:t tietysti pystyvät kommunikoimaan suoraan keskenään. Siinähän ne nököttää vierekkäin prosssorisirulla. Mutta jos kumpikin käyttää, ja erityisesti voivat muokata sitä osaa RAM muistia, joka on molempien cachessa, niin ne molemmat cachet joudutaan pitämään erikseen ajan tasalla. Tämä on ajallisesti kallista.

Kuitenkaan ei ole mitään mieltä tehdä 2x CCD prossua kahdella cachella koska ne pelit hädin tuskin hyötyvät 8 ytimestä, ja lähes kaikki muut softat hyötyvät melko vähän siitä cachesta, siis sellaiset softat jotka voisivat käyttää kaikkia ytimiä. Pelit hyötyvät niin paljon enemmän siitä cachesta. Kaksi cachea olisi vain hieman enemmän L3 muistia yhteensä, osin kuvaamasi haitan kanssa. Eli niin kauan kuin tuo korostettu osa on totta, on täysin turha haaveilla kahden CCD:n prossusta jossa molemmilla olisi ylimääräinen cache.

Oletettavasti seuraava isompi hyppy on joku 3-5x kertainen ylimääräinen cache nykyisen 64 megan sijaan, ja ellei tämä tapahdu vasta 10 vuoden päästä, se varmasti isketään 6-10 ytimen päälle koska enempää ei ne pelit vielä pitkään hyödynnä tehokkaasti. Voisi olettaa että kun tuohon määrään päädyttiin monta vuotta sitten, että se oli kompromissi hinnan ja koon suhteen. Mutta sirut koko ajan pienenee, ja vastaavasti Intelin prossujen pelisuorituskyky heikkenee ja täten ero AMD:n x3d cache malleihin kasvaa. Siitä saadaan se hinta, parempi tuote on aina kalliimpi, joka sitten näppärästi kustantaa sen suuremman cachen ilman että tärkein eli omistajien tuotto heikkenee.
 
Viimeksi muokattu:
Io-die on N6 prosessilla, ytimet N4X prosessilla ("5nm" perhe) Ja sitä 3d välimuistiakaan ei kannata pienemmällä tehdä, koska SRAM ei enään skaalaudu kuten aiemmin.

Tosin kun tarkistin asian varmuuden vuoksi, tuli vastaan tälläinen artikkeli:


Ja sram saadaan 16,67 % pienennettyä N2 prosessissa.

Tuo uutinen antaa toivoa paremmasta päivityksestä Zen6 x3d peliprossun osalta. Taidan itse pärjätä tällä 7800x3d llä siihen asti kunnes 2026-2027 julkaistaan 11800x3d. Siinä olisi varmaan tsmcn 2 valmistusprosessin myötä välimuisti ccd sirun alapuolella kuten Zen 5 sukupolvessakin ja kenties myös sramin skaalautuvuuden vuoksi l3 tason cachea 120-150 megaa tai enemmän. Saisi samalla kertaa isommat kellotaajuudet ja lisää cachea. Joka sukupolvea ei kannata päivittää.
 
Viimeksi muokattu:
Aah tajusin. Näin vaan tuon world's best gaming processor tekstin enkä kuvaa eli bugaten eli en tiennyt. Kun postasin mun kuva näkyy itselle vieläkin koska copypastasin clipboardilta sen enkä linkannut. Saa jos haluaa poistaa mun kommentin ja replysi siihen.
 
Aah tajusin. Näin vaan tuon world's best gaming processor tekstin enkä kuvaa eli bugaten eli en tiennyt. Kun postasin mun kuva näkyy itselle vieläkin koska copypastasin clipboardilta sen enkä linkannut. Saa jos haluaa poistaa mun kommentin ja replysi siihen.
Ei siis ole mitään tarvetta poistaa sun viestiä tietenkään, lähinnä tarkoitus oli vinkata siitä toisestakin graafista. Molemmissa lähteenä siis tietenkin AMD eli valmistajan omat testit, ei kolmansien osapuolten.
 
Toi eka nyt on periaatteessa jossain määrin ihan käyttäjänkin autettavissa pakottamalla peli puoliksi molempiin CCD:hin. Sä siis puhut havainnoista sellaisella prosessorilla, jossa on kaksi CCD:tä, mutta vain yksi cache toisella. Kuitenkin siinä skenaarioprosessorissa olisi kaksi cachea. (Tai ehkä pikemminkin todellisuudessa yhteinen iso L4, jos sellainen tulisi jossa molemmat CCD:t sisältäisivät ylimääräisen cachen)

Ramin ja (L3) cachen suhde on sellainen, että cache ja/tai ram sisältää saman asian. Mä olettaisin että erilliset CCD:t tietysti pystyvät kommunikoimaan suoraan keskenään. Siinähän ne nököttää vierekkäin prosssorisirulla.

Ne nimenomaan nököttävät eri siruilla, vain samassa paketissa.

Muistaakseni niiden CCD-piilastujen välillä ei mene mitään suoraa väylää, vaan kaikki liikenne kiertää IO-piirin kautta (voin olla väärässä tässä).

Mutta jos kumpikin käyttää, ja erityisesti voivat muokata sitä osaa RAM muistia, joka on molempien cachessa, niin ne molemmat cachet joudutaan pitämään erikseen ajan tasalla. Tämä on ajallisesti kallista.

Niin. Välimuisti nykyaikaisilla x86-prossuilla toimii 64 tavun lohkoissa, eli jos molemmat ronkkivat samaa osoitetta tai 64 tavun sisällä siitä mitä toinen on lähiaikoina ronkkinut, tämä ongelma ilmenee, tai jos ollaan vähän kauempana ja access patternit aktivoi prefetcherin, silloinkin voi ongelma ilmetä.

Mutta, jos useampi säie ronkkii tismalleen samaa dataa, siellä pitää joka tapauksessa softassa olla synkronointi jolla varmistetaan että ne ronkkivat sitä oikeassa järjestyksessä.

Mutta sitä synkronointia toki hidastaa, mikäli sen pitää kiertää DRAMin kautta.

Kuitenkaan ei ole mitään mieltä tehdä 2x CCD prossua kahdella cachella koska ne pelit hädin tuskin hyötyvät 8 ytimestä,

Odotetaan sitä civ7aa ;)

ja lähes kaikki muut softat hyötyvät melko vähän siitä cachesta, siis sellaiset softat jotka voisivat käyttää kaikkia ytimiä.

Kyllä monet muutkin softat siitä välimuisteista hyötyy, EPYCeistä on sellaisiakin malleja joissa on aktivoitu vaan 2 ydintä/CCD ja sitten CCD-piirejä on monta, että voidaan maksimoida se, paljonko L3-välimuistia kukin ydin saa käyttöönsä, ja EPYCit ei ole peliprossuja.

Ja sitten kun pelejä aletaan rinnakkaistaa kunnnolla suuremmalle kun 8 säikeelle (civ7?) niin alkaa sitä suurempaa välimuistia kaivata siellä toisellakin CCDllä.

Ja käyttiksen säieskedulerille olisi paljon helpompaa jos kaikki ytimet olisi samalla kellotaajuuspotentiaalilla ja samalla L3-kakulla, kuin arpoa, että onkohan tälle softalle parempaa vähän suuremmat kellot vai suurempi L3-kakku.

Pelit hyötyvät niin paljon enemmän siitä cachesta. Kaksi cachea olisi vain hieman enemmän L3 muistia yhteensä, osin kuvaamasi haitan kanssa. Eli niin kauan kuin tuo korostettu osa on totta, on täysin turha haaveilla kahden CCD:n prossusta jossa molemmilla olisi ylimääräinen cache.

Markkinoilla on jo piirejä, joissa on 12 CCDtä, joista jokaisella on tuo 3d-cache.


Lisäksi löytyy malli, jossa on 8 CCDtä, joista jokaisella on tuo 3d-cache,
mutta vain 2 ydintä/CCD aktiivisena


Oletettavasti seuraava isompi hyppy on joku 3-5x kertainen ylimääräinen cache nykyisen 64 megan sijaan, ja ellei tämä tapahdu vasta 10 vuoden päästä, se varmasti isketään 6-10 ytimen päälle koska enempää ei ne pelit vielä pitkään hyödynnä tehokkaasti. Voisi olettaa että kun tuohon määrään päädyttiin monta vuotta sitten, että se oli kompromissi hinnan ja koon suhteen. Mutta sirut koko ajan pienenee, ja vastaavasti Intelin prossujen pelisuorituskyky heikkenee ja täten ero AMD:n x3d cache malleihin kasvaa. Siitä saadaan se hinta, parempi tuote on aina kalliimpi, joka sitten näppärästi kustantaa sen suuremman cachen ilman että tärkein eli omistajien tuotto heikkenee.

Itse taas lähinnä odottaisin sitä, että sinne IO-piirille tulisi L4-cache memory side cachenä (samaan tyyliin kuin AMDllä on RDNA3ssa se muistiohjaipiirillä oleva L3-cache, ja IBMllä on myös power-sarjan prossuissaan muistiohjainpiireillä viimeisen tason välimuisti). Tämä samalla
1) kakuttaisi myös kaiken IOn ja apuprosssorien (igpu, npu) muistiliikenteen, sekä
2) tuo ytimien välinen synkronointi toimisi luonnollisesti tämän kautta varsinaista DRAMia pienemmällä viiveellä.

Applellahan tällainen on ollut jo muutaman vuoden ja Intel toi tällaisen juuri julkaistuissa arrow lake-prossuissaan.

Ja AMDllä, kun se IO-piiri tehdään joka tapauksessa vanhemmalla valmistusprosessilla, tämä tulisi edullisemmaksi kuin CCD-piirillä olevan kakun suurentaminen, tosin toki erillisellä cache-piirillä voi päästä vielä halvemmaksi itse piilastun hinnassa, mutta kalliimmalla paketoinnilla.

Mutta tämä L4-kakku olisi toki viiveiltään paljon suurempi kuin CCDn oma L3-kakku. Tämän merkittävät hyödyt tulee enemmän energiatehokkuuden paranemisesta kun DRAM-accessit vähenee, eikä niinkään keskimääräisen viiveen pienenemisestä ja suorasta suorituskyvystä.
 
Viimeksi muokattu:
Ne nimenomaan nököttävät eri siruilla, vain samassa paketissa.

Muistaakseni niiden CCD-piilastujen välillä ei mene mitään suoraa väylää, vaan kaikki liikenne kiertää IO-piirin kautta (voin olla väärässä tässä).
Oikein muistat, kaikki liikenne menee IO-sirun kautta
 

Statistiikka

Viestiketjuista
257 177
Viestejä
4 467 888
Jäsenet
73 900
Uusin jäsen
Yani

Hinta.fi

Back
Ylös Bottom