AMD CPU-spekulaatio (Zen6/Zen7 ...)

Vaikka onkin vanha video. Silti liittyy Zen5, Zen6 x3d malleihin. Tuon mukaan joissain peleissä on siis ehkä 300 megaakin low latency dataa joka on hyödyllistä varastoida mielummin prossun cacheen kuin rammikn. Eli 200-300 megan l3 cachesta voisi olla lisähyötyä johonkin peleihin vs 96megaiseen joka on nykyisissä malleissa. Tai jos saataisiin 150 megaakin voi olla hyötyä vs 96 megaan. Saa tosiaan nähdä kasvattiko AMD jo zen5 vaiheessa l3 cachen kokoa peliprossuihin. Nuo alhaiset tehonkulutuslukemat tavallaan Zen5 sukupolvessa voivat olla hyödyllisiäkin juttuja x3d prossuissa kun voi mahdollisesti ajaa kovemmilla kellotaajuuksilla peliprossua:

DigitalFoundryn Alex mainitsikin yhdessä jaksossa kuinka 7800 X3D hommaamisen jälkeen huomaa mitkä pelit on koodattu "huonosti" kun pelkän L3 välimuistin lisääminen parantaa suorituskykyä huomattavasti.
En sitten tiedä kuinka paljon perää tuossa on kun itselle ei tule mieleen tapausta jossa peliä olisi optimoitu jälkeenpäin niin että ero normaalin ja X3D mallin välillä olisi kaventunut.
 
DigitalFoundryn Alex mainitsikin yhdessä jaksossa kuinka 7800 X3D hommaamisen jälkeen huomaa mitkä pelit on koodattu "huonosti" kun pelkän L3 välimuistin lisääminen parantaa suorituskykyä huomattavasti.

Tai sitten ne on koodattu hyvin, että se itse laskenta tehdään todella nopeasti, jolloin ei hyödytä nopeammasta laskentasuorituskyvystä.

Tällaisten perusteella ei oikeasti voi päätellä mitään siitä, onko peli koodattu hyvin vai huonosti.

Jos pelin working set on iso, sitten se vaan hyötyy siitä suuremmasta välimuistista, eikä sitä working settiä usein voi pienentää, jos oikeasti tarvii käsitellä usein sitä suurta määrää dataa.
Toisaalta, jos muistia käsitellään hyvin sekalaisessa järjestyksessä(tai välimuistin rakenteen kannalta huonossa järjestelmällisessä järjestyksessä), välimuistin osumatarkkuus on huonompi.

Että ennen kuin voi sanoa kuinka hyvin peli on koodattu, pitää vähintään saada jotain oikeaa profiilidataa siitä ja mielellään myös nähdä joko pelin lähdekoodi tai siitä generoitu assembly-koodi.
 
Että ennen kuin voi sanoa kuinka hyvin peli on koodattu, pitää vähintään saada jotain oikeaa profiilidataa siitä ja mielellään myös nähdä joko pelin lähdekoodi tai siitä generoitu assembly-koodi.
Jos heitetään mutulla esimerkki että jos lähdekoodi on talon piirustukset, niin niistä voi päätellä jotain, mutta se ei suoraan esim kerro kuinka toimiva talo on kun on talossa paljon porukkaa.
 
DigitalFoundryn Alex mainitsikin yhdessä jaksossa kuinka 7800 X3D hommaamisen jälkeen huomaa mitkä pelit on koodattu "huonosti" kun pelkän L3 välimuistin lisääminen parantaa suorituskykyä huomattavasti.
En sitten tiedä kuinka paljon perää tuossa on kun itselle ei tule mieleen tapausta jossa peliä olisi optimoitu jälkeenpäin niin että ero normaalin ja X3D mallin välillä olisi kaventunut.

Tuossa pätkässä puhutaan rammista, näyttiksen vrammista ja prossun cachesta. Nuo näyttiksien kaistathan on huippunäyttismalleissa nykyään isoja. Paljonhan on vrammin/näyttiksen rammin access time/latenssi vs normaalin muistin latenssi vs access time. Luulisi, että näyttiksen muisti on myös latenssiltaan nopeampaa. Ehkä ei. Onko näyttiksen muisti kuinka hidasta vs l3 cacheen ?
 
Olettaisin, että GDDR:ät ovat suuremmalla latenssilla kuin DDR:ät (jonka takia noita GDDR:än latensseja ei juuri missään mainita), mutta vastavuoroisesti kaistaa on sitten huomattavasti enemmän.
 
Tuossa pätkässä puhutaan rammista, näyttiksen vrammista ja prossun cachesta. Nuo näyttiksien kaistathan on huippunäyttismalleissa nykyään isoja. Paljonhan on vrammin/näyttiksen rammin access time/latenssi vs normaalin muistin latenssi vs access time. Luulisi, että näyttiksen muisti on myös latenssiltaan nopeampaa. Ehkä ei. Onko näyttiksen muisti kuinka hidasta vs l3 cacheen ?

Sekä DDR- että GDDR-muistit ovat DRAM-muisteja, ja kaikki DRAM-muistit ovat viiveiltään hitaita, sitä nopeutta rajoittaa se sisällä oleva DRAM eikä GDDRn nopeampi väylä suuremmalla purskepituudella käytännössä auta viiveisiin(saattaa jopa ennemminkin jopa inasen, huonontaa viivettä, mutta ero ei ole merkittävä).

Viiveissä ei ole mitään kovin merkittäviä eroja GDDR- ja DDR-muistien välillä.

Mutta GDDR-muistit pitää kolvata piirilevylle, eikä ne välttämättä tykkää myöskään prossorikannasta, käytännössä toimii hyvin kun muistit ja muistiohjaimen sisältävä piiri on molemmat kolvattu samalle piirilevylle. Signaali voi toimia paljon suuremmalla datansiirtotajuudella kun johdot on paljon lyhyempiä ja "puhtaampia" kun ei ole mitään liittimiä välissä.

Prossujen L3-välimuistit taas ovat tyypillisesti SRAMia joka on viiveiltään todella paljon nopeampaa kuin mikään DRAM.
 
Sekä DDR- että GDDR-muistit ovat DRAM-muisteja, ja kaikki DRAM-muistit ovat viiveiltään hitaita, sitä nopeutta rajoittaa se sisällä oleva DRAM eikä GDDRn nopeampi väylä suuremmalla purskepituudella käytännössä auta viiveisiin(saattaa jopa ennemminkin jopa inasen, huonontaa viivettä, mutta ero ei ole merkittävä).

Viiveissä ei ole mitään kovin merkittäviä eroja GDDR- ja DDR-muistien välillä.

Mutta GDDR-muistit pitää kolvata piirilevylle, eikä ne välttämättä tykkää myöskään prossorikannasta, käytännössä toimii hyvin kun muistit ja muistiohjaimen sisältävä piiri on molemmat kolvattu samalle piirilevylle. Signaali voi toimia paljon suuremmalla datansiirtotajuudella kun johdot on paljon lyhyempiä ja "puhtaampia" kun ei ole mitään liittimiä välissä.

Prossujen L3-välimuistit taas ovat tyypillisesti SRAMia joka on viiveiltään todella paljon nopeampaa kuin mikään DRAM.

Jos näyttiksiin pystytään tuolla tavalla toteuttamaan nopeampaa rammia. Oon miettinyt, että miks intel ja amd ei julkaisis emolevyjä jossa olis jokasesta emo mallista julkastu eri vaihtoehtoja. Esim. Asrockin steel legend x670e julkastais 16 gigas, 32gigaa rammilla 64 gigasena jne. Noi olis normaalien kampojen sijaan juotettu emoon suoraan. Voi olla et on montakin eri syytä miks tuolla tavalla ei tehdä. Ddr6 kun tulee tulevaisuudessa emoihin lienee vielä enemmän häiriöherkempi kuin ddr5.
 
Jos näyttiksiin pystytään tuolla tavalla toteuttamaan nopeampaa rammia. Oon miettinyt, että miks intel ja amd ei julkaisis emolevyjä jossa olis jokasesta emo mallista julkastu eri vaihtoehtoja. Esim. Asrockin steel legend x670e julkastais 16 gigas, 32gigaa rammilla 64 gigasena jne. Noi olis normaalien kampojen sijaan juotettu emoon suoraan. Voi olla et on montakin eri syytä miks tuolla tavalla ei tehdä. Ddr6 kun tulee tulevaisuudessa emoihin lienee vielä enemmän häiriöherkempi kuin ddr5.
Mikäs järki tuossa nyt olisi? haittoja ilman (juuri) mitään hyötyjä?

1) et voi enää päivittää muisteja

2) jos muistit hajoaa, hajoaa koko emo

3) kalliimmat emot

4) kuten tuossa ylempänä sanottiin, ne GDDR ei tykkää välttämättä, jos prossu ei ole myös kolvattu emolle, eikä nopeuksissa ole juuri eroja

5) kuluttajalle "hankalampaa" löytää se malli mitä etsii jos toiset menee nopeammin loppuun

6) emovalmistajan pitää huomioida muistien hinnat/vaihtelut yms

7) hyödyt? ei mitään?

8) ei voi vaihdella hitaampaa nopeampaan

9) et voi valita ylipäätään muisteja, esim haluatko paljon nopeaa, paljon hidasta, vähän hidasta jne
 
Applehan tuota muistin integrointia tosiaan tekee M-sarjalaisten koneiden kanssa (LPDDR5 ei siis GDDR). Applelle tuosta suurin etu on tuon Max-malliston kanssa (M3 tässä tapauksessa), kun siinä voi sitten tuon 512 bit -muistiväylän kanssa ottaa 400 GB/s kaistan käyttöön. Halvimmissa mallissa vastaavat lukemat ovat 128 bittiä ja 100 GB/s.
 
Mikäs järki tuossa nyt olisi? haittoja ilman (juuri) mitään hyötyjä?

1) et voi enää päivittää muisteja

Tarkoittaa vaan sitä, että sitten pitää koneeseen laittaa heti järkevä määrä muistia eikä pihistellä.
Nykyaikana Mooren laki on melkein pysähtynyt DRAMin osalta eikä koneisiin juuri enää päivitellä lisää muistia sen normaalin kehityksen takia (sen sijaan muistia usein päivitetään kyllä heti oston jälkeen esim. läppäreihin joissa alunperinkin on muistia liian vähän.

2) jos muistit hajoaa, hajoaa koko emo

Kyllä, mutta muistin hajoaminen on melko harvinaista.

3) kalliimmat emot

Ei, vaan kokonaisuudessaan halvemmat. Muistin juottaminen emolevylle tulee halvemmaksi kuin DIMM-paikka. Samoin säästetään se DIMMin piirilevyn hinta.

4) kuten tuossa ylempänä sanottiin, ne GDDR ei tykkää välttämättä, jos prossu ei ole myös kolvattu emolle, eikä nopeuksissa ole juuri eroja
...
7) hyödyt? ei mitään?

Sen prossun voisi aivan hyvin kolvata myös sinne emolle. Se ei ole mikään ongelma.

Ja kaistassa on suuria nopeuseroja, sillä kaistalla on todella paljon väliä prossupiirille integroidun GPUn suorituskyvylle.

8) ei voi vaihdella hitaampaa nopeampaan

Muistien tai prossun päivittäminen nopeampiin olemassaolevalla emolla on ATK-harrastajien puuhastelua. >90% kuluttajista ei sitä kuitenkaan tee.

9) et voi valita ylipäätään muisteja, esim haluatko paljon nopeaa, paljon hidasta, vähän hidasta jne

Suurin osa kuluttajista on aivan totaalisen pihalla siitä, että kuinka nopeaa sen muistin pitäisi olla/mistä kannattaa maksaa. Kun kaikki tulee yhtenä pakettina, on selvästi suurempi mahdollisuus saada kokonaisuus, joka on mietitty järkeväksi (ja josta on esim. 3dmark-tuloksia saatavilla että niitä voidaan verrata kokonaisena pakettina)


Sinulla on nyt tähän asiaan hyvin kapea ATK-harrastajan näkökulma. Suurimmalle osalle kuluttajista tuollaisessa olisi hyvin paljon järkeä - minkä takia esim. Sony ja Microsoft myyvät suuria määriä tällaisia GDDR-muistilla varustettuja AMDn APU-piirillä varustettuja koneita. Valitettavasti vaan nämä Sonyn ja Microsoftin myymät koneet on softan puolesta cripplattuja että niissä ei voi ainakaan helposti ajaa normaaleja käyttiksiä ja niissä rahastetaan törkeällä tavalla softan hinnassa.
 
Viimeksi muokattu:
Nythän on tulossa ainakin kahdenlaisia ratkaisuja ddr5/6 signaloinnin parannukseen. Näin ulkomuistista toinen oli uusi slottityyppi joka lyhentää johtoja, mutta vaatii uudet emot ja muistit. Toinen oli nykysysteemiin sopiva ddr5 jossa on muistikammassa joku signalointisiru.

Saa nähdä miten yleistyy, mutta molemmat joustavampia kuin nuo täysin juotetut ratkaisut.
 
Viiveissä ei ole mitään kovin merkittäviä eroja GDDR- ja DDR-muistien välillä.

Kuluttajalaitteissa GDDR ja ja LPDDR on selvästi korkeammalla viiveellä. Sanotaan vaikka hatusta heittäen, että niiden viive on yli ~100 ns, DDR jedec ajoituksilla on ~70-80 ns ja XMP:llä 60-70 ns ja käsin kellottamalla ~50 ns. HBM myös korkeammalla viiveellä. Viive tulee enimmäkseen niistä muistisiruista, joten niiden juottaminen emolle tai prosessoripakettiin ei juurikaan laske viivettä. Singnaalin laatu ja energiatehokuus paranee ja kaistaa saadaan nostettua. Toki viiveillä on enten merkitystä pelaajille. Muille ei niin väliä. Moni täällä varmaan on pelaaja ja katsoo asiaa siitä näkökulmasta. Jos tahtoa olisi niin varmasti viiveitä saataisi alas. Ongelma on vaan se että perus DIMM kapulat on huomattavasti viileämpiä ja "kellotettuna kovammalla jännitteellä.

Kaikkien muistien nopeutta voidaan nostaa. Työpöytäkoneissa on tottuttu 128 bit leveään muistikaistaan, mutta Apple käyttää jo leveämpiä kaistoja ja AMD ja intel taitaa suunnitella jotain APU:ja isolla GPU:lla ja niissä on kai 256 bit muistiväylät.

GDDR on GPU:lle suunniteltu, niin varmaan ihan syystä sitä ei juuri muissa laitteissa ole käytetty.
 
Kuluttajalaitteissa GDDR ja ja LPDDR on selvästi korkeammalla viiveellä. Sanotaan vaikka hatusta heittäen, että niiden viive on yli ~100 ns, DDR jedec ajoituksilla on ~70-80 ns ja XMP:llä 60-70 ns ja käsin kellottamalla ~50 ns. HBM myös korkeammalla viiveellä. Viive tulee enimmäkseen niistä muistisiruista, joten niiden juottaminen emolle tai prosessoripakettiin ei juurikaan laske viivettä. Singnaalin laatu ja energiatehokuus paranee ja kaistaa saadaan nostettua. Toki viiveillä on enten merkitystä pelaajille. Muille ei niin väliä. Moni täällä varmaan on pelaaja ja katsoo asiaa siitä näkökulmasta. Jos tahtoa olisi niin varmasti viiveitä saataisi alas. Ongelma on vaan se että perus DIMM kapulat on huomattavasti viileämpiä ja "kellotettuna kovammalla jännitteellä.

Kaikkien muistien nopeutta voidaan nostaa. Työpöytäkoneissa on tottuttu 128 bit leveään muistikaistaan, mutta Apple käyttää jo leveämpiä kaistoja ja AMD ja intel taitaa suunnitella jotain APU:ja isolla GPU:lla ja niissä on kai 256 bit muistiväylät.

GDDR on GPU:lle suunniteltu, niin varmaan ihan syystä sitä ei juuri muissa laitteissa ole käytetty.
Ei toimisto /peli alustoissa on ollut jo iät ja aja 4 kanmavainen muistiohjain..
 
Ei kanavien laskeminen ole enää kovin mielekästä. On ainakin 16-64 bit leveitä kanavia/alikanavia, eikä se käyttäjään vaikuta juurikaan.
Jos on samalaiset kanavat, niin kyllä 4:ssä kanavassa on oina enemmän kaistaa, kuin kahdessa.. Tällöin välimuisti täyttyy nopeammin ja kanavat ovat valmiita seuraavaan muistihakuun nopeammin..
 
Harmi, että AMD ilmeisesti luopui tuosta dian 65W:n asetuksesta..

Niin prossuissa, kuin näyttiksissäkin olisi aika tehdä sukupolvi, jossa keskityttäisiin virransäästöön...
Ei ei ne kokoajan maksimitehoa vedä. Edes peleissä. Ja jokainen voi säätää ne tehonkulutukset haluamakseen. EIhän se jatkuva lisätehontarve ole kiva, mutta muuten jätettäisi vaan sitten ylikellotusvaraa niille yybee OC malleille. Nyt kun jäähyt mitoitetaan piirin maksimaaliselle varrankullutukselle, niin ne ovat hiljaisia. Siihen onko arkkitehtuurit enargiatehokkaita vai ei on vaikea ottaa kantaa, muuten kun vertailemalla niitä. On ihan teoreettistä kuinka energiapihimpi arkkitehtuuri voitaisi valmistaa. Energiatehokuus paranee jatkuvasti huomattavasti. myös arkkitehtuurien osalta. Tai en tiedä ottiko AMD vähän pakkia.
 
Ei ei ne kokoajan maksimitehoa vedä. Edes peleissä. Ja jokainen voi säätää ne tehonkulutukset haluamakseen. EIhän se jatkuva lisätehontarve ole kiva, mutta muuten jätettäisi vaan sitten ylikellotusvaraa niille yybee OC malleille. Nyt kun jäähyt mitoitetaan piirin maksimaaliselle varrankullutukselle, niin ne ovat hiljaisia. Siihen onko arkkitehtuurit enargiatehokkaita vai ei on vaikea ottaa kantaa, muuten kun vertailemalla niitä. On ihan teoreettistä kuinka energiapihimpi arkkitehtuuri voitaisi valmistaa. Energiatehokuus paranee jatkuvasti huomattavasti. myös arkkitehtuurien osalta. Tai en tiedä ottiko AMD vähän pakkia.
Jos coren päälle haluitaan kasata muuta, niin coren on jokatapuksessa kulutettava paljon maltillisemmin ja hotspotit pitää saada pois..
 
Energiatehokuus paranee jatkuvasti huomattavasti. myös arkkitehtuurien osalta. Tai en tiedä ottiko AMD vähän pakkia.

Mistä olet sanut kuvan että olisi otettu takapakkia? Se että jossain pelissä ei ole muutosta tapahtunut tai on voinut tulla jopa hiukan takapakkia ei tarkoita että takapakkia olisi tullut kaikkialla. Monessa muussa kuormassa on menty eteenpäin selvästi. Nää arkkitehtuuri muutokset nyt ei vaan ole suunnattu pelaajille vaan aivan johonkin muuhun josta saadaan katetta aivan eri tavalla. Edelleen kannattaa muistaa että nää prossut suunnitellaan ensisijaisesti datacenter tarpeisiin, mutta toimivat varsin hienosti myös työpöytä puolella joskin työpöytäpuolelle olisi aivan varmasti mahdollista tehdä optimointeja jotta suorituskyky olisi tätäkin parempi, se vaan ei ole AMD:n näkökulmasta kannataavaa.
 
Mistä olet sanut kuvan että olisi otettu takapakkia? Se että jossain pelissä ei ole muutosta tapahtunut tai on voinut tulla jopa hiukan takapakkia ei tarkoita että takapakkia olisi tullut kaikkialla. Monessa muussa kuormassa on menty eteenpäin selvästi. Nää arkkitehtuuri muutokset nyt ei vaan ole suunnattu pelaajille vaan aivan johonkin muuhun josta saadaan katetta aivan eri tavalla. Edelleen kannattaa muistaa että nää prossut suunnitellaan ensisijaisesti datacenter tarpeisiin, mutta toimivat varsin hienosti myös työpöytä puolella joskin työpöytäpuolelle olisi aivan varmasti mahdollista tehdä optimointeja jotta suorituskyky olisi tätäkin parempi, se vaan ei ole AMD:n näkökulmasta kannataavaa.
Mietin tossa ensin näykkäreitä, mutta pätee se ZEN 5 myös. Eikös prosessi päivittynyt N5 -> N4P. En ole tosin tarkkoja energiatehokuus testejä katsonut. Mutta en tarkentanut, että puhuin pelikäytöstä.

Jep ZEN 5 on täysin uusi arkkitehtuuri, vaikka päällepäin voi vaikuttaa vain parannellulta ZEN 4.
Onhan tuo täysi AVX512 tuki, ja selvä etu inteliin AMD:ltä mahtava suoritus. Intelhän on ihan kanvaassissa.

Lunar Lakessa ei paljon vakuuttanut. Uusi arkkitehtuuri ja N3B prosessi ei yhtään kilpaililijoita parempi. Tosin ilmeisesti E ja P ytimet on "erotettu" mikä auttaa huomattavasti käytännön akunkestossa. Varmaan jos AMD paketoisi muistit samoin, ja käyttäisi N3 prosessia niin oloisi selvästi edellä. Joten Intelin uusinkin arkkitehtuuri vaikuttaa selvästi huonommalta kuin zen5.
 
Viimeksi muokattu:



No niin! High Yieldiltä uunituore video tarkoilla die kuvilla Zen 5:sta ja lisää tulevasta 3D välimuistitoteutuksesta


Tuon mukaan lisäcachea voi olla 72 megaakin. Tarkottaisi l3 cachen kokonaismäärän kasvua 96 megasta 104 megaan. Voisi tuoda hyvän lisäboostin joissain peleissä. Vaikea uskoa että amd voisi jollain toisella tavalla toteuttaa tuota koska muussa tapauksessa lisä cache olisi ytimien päällä.
 
Tuon mukaan lisäcachea voi olla 72 megaakin. Tarkottaisi l3 cachen kokonaismäärän kasvua 96 megasta 104 megaan. Voisi tuoda hyvän lisäboostin joissain peleissä. Vaikea uskoa että amd voisi jollain toisella tavalla toteuttaa tuota koska muussa tapauksessa lisä cache olisi ytimien päällä.
Jos tarkoitat videon kohtaa 15:58, jossa AMD:n esityskalvossa näkyy lause "Up to 72 MB of GameCache", niin kyseessä on mielestäni suurin mahdollinen yhteenlaskettu L2- ja L3-välimuistin määrä Zen 2 (3) -työpöytäprosessoreissa ennen X3D-aikaa.

Edit: AMD:n vanhasta mainosvideosta oli tietenkin kyse eikä kalvoista. Kiitos @Mechanical Man tarkalleen oikean videon etsinnästä.
 
Viimeksi muokattu:
TSMC tukee muistaakseni jopa viittä päällekkäin laitettua 3D-vcache -sirua, mutta AMD on toistaiseksi tyytynyt yhden kerroksen käyttöön.

1728298908645.png
 
Tuon mukaan lisäcachea voi olla 72 megaakin. Tarkottaisi l3 cachen kokonaismäärän kasvua 96 megasta 104 megaan. Voisi tuoda hyvän lisäboostin joissain peleissä. Vaikea uskoa että amd voisi jollain toisella tavalla toteuttaa tuota koska muussa tapauksessa lisä cache olisi ytimien päällä.

Jos tarkoitat videon kohtaa 15:58, jossa AMD:n esityskalvossa näkyy lause "Up to 72 MB of GameCache", niin kyseessä on mielestäni suurin mahdollinen yhteenlaskettu L2- ja L3-välimuistin määrä Zen 2 (3) -työpöytäprosessoreissa ennen X3D-aikaa.

Tuo kohta videosta on vanhasta:

 
Jos tarkoitat videon kohtaa 15:58, jossa AMD:n esityskalvossa näkyy lause "Up to 72 MB of GameCache", niin kyseessä on mielestäni suurin mahdollinen yhteenlaskettu L2- ja L3-välimuistin määrä Zen 2 (3) -työpöytäprosessoreissa ennen X3D-aikaa.
Tossa puhuttiin jostain 2 kerroksesta. Kun 1 lisäkerros voisi tulla ytimien päälle. Voi olla enemmän kuin 64 megaa siksi. Hyvä pointti silti
 
Siis tuossa videollahan on kohdasta: 6:05 eteenpäin kuva tuosta r7 9700x CCD:stä. Keskellä kuvaa on käsittääkseni ensimmäinen kerros L3 välimuistia joka 32MB jotka lienee samalla tasolla tuon L2: n ja corejen kanssa noin "fyysisesti". L2 välimuistihan on tuossa core yksiköiden ja L2:n välissä sivuilla.

Tuo L3 välimuistilaajennos kasataan nyt ilmeisesti tuohon 32MB L3 pohjasirun päälle 3 kerrokseen. Pohja 32MB + 1 kerros 32MB + 2 kerros 32MB = 96 MB

Näin olen ite ainakin ymmärtänyt miten tuo todennäköisesti varmaan toteutetaan. Jossain materiaaleissa/asiakirjoissa tuo "3D välimuisti" käsittääkseni ilmoitettu 64MB joka puoltais just tuota että kyseessä on tuo 32MB kiekon omaa välimuistia + tarvittava määrä sitten kerroksina päällä.
 
Siis tuossa videollahan on kohdasta: 6:05 eteenpäin kuva tuosta r7 9700x CCD:stä. Keskellä kuvaa on käsittääkseni ensimmäinen kerros L3 välimuistia joka 32MB jotka lienee samalla tasolla tuon L2: n ja corejen kanssa noin "fyysisesti". L2 välimuistihan on tuossa core yksiköiden ja L2:n välissä sivuilla.

Tuo L3 välimuistilaajennos kasataan nyt ilmeisesti tuohon 32MB L3 pohjasirun päälle 3 kerrokseen. Pohja 32MB + 1 kerros 32MB + 2 kerros 32MB = 96 MB

Näin olen ite ainakin ymmärtänyt miten tuo todennäköisesti varmaan toteutetaan. Jossain materiaaleissa/asiakirjoissa tuo "3D välimuisti" käsittääkseni ilmoitettu 64MB joka puoltais just tuota että kyseessä on tuo 32MB kiekon omaa välimuistia + tarvittava määrä sitten kerroksina päällä.
7800x3d sukupolvessa tuo lisäcache on myös osittain muidenkin osien päällä kuin pelkän cachen. Jos muistan oikein niin myös l2 cachen päällä myös. Jos toteuttaisivat noin 9800x3d kuten sanoit niin sitä voitaisiin ajaa kovemmilla kellotaajuuksilla. Pianhan se selviää jos amd julkaisee kenties 1kk sisällä tuon uuden x3d prossun.
 
7800x3d sukupolvessa tuo lisäcache on myös osittain muidenkin osien päällä kuin pelkän cachen. Jos muistan oikein niin myös l2 cachen päällä myös. Jos toteuttaisivat noin 9800x3d kuten sanoit niin sitä voitaisiin ajaa kovemmilla kellotaajuuksilla. Pianhan se selviää jos amd julkaisee kenties 1kk sisällä tuon uuden x3d prossun.
Tuossa videollahan tulee esille juurikin tämä kun kattoo tuota 9700x CCD kuvaa. Siinä tuo L3 kavennettu keskelle kapeammaksi vs 7800x3d kuva mihin vertaa. Ja siis joo se 3d välimuistihan leviää tuossa 7800x3d tuon L2:n päälle.

Kyllä ite ainakin veikkaan tuon 9700x CCD kuvan perusteella että pinoavat nyt tuon L3 välimuisti kapeampaan ns "kolmeen kerrokseen" jotka ei mene tuon L2 välimuistin päälle. Videossahan tulee ilmi myös se että tuo Zen5 välimuistipuoli on kokonaan uudelleen suunniteltu (esim leikattu turhia zen 3 aikakaudelta jääneitä osia virransyötöstä tms vek jne) joka viittais siihen että ovat saaneet ehkä kutistettua tuota L3 välimuistia riittävän kompaktiin pakettiin ettei menisi tuo L2:n päälle.

Joo parhaassa tapauksessa kyseinen voinee tarkottaa sitä että suorittimelta saadaan nopeampia kellotaajuuksia ulos ja lämmötkin periaatteessa paremmin kurissa. Toki itseä mietityttää miten paljon tuo 3 kerrokseen paketoitu SRAM tuottanee lämpöä. Vaikka SRAM (tekniikka jolla L3 välimuisti toteutetaan) pitäis noin muuten kyllä olla energia tehokkaampaa ja vähemmän hukkalämpöä tuottavaa
 
Viimeksi muokattu:
Zen5-pohjaiset EPYCit julkaistiin eilen, mutta onko missään mitään tietoa zen5-sukupolven threadripperien aikataulusta?
 
Threadripperit ovat yleensä tulleet ulos yli puoli vuotta vastaavan EPYCin jälkeen.

Mutta tosiaan EPYC Zen 5 Turin-testit ovat ulkona. Uudet EPYCit pistävät uudet ennätyslukemat tiskiin melkein kaikissa testeissä:

Joo, todella hyvältä näyttää.

Mutta on muuten siitä typerä testi, että kun tekivät suorituskykytestin ja virrankulutustestin, ja laskivat niistä kokonaissähkönkulutuksen(eli energiatehokkuuden), raportoivat sen tehonkulutuksen isoilla helposti nähtävillä (mutta silti sekavilla) palkeilla mutta se energiatehokkuus (mikä on se, millä oikeasti on väliä) todella pienellä vaikeasti luettavalla printillä isojen kuvien alla, ja siten että sitä ei ole järjestetty mihinkään parennuusjärjestykseen.
 
Viimeksi muokattu:
Zen 5:n jälkeen otan nämä kyllä runsaan suolan kera. Ei siinä, kivahan se olisi jos 9800X3D olisi vaikka edes 15% edeltäjäänsä peleissä nopeampi.
 
Yksi huhu mitä ainakin toivon että toteutuu olisi tulevan 12-ydin/24-säie prosessorin 3D versio missä olisi onnistuttu tekemään yksi yhtenäinen siru yhdellä yhtenäisellä 3D kakulla eikä kahdella erillisellä 6-ydin sirulla mistä ehkä vain toisella olisi se 3D kakku päälle lätättynä. Toki se on vain pohdintaa ja huhua joten hyvin runsaan suolan kera vaikka esim. Mooren Laki [on kuollut] sitä pohtiikin (se youtube kanava).

Onko minulla kiire päivittää 5900X AM4 prosessorista / kannasta tai tarvitsenko oikeasti 3D prosessoria.. en kai, mutta olisi se "kiva" päivitys kuitenkin. Järki tosin sanoo että ehkä olisi parempi ensin päivitellä esim. nykyinen 6700XT näytönohjain mutta no...
 
Viimeksi muokattu:
Yksi huhu mitä ainakin toivon että toteutuu olisi tulevan 12-ydin/24-säie prosessorin 3D versio missä olisi onnistuttu tekemään yksi yhtenäinen siru yhdellä yhtenäisellä 3D kakulla eikä kahdella erillisellä 6-ydin sirulla mistä ehkä vain toisella olisi se 3D kakku päälle lätättynä. Toki se on vain pohdintaa ja huhua joten hyvin runsaan suolan kera vaikka esim. Mooren Laki sitä pohtiikin (se youtube kanava).

Onko minulla kiire päivittää 5900X AM4 prosessorista / kannasta tai tarvitsenko oikeasti 3D prosessoria.. en kai, mutta olisi se "kiva" päivitys kuitenkin. Järki tosin sanoo että ehkä olisi parempi ensin päivitellä esim. nykyinen 6700XT näytönohjain mutta no...
Siis 12-ytimen CCX:llä? Tuohan olisi aivan mahtava, mutta en usko että ennen Zen 6 nähdään yli 8 ydintä.
 
Mitä enemmän prossussa on cachea ja jos se koostuu kahdesta tai useammasta palikasta, joiden välillä tiedonsiirto on hidasta, niin sitä tärkeämpää on se, jotta käyttis:
1. Ei siirrä prosesseja corelta toiselle.
2. Osaa jakaa prosessit siten, jotta erilliset cachet tulevat mahdollisimman hyvin hyödynnetyksi.
 
Yksi huhu mitä ainakin toivon että toteutuu olisi tulevan 12-ydin/24-säie prosessorin 3D versio missä olisi onnistuttu tekemään yksi yhtenäinen siru yhdellä yhtenäisellä 3D kakulla eikä kahdella erillisellä 6-ydin sirulla mistä ehkä vain toisella olisi se 3D kakku päälle lätättynä. Toki se on vain pohdintaa ja huhua joten hyvin runsaan suolan kera vaikka esim. Mooren Laki [on kuollut] sitä pohtiikin (se youtube kanava).

No ei todellakaan tulla näkemään ainakaan zen6sta eikä todennäköisesti ennen zen7aa. Ei kannata uskoa kaikkea, mitä internetistä lukee tai mitä youtuben puhuva pää sanoo.

Ei kyse ole siitä, että "onnistutaanko" tekemään vaan siitä, että sellainen piilastu olisi selvästi kalliimpi valmistaa ja L3-välimuistin viive olisi suurempi, ja jokaisen uuden piilastumallin matalan tason suunnittelun tekeminen maksaa huomattavasti rahaa joten sanoja piilastuja pyritään käyttämään mahdollisimman moneen eikä tehdä uusia piilastumalleja pikkumarkkinoita varten. Sellaisen tekeminen ei vaan olisi tällä hetkellä taloudellisesti kannattavaa ottaen huomioon markkinatilanne, firman muut tuotteet ja tuotekehityksen ja valmistuksen reaaliteetit, ja sen kehittämiseen tarvittavat resurssit on järkevämpää käyttää muihin, tuottavampiin kohteisiin.

Ja Moores Law is dead on internetin typerimpiä tietokoneaiheisen misinformaation levittäjiä. Puskevat eteenpäin kaiken huuhaan mitä löytävät ilman mitään kykyä/osaamista mihinkään kriittiseen analyiisiin, ja jotkut jopa keksivät itse tarkoituksella huuhaata ja lähettävät sen niille ihan vaan nauraakseen niiden typeryydelle kun julkaisevat sen. Toki joskus osuvat oikeaan, kuten rikki oleva viisarikellokin näyttää oikeaa aikaa pari kertaa päivässä.

Ja sitten kun ovat väärässä niin joko 1) ovat hiljaa ja toivovat, että kaikki unohtavat sen huuhaan mitä levittivät 2) Keksivät meriselityksiä ja valehtelevat että muka onkin suunnitelmat muuttuneet, eivät voi myöntää että alkuperäinen julkaimansa asia oli täyttä huuhaata.

Että mitään mitä ne julkaisee ei pidä uskoa, jos niiden juttuja katsoo, se pitää tehdä vain nauraakseen niiden julkaseman roskan typeryydelle. Ja silloin kun julkaisevat jotain joka pitää paikkaansa, sen saman tiedon saa myös muista, luotettavimmista lähteistä.
 
Viimeksi muokattu:
En kyllä oo nähnyt mitään huhua missään 12 ytimen CCXstä, enkä usko että edes MLID semmoista on vakavissaan voinut ehdottaa.

Edit: ja se 12 ytimen ccx olisi jo nähty ei 3d malleissa jos sellainen olisi, eihän siinä muuten mitään järkeä olisi
 
Viimeksi muokattu:
Jos nuo huhutut prosentit ovat oikeita, niin Intelillä on kyllä aika hapan hymy ja AMD:n kassakone kilisee iloisesti.

Aika harva ihminen ostaa prossuja ajaakseen niillä Cinebenchiä.


Cinebench testaa vain yhtä workloadia(joka ei ole pelaaminen), ja testaa sen vähän kyseenalaisesti; Ovat moneen kertaan tehneet melko kyseenalaisia valintoja sen suhteen, millä aikataululla tuovat tuen uusille käskykantalaajennokselle. Esim. vieläkään uudet versiot eivät tue AVX-512sta jonka ensimmäinen speksi julkaistiin 2013 ja jota tukevat ensimmäiset prossut tuli 2016.

Mutta ilmeisesti Cinebenchin koodi on vektoroitu melko huonosti eivätkä ole koskaan jaksaneet optimoida koodiaan rinnakkaistumaan SIMD:lle paremmin, joten heidän huonolla koodillaan niistä uusista käskykantalaajennoksista ei suurta hyötyä saisi.

Mutta toki monet muutkin softat on yhtä huonosti optimoitu joten sen suhteen korreloi hyvin myös keskimääräisten softien suorituskyvyn suhteen.


Löysin chips and cheese-sivuston analyyysiä cinebench R15sta:


Tuossa versiossa oli enemmän skalaari-liukulukukäskyjä kuin vektoroituja liukulukukäskyjä, vaikka cinebenchin tekemän homman pitäisi olla sellaista, minkä pitäisi vektoroitua hyvin.
 
Viimeksi muokattu:
Tuntuu että taas vähän lähtee jengi keulimaan liikaa huhujen perusteella ja sit tulee taas pettymys. Eiköhän se 9000x3d sarjan parannus oo peleissä se perus 5-10% riippuen pelistä. Cinepelit erikseen.
 
En kyllä oo nähnyt mitään huhua missään 12 ytimen CCXstä, enkä usko että edes MLID semmoista on vakavissaan voinut ehdottaa.

Edit: ja se 12 ytimen ccx olisi jo nähty ei 3d malleissa jos sellainen olisi, eihän siinä muuten mitään järkeä olisi

Muistaakseni on puhunut tuosta 12 ytimen CCX:stä jätticachella kun on kysytty että millainen olisi hänen mielestä teoriassa mahdollinen jumalprossu pelaamista varten, ei että mitä on tulossa

Toki monoliittinen 12-ytiminen prossu AMD:llä on olemassa, eli ei se ihan mahdotonta olisi. Tuossa vaan valitettavasti osa coreista c-mallia joiden kellontaajuus jossain max 4Ghz tienoolla
 
Muistaakseni on puhunut tuosta 12 ytimen CCX:stä jätticachella kun on kysytty että millainen olisi hänen mielestä teoriassa mahdollinen jumalprossu pelaamista varten, ei että mitä on tulossa

Toki monoliittinen 12-ytiminen prossu AMD:llä on olemassa, eli ei se ihan mahdotonta olisi. Tuossa vaan valitettavasti osa coreista c-mallia joiden kellontaajuus jossain max 4Ghz tienoolla
Jees, tuo kuulostaa järkevämmältä. Tarkennan vielä että viittasin vain zen5 tämän vuoden julkaisuihin. 12 CCX olisi vuotanut jo, jos sellainen olisi jostain kumman syystä tulossa.
 

Statistiikka

Viestiketjuista
262 695
Viestejä
4 562 928
Jäsenet
75 010
Uusin jäsen
MrBrutalMachine

Hinta.fi

Back
Ylös Bottom