AMD CPU-spekulaatio (Zen6/Zen7 ...)

Vaikka onkin vanha video. Silti liittyy Zen5, Zen6 x3d malleihin. Tuon mukaan joissain peleissä on siis ehkä 300 megaakin low latency dataa joka on hyödyllistä varastoida mielummin prossun cacheen kuin rammikn. Eli 200-300 megan l3 cachesta voisi olla lisähyötyä johonkin peleihin vs 96megaiseen joka on nykyisissä malleissa. Tai jos saataisiin 150 megaakin voi olla hyötyä vs 96 megaan. Saa tosiaan nähdä kasvattiko AMD jo zen5 vaiheessa l3 cachen kokoa peliprossuihin. Nuo alhaiset tehonkulutuslukemat tavallaan Zen5 sukupolvessa voivat olla hyödyllisiäkin juttuja x3d prossuissa kun voi mahdollisesti ajaa kovemmilla kellotaajuuksilla peliprossua:

DigitalFoundryn Alex mainitsikin yhdessä jaksossa kuinka 7800 X3D hommaamisen jälkeen huomaa mitkä pelit on koodattu "huonosti" kun pelkän L3 välimuistin lisääminen parantaa suorituskykyä huomattavasti.
En sitten tiedä kuinka paljon perää tuossa on kun itselle ei tule mieleen tapausta jossa peliä olisi optimoitu jälkeenpäin niin että ero normaalin ja X3D mallin välillä olisi kaventunut.
 
DigitalFoundryn Alex mainitsikin yhdessä jaksossa kuinka 7800 X3D hommaamisen jälkeen huomaa mitkä pelit on koodattu "huonosti" kun pelkän L3 välimuistin lisääminen parantaa suorituskykyä huomattavasti.

Tai sitten ne on koodattu hyvin, että se itse laskenta tehdään todella nopeasti, jolloin ei hyödytä nopeammasta laskentasuorituskyvystä.

Tällaisten perusteella ei oikeasti voi päätellä mitään siitä, onko peli koodattu hyvin vai huonosti.

Jos pelin working set on iso, sitten se vaan hyötyy siitä suuremmasta välimuistista, eikä sitä working settiä usein voi pienentää, jos oikeasti tarvii käsitellä usein sitä suurta määrää dataa.
Toisaalta, jos muistia käsitellään hyvin sekalaisessa järjestyksessä(tai välimuistin rakenteen kannalta huonossa järjestelmällisessä järjestyksessä), välimuistin osumatarkkuus on huonompi.

Että ennen kuin voi sanoa kuinka hyvin peli on koodattu, pitää vähintään saada jotain oikeaa profiilidataa siitä ja mielellään myös nähdä joko pelin lähdekoodi tai siitä generoitu assembly-koodi.
 
Että ennen kuin voi sanoa kuinka hyvin peli on koodattu, pitää vähintään saada jotain oikeaa profiilidataa siitä ja mielellään myös nähdä joko pelin lähdekoodi tai siitä generoitu assembly-koodi.
Jos heitetään mutulla esimerkki että jos lähdekoodi on talon piirustukset, niin niistä voi päätellä jotain, mutta se ei suoraan esim kerro kuinka toimiva talo on kun on talossa paljon porukkaa.
 
DigitalFoundryn Alex mainitsikin yhdessä jaksossa kuinka 7800 X3D hommaamisen jälkeen huomaa mitkä pelit on koodattu "huonosti" kun pelkän L3 välimuistin lisääminen parantaa suorituskykyä huomattavasti.
En sitten tiedä kuinka paljon perää tuossa on kun itselle ei tule mieleen tapausta jossa peliä olisi optimoitu jälkeenpäin niin että ero normaalin ja X3D mallin välillä olisi kaventunut.

Tuossa pätkässä puhutaan rammista, näyttiksen vrammista ja prossun cachesta. Nuo näyttiksien kaistathan on huippunäyttismalleissa nykyään isoja. Paljonhan on vrammin/näyttiksen rammin access time/latenssi vs normaalin muistin latenssi vs access time. Luulisi, että näyttiksen muisti on myös latenssiltaan nopeampaa. Ehkä ei. Onko näyttiksen muisti kuinka hidasta vs l3 cacheen ?
 
Olettaisin, että GDDR:ät ovat suuremmalla latenssilla kuin DDR:ät (jonka takia noita GDDR:än latensseja ei juuri missään mainita), mutta vastavuoroisesti kaistaa on sitten huomattavasti enemmän.
 
Tuossa pätkässä puhutaan rammista, näyttiksen vrammista ja prossun cachesta. Nuo näyttiksien kaistathan on huippunäyttismalleissa nykyään isoja. Paljonhan on vrammin/näyttiksen rammin access time/latenssi vs normaalin muistin latenssi vs access time. Luulisi, että näyttiksen muisti on myös latenssiltaan nopeampaa. Ehkä ei. Onko näyttiksen muisti kuinka hidasta vs l3 cacheen ?

Sekä DDR- että GDDR-muistit ovat DRAM-muisteja, ja kaikki DRAM-muistit ovat viiveiltään hitaita, sitä nopeutta rajoittaa se sisällä oleva DRAM eikä GDDRn nopeampi väylä suuremmalla purskepituudella käytännössä auta viiveisiin(saattaa jopa ennemminkin jopa inasen, huonontaa viivettä, mutta ero ei ole merkittävä).

Viiveissä ei ole mitään kovin merkittäviä eroja GDDR- ja DDR-muistien välillä.

Mutta GDDR-muistit pitää kolvata piirilevylle, eikä ne välttämättä tykkää myöskään prossorikannasta, käytännössä toimii hyvin kun muistit ja muistiohjaimen sisältävä piiri on molemmat kolvattu samalle piirilevylle. Signaali voi toimia paljon suuremmalla datansiirtotajuudella kun johdot on paljon lyhyempiä ja "puhtaampia" kun ei ole mitään liittimiä välissä.

Prossujen L3-välimuistit taas ovat tyypillisesti SRAMia joka on viiveiltään todella paljon nopeampaa kuin mikään DRAM.
 
Sekä DDR- että GDDR-muistit ovat DRAM-muisteja, ja kaikki DRAM-muistit ovat viiveiltään hitaita, sitä nopeutta rajoittaa se sisällä oleva DRAM eikä GDDRn nopeampi väylä suuremmalla purskepituudella käytännössä auta viiveisiin(saattaa jopa ennemminkin jopa inasen, huonontaa viivettä, mutta ero ei ole merkittävä).

Viiveissä ei ole mitään kovin merkittäviä eroja GDDR- ja DDR-muistien välillä.

Mutta GDDR-muistit pitää kolvata piirilevylle, eikä ne välttämättä tykkää myöskään prossorikannasta, käytännössä toimii hyvin kun muistit ja muistiohjaimen sisältävä piiri on molemmat kolvattu samalle piirilevylle. Signaali voi toimia paljon suuremmalla datansiirtotajuudella kun johdot on paljon lyhyempiä ja "puhtaampia" kun ei ole mitään liittimiä välissä.

Prossujen L3-välimuistit taas ovat tyypillisesti SRAMia joka on viiveiltään todella paljon nopeampaa kuin mikään DRAM.

Jos näyttiksiin pystytään tuolla tavalla toteuttamaan nopeampaa rammia. Oon miettinyt, että miks intel ja amd ei julkaisis emolevyjä jossa olis jokasesta emo mallista julkastu eri vaihtoehtoja. Esim. Asrockin steel legend x670e julkastais 16 gigas, 32gigaa rammilla 64 gigasena jne. Noi olis normaalien kampojen sijaan juotettu emoon suoraan. Voi olla et on montakin eri syytä miks tuolla tavalla ei tehdä. Ddr6 kun tulee tulevaisuudessa emoihin lienee vielä enemmän häiriöherkempi kuin ddr5.
 
Jos näyttiksiin pystytään tuolla tavalla toteuttamaan nopeampaa rammia. Oon miettinyt, että miks intel ja amd ei julkaisis emolevyjä jossa olis jokasesta emo mallista julkastu eri vaihtoehtoja. Esim. Asrockin steel legend x670e julkastais 16 gigas, 32gigaa rammilla 64 gigasena jne. Noi olis normaalien kampojen sijaan juotettu emoon suoraan. Voi olla et on montakin eri syytä miks tuolla tavalla ei tehdä. Ddr6 kun tulee tulevaisuudessa emoihin lienee vielä enemmän häiriöherkempi kuin ddr5.
Mikäs järki tuossa nyt olisi? haittoja ilman (juuri) mitään hyötyjä?

1) et voi enää päivittää muisteja

2) jos muistit hajoaa, hajoaa koko emo

3) kalliimmat emot

4) kuten tuossa ylempänä sanottiin, ne GDDR ei tykkää välttämättä, jos prossu ei ole myös kolvattu emolle, eikä nopeuksissa ole juuri eroja

5) kuluttajalle "hankalampaa" löytää se malli mitä etsii jos toiset menee nopeammin loppuun

6) emovalmistajan pitää huomioida muistien hinnat/vaihtelut yms

7) hyödyt? ei mitään?

8) ei voi vaihdella hitaampaa nopeampaan

9) et voi valita ylipäätään muisteja, esim haluatko paljon nopeaa, paljon hidasta, vähän hidasta jne
 
Applehan tuota muistin integrointia tosiaan tekee M-sarjalaisten koneiden kanssa (LPDDR5 ei siis GDDR). Applelle tuosta suurin etu on tuon Max-malliston kanssa (M3 tässä tapauksessa), kun siinä voi sitten tuon 512 bit -muistiväylän kanssa ottaa 400 GB/s kaistan käyttöön. Halvimmissa mallissa vastaavat lukemat ovat 128 bittiä ja 100 GB/s.
 
Mikäs järki tuossa nyt olisi? haittoja ilman (juuri) mitään hyötyjä?

1) et voi enää päivittää muisteja

Tarkoittaa vaan sitä, että sitten pitää koneeseen laittaa heti järkevä määrä muistia eikä pihistellä.
Nykyaikana Mooren laki on melkein pysähtynyt DRAMin osalta eikä koneisiin juuri enää päivitellä lisää muistia sen normaalin kehityksen takia (sen sijaan muistia usein päivitetään kyllä heti oston jälkeen esim. läppäreihin joissa alunperinkin on muistia liian vähän.

2) jos muistit hajoaa, hajoaa koko emo

Kyllä, mutta muistin hajoaminen on melko harvinaista.

3) kalliimmat emot

Ei, vaan kokonaisuudessaan halvemmat. Muistin juottaminen emolevylle tulee halvemmaksi kuin DIMM-paikka. Samoin säästetään se DIMMin piirilevyn hinta.

4) kuten tuossa ylempänä sanottiin, ne GDDR ei tykkää välttämättä, jos prossu ei ole myös kolvattu emolle, eikä nopeuksissa ole juuri eroja
...
7) hyödyt? ei mitään?

Sen prossun voisi aivan hyvin kolvata myös sinne emolle. Se ei ole mikään ongelma.

Ja kaistassa on suuria nopeuseroja, sillä kaistalla on todella paljon väliä prossupiirille integroidun GPUn suorituskyvylle.

8) ei voi vaihdella hitaampaa nopeampaan

Muistien tai prossun päivittäminen nopeampiin olemassaolevalla emolla on ATK-harrastajien puuhastelua. >90% kuluttajista ei sitä kuitenkaan tee.

9) et voi valita ylipäätään muisteja, esim haluatko paljon nopeaa, paljon hidasta, vähän hidasta jne

Suurin osa kuluttajista on aivan totaalisen pihalla siitä, että kuinka nopeaa sen muistin pitäisi olla/mistä kannattaa maksaa. Kun kaikki tulee yhtenä pakettina, on selvästi suurempi mahdollisuus saada kokonaisuus, joka on mietitty järkeväksi (ja josta on esim. 3dmark-tuloksia saatavilla että niitä voidaan verrata kokonaisena pakettina)


Sinulla on nyt tähän asiaan hyvin kapea ATK-harrastajan näkökulma. Suurimmalle osalle kuluttajista tuollaisessa olisi hyvin paljon järkeä - minkä takia esim. Sony ja Microsoft myyvät suuria määriä tällaisia GDDR-muistilla varustettuja AMDn APU-piirillä varustettuja koneita. Valitettavasti vaan nämä Sonyn ja Microsoftin myymät koneet on softan puolesta cripplattuja että niissä ei voi ainakaan helposti ajaa normaaleja käyttiksiä ja niissä rahastetaan törkeällä tavalla softan hinnassa.
 
Viimeksi muokattu:
Nythän on tulossa ainakin kahdenlaisia ratkaisuja ddr5/6 signaloinnin parannukseen. Näin ulkomuistista toinen oli uusi slottityyppi joka lyhentää johtoja, mutta vaatii uudet emot ja muistit. Toinen oli nykysysteemiin sopiva ddr5 jossa on muistikammassa joku signalointisiru.

Saa nähdä miten yleistyy, mutta molemmat joustavampia kuin nuo täysin juotetut ratkaisut.
 
Viiveissä ei ole mitään kovin merkittäviä eroja GDDR- ja DDR-muistien välillä.

Kuluttajalaitteissa GDDR ja ja LPDDR on selvästi korkeammalla viiveellä. Sanotaan vaikka hatusta heittäen, että niiden viive on yli ~100 ns, DDR jedec ajoituksilla on ~70-80 ns ja XMP:llä 60-70 ns ja käsin kellottamalla ~50 ns. HBM myös korkeammalla viiveellä. Viive tulee enimmäkseen niistä muistisiruista, joten niiden juottaminen emolle tai prosessoripakettiin ei juurikaan laske viivettä. Singnaalin laatu ja energiatehokuus paranee ja kaistaa saadaan nostettua. Toki viiveillä on enten merkitystä pelaajille. Muille ei niin väliä. Moni täällä varmaan on pelaaja ja katsoo asiaa siitä näkökulmasta. Jos tahtoa olisi niin varmasti viiveitä saataisi alas. Ongelma on vaan se että perus DIMM kapulat on huomattavasti viileämpiä ja "kellotettuna kovammalla jännitteellä.

Kaikkien muistien nopeutta voidaan nostaa. Työpöytäkoneissa on tottuttu 128 bit leveään muistikaistaan, mutta Apple käyttää jo leveämpiä kaistoja ja AMD ja intel taitaa suunnitella jotain APU:ja isolla GPU:lla ja niissä on kai 256 bit muistiväylät.

GDDR on GPU:lle suunniteltu, niin varmaan ihan syystä sitä ei juuri muissa laitteissa ole käytetty.
 
Kuluttajalaitteissa GDDR ja ja LPDDR on selvästi korkeammalla viiveellä. Sanotaan vaikka hatusta heittäen, että niiden viive on yli ~100 ns, DDR jedec ajoituksilla on ~70-80 ns ja XMP:llä 60-70 ns ja käsin kellottamalla ~50 ns. HBM myös korkeammalla viiveellä. Viive tulee enimmäkseen niistä muistisiruista, joten niiden juottaminen emolle tai prosessoripakettiin ei juurikaan laske viivettä. Singnaalin laatu ja energiatehokuus paranee ja kaistaa saadaan nostettua. Toki viiveillä on enten merkitystä pelaajille. Muille ei niin väliä. Moni täällä varmaan on pelaaja ja katsoo asiaa siitä näkökulmasta. Jos tahtoa olisi niin varmasti viiveitä saataisi alas. Ongelma on vaan se että perus DIMM kapulat on huomattavasti viileämpiä ja "kellotettuna kovammalla jännitteellä.

Kaikkien muistien nopeutta voidaan nostaa. Työpöytäkoneissa on tottuttu 128 bit leveään muistikaistaan, mutta Apple käyttää jo leveämpiä kaistoja ja AMD ja intel taitaa suunnitella jotain APU:ja isolla GPU:lla ja niissä on kai 256 bit muistiväylät.

GDDR on GPU:lle suunniteltu, niin varmaan ihan syystä sitä ei juuri muissa laitteissa ole käytetty.
Ei toimisto /peli alustoissa on ollut jo iät ja aja 4 kanmavainen muistiohjain..
 
Ei kanavien laskeminen ole enää kovin mielekästä. On ainakin 16-64 bit leveitä kanavia/alikanavia, eikä se käyttäjään vaikuta juurikaan.
Jos on samalaiset kanavat, niin kyllä 4:ssä kanavassa on oina enemmän kaistaa, kuin kahdessa.. Tällöin välimuisti täyttyy nopeammin ja kanavat ovat valmiita seuraavaan muistihakuun nopeammin..
 
Harmi, että AMD ilmeisesti luopui tuosta dian 65W:n asetuksesta..

Niin prossuissa, kuin näyttiksissäkin olisi aika tehdä sukupolvi, jossa keskityttäisiin virransäästöön...
Ei ei ne kokoajan maksimitehoa vedä. Edes peleissä. Ja jokainen voi säätää ne tehonkulutukset haluamakseen. EIhän se jatkuva lisätehontarve ole kiva, mutta muuten jätettäisi vaan sitten ylikellotusvaraa niille yybee OC malleille. Nyt kun jäähyt mitoitetaan piirin maksimaaliselle varrankullutukselle, niin ne ovat hiljaisia. Siihen onko arkkitehtuurit enargiatehokkaita vai ei on vaikea ottaa kantaa, muuten kun vertailemalla niitä. On ihan teoreettistä kuinka energiapihimpi arkkitehtuuri voitaisi valmistaa. Energiatehokuus paranee jatkuvasti huomattavasti. myös arkkitehtuurien osalta. Tai en tiedä ottiko AMD vähän pakkia.
 
Ei ei ne kokoajan maksimitehoa vedä. Edes peleissä. Ja jokainen voi säätää ne tehonkulutukset haluamakseen. EIhän se jatkuva lisätehontarve ole kiva, mutta muuten jätettäisi vaan sitten ylikellotusvaraa niille yybee OC malleille. Nyt kun jäähyt mitoitetaan piirin maksimaaliselle varrankullutukselle, niin ne ovat hiljaisia. Siihen onko arkkitehtuurit enargiatehokkaita vai ei on vaikea ottaa kantaa, muuten kun vertailemalla niitä. On ihan teoreettistä kuinka energiapihimpi arkkitehtuuri voitaisi valmistaa. Energiatehokuus paranee jatkuvasti huomattavasti. myös arkkitehtuurien osalta. Tai en tiedä ottiko AMD vähän pakkia.
Jos coren päälle haluitaan kasata muuta, niin coren on jokatapuksessa kulutettava paljon maltillisemmin ja hotspotit pitää saada pois..
 

Statistiikka

Viestiketjut
253 826
Viestejä
4 411 053
Jäsenet
73 260
Uusin jäsen
Avaruuslapsi

Hinta.fi

Back
Ylös Bottom