NVIDIA esitteli Ada Lovelacen muistijärjestelmän saloja

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 554


Kaotik kirjoitti uutisen/artikkelin:
NVIDIA on julkaissut GeForce RTX 4060 -perheen näytönohjainten julkistuksen yhteydessä myös mielenkiintoisen katsauksen piirin muistipuolen sielunelämään. Blogissa käydään läpi RTX 40 -sarjan eli Ada Lovelace -arkkitehtuurin muistijärjestelmää ja miten kasvanut L2-välimuisti vaikuttaa siihen.

Kuten prosessoritkin, myös grafiikkapiirit noudattavat perinteistä muistihierarkiaa, jossa on eri tasoisia välimuisteja ennen varsinaisia muistiohjaimia. Suoritusyksiköt hakevat dataa niin läheltä kuin mahdollista ja mikäli haettua ei löydy lähimmältä välimuistitasolta, sitä haetaan seuraavalta ja niin edelleen, kunnes jäljelle jää varsinainen muisti (VRAM, Video RAM). NVIDIAlla on käytössä kaksi välimuistitasoa, L1 ja L2. L1-välimuistit ovat kunkin SM-yksikön omia ja suoraan niiden yhteydessä, kun L2-välimuisti on koko grafiikkapiirin yhdessä jakama.



NVIDIAn vertailut on tehty yksinomaan GeForce RTX 4060 Ti:llä (AD106), mutta vertailupisteen saamiseksi grafiikkapiirillä ajettiin testit sekä normaalisti 32 Mt:n että 2 megatavuun rajoitetulla L2-muistilla. Referenssiksi kerrottakoon, että esimerkiksi edeltävässä Ampere-sukupolvessa ns. vastaavalla GA106-piirillä oli 3 Mt L2-välimuistia.

Yhtiön testien mukaan L2-välimuistin kasvattaminen 2 Mt:stä 32 megatavuun AD106:lla laskee muistiliikennettä pelistä riippuen 40-60 %:iin. Vertailu on toteutettu kussakin pelissä 1080p, 1440p ja 4K-resoluutioiden keskiarvolla. Suurin hyötyjä on Call of Duty: Modern Warfare 2 ja pienimmän edun suuremmasta välimuistista vie nimiinsä Assassin’s Creed Valhalla. NVIDIA on tämän myötä keksinyt markkinoida tietyissä yhteyksissä myös näytönohjainten muistikaistaa ns. efektiivisenä muistikaistana välimuistin vaikutuksen vuoksi. Esimerkiksi GeForce RTX 4060 Ti:n 228 Gt/s:n muistikaista on yhtiön mukaan efektiivisesti jopa 554 Gt/s, mikä ajaa ohi edeltävän sukupolven RTX 3060 Ti 12 Gt:n 448 Gt/s todellisesta muistikaistasta.

Pienentyneet muistihaut parantavat luonnollisesti myös suorituskykyä. NVIDIAn mukaan ilman säteenseurantaa 32 Mt:n välimuisti parantaa suorituskykyä noin 17-18 % 2 megatavuun verrattuna. Säteenseuranta käytössä suorituskyky etu on jo noin 25 % ja DLSS 3:lla jopa 34 %. Valitettavasti diasta ei käy ilmi, onko suorituskykyparannukset mitattu keskiarvona samoilla testeillä kuin muistiliikenteen lasku, vai miten. Niin ikään on jätetty mainitsematta se, tarkoitetaanko DLSS 3:lla tässä yhteydessä sekä DLSS Super Resolutionia että Frame Generationia.

Lähde: NVIDIA

Linkki alkuperäiseen juttuun
 
Liittynyt
18.10.2016
Viestejä
1 827
Vaikea uskoa jotta 33% muistikaista-kutistus (3060-12GB/192 vs. 4060/128) olisi korjattavissa pelkällä välimuistin koon kasvattamisella jos halutaan siirtää näitä datamääriä. Saattaa riittää 1080-resolla testipeleistä riippuen, kunhan resoluutio yhtään nousee niin suorituskyky laskenee rajusti.
Lähinnä tulee mieleen yli 30v takainen Intel 386SX, jonka puolitetun 16-bittisen muistikaistan hitautta ei korjannut mikään emolevylle asennettu välimuistikaan :mad:
 

finWeazel

Chief Karpfen
Liittynyt
15.12.2019
Viestejä
7 973
Vaikea uskoa jotta 33% muistikaista-kutistus (3060-12GB/192 vs. 4060/128) olisi korjattavissa pelkällä välimuistin koon kasvattamisella jos halutaan siirtää näitä datamääriä. Saattaa riittää 1080-resolla testipeleistä riippuen, kunhan resoluutio yhtään nousee niin suorituskyky laskenee rajusti.
Lähinnä tulee mieleen yli 30v takainen Intel 386SX, jonka puolitetun 16-bittisen muistikaistan hitautta ei korjannut mikään emolevylle asennettu välimuistikaan :mad:
Isommalle resoluutiolle tarkoitetuissa näyttökorteissa on isompi cache. Ad102:ssa on 96MB välimuisti mistä on 4090:ssa päällä 72MB. Tuohon päälle toki ne pienemmät cachet myös.

AMD:lla on oma iso cachensa. Kyllä iso cache toimii, ei nvidia muuten sitä olisi "kopioinut"
 
Liittynyt
14.12.2016
Viestejä
2 768
Yep!
AMD alkoi käyttää isoa cache aikaisemmin ja hyvinhän se on toiminut!
Testejä odotellessa, koska nehän sen loppujen lopuksi paljastavat.
Eroja tulee varmaan käytetyn resoluution mukaan!
 
Liittynyt
17.10.2016
Viestejä
1 597
Jossain vaiheessa oli huhuja RTX 4090 Ti kortista entistä isommalla välimuistilla. Onkohan tuollainen kortti edelleen tuloillaan?
 

finWeazel

Chief Karpfen
Liittynyt
15.12.2019
Viestejä
7 973
Jossain vaiheessa oli huhuja RTX 4090 Ti kortista entistä isommalla välimuistilla. Onkohan tuollainen kortti edelleen tuloillaan?
4090Ti on mahdollinen. 4090:en käyttää leikattua ad102 piiriä. 4090Ti voisi tulla täydellä tai vähemmän leikatulla ad102 piirillä. Täysi 96MB cache versus 4090 72MB, enemmän suoritusyksiköitä ja mahdollisesti hieman isompi kellotaajuus jos/kun parhaiten kulkevia piirejä on kerätty jemmaan tehtaalla + syötetään hieman enemmän virtaa piirille. Muistien nopeus voisi olla myös hieman isompi ti mallissa.
 
Liittynyt
12.12.2016
Viestejä
4 259
4090Ti on mahdollinen. 4090:en käyttää leikattua ad102 piiriä. 4090Ti voisi tulla täydellä tai vähemmän leikatulla ad102 piirillä. Täysi 96MB cache versus 4090 72MB, enemmän suoritusyksiköitä ja mahdollisesti hieman isompi kellotaajuus jos/kun parhaiten kulkevia piirejä on kerätty jemmaan tehtaalla + syötetään hieman enemmän virtaa piirille. Muistien nopeus voisi olla myös hieman isompi ti mallissa.
Tälle voisi myös potkia viemään sen 600W, mille kuormalle noiden 4090 korttien jäähyt on ilmiselvästi suunnittelu... On kyllä melkoinen jytky jos vielä 4090 verrattuna noin 25% lisää vauhtia tulisi, joka olisi periaatteessa mahdollista tuosta piiristä
 
Liittynyt
14.12.2016
Viestejä
2 768
3500€. ???
Jos jytkystä siis puhutaan ;)
Mutta eiköhän sieltä se 4090ti tule vielä markkinoille.
 
Liittynyt
05.03.2018
Viestejä
1 346
Toivottavasti tulee kun jäi 4090 väliin satunnaisista syistä ja tässä vaiheessa ei viitsisi enää vanhaa SERriä ostaa...:D

Syksyllä 4090ti jollain reilusti alle 2000€ hinnalla samalla kun 4090 hintaa vähän lasketaan olis ihan mukavaa.
 
Liittynyt
31.10.2017
Viestejä
545
Isommalle resoluutiolle tarkoitetuissa näyttökorteissa on isompi cache. Ad102:ssa on 96MB välimuisti mistä on 4090:ssa päällä 72MB. Tuohon päälle toki ne pienemmät cachet myös.

AMD:lla on oma iso cachensa. Kyllä iso cache toimii, ei nvidia muuten sitä olisi "kopioinut"
Välimuistin koon kasvattaminen on okei, mutta vain tilanteissa joissa välimuistia kasvattamalla haetaan lisänopeutta ja arvoa jo olemassa olevaan nopeaan suorituskykyyn. Toisin sanoen näkis mielummin vaikka nuo isommalla välimuistilla varustetut kortit sitten Super-revisioina tms. Ja nykyistenkin korttien muisti- ja pcie kaistat takaisin aikaisemmin tunnetuissa malli nopeuksissaan.

Eikä näin että halvimmat karvalakkimallit ja keskiluokan kortit rampautetaan tahallisesti ja paikataan "puuttuva suorituskyky" antamalla kylkeen juuri riittävästi välimuistia että tilanne ei näyttäisi täysin katastrofaaliselta edeltävään sukupolveen verrattuna. Todellisuudessa tuomatta mitään todellista suorituskykylisää sukupolvien välille samalla luonnollisesti oikeuttaen edelleen "kryptovaluuttahinnoittelun" korteille.
 
Viimeksi muokattu:
Liittynyt
21.02.2017
Viestejä
5 025
Välimuistin koon kasvattaminen on okei, mutta vain tilanteissa joissa välimuistia kasvattamalla haetaan lisänopeutta ja arvoa jo olemassa olevaan nopeaan suorituskykyyn. Toisin sanoen näkis mielummin vaikka nuo isommalla välimuistilla varustetut kortit sitten Super-revisioina tms. Ja nykyistenkin korttien muisti- ja pcie kaistat takaisin aikaisemmin tunnetuissa malli nopeuksissaan.

Eikä näin että halvimmat karvalakkimallit ja keskiluokan kortit rampautetaan tahallisesti ja paikataan "puuttuva suorituskyky" antamalla kylkeen juuri riittävästi välimuistia että tilanne ei näyttäisi täysin katastrofaaliselta edeltävään sukupolveen verrattuna. Todellisuudessa tuomatta mitään todellista suorituskykylisää sukupolvien välille samalla luonnollisesti oikeuttaen edelleen "kryptovaluuttahinnoittelun" korteille.
Vähän erikoinen perspektiivi, taidat haukkua nyt hieman väärää puuta.

Välimuisti ei ole syy siihen, että alemman suorituskykyluokan kortit ovat suhteellisesti köyhempiä kapistuksia kuin edellisissä sukupolvissa. Se on ihan vain Nvidian markkinastrategiaa, jota olisi ollut aivan yhtä mahdollista toteuttaa sellaisellakin arkkitehtuurilla, jossa merkittävästi entistä suurempaan välimuistiin ei olisi turvauduttu.

Mitään järkeä ei olisi julkaista malleja joissa välimuisti on poistettu käytöstä, kun se välimuisti on jo sirulla.
 
Liittynyt
31.10.2017
Viestejä
545
Se on ihan vain Nvidian markkinastrategiaa
Niin markkinointistrategiaa jolla yritetään kääntää näytönohjainmarkkinoiden status quo riippuvaiseksi fakeframeista. Niin tämähän tuskin tuli kenellekään yllätyksenä sillä Nvidia on tätä pyrkinyt ajamaan sisään sitten RTX 2000-sarjan lanseerauksen. Kyseisen ei tule kuitenkaan olla itseisarvo joka ajaa alimman ja keskiluokan kortit täysin riippuvaisiksi tekniikan toimivuudesta vaan kyseiset tekniikat tuo lähinnä lisäarvoa ja parhaimmillaan venyttävät korttien suorituskykyä äärimmilleen (RTX 4090 + RT + DLSS = 4 ja 8k high framerate pelaaminen). Eikä edelleenkään niin että alimman ja keskiluokan kortit tehdään riippuvaisiksi tekniikasta heikentämällä niiden suorituskykyä tarkoituksellisesti.

Toki pitää nyt samalla todeta toki että AMD oli nimenomaan valmistaja joka toi valimuistiratkaisut leikatuilla muisti ja pcie kaistoilla markkinoille ensimmäisenä näihin alemmankeskiluokan kortteihin rx 6000-sarjan mukana. Ja kun ottaa huomioon miten AMD on seurannut Nvidian vanavedessä esim hinnoittelun osalta. Laittamatta sen enempää foliohattua päähän mutta. En olisi lainkaan yllättynyt että koko juttu on molempien tahojen osalta täysin suunnitelmallista toimintaa ja joskus tulevaisuudessa paljastuu kuinka yhtiöt yhteisessä duopoliymmärryksessä päättivät kyseisen strategian kuluttajaluokan kortteihin.

Mitään järkeä ei olisi julkaista malleja joissa välimuisti on poistettu käytöstä, kun se välimuisti on jo sirulla.
NIin siis puhuin tuossa välimuistin kasvattamisesta normaalin ja supermallin välillä en välimuistin poistamisesta kokonaan normaalista mallista.
 
Viimeksi muokattu:
Liittynyt
22.10.2016
Viestejä
11 111
Vaikea uskoa jotta 33% muistikaista-kutistus (3060-12GB/192 vs. 4060/128) olisi korjattavissa pelkällä välimuistin koon kasvattamisella jos halutaan siirtää näitä datamääriä. Saattaa riittää 1080-resolla testipeleistä riippuen, kunhan resoluutio yhtään nousee niin suorituskyky laskenee rajusti.
Muistin kellotaajuus on noussut n. 13%, että kaista on pudonnut vain n. 24%, ei 33%.

Lähinnä tulee mieleen yli 30v takainen Intel 386SX, jonka puolitetun 16-bittisen muistikaistan hitautta ei korjannut mikään emolevylle asennettu välimuistikaan :mad:
Nyt menee vertaus pahasti pieleen.

386ssa se emolevyllä oleva välimuisti oli sen hitaan väylän takana. Kaikki accessit sinne välimuistiin kärsivät myös siitä väylän hitaudesta.

486ssa sen sijaan prosessoriytimen kaksoiskellotus tuplasti (486DX2) ja myöhemmin triplasti (DX4) muistiväylää suuremmalle nopeudelle toimi oikein mukavasti, kun sinne itse piirille oli tullut L1-välimuisti joka toimi ytimen eikä väylän nopeudella.

L2-välimuisti oli kuitenkin 486ssa väylän takana.

Nykypiireissä(*) mikään välimuisti ei ole sen "hitaan" muistiväylän takana.

(*)Intelillä Pentium Prosta lähtien, AMDllä K7sta lähtien.
 
Viimeksi muokattu:
Liittynyt
21.02.2017
Viestejä
5 025
Toki pitää nyt samalla todeta toki että AMD oli nimenomaan valmistaja joka toi valimuistiratkaisut markkinoille ensimmäisenä näihin alemmankeskiluokan kortteihin rx 6000-sarjan mukana. Ja kun ottaa huomioon miten AMD on seurannut Nvidian vanavedessä esim hinnoittelun osalta. Laittamatta sen enempää foliohattua päähän mutta. En olisi lainkaan yllättynyt että koko juttu on molempien tahojen osalta täysin suunnitelmallista toimintaa ja joskus tulevaisuudessa paljastuu kuinka yhtiöt yhteisessä duopoliymmärryksessä päättivät kyseisen strategian kuluttajaluokan kortteihin.
Kartelliepäilyt hintojen nousun pohjalta voin jotenkin vielä ymmärtää, vaikken kartellia todennäköisenä selittäjänä hintojen nousulle pidäkään. Mutta että kartelliteoria, koska molemmilla välimuistiratkaisu? Menee jo harhaiseksi.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 554
Välimuistin koon kasvattaminen on okei, mutta vain tilanteissa joissa välimuistia kasvattamalla haetaan lisänopeutta ja arvoa jo olemassa olevaan nopeaan suorituskykyyn. Toisin sanoen näkis mielummin vaikka nuo isommalla välimuistilla varustetut kortit sitten Super-revisioina tms. Ja nykyistenkin korttien muisti- ja pcie kaistat takaisin aikaisemmin tunnetuissa malli nopeuksissaan.
Muistiohjaimet ovat yksi niistä elementeistä mitkä ei käytännössä skaalaudu enää. Jos tuonne pienen pään piireihin lyötäisiin leveämpää väylää piirin kokoa pitäisi kasvattaa (niiden on oltava piirin reunalla) mikä nostaa hintaa. Jokainen uusi prosessi on entistä kalliimpi per mm².
Sama taitaa päteä myös PCIe-ohjaimeen.
 

aop

Liittynyt
17.10.2016
Viestejä
1 374
Muistin kellotaajuus on noussut n. 13%, että kaista on pudonnut vain n. 24%, ei 33%.



Nyt menee vertaus pahasti pieleen.

386ssa se emolevyllä oleva välimuisti oli sen hitaan väylän takana. Kaikki accessit sinne välimuistiin kärsivät myös siitä väylän hitaudesta.

486ssa sen sijaan prosessoriytimen kaksoiskellotus tuplasti (486DX2) ja myöhemmin triplasti (DX4) muistiväylää suuremmalle nopeudelle toimi oikein mukavasti, kun sinne itse piirille oli tullut L1-välimuisti joka toimi ytimen eikä väylän nopeudella.

L2-välimuisti oli kuitenkin 486ssa väylän takana.

Nykypiireissä(*) mikään välimuisti ei ole sen "hitaan" muistiväylän takana.

(*)Intelillä Pentium Prosta lähtien, AMDllä K7sta lähtien.
AMD K6-III prossussa oli nopea L2 välimuisti samalla piisirulla ytimen kanssa. AMD K7 prossuissa taisi olla ennen Thunderbirdiä ulkoinen L2 välimuisti prosessorikortilla puolella ytimen kellotaajuudesta. Sama homma Pentium II ja III prossuissa ennen Copperminea. Välimuistillisessa Celeronissa taisi olla välimuisti samalla piilastulla ennen Coppermineakin ja ne olikin kovia kellottumaan, kun L2 kellotaajuus ei rajoittanut menoa.
 
Liittynyt
18.10.2016
Viestejä
3 053
Vieläkö cachet tehdään SRAM muistista vai onko siihen kehitetty jo jotain parempaa?
 
Liittynyt
22.10.2016
Viestejä
11 111
Välimuistit on sramia about kaikkialla ja tietääkseni parempaa ei ole olemassa.
Juu. Välillä joissain harvoissa piireissä uloimman tason välimuisti oli EDRAMia eli logiikkaprosessilla tehtyä DRAMia, mutta EDRAMin skaalautuminen loppui jo yli viitisen vuotta sitten.

Nyt tilanne on se, että SRAMin skaalautuminen on myös hidastunut merkittävästi (enemmän kuin logiikan) ja SRAMillakin käytännössä hinta/bitti on alkanut nousta uusien valmistustekniikoiden myötä.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
21 554
Nyt tilanne on se, että SRAMin skaalautuminen on myös hidastunut merkittävästi (enemmän kuin logiikan) ja SRAMillakin käytännössä hinta/bitti on alkanut nousta uusien valmistustekniikoiden myötä.
Joka yhdessä muistiohjainten nollaskaalautumisen kanssa on se isoin syy miksi AMD kehitti 16Mt I$/64-bit muistiohjain MCD sirut jotka valmistetaan pykälää vanhemmalla prosessilla
 
Toggle Sidebar

Statistiikka

Viestiketjut
240 031
Viestejä
4 192 766
Jäsenet
70 842
Uusin jäsen
wpentti

Hinta.fi

Ylös Bottom