SK Hynix: HBM3 tarjoaa vähintään 665 Gt/s kaistaa per muistipino

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 747
SK Hynix on paljastanut HBM2e-sivuillaan ensimmäiset nopeustiedot yhtiön tulevista HBM3-muisteista. Kuvan mukaan HBM3:n I/O-nopeudet tulevat olemaan vähintään 5,2 Gbps, mikä tarkoittaisi vähintään 665 Gt/s:n muistikaistaa per pino.

1623357370647.png


Lähteet: SK hynix Official Product Website, HBM3 to Top 665 GBps Bandwidth per Chip, SK Hynix Says
 
Jokos noilla oli se integrointi jotenkin halvempaa? Muistelen jostain lukeneeni jotain sellaista..
Luulisi ainakin, että virrankulutus olisi 2:lla pinolla jotain GDDR6X:ää maltillisempaa.. Eikös noilla saanut aika suuria muistimääriä /pino?
 
Jokos noilla oli se integrointi jotenkin halvempaa? Muistelen jostain lukeneeni jotain sellaista..
Luulisi ainakin, että virrankulutus olisi 2:lla pinolla jotain GDDR6X:ää maltillisempaa.. Eikös noilla saanut aika suuria muistimääriä /pino?

Aiemmin HBMn paketoinnin hinnan ongelma on ollut iso interposer. Interposer on siis muinaisella valmistustekniikalla tehty piiri, joka sisältää vain johtoja, ja sijaitsee muiden piirien alla Muinainenkin valmistustekniikka kuitenkin maksaa jos sillä on pitänyt tehdä hyvin iso piilastu. Tähän on kuitenkin ratkaisuita, ainakin seuraavat:

1) Intelin EMIB mahdollistaa paljon pienemmän interposerin, koska sen ei tarvi olla itse varsinaisen GPUn alla muuta kuin aivan sen reunan luona Tämä on jo käytössä siinä Intelin prossussa jossa samassa paketissa on Kaby Lake ja AMDn näyttis.

1b) Myös muilta valmistajilta voi joskus lähiaikoina olla tulossa EMIBin kaltaisia ratkaisuita.

2) Jos muistipinon pinoaa suoraan itse varsinaisen GPU-piilastun päälle, ja läpiviennit on integroitu sille GPU-piilastulle, interposeria ei tarvita. Tässä on kuitenkin ongelmana mm. se, että sitten se muistin oleminen pääsirun päällä hankaloittaa sen jäähdytystä.

3) AMDn on myös joissain pitkän tähtäimen tulevaisuusvisioissaan puhunut "aktiivi-interposerista" jossa interposerille käytännössä laitetaan sellaista aktiivista kamaa, jota ei tarvi/kannata valmistaa uudella valmistustekniikalla, esim IO-toiminnallisuuden logiikkaa ja PHYitä , jolloin nämä on pois varsinaisen piirin pinta-alasta, ja interposer ei nosta kokonais-pii-pinta-alaa niin paljoa
 
Paljonko tuo on nyt sitten esim RTX3090:n muistisysteemin nopeuteen verrattuna?

Itse laskeslelin, että noilla uusilla muistella pystyy parantamaan muisti kaistaa 25% - 30%. RTX3090 maksimi muistikaista on 936.2 GB/s eli noilla uusilla muisteilla se nousisi johonkin 1220 GB/s. Tietty tämä on vain arvio, koska joku muu komponentti voi rajoittaa menoa ja todellisuudessa ei päästä ihan näin suuriin nousuihin.

Nämä jututhan ovat aina juuri niin nopeita kun on pullonkaulat arkkitehtuureissa ja softaratkaisuissa.
 
Itse laskeslelin, että noilla uusilla muistella pystyy parantamaan muisti kaistaa 25% - 30%. RTX3090 maksimi muistikaista on 936.2 GB/s eli noilla uusilla muisteilla se nousisi johonkin 1220 GB/s. Tietty tämä on vain arvio, koska joku muu komponentti voi rajoittaa menoa ja todellisuudessa ei päästä ihan näin suuriin nousuihin.

Nämä jututhan ovat aina juuri niin nopeita kun on pullonkaulat arkkitehtuureissa ja softaratkaisuissa.
Tuohan riippuu myös ihan siitä montako pinoa niitä HBM-muisteja pistetään, tuo reilu 1,2 Tt/s tulisi kahdella pinolla (2048bit)
 
3) AMDn on myös joissain pitkän tähtäimen tulevaisuusvisioissaan puhunut "aktiivi-interposerista" jossa interposerille käytännössä laitetaan sellaista aktiivista kamaa, jota ei tarvi/kannata valmistaa uudella valmistustekniikalla, esim IO-toiminnallisuuden logiikkaa ja PHYitä , jolloin nämä on pois varsinaisen piirin pinta-alasta, ja interposer ei nosta kokonais-pii-pinta-alaa niin paljoa
Miten tämä käytännössä menee, eli vaikuttaako raaka kide, josta valotettavat kiekot leikataan, muuhun kuin kiekon läpimittaan? Seostetaanko kiekko vai kide vai onko pohjalla aina vain puhdas piikiekko, jonka päälle kasvatetaan kerroksittain johdemateriaalin ja seospiin ohutkalvoja? Kuulostaa tosiaan aikamoiselta hukalta, jos joudutaan liitosalustaan käyttämään samaa materiaalia, johon voisi rakentaa piirejäkin.
 
Miten tämä käytännössä menee, eli vaikuttaako raaka kide, josta valotettavat kiekot leikataan, muuhun kuin kiekon läpimittaan? Seostetaanko kiekko vai kide vai onko pohjalla aina vain puhdas piikiekko, jonka päälle kasvatetaan kerroksittain johdemateriaalin ja seospiin ohutkalvoja? Kuulostaa tosiaan aikamoiselta hukalta, jos joudutaan liitosalustaan käyttämään samaa materiaalia, johon voisi rakentaa piirejäkin.

Pii on hyvin, hyvin halpaa. Pii on yksi maapallon yleisimmistä alkuaineista.

Eikä se raakakiekonkaan tekeminen kovin kallista ole, muistaakseni sen raakakiekon osuus on suuruusluokkaa sadasosasta tuhannesosaan valmiin piikiekon hinnasta.

Kallista on se kuukausia kestävä hyvin monimutkainen työ jonka aikana siitä tulee kiekollinen mikropiirejä.

Vaikka piiri olisi valmistettu vanhalla valmistustekniikalla, koko kiekon pinta-ala joudutaan kuitenkin valottamaan, ja joka kerrokselle erikseen.

Muinainen valmistustekniikka tarkoittaa käytännössä halvempaa hintaa/pinta-ala mm.
seuraavista syistä:

1) voidaan käyttää vanhempaa, huonompaa, halvempaa kalustoa, jonka hinta on jo kuoletettu

2) jokainen kerros tarvii valottaa vain kertaalleen. Noissa viimeisissä DUV-kalustolla tehtävissä prosesseissa (TSMCn "7nm", Intel "10nm") pienimmät yksityiskohdat sisältävät kerrokset pitää valottaa todella moneen kertaan, enemmän työvaiheita, valmistus kestää kauemmin, sama määrä valmistuskalustoa tuottaa aikayksikköä kohden vähemmän valmiita piikiekkoja.

3) johtokerroksia on usein vanhoissa valmistustekniikoissa vähemmän.

4) kysynnän ja tarjonnan laki. Kun muinaisen valmistustekniikan tehtaita on monella valmistajalla ja niihin ei ole samanlaista tunkua, voidaan paremmin shoppailla sieltä mistä halvemmalla saadaan.

5) luotettavuus ja saannot. Muinaisesta valmistustekniikasta varmasti tiedetään kaikki se ominaisuudet erittäin hyvin, ja valmistustekniikasta on kaikki ongelmat ehditty korjata hyvin. Saannot on sen takia muinaisella tekniikalla yleensä erinomaiset.
 
Viimeksi muokattu:
Niin.. Onko noiden virrankulutuksesta ja muistiohjaimen virrankulutuksesta esitetty mitään arvioita? 3090:n nykyinen muistivirityshän on ilmeisesti melko virtasyöppö viritys?
 
Niin.. Onko noiden virrankulutuksesta ja muistiohjaimen virrankulutuksesta esitetty mitään arvioita? 3090:n nykyinen muistivirityshän on ilmeisesti melko virtasyöppö viritys?

No voisi olettaa että HBM3 tuskin hurjasti kasvattaa virrankulutusta, päinvastoin se voi jopa laskea jos niiden valmistuksessa siirrytään uudempaan valmistusprosessiin. Ja sehän jo tiedetään että HMB2 on huomattavasti vähemmän virtaa kuluttava verrattuna GDDR6:n ja GDDR6X ei myöskään ole mitenkään vähävirtainen. Toki siinä suhteessa ilmeisesti hiukan parempi jos vertaillaan sitä GDDR6 pelkästään kaistan perusteella, eli jos pykättäisiin esim. 1 teran kaista molemmilla, niin GDDR6X kulutus kokonaisuutena olisi pienempi, mutta jos laitetaan 16GB molempia, niin GDDR6 kuluttaa vähemmän, toki kaistaakin on vähemmän.
 
No voisi olettaa että HBM3 tuskin hurjasti kasvattaa virrankulutusta, päinvastoin se voi jopa laskea jos niiden valmistuksessa siirrytään uudempaan valmistusprosessiin. Ja sehän jo tiedetään että HMB2 on huomattavasti vähemmän virtaa kuluttava verrattuna GDDR6:n ja GDDR6X ei myöskään ole mitenkään vähävirtainen. Toki siinä suhteessa ilmeisesti hiukan parempi jos vertaillaan sitä GDDR6 pelkästään kaistan perusteella, eli jos pykättäisiin esim. 1 teran kaista molemmilla, niin GDDR6X kulutus kokonaisuutena olisi pienempi, mutta jos laitetaan 16GB molempia, niin GDDR6 kuluttaa vähemmän, toki kaistaakin on vähemmän.
HBM:n väylä on per linja hitaampi ja pienemmän kapasitanssin omaava, joten luulisi datansiirron olevan paljon vähemmän tehoa kuluttavaa..
 
HBM:n väylä on per linja hitaampi ja pienemmän kapasitanssin omaava, joten luulisi datansiirron olevan paljon vähemmän tehoa kuluttavaa..

Niin mutta jos verrataan teran siirtonopeuteen kykenevänä HBM2 vs GDDR6 niin virrankulutuksessa GDDR6 kulutti moninkertaisen määrän virtaa.

Tuossa jotain jorinaa aiheesta
 
Aiemmin HBMn paketoinnin hinnan ongelma on ollut iso interposer. Interposer on siis muinaisella valmistustekniikalla tehty piiri, joka sisältää vain johtoja, ja sijaitsee muiden piirien alla Muinainenkin valmistustekniikka kuitenkin maksaa jos sillä on pitänyt tehdä hyvin iso piilastu. Tähän on kuitenkin ratkaisuita, ainakin seuraavat:

1) Intelin EMIB mahdollistaa paljon pienemmän interposerin, koska sen ei tarvi olla itse varsinaisen GPUn alla muuta kuin aivan sen reunan luona Tämä on jo käytössä siinä Intelin prossussa jossa samassa paketissa on Kaby Lake ja AMDn näyttis.

1b) Myös muilta valmistajilta voi joskus lähiaikoina olla tulossa EMIBin kaltaisia ratkaisuita.

2) Jos muistipinon pinoaa suoraan itse varsinaisen GPU-piilastun päälle, ja läpiviennit on integroitu sille GPU-piilastulle, interposeria ei tarvita. Tässä on kuitenkin ongelmana mm. se, että sitten se muistin oleminen pääsirun päällä hankaloittaa sen jäähdytystä.

3) AMDn on myös joissain pitkän tähtäimen tulevaisuusvisioissaan puhunut "aktiivi-interposerista" jossa interposerille käytännössä laitetaan sellaista aktiivista kamaa, jota ei tarvi/kannata valmistaa uudella valmistustekniikalla, esim IO-toiminnallisuuden logiikkaa ja PHYitä , jolloin nämä on pois varsinaisen piirin pinta-alasta, ja interposer ei nosta kokonais-pii-pinta-alaa niin paljoa

Voisiko tuota 3) kohtaa toteuttaa kuten läppäreissä erillinen gpu piiri tai nykyiset GDD6-sirut, että HBM3-muistipino(t) olisi oma piiri pcb:llä, ja "johdot" sitten gpu ytimen pinneihin/kosketuskohtiin?

2)
...käytössä siinä Intelin prossussa jossa samassa paketissa on Kaby Lake ja AMDn näyttis
Mikäs prossumalli kyseessä tarkalleen?

Ja se tärkein kysymys, mikäs tuollaisen valmistushinta (nk. omakustannehinta) 16GB kohdalla... nyt Gddr6 piiri maksaa jotain 5-10$ väliltä per GB. -> 70-100$ 16GB.
 
Viimeksi muokattu:
Voisiko tuota 3) kohtaa toteuttaa kuten läppäreissä erillinen gpu piiri tai nykyiset GDD6-sirut, että HBM3-muistipino(t) olisi oma piiri pcb:llä, ja "johdot" sitten gpu ytimen pinneihin/kosketuskohtiin?
Ei, interposeria (tai EMIBiä tai muuta vastaavaa piiriä) käytetään koska HBM:t vaatii niin paljon kontakteja ja lyhyen signaalimatkan. Niiden on oltava siinä ihan niitä käyttävän piirin kyljessä kiinni.
2)
Mikäs prossumalli kyseessä tarkalleen?
Kaby Lake-G:t eli Core iX-8xxxG-prosessorit.
 
Mielenkiinnolla odotan milloin tulee taas jotain muistien puolesta innovatiivista markkinoille, kuten Vega sarjalaiset oli. Nämä on vanhentuneet aika hyvin. Saisipa RDNA3 näyttiksen HBM3 pinoilla, joku 16+gigaa muistia ja kaistaa olisi varmaan ihan kivasti tuolle GPUlle. Toki, jos menevät chipletteihin, niin onko hyötyä, vai nostavatko vaan sitä chipletin päälle laitettavaa muistia määrältään isommaksi ja sitten varsinainen muisti olisi edelleen GDDR6 tasoista. Tuo ison välimuistin määrän hyöty on nyt nähty näissä RDNA2 korteissa jo.
 
Viimeksi muokattu:
Mielenkiinnolla odotan milloin tulee taas jotain muistien puolesta innovatiivista markkinoille, kuten Vega sarjalaiset oli. Nämä on vanhentuneet aika hyvin. Saisipa RDNA3 näyttiksen HBM3 pinoilla, joku 16+gigaa muistia ja kaistaa olisi varmaan ihan kivasti tuolle GPUlle. Toki, jos menevät chipletteihin, niin onko hyötyä, vai nostavatko vaan sitä chipletin päälle laitettavaa muistia määrältään isommaksi ja sitten varsinainen muisti olisi edelleen GDDR6 tasoista. Tuo ison välimuistin määrän hyöty on nyt nähty näissä RDNA2 korteissa jo.
Mikäs Vegan muisteissa innovatiivista oli? Fiji oli ensimmäinen AMD:n GPU HBM-muisteilla
 
Mikäs Vegan muisteissa innovatiivista oli? Fiji oli ensimmäinen AMD:n GPU HBM-muisteilla
Katos perkele, näin sitä unohtaa asioita. Tuo Fiji olikin se, joka oli todella lupaava, kuten olisi ollut Vegakin, jos se olisi saatu ulos vuotta aiemmin. Mutta täytyy sanoa, että Vegat on mielestäni ikääntyneet paremmin kuin nuo Fijit. Vegassa oli vasta riittävästi HBM muistia paremman pään kortiksi.
 
Katos perkele, näin sitä unohtaa asioita. Tuo Fiji olikin se, joka oli todella lupaava, kuten olisi ollut Vegakin, jos se olisi saatu ulos vuotta aiemmin. Mutta täytyy sanoa, että Vegat on mielestäni ikääntyneet paremmin kuin nuo Fijit. Vegassa oli vasta riittävästi HBM muistia paremman pään kortiksi.
390x on 8 gb muistilla, samoin kuin jotkut (harvat) 290x mallit.

tekniikan maailmassa vuosi on pitkä aika. mieti jos zen 3(ryzen 5000 sarja) olisi julkaistu vuotta aiemmin, tai zen 2 olisi julkaistu heinäkuussa 2018, tai alkuperäinen zen olisi julkaistu jo 2016, ja esitelty 2015 syksyllä.
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
264 445
Viestejä
4 585 021
Jäsenet
75 432
Uusin jäsen
Jiiaer

Hinta.fi

Back
Ylös Bottom