AMD Radeon Computexissa: Vega 56 Nano ja 7 nanometrin Vega työasemiin

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 377
amd-powercolor-radeon-rx-vega-56-nano-20180606.jpg



AMD piti viime yönä Suomen aikaa oman Computex-esityksensä. Esityksen antia voidaan pitää suurimmalti osin odotettuna, sillä esillä olivat 7nm valmistusprosessilla toteutettu uusi työasema-Vega sekä Vega 56 Nano.

Vega 56 Nano ei ole varsinaisesti uusi tuote, sillä sitä on esitelty jo muun muassa AMD:n 2. sukupolven Ryzen-julkaisutilaisuuksissa ympäri maailman. Nyt PowerColorin suunnittelema näytönohjain on kuitenkin julkaistu virallisesti ja se saapuu myyntiin välittömästi ainakin osassa maailmaa.



7 nanometrin prosessilla valmistettu Vega oli puolestaan ensimmäistä kertaa esillä. AMD ei ole vielä paljastanut grafiikkapiirin tarkkoja yksityiskohtia ja tässä vaiheessa siitä tiedetään vain käytetty arkkitehtuuri ja että siinä on yhteensä 32 gigatavua HBM2-muistia. AMD:n mukaan palvelimiin ja työasemiin optimoitu grafiikkapiiri tukee joitain uusia koneoppimiseen liittyviä käskyjä ja yhtiö on parhaillaan päivittämässä Radeon ProRender -säteenseurantaa hyödyntämään koneoppimista.



Suorituskyvystä ei saatu vielä kouriintuntuvia lukuja, mutta AMD:n mukaan 7 nanometrin prosessi tarjoaa nykyiseen verrattuna kaksinkertaisen transistoritiheyden, kaksinkertaisen energiatehokkuuden ja yli 1,35 kertaisen suorituskyvyn.

AMD kertoi lopuksi myös monitulkintaisesti lupaavansa tuoda 7 nanometrin myös pelipuolelle. Se oli ajoitettu sopivasti 7 nanometrin Vegan julkaisuaikataulun yhteyteen, mutta saattoi yhtä hyvin viitata esimerkiksi Naviin ja 7 nanometrin Ryzeneihin. Siitä riippumatta, 7 nanometrin Vega julkaistaan vuoden jälkimmäisen puoliskon aikana Radeon Instinct -tuoteperheeseen. AMD:n näytönohjainten roadmap lupaa edelleen Navin ja toistaiseksi nimeämättömän sitä seuraavan sukupolven julkaisujen tapahtuvan vuoden 2020 loppuun mennessä. Navi tullaan valmistamaan 7 nanometrin valmistusprosessilla ja sitä seuraava sukupolvi parannetulla 7 nanometrin prosessilla.

Lähde: AnandTech, 7nm Vega kuva: UFD Tech

Linkki alkuperäiseen uutiseen (io-tech.fi)
 
Odotan vain että jompi kumpi valmistaja keksisi miten saada tehtyä useammasta piiristä 1 virtuaalinen gpu joka toimisi korkealla virkistystaajuudella ja ilman järkyttävää frametimeseilaamista. Tuolla saisi taas piirien hintoja alaspäin kun ei tarvitsisi tehdä "postikortin kokoista" sirua joissa saanto on joku 1/10 jos edes sitäkään.
 
Odotan vain että jompi kumpi valmistaja keksisi miten saada tehtyä useammasta piiristä 1 virtuaalinen gpu joka toimisi korkealla virkistystaajuudella ja ilman järkyttävää frametimeseilaamista. Tuolla saisi taas piirien hintoja alaspäin kun ei tarvitsisi tehdä "postikortin kokoista" sirua joissa saanto on joku 1/10 jos edes sitäkään.
Nvidian grid on mittaustarkkuuden rajoissa tuollainen.
 
Nvidian grid on mittaustarkkuuden rajoissa tuollainen.
Pikatarkistuksella gridissä luodaan yhteen gpuhun useampi vGPU jolloin yksi tehokas näyttis voi palvella max kahdeksaa käyttäjää.
Itse haluaisin järjestelmän missä esimerkiksi 4 gpu:ta jaetulla muistilla jotka kykenee piirtämään yksinään 30fps toimisivat yhdessä 120fps nopeudella joko jakamalla ruudun mosaikkiin ja piirtämällä oman nurkan tai sitten vuorottelemalla framejen piirrossa. Mosaikki ei voi olla raaka 1/4 ruutu kaikille koska jos kahelle gpu:lle tulee pelkkää taivasta ja yksi lokki ja kahelle muulle taas maata missä tapahtuu normandian maihinnousun verran asiaa niin jako ei ole tasainen. Pelkästään tuon alueen skaalaaminen on vaikea tehtävä. siksi peräkkäiset framet olisi todennäköisempi jako. En vaan tiedä miten hyvin toimii jos 4 prosessoria tappelee samasta muistista.
 
Pikatarkistuksella gridissä luodaan yhteen gpuhun useampi vGPU jolloin yksi tehokas näyttis voi palvella max kahdeksaa käyttäjää.
Itse haluaisin järjestelmän missä esimerkiksi 4 gpu:ta jaetulla muistilla jotka kykenee piirtämään yksinään 30fps toimisivat yhdessä 120fps nopeudella joko jakamalla ruudun mosaikkiin ja piirtämällä oman nurkan tai sitten vuorottelemalla framejen piirrossa. Mosaikki ei voi olla raaka 1/4 ruutu kaikille koska jos kahelle gpu:lle tulee pelkkää taivasta ja yksi lokki ja kahelle muulle taas maata missä tapahtuu normandian maihinnousun verran asiaa niin jako ei ole tasainen. Pelkästään tuon alueen skaalaaminen on vaikea tehtävä. siksi peräkkäiset framet olisi todennäköisempi jako. En vaan tiedä miten hyvin toimii jos 4 prosessoria tappelee samasta muistista.

Tuohan kuulosta about siltä miten SLI ja crossfire toimii, mitä muistelen jostain mikrobitistä joskus lukeneeni.
 
Tuohan kuulosta about siltä miten SLI ja crossfire toimii, mitä muistelen jostain mikrobitistä joskus lukeneeni.
Ei toimi noin. SLI ja Multi-GPU (eli ex-Crossfire) toimivat sovelluksesta riippuen AFR-tilassa (yleisin) tai jossain SFR-tiloista.
AFR eli Alternative Frame Rendering -tilassa yksi näyttis renederöi parilliset framet, toinen parittomat (tai jos useampi kuin 2 näyttistä niin järjestyksessä esim eka renderöi ekan, toka tokan jne kunnes alkaa sykli alusta.)
SFR eli Single tai Split Frame Rendering -tilassa näyttikset renderöi samanaikaisesti samaa ruutua jaettuna osiin eri tavoin (esim Civeissä ainakin DX12 tilassa ihan 50/50 jaettu ruutu kahdelle näyttikselle)
Joskus muinoin AMDllä/ATIlla oli scrissor-mode jossa ruutu jaettiin pieniin palasiin mutta se katosi muistaakseni nopeasti
 
Odotan vain että jompi kumpi valmistaja keksisi miten saada tehtyä useammasta piiristä 1 virtuaalinen gpu joka toimisi korkealla virkistystaajuudella ja ilman järkyttävää frametimeseilaamista. Tuolla saisi taas piirien hintoja alaspäin kun ei tarvitsisi tehdä "postikortin kokoista" sirua joissa saanto on joku 1/10 jos edes sitäkään.

Ongelmana on kaista piirien välillä.

Kahden piirin systeemi on muistin suhteen NUMA, toiseen piiriin kytketyn muistin käyttö on paljon hitaampaa (usein liian hidasta).

Tämän johdosta esim. nykyisillä väyläratkaisuilla tekstuurit pitää tallettaa molempien piirien muistiin(haaskaten muistia). Mutta sitten ongelma tulee siitä, jos esim renderöidään tekstuuriin.

Jotta monen piilastun systeemi saadaan toimimaan hyvin ja "saumattomasti", niitä yhdistävän väylän pitää olla todella nopea.
 
Tuohan kuulosta about siltä miten SLI ja crossfire toimii, mitä muistelen jostain mikrobitistä joskus lukeneeni.
Muistin käyttö on tuossa suurin ero. SLI ja Xfire on 4x4GB vram -> 4GB vram. Tuo mitä ite tarkoitin ja ainakin AMD yrittää saada toimivaksi eli zen tapainen ratkaisu näyttiksille tekis 4x4GB vram -> 16GB vram
 
Muistin käyttö on tuossa suurin ero. SLI ja Xfire on 4x4GB vram -> 4GB vram. Tuo mitä ite tarkoitin ja ainakin AMD yrittää saada toimivaksi eli zen tapainen ratkaisu näyttiksille tekis 4x4GB vram -> 16GB vram
Ainakin DX12 ja muistaakseni myös Vulkan mahdollistavat jaetun muistia varmuuden usean GPUn kesken. Se ei toki poista hitautta käpelöidä toisen muistia, mutta jos devit haluavat nähdä oikeasti vaivaa homman toteuttamiseen tuonkin hyödyntäminen on mahdollista
 
Olikohan se HD6990 jonka yhteydessä AMD käytti mainoslausetta että 8GB on 8GB.

Ei tarvita paljon mielikuvitusta että yhdistää

https://docs.nvidia.com/grid/latest/pdf/grid-vgpu-user-guide.pdf

ja käyttääkin laskenta-alustana jotakin tämän kaltaista:

NVIDIA DGX Station

Vaikkakin kyse on on koneoppimisalustasta, niin eiköhän samalla idealla ole mahdollista toteuttaa kaipailtu klusteri GPU, jonka päälle sitten voi läjätä vGPU instansseja. Koko ei ole ihan sitä mitä varmaan haluttiin, mutta tietokoneetkin tarvitsivat aluksi aika paljon enempi tilaa kuin mitä nykyisin.
 
Olikohan se HD6990 jonka yhteydessä AMD käytti mainoslausetta että 8GB on 8GB.

Ei tarvita paljon mielikuvitusta että yhdistää

https://docs.nvidia.com/grid/latest/pdf/grid-vgpu-user-guide.pdf

ja käyttääkin laskenta-alustana jotakin tämän kaltaista:

NVIDIA DGX Station

Vaikkakin kyse on on koneoppimisalustasta, niin eiköhän samalla idealla ole mahdollista toteuttaa kaipailtu klusteri GPU, jonka päälle sitten voi läjätä vGPU instansseja. Koko ei ole ihan sitä mitä varmaan haluttiin, mutta tietokoneetkin tarvitsivat aluksi aika paljon enempi tilaa kuin mitä nykyisin.
Sitähän ei tiedetä millään tasolla miten hyvin nuo dgx:t suoriutuu siitä pelien renderöinnistä tasaisilla frametimeillä
 
AMD Announces 32-core Threadripper 2, Shows 7nm EPYC CPU

Tom’s Hardwaren artikkelin loppua lainaten:

Lisa Su also displayed a 7nm EPYC processor, which is coming to market this year, and the world's first 7nm Radeon Instinct Vega GPU with 32GB of HBM2, but those leading models are destined for the data center. AMD says that 7nm gaming GPUs will follow early next year.

Tuo lupailee mukavasti ”aikaisin” ensi vuodelle uutta pelikorttirintamalle. Toteutumista saa toivoa.:nb:
 
Nvidian grid on mittaustarkkuuden rajoissa tuollainen.
Pikatarkistuksella gridissä luodaan yhteen gpuhun useampi vGPU jolloin yksi tehokas näyttis voi palvella max kahdeksaa käyttäjää.
Itse haluaisin järjestelmän missä esimerkiksi 4 gpu:ta jaetulla muistilla jotka kykenee piirtämään yksinään 30fps toimisivat yhdessä 120fps nopeudella joko jakamalla ruudun mosaikkiin ja piirtämällä oman nurkan tai sitten vuorottelemalla framejen piirrossa. Mosaikki ei voi olla raaka 1/4 ruutu kaikille koska jos kahelle gpu:lle tulee pelkkää taivasta ja yksi lokki ja kahelle muulle taas maata missä tapahtuu normandian maihinnousun verran asiaa niin jako ei ole tasainen. Pelkästään tuon alueen skaalaaminen on vaikea tehtävä. siksi peräkkäiset framet olisi todennäköisempi jako. En vaan tiedä miten hyvin toimii jos 4 prosessoria tappelee samasta muistista.
Neljä framebufferia on liikaa. Vaikka tuo toimisikin 120fps, niin lagi olisi sama kuin 30fps pelattaessa. Tuohan perustuu siihen, että yksi näytönohjain voisi käsitellä yhtä kuvaa 4 framen ajan.
 
Neljä framebufferia on liikaa. Vaikka tuo toimisikin 120fps, niin lagi olisi sama kuin 30fps pelattaessa. Tuohan perustuu siihen, että yksi näytönohjain voisi käsitellä yhtä kuvaa 4 framen ajan.
Njoo, olet oikeassa. Eli mosaiikki on parempi.
 
AMD Announces 32-core Threadripper 2, Shows 7nm EPYC CPU

Tom’s Hardwaren artikkelin loppua lainaten:

Tuo lupailee mukavasti ”aikaisin” ensi vuodelle uutta pelikorttirintamalle. Toteutumista saa toivoa.:nb:

Hmm, aika eri tulkinnat Anandilla ja Tompalla, pitää koittaa jos jossain kuuluisi selvästi mitä sanotaan kuhan iltavuorosta pääsee kotio

Kuuntelin tuosta uutisessakin linkatusta videosta eikä kyllä puhunut mitään "early next yearista", IMO.
"To all you gamers out there, we are definitely bringing 7 nanometer GPUs to gaming aswell, so stay tuned for that" tuosta tulkkasin, noin 1h24min5sec kohilta
 
Tuo kuva jäi itsellekin. Lähinnä siellä näytettiin diaa jossa 7nm laskenta tulisi vuoden loppuun, sen jälkeen Navi, eli peliohjain ja 2020 mennessä 7nm+ päivitys joten isohko väli sinne jää. Eri asia on, että onko joku saanut haastattelusta enemmän irti aikatauluista. Mutta ihan hyvä arvaus on, että jos laskentapiirejä tulee myyntiin jo tämän vuoden toisella puoliskolla, niin 7nm pelinäyttistä voisi saada jo ennen 2019 kesää... mutta riippuu tietysti saannoista. Laskentakorttia voi myydä 4000-10000 hintahaarukkaan tai vieläkin kalliimmalla ja jos 80% piireistä on susia, niin se saattaa kannattaa.
Jotta pelikortteja voisi myydä 700-900 hintahaarukkaan, niin santojen pitää olla jo monta kertaluokkaa parempia. Ja jos myytävä pelikortti pohjautuu Vegaan, niin pitäisi saad HMA muistia aika edellisesti joten 1200 egen jostain pelivegasta kuulostaa kohtuulliselta jos jo aikaisin keväällä sellainen variantti. Luultavasti tuo hinta ja myöhäinen kevät jos hyvin käy.
Mutta jos Navi on valmis jo keväällä niin sitten kaikki on kiinni siitä montako ehjää piiriä saadaan ulos 7nm tekniikalla piikiekoista. Navissa lienee gddr6 jos yhtään pitää arvata. Ainakin jos Nvidian kanssa aikovat kilpailla ja piirin pitää olla Vegaa pienempi hinnan takia.
Mutta itse tuon esityksen perusteella ei siis voi vetää mitään määritelmiä koska peli gpu tulee. Joko jollain on ollut privahaastattelu, tai vain arkailevat sen perusteella että laskentakortti on etuajassa tuon esityksen perusteella. Alunperin laskentakortin piti tulla myyntiin aikaisin ensi keväällä, nyt puhuivat että myyntiin jo tänä vuonna toisella puoliskolla. Eli 1-2 kvartaalia etuajassa.
 
Saako tuota Vega Nanoa vielä mistään Suomeen? Saksasta löytyy, mutta vain kaupoista jotka eivät tahdo suomalaisia asiakkaita.

Edit: No nyt ei näy enää edes Saksassa.
 
Viimeksi muokattu:
Saako tuota Vega Nanoa vielä mistään Suomeen? Saksasta löytyy, mutta vain kaupoista jotka eivät tahdo suomalaisia asiakkaita.

Eipä ole tullut vastaan, hyvän hintanen saksassa tuo 449€.

Tuo 7nm vegan gpun sirun koko on kyllä sen verta pieni että luulisi olevan suhteellisen helppo massavalmistukselle. Eli en pitäisi yhtään epätodennäköisenä sitä etteikö tuo löytäisi peliohjaimiinkin itseään. Esim. kahdella hbm2:lla 8/16GB muistilla nopeammilla kuin nykyisissä rx vegoissa ja corekin korkeammilla kelloilla kiitos uuden prosessin.

Toinen mikä tulee vähän mieleen että oisko tuossa sittenkään täys fp64:nen vaiko vain suora vega10 die shrinkki CU:den osalta. Varsinkin kun tilaa vie 2 lisättyä hbm2 muistiohjainta ja AI/DL/ML rautaa, jos tuossa nyt mitään ylimääräistä DL rautaa mukana edes on(Voi toki olla että mainostavat vain normi fp16/int8 laskentatehoaan AI rautana).
 
Eipä ole tullut vastaan, hyvän hintanen saksassa tuo 449€.

Tuo 7nm vegan gpun sirun koko on kyllä sen verta pieni että luulisi olevan suhteellisen helppo massavalmistukselle. Eli en pitäisi yhtään epätodennäköisenä sitä etteikö tuo löytäisi peliohjaimiinkin itseään. Esim. kahdella hbm2:lla 8/16GB muistilla nopeammilla kuin nykyisissä rx vegoissa ja corekin korkeammilla kelloilla kiitos uuden prosessin.

Toinen mikä tulee vähän mieleen että oisko tuossa sittenkään täys fp64:nen vaiko vain suora vega10 die shrinkki CU:den osalta. Varsinkin kun tilaa vie 2 lisättyä hbm2 muistiohjainta ja AI/DL/ML rautaa, jos tuossa nyt mitään ylimääräistä DL rautaa mukana edes on(Voi toki olla että mainostavat vain normi fp16/int8 laskentatehoaan AI rautana).
On too isompi kuin suoran shrinkin pitäisi, jossain 350mm2 tienoilla, eli aika todennäköisesti on 1/2 FP64
 
On too isompi kuin suoran shrinkin pitäisi, jossain 350mm2 tienoilla, eli aika todennäköisesti on 1/2 FP64

Ei tuo kyllä ihan 350mm² ole, itse laskeskelin jonku 14,5mm*23mm = 333mm². Toisaalta noin laskettuna Vega 10 olisi yli 500mm².
upload_2018-6-7_18-41-7.png
 
Ei tuo kyllä ihan 350mm² ole, itse laskeskelin jonku 14,5mm*23mm = 333mm². Toisaalta noin laskettuna Vega 10 olisi yli 500mm².
upload_2018-6-7_18-41-7.png
Vega 10 on kuitenkin 484mm². Tuo ~350 oli useamman mielipide parin eri kuvan perusteella, voihan se toki heittää enemmänkin mutta sen näkee sitten joskus
 

Statistiikka

Viestiketjuista
257 000
Viestejä
4 465 826
Jäsenet
73 879
Uusin jäsen
Torvelo

Hinta.fi

Back
Ylös Bottom