AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Liittynyt
21.02.2017
Viestejä
3 598
Yllättävää ettei tue variable rate shadinigiä. Ehkäpä konsoleihin kuitenkin ehtii, etenkin niissä luulisi tuosta olevan iloa kun resoluutioskaalaukset on siinä ympäristössä kovassa käytössä.
 
Liittynyt
16.10.2016
Viestejä
8 594
Toivotaan tosiaan että NVIDIA vastaisi tähän julkaisuun, joko uusilla korteilla (refresh päivitys samaan hintaan), tai alemmilla hinnoilla.

Niille jotka odottivat vielä nopeampaa ja halvempaa:
Ei mikään pörssiyhtiö lähde julkaisemaan reippaasti halvempaa ja nopeampaa kuin ainoa kilpailija.

Tuo 1-20% nopeampi, n. 10% alempaan hintaan on jo aika iso "ale", ja tulee varmasti ajamaan myyntiä, varsinkin kun Zen 2 prossut ja uudet GPUt tulevat myyntiin samana päiväna. Ja kun Intelillä on edelleen toimitusvaikeuksia, voi jonkinlaista Ryzen 5 + 5700 Navi comboa olla hyvinkin odotettavissa mid/high-end pelikone paketeissa.

AMDhan on jo aika lailla ilmoittanut/antanut ymmärtää emolevy valmistajien kautta ettei heitä kiinnosta olla se halvempi budjetti vaihtoehto tällä hetkellä, onhan heillä nyt CPU rintamalla vastaavat tai paremmat tuotteet kuin Intelillä, ja nyt saatiin sitten NAVI numeroita ulos ja sijoittuu kilpailemaan erittäin hyvin RTX 2060 ja RTX 2070 kanssa.
Halpuus ja nopeustilanteen näkee sitten, kun tuo on markkinoilla ja kaupasta saatavilla. Sitä ennen suhteellisilla hinnoilla ym ei ole mitään merkitystä.
 
Liittynyt
16.01.2019
Viestejä
80
Tuo Antilag ominaisuus oli mielenkiintoinen, voi tuoda pienen edun esports peleissä
Jos nuo viive-erot on noin suuret isoillakin ruudunpäivitysnopeuksilla (demossa oli 60fps) niin toi etu on valtava fps peleissä. Olisi kiva tietää vähän tarkemmin että mitä tuo ominaisuus tekee.
 
Liittynyt
10.07.2017
Viestejä
1 428
Niin ja ei ole noiden sliedien mukaan 10% alempi hinta. Noi dollarihinnat on aina menny suoraa euroiksi. Hintaero on 10€, eli ~3%. Sitten vielä täys mysteeri miten board partnerit hinnottelee omat tuotteensa, koska tota blower kikkaretta iha turha ostaa.

Power limitti myös mielenkiintonen. 180W board power. Saakohan tohon apuja sitten korttipartnereilta. Esimerkkinä RTX2060 vakio tais olla 190, mutta valmistajien korteissa jopa 225W
 
Viimeksi muokattu:

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
18 295
Niin ja ei ole noiden sliedien mukaan 10% alempi hinta. Noi dollarihinnat on aina menny suoraa euroiksi. Hintaero on 10€, eli ~3%. Sitten vielä täys mysteeri miten board partnerit hinnottelee omat tuotteensa, koska tota blower kikkaretta iha turha ostaa.
Olet siis päässyt jo testailemaan tuota blower-jäähyä? Ei se blower-malli automaattisesti tarkoita hyvää tai huonoa
 
Liittynyt
10.07.2017
Viestejä
1 428
No tilastollisesti mutuilen ja veikkaan että on. Koska tähän mennessä ykskään blower historiassa ei oo voittanu esim kahen tuulettimen malleja. Olettaen nyt et jossain kenkälaatikkoa isommas kotelossa edes parilla kotelotuulettimella.
 
Liittynyt
06.09.2017
Viestejä
601
Meh,

Ei taida olla vielä tarvetta vaihtaa GTX 1080 mihinkään.
Tuo 5700 xt 50th anniversary editionia voisi ehkä harkita kun näkee mikä hinta Suomeen asettuu ja mihin tuo oikeasti pystyy.
Paperilla vaikuttaa ainakin ihan pätevältä 4K:n pyörittäjältä.
 

Teuras

BANNATTU
BANNED
Liittynyt
28.10.2016
Viestejä
225
Meh,

Ei taida olla vielä tarvetta vaihtaa GTX 1080 mihinkään.
Tuo 5700 xt 50th anniversary editionia voisi ehkä harkita kun näkee mikä hinta Suomeen asettuu ja mihin tuo oikeasti pystyy.
Paperilla vaikuttaa ainakin ihan pätevältä 4K:n pyörittäjältä.
Korttia, jos AMD:n markkinointi diossa mainostetaan 2k korttina niin jättäisin hyllyyn.
 
Liittynyt
19.10.2016
Viestejä
2 823
Meh,

Ei taida olla vielä tarvetta vaihtaa GTX 1080 mihinkään.
Tuo 5700 xt 50th anniversary editionia voisi ehkä harkita kun näkee mikä hinta Suomeen asettuu ja mihin tuo oikeasti pystyy.
Paperilla vaikuttaa ainakin ihan pätevältä 4K:n pyörittäjältä.
Joo eipä vielä 2080tikään kaikkia pelejä jaksa 4k ettei asetuksia tarvitse karsia....
 
Liittynyt
22.10.2016
Viestejä
9 102
Video, jossa selitetään aika paljon Navin arkkitehtuuria

https://www.youtube.com/watch?v=V7wwDnp8p6Y

Arkkitehtuuri eroaa oikeasti huomattavasti GCNstä, ei todellakaan ole mikään GCNn viilaus kuten Vega oli.


Oleellisia pointteja arkkitehtuurista:

* GCN:ssä kaikki laskuoperaatiot voitiin aloittaa vain neljän kellojakson välein, ja niillä oli neljän kellojakson viive. Välissä laskettiin joko vektorioperaatioiden muita linjoja, tai muiden wavefronttien skalaarikäskyjä. Koskaan ei liukuhihna stallannut datariippuvuuksien takia.
Navissa ei tälläista interleavausta ole, vaan käskyn suoritus voidaan aloittaa millä kellojaksolla tahansa. Jos käskyllä on datariippuvuuksia vielä kesken olevasta käskystä, liukuhihna stallataan. Kääntäjä toki yrittää sijoittaa peräkkäin käskyjä, joiden välillä ei ole datariippuvuuksia.

* 64-kokoisten wavefronttien lisäksi tuetaan myös 32-leveitä. Kumpia tahansa voidaan käyttää, 64lle on kaksi syytä, yhteensopivuus vanhan 64-leveitä vektoreita sisältävän koodin kanssa, sekä sillä saadaan parempi utilisaatio, jos työtä on paljon ja haarautumisia vähän. 32 taas mahdollistaa nopeamman suorituksen tilanteessa, jossa työtä laskettavaksi on vähän, tai koodissa on hyvin paljon haarautumisia. (64 usein parempi throughputille, 32 viiveelle).
64-leveässä moodissa ekalla kellojaksolla lasketan linjat 0-31, seuraavalla kellojaksolla linjat 32-63, sama periaate kuin GCNssä mutta jako kahteen eikä neljään.

* SIMD-yksiköt on nyt 16 linjan sijasta 32 linjaa leveitä, eli 32-kokoinen wavefront menee yhdessä kellojaksossa. Useimmilla operaatiolla on tosin viiden kellojakson viive, eli 32-leveässä moodissa voi joskus tulla datariippuvuuksien takia neljäkin stallia käskyjen väliin, ja 64-leveässä moodissa kolme stallia, jos heti seuraava käsky haluaa tätä juuri laskettua dataa käyttää.

* Tämä rakenne mahdollistaa sen, että piirin hyvään utilisaatioon tarvitaan paljon pienempi määrä work-itemeita kuin CGN vaati. GCN vaati käytännössä vähintään linjamäärä * 4 verran (eli esim. RX590llä 2304*4 = 9216 work itemia hyvään utilisaatioon(silloin kun mitään muistinkäytöstä johtavia stalleja ei tule), RDNAlla riittää 32-leveillä wavefronteilla suoraan piirin linjamäärä eli esim. tuolla ekalla piirillä 2560 kpl, eli siis käytännössä 4x pienempi linjamäärä, ja 64-leveillä wavefronteilla tuplasti piirin linjamäärä, eli ekalla piirillä 5120kpl.

Se, että piirin saa työllistettyä hyvin pienemmällä work item-määrällä ei kuitenkaan hyödytä vain silloin, kun työstä on pulaa, vaan se auttaa myös siihen, että kun kerrallaan aktiivisia work-itemeja on vähemmän(ja ne suoriutuvat nopeammin), välimuisteissa on pienemmän määrän säikeitä dataa kilpailemassa välimuistien kapasiteetista, välimuisteille saadaan parempi osumatarkkuus ja muistiaccesseja ulomman tason välimuisteihin tai ulkoiseen DRAMiin voi tulla vähemmän.

* Välimuistiin on tuotu yksi taso väliin

* Piirin pitäisi samalla jännitteellä kellottua korkeammalle kuin Vegan. Tuo 5 kellojakson viive useimmille operaatioille GCNn neljän sijaan tukisi sitä, että tämä ei ole vain propagandaa.


Tässä on sitten vähän omaa tulkintaa:

* Tuo NAVIN käsite "compute unit" tuntuu nyt olevan ihan höttöä, joka pidetään olemassa vain sen takia, että se on sellainen määrä laskentakapasiteettia, joka vastaa yhtä GCN:n CU:ta. Tekee vertailun GCNään helpommaksi.

Piirin arkkitehtuuri perustuu oikeasti "dual compute unit"eihin, jotka on ne oikeat ytimet, ja nämä ovat tuplasti isompia. Yhdessä DCU:ssa on L1-välimuisti, ja neljä clusteria joista jokaisessa on skalaariyksikkö ja 32-leveä SIMD-yksikkö. Ja täysin keinotekoisesti kahta tällaista clusteria, puolikasta DCUta kutsutaan CU:ksi.

Yhden DCU:n rakenne näkyy kohdassa 4:46,
yhden clusterin rakenne näkyy kohdassa 5:30


Lisää omaa tulkintaa, kohdassa 6:54 olevasta slidestä:

Tuossa tuo GCN laskee tuon koodin 16 kellojaksossa, mutta käsittääkseni se laskisi efektiivisesti samassa ajassa yhdellä CUlla sen koodin käytännössä neljään kertaan, neljälle eri wavefrontille. Kellojaksolla 1 voisi alkaa toinen wavefront, kellojaksolla 2 kolmas, kellojaksolla 3 neljäs, ja kun näitä suoritetaan monta peräkkäin, aina 16 kellojakson sisällä voi alkaa ja valmistua 4 wavefronttia.

Navi taas käytännössä pystyy yhdessä CUssa laskemaan tuota tuossa esitetystä koodista kahta wavefrontia rinnakkain,

Eli GCN laskee tuota esimerkkikoodia käsittääkseni 256 WI / 16 kellojaksoa = 16 WI/kellojakso,
WARP32-NAVI 64 WI / 8 kellojakso = 8 WI/kellojakso, WARP-64-NAVI 128WI/9 kellojaksoa = 14.22 WI/kellojakso, eli käsittääkseni tällä koodilla GCNllä olisi kuitenkin paras throughput, mikäli se saadaan työllistettyä hyvin

Joten Navi on radikaalisti nopeampi kuin GCN vain silloin kun GCNää ei saisi työllistettyä kunnolla, tai koodissa on paljon skaari-kokonaisluku-operaatioita joita GCN ei suostu laskemaan kuin neljän kellojakson välein mutta navi vaikka joka kellojakso. Ja jos WAVE64-moodi saadaan työllistettyä kunnolla, ja koodissa on paljon datariippuviiksia, tuo uusi WAVE32-moodi voi käydä selvästi hitaammaksi kuin WAVE64-moodi.



Sitten pointteja tuosta ekasta piiristä:

* Tuo ensimmäinen navi-piiri on pinta-alataan 251mm (vertailun vuoksi: samalla valmistustekniikalla valmistettu vega 20("radeon vii") oli 331mm^2

* ROPien määrä on 64. Eli sama kuin vegassa, tuplasti enemmän kuin RX580ssä.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
16 250
Video, jossa selitetään aika paljon Navin arkkitehtuuria

https://www.youtube.com/watch?v=V7wwDnp8p6Y

Arkkitehtuuri eroaa oikeasti huomattavasti GCNstä, ei todellakaan ole mikään GCNn viilaus kuten Vega oli.


Oleellisia pointteja arkkitehtuurista:

* GCN:ssä kaikki laskuoperaatiot voitiin aloittaa vain neljän kellojakson välein, ja niillä oli neljän kellojakson viive. Välissä laskettiin joko vektorioperaatioiden muita linjoja, tai muiden wavefronttien skalaarikäskyjä. Koskaan ei liukuhihna stallannut datariippuvuuksien takia.
Navissa ei tälläista interleavausta ole, vaan käskyn suoritus voidaan aloittaa millä kellojaksolla tahansa. Jos käskyllä on datariippuvuuksia vielä kesken olevasta käskystä, liukuhihna stallataan. Kääntäjä toki yrittää sijoittaa peräkkäin käskyjä, joiden välillä ei ole datariippuvuuksia.

* 64-kokoisten wavefronttien lisäksi tuetaan myös 32-leveitä. Kumpia tahansa voidaan käyttää, 64lle on kaksi syytä, yhteensopivuus vanhan 64-leveitä vektoreita sisältävän koodin kanssa, sekä sillä saadaan parempi utilisaatio, jos työtä on paljon ja haarautumisia vähän. 32 taas mahdollistaa nopeamman suorituksen tilanteessa, jossa työtä laskettavaksi on vähän, tai koodissa on hyvin paljon haarautumisia. (64 usein parempi throughputille, 32 viiveelle).
64-leveässä moodissa ekalla kellojaksolla lasketan linjat 0-31, seuraavalla kellojaksolla linjat 32-63, sama periaate kuin GCNssä mutta jako kahteen eikä neljään.

* SIMD-yksiköt on nyt 16 linjan sijasta 32 linjaa leveitä, eli 32-kokoinen wavefront menee yhdessä kellojaksossa. Useimmilla operaatiolla on tosin viiden kellojakson viive, eli 32-leveässä moodissa voi joskus tulla datariippuvuuksien takia neljäkin stallia käskyjen väliin, ja 64-leveässä moodissa kolme stallia, jos heti seuraava käsky haluaa tätä juuri laskettua dataa käyttää.

* Tämä rakenne mahdollistaa sen, että piirin hyvään utilisaatioon tarvitaan paljon pienempi määrä work-itemeita kuin CGN vaati. GCN vaati käytännössä vähintään linjamäärä * 4 verran (eli esim. RX590llä 2304*4 = 9216 work itemia hyvään utilisaatioon(silloin kun mitään muistinkäytöstä johtavia stalleja ei tule), RDNAlla riittää 32-leveillä wavefronteilla suoraan piirin linjamäärä eli esim. tuolla ekalla piirillä 2560 kpl, eli siis käytännössä 4x pienempi linjamäärä, ja 64-leveullä wavefronteilla tuplasti piirin linjamäärä, eli ekalla piirillä 5120kpl.

Se, että piirin saa työllistettyä hyvin pienemmällä work item-määrällä ei kuitenkaan hyödytä vain silloin, kun työstä on pulaa, vaan se auttaa myös siihen, että kun kerrallaan aktiivisia work-itemeja on vähemmän(ja ne suoriutuvat nopeammin), välimuisteissa on pienemmän määrän säikeitä dataa kilpailemassa välimuistien kapasiteetista, välimuisteille saadaan parempi osumatarkkuus ja muistiaccesseja ulomman tason välimuisteihin tai ulkoiseen DRAMiin voi tulla vähemmän.

* Välimuistiin on tuotu yksi taso väliin

* Piirin pitäisi samalla jännitteellä kellottua korkeammalle kuin Vegan. Tuo 5 kellojakson viive useimmille operaatioille GCNn neljän sijaan tukisi sitä, että tämä ei ole vain propagandaa.


Tässä on sitten vähän omaa tulkintaa:

* Tuo NAVIN käsite "compute unit" tuntuu nyt olevan ihan höttöä, joka pidetään olemassa vain sen takia, että se on sellainen määrä laskentakapasiteettia, joka vastaa yhtä GCN:n CU:ta. Tekee vertailun GCNään helpommaksi.

Piirin arkkitehtuuri perustuu oikeasti "dual compute unit"eihin, jotka on ne oikeat ytimet, ja nämä ovat tuplasti isompia. Yhdessä DCU:ssa on L1-välimuisti, ja neljä clusteria joista jokaisessa on skalaariyksikkö ja 32-leveä SIMD-yksikkö. Ja täysin keinotekoisesti kahta tällaista clusteria, puolikasta DCUta kutsutaan CU:ksi.

Yhden DCU:n rakenne näkyy kohdassa 4:46,
yhden clusterin rakenne näkyy kohdassa 5:30


Lisää omaa tulkintaa, kohdassa 6:54 olevasta slidestä:

Tuossa tuo GCN laskee tuon koodin 16 kellojaksossa, mutta käsittääkseni se laskisi efektiivisesti samassa ajassa yhdellä CUlla sen koodin käytännössä neljään kertaan, neljälle eri wavefrontille. Kellojaksolla 1 voisi alkaa toinen wavefront, kellojaksolla 2 kolmas, kellojaksolla 3 neljäs, ja kun näitä suoritetaan monta peräkkäin, aina 16 kellojaksin sisällä voi alkaa ja valmistua 4 wavefronttia.

Navi taas käytännössä pystyy yhdessä CUssa laskemaan tuota tuossa esitetystä koodista kahta wavefrontia rinnakkain,

Eli GCN laskee tuota esimerkkikoodia käsittääkseni 256 WI / 16 kellojaksoa = 16 WI/kellojakso,
WARP32-NAVI 64 WI / 8 kellojakso = 8 WI/kellojakso, WARP-64-NAVI 128WI/9 kellojaksoa = 14.22 WI/kellojakso, eli käsittääkseni tällä koodilla GCNllä olisi kuitenkin paras throughput, mikäli se saadaan työllistettyä hyvin

Joten Navi on radikaalisti nopeampi kuin GCN vain silloin kun GCNää ei saisi työllistettyä kunnolla, tai koodissa on paljon skaari-kokonaisluku-operaatioita joita GCN ei suostu laskemaan kuin neljän kellojakson välein mutta navi vaikka joka kellojakso. Ja jos WAVE64-moodi saadaan työllistettyä kunnolla, ja koodissa on paljon datariippuviiksia, tuo uusi WAVE32-moodi voi käydä selvästi hitaammaksi kuin WAVE64-moodi.



Sitten pointteja tuosta ekasta piiristä:

* Tuo ensimmäinen navi-piiri on pinta-alataan 251mm (vertailun vuoksi: samalla valmistustekniikalla valmistettu vega 20("radeon vii") oli 331mm^2

* ROPien määrä on 64. Eli sama kuin vegassa, tuplasti enemmän kuin RX580ssä.




.
Jaksatko lyhyesti selittää, mikä on wavefront? Niitä ei Patterson-Hennessyssä ollut..
 

IcePen

Typo Generaatroti ;-)
Liittynyt
17.10.2016
Viestejä
5 755
Pelikäytössähän GCN:ät on jääneet paljon kauemmaksi teoreetisesta kapasiteetistaaan (keskimäärin) kuin Nvidian tuotteet ja tämä Rdna/Navi arkkitehtuuri näytää olevan suunnattu nimenomaan kuromaan tämä ero umpeen niin että se teoreetinen teho muuttuu pelikäytössä käytännön tehoksi.

hkultala voisito vielä kommentoida Rdna vs Truring ja mikä on muutunut vs GCN vs Turing.


Jännää kun Koduri oli kovasti Vegan puolalla vs Navi ja nyt se puhuu kovasti kehittävänsä pelinäytönohjanta Intelilä taitaapi olla Kodurin tosiassa kumminkin pääasissa laskenta korttien perässä eikä pelikortien perässä tämä selittäisi myös sen miksi AMD ei ole hädissää Kodurin lähdöstä.
 
Liittynyt
22.10.2016
Viestejä
9 102
Jaksatko lyhyesti selittää, mikä on wavefront? Niitä ei Patterson-Hennessyssä ollut..
nVidia käyttää termiä "warp", melkein sama kuin OpenCLn "work group". (tosin ajurit voi myös splitata OpenCL-work groupin moneen wavefronttiin)

Eli siis joukko work-itemeita(esim. pikseleitä) jotka on niputettu yhteen siten että ne lasketaan kerralla, samassa rautasäikeessä, eri SIMD/SIMT-linjoilla.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 860


Tuossa yksi toinen höpinävideo jossa puhutaan siitä kuinka AMD on ilmeisesti loppumetreillä tehnyt aika radikaalin muutoksen mitä tulee itse RX tuoteperheeseen.
 
Liittynyt
22.10.2016
Viestejä
9 102


Tuossa yksi toinen höpinävideo jossa puhutaan siitä kuinka AMD on ilmeisesti loppumetreillä tehnyt aika radikaalin muutoksen mitä tulee itse RX tuoteperheeseen.
En usko tuota tuon jätkän spekulaatiota. Tuo piiri on 251mm^2, tuo on isompi kuin Polaris 10 (232mm^2).

Ja "7nm" on fundamentaalisesti kalliimpi(*) valmistustekniikka kuin "14nm" on, johtuen monikertaisista valotuksista.

Tuon piirin valmistuskustannukset on siis jo alusta lähtien tiedetty selvästi kalliimiksi kuin RX480n/RX580n/RX590n valmistuskustannukset.

AMDllä ei todellakaan ole voinut olla mitään suunnitelmaa tähdätä tuolla selvästi alempaan hintaluokkaan.


Sitten omaa spekulaatiota:

Jossain on ollut juttua siitä, että seuraavana vuonna on luvassa vielä jotain selvästi uutta, ja tästä oli aluksi huhuja, että tämä ensimmäinen Navi olisi joku "välimuoto GCNn ja seuraavan sukupolven väliltä.". Luulisin, että kyse on siitä, että säteenjäljityksen törmäystarkastusyksiköt eivät ehtineet vielä tähän mukaan, mutta ne tulee sitten ensi vuonna, isommassa piirissä (joka sitten kovaa lähinnä vega/fury-linjan)



(*) Fundamentaalisesti kalliimmalla siis tarkoitan sitä, että prosesseilal ei ole vain se hintaero, mikä tulee siitä, että tonen on vanhempi ja kypsyneempi jonka R&D ja investoinnit on jo katettu, vaan että vaikka kaikki R&D-kustannukset ja tehtaiden investoinnit kuoletetaan pois, "7nm" piikiekko on hitaampi ja kalliimpi valmistaa kuin "14nm" piikiekko.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 860
Ja mikä se muutos sitten oli?
Tuotteita tuli enemmän ja niiden suorituskyky on korkeampi kuin oli alinperin huhuiltu ja vuodettu. Myös RDNA mahdollistaisi joidenkin mielestä oikeasti ison navin tekemisen joka olisi sitten siellä 2080 luokassa tehoiltaan ettei ylikin.
 
Liittynyt
17.10.2016
Viestejä
2 860
En usko tuota tuon jätkän spekulaatiota. Tuo piiri on 251mm^2, tuo on isompi kuin Polaris 10 (232mm^2).

AMDllä ei todlelakaan ole voinut olla mitään suunnitelmaa tähdätä tuolla alempaan hinaluokkaan ja tarjota jotain muuta, isompaa piiriä tässä hintaluokassa.
Muistanko väärin vai eihän tästä kauan ole kun AMD ihan itse sanoi että navit tulee Radeon VII:n alapuolelle?

EDIT: Ja siis ajatus oli alunperin ettei AMD edes yritä high-endiin kun paukut ei ole sinne riittäneet aikaisemminkaan vaan tyytyisi tekemään näitä keskiluokan ja alemman keskiluokan tuotteita.
 
Liittynyt
22.10.2016
Viestejä
9 102
Ja mikä se muutos sitten oli?
Tuo jätkä spekuloi, että AMDllä olisi takataskussa isompi piiri, joka jätetiin toistaiseksi julkaisematta, ja tämän nyt julkiastun piirin piti alunperin tulla halvempaan hintaluokkaan.

edit: jopas katsoin hätäisesti.

En usko tätä spekulaatiota, aiemmassa viestissäni selitän, miksei:

AMD-spekulaatioketju (Navi)
 
Viimeksi muokattu:
Liittynyt
21.06.2017
Viestejä
5 329
Tuotteita tuli enemmän ja niiden suorituskyky on korkeampi kuin oli alinperin huhuiltu ja vuodettu. Myös RDNA mahdollistaisi joidenkin mielestä oikeasti ison navin tekemisen joka olisi sitten siellä 2080 luokassa tehoiltaan ettei ylikin.
Niin eikait se nyt täysin mahdottomuus olisi tehdä piiriä 60CU:lla eli puolet tuosta nykyisestä lisää jolloin piirin koko olisi jotain 380mm2 luokkaa eli ei edelleenkään mikään tolkuttoman suuri piiri mutta ruutia tulisi kummasti lisää, toki myös TDP kasvaisi varmaan sinne vegan lukemiin.
 
Liittynyt
22.10.2016
Viestejä
9 102
Niin eikait se nyt täysin mahdottomuus olisi tehdä piiriä 60CU:lla eli puolet tuosta nykyisestä lisää jolloin piirin koko olisi jotain 380mm2 luokkaa eli ei edelleenkään mikään tolkuttoman suuri piiri mutta ruutia tulisi kummasti lisää, toki myös TDP kasvaisi varmaan sinne vegan lukemiin.
Odotetaan tätä ensi vuodeksi, 128 ROPilla ja vähintään 32 DCUlla, ehkä jopa 40llä, ja säteenjäljityksen törmäystarkastusykisköillä.

AMDllä on ollut viime vuosina tapana julkaista vuorovuosin high-end-piiri ja mainstream-piirilinjasto.
 
Liittynyt
16.10.2016
Viestejä
8 594
Niin eikait se nyt täysin mahdottomuus olisi tehdä piiriä 60CU:lla eli puolet tuosta nykyisestä lisää jolloin piirin koko olisi jotain 380mm2 luokkaa eli ei edelleenkään mikään tolkuttoman suuri piiri mutta ruutia tulisi kummasti lisää, toki myös TDP kasvaisi varmaan sinne vegan lukemiin.
Miten lie tuolla nykyisellä 7 nanon prosessilla sellaisen piirin hinta ja saannot?
 
Liittynyt
20.10.2016
Viestejä
3 098
Miten lie tuolla nykyisellä 7 nanon prosessilla sellaisen piirin hinta ja saannot?
Ei ole tietoa saatavilla. Fiilispohjata hinta per transistori on samaa luokkaa, mitä 12nm tsmc:llä. Ensivuonna tulee ne 7nm EUV prosessilla tehdyt tuotteet kauppoihin ja niiden valotus on nopeampaa, mitä nyt, kun maskeja tarvitaan vähemmän. Se tiputtaa valmistuskustannuksia mukavasti.
 
Liittynyt
16.10.2016
Viestejä
8 594
Ei ole tietoa saatavilla. Fiilispohjata hinta per transistori on samaa luokkaa, mitä 12nm tsmc:llä. Ensivuonna tulee ne 7nm EUV prosessilla tehdyt tuotteet kauppoihin ja niiden valotus on nopeampaa, mitä nyt, kun maskeja tarvitaan vähemmän. Se tiputtaa valmistuskustannuksia mukavasti.
Tuostahan on nimenomaan sanottu, että on KALLIS, kun pitää valotella monesti ja muistelisin jossain nähneeni jonkun piirin saannoistakin jotain ja ei ne silloin olleet mitenkään vakuuttavat, piirin koko huomioiden..
 
Liittynyt
20.10.2016
Viestejä
3 098
Tuostahan on nimenomaan sanottu, että on KALLIS, kun pitää valotella monesti ja muistelisin jossain nähneeni jonkun piirin saannoistakin jotain ja ei ne silloin olleet mitenkään vakuuttavat, piirin koko huomioiden..
Kiekkojen tekeminen on hitaampaa, mutta siitä enemmän piirejä pidemmälle (sama transistorimäärä pienemmässä tilassa), se paikkaa vähän tilannetta. Ei se kyllä halpa ole, mutta varmaan aika lähellä tuota vanhempaa prosessia.
Zen2 chipletit on pieniä, mutta niistä on huhuttu 70% saanneista. Naveilla on taatusti pienemmät, VII:llä varmaan jo aika huonot. Tosiaalta on nuo isot Touring piiritkin aika mammutteja, joten saannit kärsii sielläkin.
 
Liittynyt
17.10.2016
Viestejä
9 352
AMD ei ole koskaan tainnut tehdä yli 64 rop:n piiriä? Liekö siellä jotain rajoittavia tekijöitä jotka vaikeuttavat ylöspäin skaalausta.

Tekevät isompia sitten joskus myöhemmin.

Piirien skaalaaminen isommiksi entisestään huonontaisi saantoja ja vaikeuttaisi myös muistikaistan kannalta tilannetta. Jos AMD laskee, ettei se pärjää 256-bit GDDR6 muisteilla RTX 2080/superille, niin ehkä sen ei kannata ehdoin tahdoin lähteä taistelemaan valmiita piirejä vastaan, joita ei voi voittaa ilman kalliita ratkaisuita.
 
Liittynyt
17.01.2018
Viestejä
408
Yksi spekulaation peruste pitäisi olla myös hinta ja se mitä lisärahalla saa
Tällä hetkellä ;
Vega 56 = ~ 250€
Polaris 30 ~ 200€
Polaris 20 ~ 180€
Noissa on valmiina jäähdytys , mutta matalat kellot

Tuleeko Navi 10 antamaan tuplahinnalle vastiketta , kellotaajuudet ei ainakaan vielä ole mitenkään järkyttäviä
 

Taneli-

☤ Virallinen ⚔ testaaja ☣
Make ATK Great Again
Liittynyt
17.10.2016
Viestejä
4 592
Yksi spekulaation peruste pitäisi olla myös hinta ja se mitä lisärahalla saa
Tällä hetkellä ;
Vega 56 = ~ 250€
Polaris 30 ~ 200€
Polaris 20 ~ 180€
Noissa on valmiina jäähdytys , mutta matalat kellot

Tuleeko Navi 10 antamaan tuplahinnalle vastiketta , kellotaajuudet ei ainakaan vielä ole mitenkään järkyttäviä
Tosin yksi asia mikä pitäisi ottaa huomioon on, miten pitkään Vega 56 ja 64 tulee sitten enää saamaan Navin julkaisun jälkeen? Eli jos nyt saa ~300€ 56 ja ~400€ 64 mallia tuleeko sitä enää saamaan (ja miten pitkään) samalla hinnalla kun Navit tulevat myyntiin.

Itse epäilen että suurin syy miksi noita kortteja (siis ns. parhaimpia jopa noista, Radeon Saphire RX Vega 64 NITRO+ / Saphire RX Vega 56 Pulse jne) saa halvalla johtuu siitä että varastot myydään loppuun eikä uusia kohta ole enää saatavilla.
 
D

Deleted member 4604

Vieras (tunnus poistettu)
AMD ei ole koskaan tainnut tehdä yli 64 rop:n piiriä? Liekö siellä jotain rajoittavia tekijöitä jotka vaikeuttavat ylöspäin skaalausta.
GCN:n kanssa 64 raja tulee shader enginejen määrästä, joka on maksimissaan neljä.
Jokaisessa SE:ssä maksimissaan neljä RB:tä, joissa jokaisessa 4 ROP:a.

Toivottavasti tuo on RDNA:ssa muuttunut.
 

IcePen

Typo Generaatroti ;-)
Liittynyt
17.10.2016
Viestejä
5 755
Tosin yksi asia mikä pitäisi ottaa huomioon on, miten pitkään Vega 56 ja 64 tulee sitten enää saamaan Navin julkaisun jälkeen? Eli jos nyt saa ~300€ 56 ja ~400€ 64 mallia tuleeko sitä enää saamaan (ja miten pitkään) samalla hinnalla kun Navit tulevat myyntiin.

Itse epäilen että suurin syy miksi noita kortteja (siis ns. parhaimpia jopa noista, Radeon Saphire RX Vega 64 NITRO+ / Saphire RX Vega 56 Pulse jne) saa halvalla johtuu siitä että varastot myydään loppuun eikä uusia kohta ole enää saatavilla.
Juurikin näin kuluttajapuolella ainoa myyntiinjäävä Vega on Vega VII.

Vain kaksi HBM muistipinoa sisältävien Vega pohjaisten piirien/korttien valmistus loppuu täysin jäljellle jää vain 4:n HBM pinon mallit.

Pro puolella GDDR6 Navit pystyy korvaamaan suurelta osin 2 HBM pinon Vegat joten tarvii tapahtua vain pieni siirtymä ylöspäin 4 pinon HBM Vegoihin että on koko markkina katettuna.
 
Liittynyt
22.10.2016
Viestejä
9 102
Mikäköhän on suorituskyky ko ratkaisulla. Jos ei erittäin hyvä, niin joutuvat lisäämään tekstuuriyksiköiden määrää todella rajusti.
Oikeastaan tuossa vaan integroidaan ne (uudet) törmäystarkastusyksiköt TMUiden yhteyteen, jolloin voidaan ladata laatikko-/kolmiodata niillä TMUiden latausyksiköillä, ja hyödyntää teksturivälimuisteja myös kolmio-/laatikkodatalle.

Koska TMUilla on ennestään jo todella järeät latausyksiköt, tuo vaan uudelleenkäyttää niitä.

Itse törmäystarkastukset tekevä rauta on kuitenkin ihan uutta rautaa, niitä ei lasketa samoilla ALUilla kuin tekstuurien filtteröintiä (niiden tarkkuus ei riittäisi).
 
Liittynyt
16.10.2016
Viestejä
8 594
Oikeastaan tuossa vaan integroidaan ne (uudet) törmäystarkastusyksiköt TMUiden yhteyteen, jolloin voidaan ladata laatikko-/kolmiodata niillä TMUiden latausyksiköillä, ja hyödyntää teksturivälimuisteja myös kolmio-/laatikkodatalle.

Koska TMUilla on ennestään jo todella järeät latausyksiköt, tuo vaan uudelleenkäyttää niitä.

Itse törmäystarkastukset tekevä rauta on kuitenkin ihan uutta rautaa, niitä ei lasketa samoilla ALUilla kuin tekstuurien filtteröintiä (niiden tarkkuus ei riittäisi).
Mutta jos ko yksikköä käytetään törmäystarkastukseen, niin jääkö silloin muu tmu huilimaan käytännössä?
Onko niillä paljon joutoaikaa raskaassa graaffisessa scenessä?
 
Liittynyt
22.10.2016
Viestejä
9 102
Mutta jos ko yksikköä käytetään törmäystarkastukseen, niin jääkö silloin muu tmu huilimaan käytännössä?
Onko niillä paljon joutoaikaa raskaassa graaffisessa scenessä?
TMU koostuu käytännössä seuraavista osista:
1) osoitteenlaskentayksikkö, joka laskee muistiosoitteita tekstuurikordinaateista
2) järeät latausyksiköt välimuisteineen
3) rautatoteututettu bilineaarinen suodatus (tyypillisesti 4 pikseliä/kellojakso-throughputilla(tämän takia yksi TMU usein lasketaan neljäksi))
4) Lisäksi on vähän kontrollia ja lisädataväylät sen datan kierrättämiseen monta kertaa sen bilineaarisen suodatuksen läpi jotta voidaan tehdä myös monimutkaisempia filtteröintejä käyttäen siihen monta kellojaksoa).

Nyt sinne tulee mukaan yksi oleellinen osa lisää: törmäystarkastusyksikkö. Ja kontrollia pitää vähän monimutkaistaa. Osoitteenlaskenta säteenjäljityksessä sen sijaan menee paljon yksinkertaisemmin kuin teksturoinnissa.


Kaikilla nykyarkkitehtuureilla TMUt on aina shader-prosessoreissa melko tiukasti kiinni, ja ne vaan palvelee niitä shadereita - kaikki tekstuurinhaut tehdään, koska shader-koodissa on tekstuurinhakukäsky. Jos sillä shader-prosessorilla, johon TMU on kytketty, ei suoriteta tekstuurinhakukäskyä, sen shader-prosessorin TMU idlaa.

Toki se tekstuurinhakukäsky tyypillisesti tehdään esim. 32-tai 64-kokoiselle wavefrontille/warpille kerralla, ja yksi TMU on vain 4-leveä, joten käytännössä yhdestä tekstuurinhakukäskystä se (nelois-)TMU on bilineaarisellakin suodatuksella työllistetty 8 tai 16 kellojakson ajan. Trilineaarisella tuplat tästä, eli 16 tai 32 kellojaksoa, ja anisotrooppisella suorituksella mahdollisesti vielä monta kertaa kauemmin.

Kun tehdään säteenjäljitystä, se shader-prosessori ajaa käytännössä koodia, jossa on integroitu yhteen
1) säteenjäljityksen kontrollikoodi, joka kutsuu törmäystarkastusyksiköitä tekemään niitä törmäystarkastuksia.
2) pikselishaderikoodi, miten pikseliä väritetään kun säde osuu johonkin kolmioon, eli miten se kolmion pinta värittää ja heijastaa sitä valoa. Tässä tulee normaaleita tekstuurihakuja ihan samalla tavalla kuin rasteroinnissakin.
3) uusien sekundäärisäteiden laukominen (tämän voi tulkita oikeastaan osaksi sekä 1stä että 2sta).
 
Liittynyt
17.10.2016
Viestejä
328
Verkkokauppa comissa näköjään ei ole myynnissä vegaa 56 tai 64 enää ollenkaan. Vain rx 580 ja radeon 7.
 

Taneli-

☤ Virallinen ⚔ testaaja ☣
Make ATK Great Again
Liittynyt
17.10.2016
Viestejä
4 592
Verkkokauppa comissa näköjään ei ole myynnissä vegaa 56 tai 64 enää ollenkaan. Vain rx 580 ja radeon 7.
Veikkaan että valmistus lopetettu ja kohta niitä ei enää saa, mikäli haluaa ostaa hyvän kortin halvalla kannattaa katsoa esim. saksan amazonia:
Vega 64 376€ + veroero. Saphire Nitro+
+
Vega 56 274€ + veroero. Saphiren Pulse

Toki huonompia malleja saa halvemmallakin.

Edit: ja näköjään vajaa kuukausi sitten pohdin juuri samaa tässä ketjussa, edellisellä sivulla.
 

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
18 295
Veikkaan että valmistus lopetettu ja kohta niitä ei enää saa, mikäli haluaa ostaa hyvän kortin halvalla kannattaa katsoa esim. saksan amazonia:
Vega 64 376€ + veroero. Saphire Nitro+
+
Vega 56 274€ + veroero. Saphiren Pulse

Toki huonompia malleja saa halvemmallakin.

Edit: ja näköjään vajaa kuukausi sitten pohdin juuri samaa tässä ketjussa, edellisellä sivulla.
Jotain Sapphiren 56:sta näyttäisi olevan kotimaassakin tarjolla alle 300e hintaan edelleen, postikulut huomioiden ei välttämättä ole tuo Amazon halvin siis
 

Sampsa

Sysop
Ylläpidon jäsen
S Y N T H W A V E
Team Pätkäpaasto
Liittynyt
13.10.2016
Viestejä
11 038
Radeon RX 5700 sarja tulee korvaamaan Vegat, niiden tuotanto on lopetettu.
 

mRkukov

Hrrrr...
Liittynyt
17.10.2016
Viestejä
7 094
Verkkokauppa . com ei ole myynyt Vega kortteja moneen kuukauteen.
Onko ne myynyt niitä oikein ollenkaan? Muistan joskus yli 6kk sitten todenneeni jo tuon saman.

Radeon RX 5700 sarja tulee korvaamaan Vegat, niiden tuotanto on lopetettu.
Pelikäytössä pelikäyttöön suunnattu arkkitehtuuri. Täysin loogista. Kattaako "Vegat" myös radeon vii?
 
Toggle Sidebar

Statistiikka

Viestiketjut
163 880
Viestejä
3 048 585
Jäsenet
56 773
Uusin jäsen
yovahti

Hinta.fi

Ylös Bottom