AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Ok, kiitos. Pitää sitten varmaan jostain hommata se kolmas piuha, jos Prime löytyisi kassiin. Jimm'ssiin en taida taipua maailmapoliittisista syistä.
 
Sama kortti voi hyvin olla muuallakin ovh-hintainen, mutta kolmas piuha toki ok valinta sekin tässä tapauksessa
Joo, katsotaan minkä onnistuu saamaan, jos minkään. Luulin, että Pulse olis ollu noita ovh-malleja, mutta se meneekin yli 800 euron. Hellhoundin hintaa en vielä ole löytänyt.

Vaan toki ei haluais huonoa laatuakaan ostaa, että ehkä se ASUS jää hyllyyn ja nöyrtyy vielä muutaman kympin budjetin ylittämiseen.
 
Viimeksi muokattu:
Jaaha, ilman taidettiin jäädä. Jäin ostamaan Datatronikista Reaperia 720 eurolla ja pääsin jo kirjottamaan osoitetta, kunnes lensin jotenkin ulos jonosta ja se oli sitten siinä. Muuallakin enää pelkkää ei-oota.

Milloinkohan noita mahtaa tulla lisää ja nousevatkohan hinnat noista mitkä eivät olleet nyt ovh:lla?
 
Jaaha, ilman taidettiin jäädä. Jäin ostamaan Datatronikista Reaperia 720 eurolla ja pääsin jo kirjottamaan osoitetta, kunnes lensin jotenkin ulos jonosta ja se oli sitten siinä. Muuallakin enää pelkkää ei-oota.

Milloinkohan noita mahtaa tulla lisää ja nousevatkohan hinnat noista mitkä eivät olleet nyt ovh:lla?

Nousevat sinne alkaen 750€ non XT ja 800€ XT. Hinnat laskevat ehkä kesällä

Proshopissa asus prime non xt:tä vapaana
 
Jep. Pettymyshän tuo. Ostoskoriin sai Datatronic ja Proshop, mutta siihen se sitten jäikin. Näyttää droonikaupankin tuotteet kelvanneen, eioota tarjolla. Verkkokauppacom sivut ihan totaalisen alhaalla.
 
Itselläni tais selvästi käydä tuurin kun sain Asuksen ostettua Verkkokauppacomin sivuilta heti julkasusta ja vielä 15min myöhemmin menin Proshopin sivuille ja sain sieltä napattua Sapphiren Pulsen kaverille.
 
RDNA4-arkkitehtuurista ja säteenjäljityksestä:

RDNA2ssa ja RDNA3ssa säteenjäljityksen BVH-puun läpikäynti tehtiin softalla shader-ytimillä, kun se nvidian piireillä tehdään raudalla.

Ennen RDNA4n julkaisua mietittiin, että josko AMD nyt siirtyisi rautaratkaisuun puun läpikäynnissä, että saadaan shader-kuormaa alas, mutta tätä ei vieläkään tapahtunut.

Säteenjäljitysten törmäystarkastusnopeus RDNA4ssa kuitenkin tuplattiin, ja jos tämä tuplaus olisi tehty vain suoraan säteenjäljitysyksiköiden määrää korkealla tasolla kasvattamalla, ja jäljittämällä useampaa sädettä rinnakkain, shader-kuormitus olisi vaan kasvanut ja ollut pahempi pullonkaula

Mutta: Tämä törmäystarkastusten nopetus tehtiin tavalla, joka ei lisännyt sitä shader-kuormitusta, samalla shader-kuormituksella saadaan nyt tarkastettua (teoriassa) tuplamäärä laatikoita.


RDNA2- ja RDNA3-sukupolvissa BVH-puu oli radix4-tyyppinen (quadtree), eli jokaisella laatikolla oli maksimissaan 4 alilaatikkoa.

Eli jos vaikka meillä oli 64 matalimmin tason (0-tason) laatikkoa, niin korkeimman tason laatikko sisältää 4 toiseksi korkeimman tason laatikko, toiseksi korkeimman tason laatikot sisältävät kukin 4 kolmanneksi korkeimman tason latikkoa (4*4=16), nämä 16 kolmanneksi korkeimman tason laatikkoa sisältävät kukin 4 matalimman tason laatikkoa (4*16 = 64)

tree4.png


Ja sitten törmäystarkastusyksiköt oli organisoitu siten että ne pystyy tarkastamaan laatikon kaikki 4 alilaatikkoa kerralla, joka kellojakso yksi taso puuta, 4 laatikkotarkastusta(*)

RDNA4ssa BVH-puu muutettiin radix4-muodosta radix-8-muotoon (octree)

Eli 64 0-tason laatikkoa talletettaisiinkin puuhun tavalla, että korkeimman tason laatikko sisältää 8 toiseksi korkeimman tason laatikkoa, nämä 8 kukin sisältävät 8 matalimman tason laatikkoa (8*8=64)

2560px-Octree2.svg.png

Samalla törmäystarkastusykiköitä muutettiin siten, että ne pystyvät kerralla tekemään 8 laatikkotarkastusta keralla yhdessä kellojaksossa, eli edelleen yhden tason verran puuta kellojaksossa, vaikka joka tasolla on tuplamäärä alilaatikoita

Tällöin 64 0-tason laatikkoa sisältävästä puusta tarvii käydä läpi vain kaksi tasoa kolmen sijaan että saavutaan sen 0-tasolle.


Tästä kun vähän laskee, niin tajuaa, että vaikka törmäystarkastusten teoreettinen maksimimäärä kellojaksossa kasvoi kaksinkertaiseksi, puun läpikäynti nopeutuikin vain 1.5-kertaisesti perustapauksessa, jossa puuta pitää jäljittää vain yhteen lehteen.

Mutta: ei pidä ajatella, että nyt "laskentatehoa menee hukkaan koska 2x laskentateholla saadaan usein vain 1.5x nopeutus", koska se raaka laskentateho ei yleensä ole se pullonkaula.

Se mikä on kallista on kaikki monimutkaisuus, erilliset muistiaccessit, kaiken kontrollioverhead jne. Ja nyt puut läpikäydessä myös erillisten muistiaccessien ja kontrollioperaatioiden määrä putoaa 33%, joskin ne muistiaccessit on nyt tuplasti leveämpiä.

AMDlle oli käytännössä helpompaa ja halvempaa tuplata niiden törmäystarkastusyksiköiden järeys laittamalla ne tekemään kerralla 8 tarkastusta ja syöttämällä niille tuplamäärän dataa(samasta lähteestä, helpolla leveällä latauksella) kuin mitä olisi ollut saada millään keinolla käytyä puuta läpi 1.5-kertaisella nopeudella millään muulla tavalla.

ja lisäksi, usein se säde osuu moneen laatikkoon että pitää tarkastaa useita lapsilaatikoita. Silloin tuo nopeutus radix-4-puun ja radix-8-puun välillä on helposti parempi kuin tuo 1.5x.

Eli siis, AMD ei käytännössä tuplannut säteenjäljityksen nopeutta, vaan AMD n. 1.6-kertaisti säteenjäljityksen nopeuden, tavalla joka teki siitä shader-kuorman ja vaadittavan rinnakkaisuuden yms. kannalta helpompaa ja halvempaa (mutta vaati sen tuplamäärän törmäystarkastuksia ja leveämpiä piirin sisäisiä väyliä)

(*) Käytännössä yksittäiseltä säikeeltä siihen tarkastukseen ja puun alilaatikoiden hakemiseen muistista menee kyllä useampi kuin yksi kellojakso (viive >1 kellojakso), mutta tämä homma on liukuhihnoitettu ja monisäikeistetty, että lasketaan montaa säiettä limittäin ja joka kellojakso voidaan jollekin säikeelle, jollekin säteelle aloittaa nämä törmäystarkastukset.


Ja niin, mikä on nVidian puun tyyppi, sitä en tiedä. nvidian ekoissa RTX-piireissä se oli käsittääkseni radix-4, mutta voi uusissa sukupolvissa olla jopa 8 tai 16.

edit: Nyt onnistuin löytämään yhden nvidian sliden, joka vihjaisi, että nvidialla todennäköisesti jo 3000-sarjassa olisi radix-8-puu, mutta ei voi olla varma, koska tuo oli vaan kuvaesimerkki bvh-puun ideasta.

NVIDIA-Ampere-RT-Cores.jpg
 
Viimeksi muokattu:
Oliko seuraava tehokorttisarja tulossa 2026?
Eihän sitä koskaan tiedä, mutta trendi näyttää olevan että uudet isot julkaisut harvenee:
5000-sarja & RDNA: 7/2019
6000-sarja & RDNA2: 11/2020 (16kk)
7000-sarja & RDNA3: 12/2022 (25kk)
9000-sarja & RDNA4: 3/2025 (28kk)

Ekstrapoloitu ennuste on jotain 30kk eli syyskuu 2027, keskiarvo taas 23kk eli helmikuu 2027

NVIDIAlla vastaavasti
RTX 2000: 9/2018
RTX 3000: 9/2020 (24kk)
RTX 4000: 10/2022 (25kk)
RTX 5000: 1/2025 (28kk)

Veikkaan että RTX 6000 sarjasta virallista infoa aikaisintaan CES 2027.

Muoks; nykyinen 3080 on sitten 7 vuotta vanha kun on vihdoin järkihintaisia päivityksiä tarjolla, ja siitä varmaan saa vielä silloinkin pari sataa euroa käytettynä :lol:
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
270 199
Viestejä
4 671 805
Jäsenet
76 575
Uusin jäsen
sagge

Hinta.fi

Back
Ylös Bottom