Virallinen: NVIDIA vs AMD (vs Intel) keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Miten esim. blackwell:ssa uutena tulleet pakatut kolmioklusterit bvh-puun rakentamiseen ja läpikäymiseen. Uusi primitiivi hiuksiin, karvoihin yms.Lisää suorituskykyä kunhan peleihin tulee tukea, alan wake2, indiana jones yms. Kolmioklusterit mahdollistavat tiheämmän dynaamisen geometrian kun bvh-puun rakentaminen nopeutuu erittäin merkittävästi ja myös läpikäyminen nopeutuu. Läpinäkyvyyksiin oli nyös uutta juttua joka auttaa esim. ruohon yms. kanssa peleissä.

Tai toisella puolella hyötysoftiin kuten davinci resolve oli blackwell:ssa paljonkin uutta video purku, pakkaus puolelle ja fp4:en auttaa neuroverkkojuttujen kanssa kunhan saadaan fp4 optimoidut mallit.

Jo Quake käytti valaistuslaskennassa tilojen jakamista vastaaviin rakenteisiin viime vuosituhannella ja Doomissa oli BSP-puu.

Tässä on se käytännön ongelma, että tech brot aina keksii vanhoja asioita uudestaan, paketoi ne kauniiseen jargoniin ja siinä on vaan tarkoitus saada osakekursseja ylös.

--

Suuremman tason kuvassa kyse on kuitenkin siitä, että "perinteisiä arvoja", eli niinkuin kolmioprivitiimirasterointia ei kehitetä, vaan paukut on pistetty juuri tuonne RT-puolelle. Käytännössä tämä sitten tulee niin, että perinteiset pelit ei nopeudu, mutta uutta näytönohjainta pistetään puolipakolliseksi Alan Wake 3:ssa ja uusissa Indiana Jones -peleissä, kun vanhat näytönohjaimet tukevat niin huonosti RT:tä.

Sitten vanhoissa näytönohjaimissa ei tueta näitä uusia ominaisuuksia, vaikka siihen olisi mahdollisuus - ja annetaan ajurien päivittämättömyydellä niiden vaipua unholaan, kun kuluttaja on pakotettu päivittämään omansa.
 
Jo Quake käytti valaistuslaskennassa tilojen jakamista vastaaviin rakenteisiin viime vuosituhannella ja Doomissa oli BSP-puu.
Säteenseuranta lienee ultimate boss, kun siihen on elokuvateollisuuskin päätynyt. Tai no, oikein pitkällä aikajäntellä neuroverkkorenderöinti voi korvata säteenseurannan. End game on kuka saa sätenseurannan peleissä toimimaan parhaiten. Nvidia toi blackwelliin uusia asioita(pakatut kolmio klusterit) jotka rautakiihdytetysti nopeuttavat säteenseurantaa sekä bvh-puun rakentamisen puolella(isoin ongelma ennen blackwellia) ja läpikäymisen kanssa.

Aikaisemman generaation korteissa ja amd korteissa tänääkin on vain kolmio ja box primitiivit. Rakennatko bvh-puu uusiksi joka framessa dynaamiselle geometrialle/lod:lle kolmio kerrallaan vai klusteri kerrallaan? Teetkö tormäystarkastukset boxi ja kolmio kerrallaan vai box, klusteri, kolmio rakenteella. Opacity micromap engine auttaa kasvuston kanssa, toki vaatii peliengineltä tukea. Pakatut kolmioklusterit on hyvä innovointi blackwell:ssa kuten on myös opacity micromap ja linear swept spheres.

1757048239283.png

Täältä voi lueskella jos kiinnostaa ymmärtää mistä tässä on kyse: https://images.nvidia.com/aem-dam/S...ell/nvidia-rtx-blackwell-gpu-architecture.pdf

---
Jos oikein haluaa halkoa hiuksia niin gddr7 muistitkin hyvä innovaatio. Läppäripuolella virrankulutus. Supereihin(huhuttu ja paljon odotettu) +50% muistikapasiteetti mikä ei onnistuisi gddr6 muisteilla kun ei ole olemassa gddr6 3GB piirejä. +50% hyvä kompromissi versus +100% ja clamshell + kalliimpi pcb.

--

Mitä nämä amd innovaatiot ovat jossa amd sinun mukaan juoksee ja nvidia ei? Mun nähdäkseni nvidia on se joka on edellä ja innovoi säteenseurantaan ja neuroverkkoihin liittyen.
 
Viimeksi muokattu:
Säteenseuranta lienee ultimate boss, kun siihen on elokuvateollisuuskin päätynyt. Tai no, oikein pitkällä aikajäntellä neuroverkkorenderöinti voi korvata säteenseurannan. End game on kuka saa sätenseurannan peleissä toimimaan parhaiten. Nvidia toi blackwelliin uusia asioita(pakatut kolmio klusterit) jotka rautakiihdytetysti nopeuttavat säteenseurantaa sekä bvh-puun rakentamisen puolella(isoin ongelma ennen blackwellia) ja läpikäymisen kanssa.

Aikaisemman generaation korteissa ja amd korteissa tänääkin on vain kolmio ja box primitiivit. Rakennatko bvh-puu uusiksi joka framessa dynaamiselle geometrialle/lod:lle kolmio kerrallaan vai klusteri kerrallaan? Teetkö tormäystarkastukset boxi ja kolmio kerrallaan vai box, klusteri, kolmio rakenteella. Opacity micromap engine auttaa kasvuston kanssa, toki vaatii peliengineltä tukea. Pakatut kolmioklusterit on hyvä innovointi blackwell:ssa kuten on myös opacity micromap ja linear swept spheres.

1757048239283.png

Täältä voi lueskella jos kiinnostaa ymmärtää mistä tässä on kyse: https://images.nvidia.com/aem-dam/S...ell/nvidia-rtx-blackwell-gpu-architecture.pdf

---
Jos oikein haluaa halkoa hiuksia niin gddr7 muistitkin hyvä innovaatio. Läppäripuolella virrankulutus. Supereihin(huhuttu ja paljon odotettu) +50% muistikapasiteetti mikä ei onnistuisi gddr6 muisteilla kun ei ole olemassa gddr6 3GB piirejä. +50% hyvä kompromissi versus +100% ja clamshell + kalliimpi pcb.

--

Mitä nämä amd innovaatiot ovat jossa amd sinun mukaan juoksee ja nvidia ei? Mun nähdäkseni nvidia on se joka on edellä ja innovoi säteenseurantaan ja neuroverkkoihin liittyen.

Pitää mennä töihin, ehkä kirjoittelen pidemmin illalla, jos jaksan.

Nämä kaikki on tehty jo. Voit muuttaa random ei-kolmio primitiivin vaikka marching cubesilla kolmioiksi. Tai sitten tehdä sitä ray-tracingiä, joka ei ole niin rajoittunutta, kuin annat ymmrätää.
Mitä tässä on tapahtunut, niin laskentaa on siirretty GPU:lle ja nopeutettu. Jo ensimmäinen Geforce sisälsi TnL enginen, eli senaikainen valaistus ja geometrinen pyörittely oli siirretty GPU:lle.

Hirveästi tulee sinulta Nvidian markkinointimateriaalia, ja jos et ymmärrä mikä tässä on vikana: jos käyttäjät lukitaan yhden vendorin ratkaisuun, sille voi tapahtua mitä vaan. Nvidia vaan vanhentaa APIn ja käyttäjän uudella kortilla ei voi pelata Batmania, niinkuin vanhalla. Onneksi nuo nyt kuvassa ovat nopeutuksia, eikä varsinaista featuretuputtamista. Mutta ne on kuitenkin nopeutuksia RT:hen, ja suurin osa peleistä ei ole RT.

--

..ja et voi puhua muistimääräinnovaatioista ja Nvidiasta. 2017 julkaistiin tuommoinen $699 Nvidia-kortti 11GB muistilla ja nyt samassa hintaluokassa saa 12-16GB. 8½ vuoden jälkeen. Naurettavaa. Säälittävää.
 
Pitää mennä töihin, ehkä kirjoittelen pidemmin illalla, jos jaksan.

Nämä kaikki on tehty jo. Voit muuttaa random ei-kolmio primitiivin vaikka marching cubesilla kolmioiksi. Tai sitten tehdä sitä ray-tracingiä, joka ei ole niin rajoittunutta, kuin annat ymmrätää.
Mitä tässä on tapahtunut, niin laskentaa on siirretty GPU:lle ja nopeutettu. Jo ensimmäinen Geforce sisälsi TnL enginen, eli senaikainen valaistus ja geometrinen pyörittely oli siirretty GPU:lle.

Hirveästi tulee sinulta Nvidian markkinointimateriaalia, ja jos et ymmärrä mikä tässä on vikana: jos käyttäjät lukitaan yhden vendorin ratkaisuun, sille voi tapahtua mitä vaan. Nvidia vaan vanhentaa APIn ja käyttäjän uudella kortilla ei voi pelata Batmania, niinkuin vanhalla. Onneksi nuo nyt kuvassa ovat nopeutuksia, eikä varsinaista featuretuputtamista. Mutta ne on kuitenkin nopeutuksia RT:hen, ja suurin osa peleistä ei ole RT.

--

..ja et voi puhua muistimääräinnovaatioista ja Nvidiasta. 2017 julkaistiin tuommoinen $699 Nvidia-kortti 11GB muistilla ja nyt samassa hintaluokassa saa 12-16GB. 8½ vuoden jälkeen. Naurettavaa. Säälittävää.

Ei tästä kannata vääntää kun et halua laskea parempaa rautatoteutusta innovoinniksi. Toisaalta ei amd:kaan tällaisen vaatimuksen läpi katsottuna innovoi. Ei edes openai innovoi kun neuroverkot keksittiin 1960-luvulla ja transformer keksittiin 2017(attention is all you need paper).

TLDR versio vielä alleviivattuna. AMD ja nvidian vanha rauta käsittelevät kolmioita yksi kerrallaan. Blackwell:ssa käsitellään klustereina. Tämä käsittely ei ole sama asia kuin bvh puu, klusteri/kolmio tässä kontekstissa on input bvh:n rakentamiseen ja primitiivi bvh/puun sisällä(vanhoissa raudoissa kolmio, ei klusteri bvh-puun sisällä). Jos haluaa analogian vetää rasteripuolelle niin voi ajatella engineä joka käsittelee vain kolmioita tai engineä joka käsittelee triangle strip:ja. Strip:lla saadaan etua versus pelkät kolmiot ja kolmioklustereilla saavutetaan samankaltainen etu. Triangle strip - Wikipedia

Konkreettisesti blackwell:ssa bvh-puun rakentaminen on uusia primitiivejä käyttäessä kaksi kertaluokkaa nopeampaa kuin ennen. Tämä on oleellista jos halutaan esim. animoida bvh-puussa olevaa sisältöä tai tehdä lod:ia.
Mega Geometry provides new BVH construction capabilities that adopt clusters oftriangles as first-class primitives. New Cluster-level Acceleration Structures (CLAS) can begenerated out of spatially compact batches of up to 256 triangles. A collection of CLAS isthen used as input to construct a final BVH. CLAS can be generated on demand, e.g. whenan object is loaded from disk, and then cached for future frames. Because each CLASrepresents a collection on the order of 100 triangles, the processing required bysubsequent BVH builds is reduced by two orders of magnitude compared to classictriangle-based methods. Consequently, a game engine can budget for many more BVHbuilds per frame, and handle cluster-LOD switches by simply reconstructing the BVHs ofaffected objects from CLASes.
 
Viimeksi muokattu:
Jo Quake käytti valaistuslaskennassa tilojen jakamista vastaaviin rakenteisiin viime vuosituhannella ja Doomissa oli BSP-puu.

Tässä on se käytännön ongelma, että tech brot aina keksii vanhoja asioita uudestaan, paketoi ne kauniiseen jargoniin ja siinä on vaan tarkoitus saada osakekursseja ylös.

--

Suuremman tason kuvassa kyse on kuitenkin siitä, että "perinteisiä arvoja", eli niinkuin kolmioprivitiimirasterointia ei kehitetä, vaan paukut on pistetty juuri tuonne RT-puolelle. Käytännössä tämä sitten tulee niin, että perinteiset pelit ei nopeudu, mutta uutta näytönohjainta pistetään puolipakolliseksi Alan Wake 3:ssa ja uusissa Indiana Jones -peleissä, kun vanhat näytönohjaimet tukevat niin huonosti RT:tä.

Sitten vanhoissa näytönohjaimissa ei tueta näitä uusia ominaisuuksia, vaikka siihen olisi mahdollisuus - ja annetaan ajurien päivittämättömyydellä niiden vaipua unholaan, kun kuluttaja on pakotettu päivittämään omansa.
Rasteroinnissa on aivan tarpeeksi nopeutta ja lisäksi sitä on kehitelty jo niin pitkään, jotta se on varmasti melkoisen optimoitu suoritus. RT raudalla taas on melko uusi asia, jota painotetaan kokoajan enemmän, joten siihen on kaikkein järkevintä panostaa.

En näe muutakuin huonona ideana olla kehittämättä uutta, sillä perusteella, jotta "vanhoilla näyttiksillä pyörii huonosti". Jos uusi nopeuttaa uudella näyttiksellä / mahdollistaa uusia jippoja, niin se on vain ja ainoastaan erittäin hyvä juttu. Jos tähän olisi aikoinaan lähdetty, niin myöskään rautarasterointiakaan ei olisi kehitetty / otettu käyttöön, kun "vanhoilla näyttiksillä pyöri huonosti".

Nvidia on nyt vienyt alaa eteenpäin voimakkaasti vuosikausia, mm. RT:n johdosta. AMD on laiskotellut ja jäänyt pahasti jälkeen.
 
Itselläni Rtx 4070 ja päätin skipata nykyisen sukupolven mutta Amd seuraavaa sukupolvea kyllä odottelen sekä jos Intel saisi jotain mikä olisi about Rtx 5080 tehoinen mutta isommalla vram määrällä, voi tosin olla että Intelin kanssa saa odottaa aika kauan että pääsevät sinne tasolle.

Nyt vain kun oma harrasteluprojekti tekoälyn kanssa(joka toimii tämän 4070 kanssa kuulemma ihan ok) jota ajattelin aloitella tarvitsee Nvidian näytönohjainta niin miettii että pitäisikö sittenkin olla avoin asian suhteen ja harkita Nvidiaakin.... Voi tosin olla että mun projekti alkaa kyllästyttää ennen kuin sopivaa näytönohjainta edes tulee, tää on näitä autismikirjon juttuja että innostuu jostain ja sit yhtäkkiä se into voikin lopahtaa pahasti, toki se että mahdollisesti maksaa muutaman satkun enemmän näytönohjaimesta jota kuitenkin käytän pelaamiseen niin ei ole niin iso menetys varsinkin kun työtilanne vaikuttaa hyvältä taas vaihteeksi jolloin se muutama satku ei tunnu missään.
 

Statistiikka

Viestiketjuista
285 957
Viestejä
4 906 929
Jäsenet
79 107
Uusin jäsen
lmn

Hinta.fi

Back
Ylös Bottom