AMD:n David Wang kertoi näkemyksensä DXR-rajapinnasta

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu
Kuten jo sanoin, ei ole mielestäni turha (siksi toisekseen se on oma video ja oma vaivansa siinäkin oli).
No voi hyvä ihme nyt, trollaatko ihan tosissasi? Miten se video ei ollut turha, kun yritit esittää 60 ja 30 FPS "olematonta eroa" näyttämällä pelkkää 30 FPS:ää?

30x /sek on ihmiselle paljon.:tup:
Oma lainaus:
:tup::tup:
Vaikuttaa tuossa aika olennaisesti se, ettei (peli)kohteet liiku kovin usein ruudun poikki suuntaisesti.
Ei se suunta vaikuta tippaakaan sen liikkeen sulavuuteen.

Tässä on nyt niin perusasiat hukassa että alkaa epäilyttämään trollaatko vain?
 
...
Jos noilla nykyisillä RTX korteilla sädetettäisiin myös varjot niin se suorituskyky tankkaisi vielä rajummin.

Jo nyt mahdollista, kyse todella laajasta paketista.

Ei kyse ollut siitä onko varjojen sädettäminen mahdollista vai ei (tietenkin se on).

Kysymys on siitä että jos niihin varjohinkin käöytettäisii tuota säteenmuodotusta niin sitä säteenseurantatehoa tarvitaan vieläkin enempi siltä RTX kortilta jolla sitä säteenseurantatehoa on jo lähtökohtaisestiu aivan liian vähän.
 
...

Häh. Mikä softa tekee jotain muuta mutta ei varjoja säteenjäljityksellä?

Mitä nyt tarkoitat "asialla" ? Säteenjäljityksessä kyllä tyypillisesti tehdään törmäystarkastustestit kaikkiin primitiiveihin, mitä maailmassa on, BVH vaan skaalautuu mukavan logaritmisesti kolmioiden määrään nähden että näiden määrä lisääntyminen ei te siitä juurikaan raskaampaa.
Juu kyllä säteenjäljitystä käytetään peleissä ja muissakin softissa hyvin monissa eri tarkoituksisssa ja sehän on juuri asian ydin kun tuon RTX kortin teho ei riitä edes niin ilmeisimpiin ruudulla näkyvyyn säteenseuranta käyttötarkoituksiin.

Siksi BF2:in käytää sitä RTX kortin säteenseuratayksiö tehoa vain ensijaisiin valon/kuvan heijastuksiin heijastavilta pinnoilta (kuten vesi) eikä mihinkään muuhun.

It’s also worth pointing out that ray traced reflections is the only ray traced effect in Battlefield V. Every other aspect of how the game is rendered is done through traditional means, so shadows and ambient occlusion, for example, are the standard game effects. This means that if you’re not in an area with reflective surfaces, you basically aren’t getting any benefit from DXR.

Battlefield V DXR Real-Time Ray Tracing Performance Tested

Itse odotan mielenkinnolla sitä uutta Metroa kun siinä RTX säteenseuranta kykyä käytetään varjojen ja valon sironnan muodostukseen.
 
Viimeksi muokattu:
...
Huonosta suorituskyvystä aika paljon voi selittyä jo BVH-puulla, eli

Koko BVH-puu rakennetaan uusiksi joka framen välillä ja joko
A) tähän haaskataan paljon laskentatehoa (joko CPUlla tai näyttiksen shadereilla; nVidialla ei (vielä) ole rautatukea BVH-puun rakentamiseen, tai
B) se BVH-puu rakennetaan jollain hyvin nopealla algoritmillä joka tekee hyvin huonolaatuisen BVH-puun jolloin säteenjäljityksessä tulee todella paljon ylimääräisiä tarkastuksia.

Jos pelin 3D-objekteja säilytetään järkevässä tietorakenteessa jossa BVH-puun muodostaminen on otettu huomioon, voidaan BVH-puun rakentamista nopeuttaa huomattavasti, eikä tämä vaadi mitään hirveän monimutkaista. Esimerkiksi korkealla tasolla jaetaan kaikki objektit paikallaanpysyviin ja liikkuviin, ja molemmille tehdään oma haara juuritasolla BVH-puuhun, ja joka framella generoidaan uusiksi vain se liikkuvien objektien BVH-puu-haara. Toki tämä jakokin tarkoittaa yleensä yhtä lisätarkastusta/säde.
...
Mitä tuo Nviidan kortin RTX yksikkö oikein tekee kun luulisi että sen säteenseuranta tehon kannalta olennainen seikka olisi juuri tuo BVH puun optimoitti joten luulisi että sitä tekisi Nvidian näyttiksen ajuri hyödyntäen sitä RTX yksikköä.
 
Mitä tuo Nviidan kortin RTX yksikkö oikein tekee kun luulisi että sen säteenseuranta tehon kannalta olennainen seikka olisi juuri tuo BVH puun optimoitti joten luulisi että sitä tekisi Nvidian näyttiksen ajuri hyödyntäen sitä RTX yksikköä.
Se RT-core on oletettavasti ihan täysin fixed function rautaa jonka tehtävä on laskea niitä säteitä eikä optimoida sitä osumapuuta
 
Se RT-core on oletettavasti ihan täysin fixed function rautaa jonka tehtävä on laskea niitä säteitä eikä optimoida sitä osumapuuta
At the heart of Turing’s hardware-based ray tracing acceleration is the new RT Core included in each SM. RT Cores accelerate Bounding Volume Hierarchy (BVH) traversal and ray/triangle intersection testing (ray casting) functions. RT Cores perform visibility testing on behalf of threads running in the SM.

NVIDIA Turing Architecture In-Depth | NVIDIA Developer Blog

Edit:
Oleellista on siis se, että RT-coret eivät ole mitään yleispäteviä RT-laskureita, vaan ainoastaan offloadaavat noiden sekundäärisäteiden osumalaskentaa.

Se, että ammut säteitä ympäriinsä ei vielä tee mitään. Lisäksi niille osumille pitää tehdä jotain niillä tavallisilla shadereilla.

10Gigarays per sec tarkoittaisi 100 000 sädettä per frame jos peli pyörisi 100fps.

Ja kun 1920x1080 resossa on 2 megapikseliä, niin joka pikselille ei todellakaan voi lähetellä säteitä, vaan niitä pitää oikeasti laittaa kovasti säästellen -> koodaajat joutuvat opettelemaan taas kerran, että miten rajallisesta resurssista saadaan suurin visuaalinen hyöty ja tuohon menee varmasti aikaa.
 
Viimeksi muokattu:
No voi hyvä ihme nyt, trollaatko ihan tosissasi? Miten se video ei ollut turha, kun yritit esittää 60 ja 30 FPS "olematonta eroa" näyttämällä pelkkää 30 FPS:ää?
  1. En tiennyt videon taajuutta.
  2. Lopputulos näytti samalta, videolla ja näytöllä.
  3. Jos kerran video on pelkää 30FPS: tä, se olikin juuri se pointti, sen(kin) sulavuus!
Ei se suunta vaikuta tippaakaan sen liikkeen sulavuuteen.

Tässä on nyt niin perusasiat hukassa että alkaa epäilyttämään trollaatko vain?
Niin, että pelaajaa kohden tuleva kohde näkyy ihan yhtä selvästi (huonosti, 30FPS) kuin ruudun poikki kulkeva. Asia selvä.

Ps. Poistin videon.
 
  1. En tiennyt videon taajuutta.
  2. Lopputulos näytti samalta, videolla ja näytöllä.
  3. Jos kerran video on pelkää 30FPS: tä, se olikin juuri se pointti, sen(kin) sulavuus!
Niin, että pelaajaa kohden tuleva kohde näkyy ihan yhtä selvästi (huonosti, 30FPS) kuin ruudun poikki kulkeva. Asia selvä.

Ps. Poistin videon.
Miksi käytät videota esimerkkinä jos et edes perusjuttuja siitä videosta tiennyt?
Lopputulos ei taatusti näytä samalta, koska siinä näytöllä pelatessa oikeasti se 60 FPS on 60 FPS eikä 30 FPS.
Se pelaajaa kohden tulevan kohteen sijainti päivittyy 30 kertaa sekunnissa, ihan kuten sivuttaissuunnassakin. Jos liike on kyllin hidasta se saattaa toki vaikuttaa verrattain sulavalta, mutta siitä riippumatta se on 60 FPS:llä sulavampaa olettaen ettei se teleporttaa 1/30s välein aina tiettyä matkaa eteenpäin vaan liike on jatkuvaa (vaihtelevaa tai ei, ei väliä).

Absurdi ajatus tämä, että nimimerkkinsäkin PC-maailman huippukoneista valkannut yrittää puolustella 30 FPS:ää kuin pahinkin konsolipelaaja, joille ei muuta ole tarjolla (joissain peleissä toki on 60 FPS optiot, mutta harvinaista se on).

Sama kuin eräs toinen käyttäjä koitti vakuutella että kyllä se 1080 @ 60 Hz on ihan riittävä resoluutio vaikka kaikki tietävät, ettei (lähes) kukaan osta mitään FullHD 60 Hz -näyttöjä jos koneesta löytyy RTX-hintaluokan näytönohjain, vaan silloin katsotaan niitä 1440p ja 4K näyttöjä ja mahdollisuuksien mukaan 120Hz+ virkistystaajuuksia​
 
Kun tässä ketjussa nyt tuosta BFV:nkin DXR-toteutuksesta on puhuttu, niin näemmä otettu takapakkia vrt alkuperäinen demo DXR-puolella mutta ilman DXR:ää näyttää paremmalta kuin demossa, on tuossa vielä paljon työtä

 
10Gigarays per sec tarkoittaisi 100 000 sädettä per frame jos peli pyörisi 100fps.

Ja kun 1920x1080 resossa on 2 megapikseliä, niin joka pikselille ei todellakaan voi lähetellä säteitä, vaan niitä pitää oikeasti laittaa kovasti säästellen -> koodaajat joutuvat opettelemaan taas kerran, että miten rajallisesta resurssista saadaan suurin visuaalinen hyöty ja tuohon menee varmasti aikaa.

10 000 000 000 / 100 = 100 000?
 
Mitä tuo Nviidan kortin RTX yksikkö oikein tekee kun luulisi että sen säteenseuranta tehon kannalta olennainen seikka olisi juuri tuo BVH puun optimoitti joten luulisi että sitä tekisi Nvidian näyttiksen ajuri hyödyntäen sitä RTX yksikköä.

Nykyinen nVidian RTX-yksikkö tekee vain törmäystarkastuksia, ei mitään muuta.

Niiden törmäystarkastusten tekeminen kaikkien kolmioiden kanssa olisi todella, todella hidasta, kun kolmioita on vaikka miljoona. BVH-puu pudottaa sen tarkastusten määrän tällöin karkeasti ottaen miljoonasta n. 21een per säde. Tosin, jos sen BVH-puun laatu on huono, sitten voidaankin niitä törmäystarkastuksia tarvita n. 21 sijasta olla vaikka n. 40.

Ja ajuri ei tiedä, että onko pelin geometria muuttunut vai ei, tai että mitä siinä on muuttunut (eikä sen ole järkevää alkaa säilömään edellisen framen geometriaa ja tekemään diffiä edellisen framen geometrian kanssa, vaikka se periaatteessa voisi siten tehdä). Ajuri ei voi mitenkään järkevästi tehdä päätöstä, että mitä osia BVH-puusta pitää generoida uudelleen ja mitä ei, sen on oltava pelikoodarin vastuulla.

Odotellaan rautapohjaista BVH-rakenninta nVidialta sukupolveen, joka tulee ulos n. 2021. Ei aiemmin. (minulla on ehkä hiukan sisäpiirin tietoa tähän liittyen, ei mitään varmaa eikä mitään varsinaisesti salaista, mutta jätän silti kertomatta lähteeni)
 
Viimeksi muokattu:
At the heart of Turing’s hardware-based ray tracing acceleration is the new RT Core included in each SM. RT Cores accelerate Bounding Volume Hierarchy (BVH) traversal and ray/triangle intersection testing (ray casting) functions. RT Cores perform visibility testing on behalf of threads running in the SM.

NVIDIA Turing Architecture In-Depth | NVIDIA Developer Blog

Edit:
Oleellista on siis se, että RT-coret eivät ole mitään yleispäteviä RT-laskureita, vaan ainoastaan offloadaavat noiden sekundäärisäteiden osumalaskentaa.

Se, että ammut säteitä ympäriinsä ei vielä tee mitään. Lisäksi niille osumille pitää tehdä jotain niillä tavallisilla shadereilla.

10Gigarays per sec tarkoittaisi 100 000 sädettä per frame jos peli pyörisi 100fps.

Ja kun 1920x1080 resossa on 2 megapikseliä, niin joka pikselille ei todellakaan voi lähetellä säteitä, vaan niitä pitää oikeasti laittaa kovasti säästellen -> koodaajat joutuvat opettelemaan taas kerran, että miten rajallisesta resurssista saadaan suurin visuaalinen hyöty ja tuohon menee varmasti aikaa.

... paitsi että 10 gigarays tarkoittaa 100 000 000 sädettä per frame jos peli pyörisi 100 fps. Vain tuhatkertaisesti pieleen.

Eli jokaiselle pikselille onkin full-HD-reluutiolla varaa n. 50 "säteeseen".

Se, mitä tässä nvidian "säteellä" todellisuudessa taidetaan tarkoittaa on yhtä säteen ja BVH-laatikon tai kolmion törmäystarkastusta. (en ole kuitenkaan aivan varma tästä)

Jos kolmioita on scenessä n. 100000, tarkoittaa se n. 18 tarkastusta että kaikki saadaan tarkastettua (log (100000) ~ 17). Eli joka pikseliä kohden on varaa n. kolmeen oikeaan säteeseen.

60 FPSllä on sitten varaa n. 5 oikeaan säteeseen/pikseli.
 
1)

Huonosta suorituskyvystä aika paljon voi selittyä jo BVH-puulla, eli

Koko BVH-puu rakennetaan uusiksi joka framen välillä ja joko
A) tähän haaskataan paljon laskentatehoa (joko CPUlla tai näyttiksen shadereilla; nVidialla ei (vielä) ole rautatukea BVH-puun rakentamiseen, tai
B) se BVH-puu rakennetaan jollain hyvin nopealla algoritmillä joka tekee hyvin huonolaatuisen BVH-puun jolloin säteenjäljityksessä tulee todella paljon ylimääräisiä tarkastuksia.

Jos pelin 3D-objekteja säilytetään järkevässä tietorakenteessa jossa BVH-puun muodostaminen on otettu huomioon, voidaan BVH-puun rakentamista nopeuttaa huomattavasti, eikä tämä vaadi mitään hirveän monimutkaista. Esimerkiksi korkealla tasolla jaetaan kaikki objektit paikallaanpysyviin ja liikkuviin, ja molemmille tehdään oma haara juuritasolla BVH-puuhun, ja joka framella generoidaan uusiksi vain se liikkuvien objektien BVH-puu-haara. Toki tämä jakokin tarkoittaa yleensä yhtä lisätarkastusta/säde.

2)

Toinen mahdollisuus huonon suorituskykyyn voi olla, jos pelissä ei käytetä mitään hyvää kohinanvaimennusta polunjäljityksen yhteydessä, vaan ammutaan suuri määrä säteitä per pikseli. Toki noissa kohinanvaimennuksissakin on ongelmansa, erityisesti jos sitä tehdään temporaalisesti.
Battlefield 5's RTX ray tracing tested: is this the next level in gaming graphics?
Löytyy myös Dicen insinöörin selityksiä ongelmista...

 
... paitsi että 10 gigarays tarkoittaa 100 000 000 sädettä per frame jos peli pyörisi 100 fps. Vain tuhatkertaisesti pieleen.

Eli jokaiselle pikselille onkin full-HD-reluutiolla varaa n. 50 "säteeseen".

Se, mitä tässä nvidian "säteellä" todellisuudessa taidetaan tarkoittaa on yhtä säteen ja BVH-laatikon tai kolmion törmäystarkastusta. (en ole kuitenkaan aivan varma tästä)

Jos kolmioita on scenessä n. 100000, tarkoittaa se n. 18 tarkastusta että kaikki saadaan tarkastettua (log (100000) ~ 17). Eli joka pikseliä kohden on varaa n. kolmeen oikeaan säteeseen.

60 FPSllä on sitten varaa n. 5 oikeaan säteeseen/pikseli.
No, kerrankos menee killilleen.

Kuulostaa hulluilta sädemääriltä, koska netissä on varsin siedettävän näköisiä demoja 1 ray per pixel määrillä sopivilla tempospatial-denoisereilla. Ne tosin sopinevat huonosti heijastuksiin, jotka ovat varmaan se vaikein asia de-noisettaa hyvin.
 
No, kerrankos menee killilleen.

Kuulostaa hulluilta sädemääriltä, koska netissä on varsin siedettävän näköisiä demoja 1 ray per pixel määrillä sopivilla tempospatial-denoisereilla. Ne tosin sopinevat huonosti heijastuksiin, jotka ovat varmaan se vaikein asia de-noisettaa hyvin.

Tässä tulee vastaan se, että jokaista primäärisädettä kohden lauotaan usein muutama sekundäärisäde niistä osuma-/heijastumiskohdista.

Eli yksi primäärisäde saattaa tarkoittaa esim. viittä sädettä kokonaisuudessaan (ja 90 osumatarkastusta kokonaisuudessaan näistä viidestä säteestä)
 

Statistiikka

Viestiketjuista
264 123
Viestejä
4 572 255
Jäsenet
75 382
Uusin jäsen
Pn2025

Hinta.fi

Back
Ylös Bottom