DirectX Shader Execution Reordering lupaa suuria suorituskykyparannuksia

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
24 983
Synteettisessä esimerkkisovelluksessa SER-paransi GeForce RTX 4090:n suorituskykyä 40 % ja joidenkin Arc B -sarjan mallien jopa 90 %, mutta peleissä vastaavaa ei kannata odottaa.
directx-12-ser-20260306.jpg

Microsoft on julkaissut uuden Shader Model 6.9:n osana Agility SDK 1.619 -versiota. Lisäksi mukana on DXR 1.2 -rajapinnalle laajennettu tuki Opacity Micromaps -ominaisuudelle ja tuki Shader Execution Reordering -ominaisuudelle ja muita uutuuksia.

Shader Model 6.9:n uusia ominaisuuksia ovat tuki Long Vector -ominaisuudelle ja tietyille HLSL-käskyille lisätty tuki 16 bittisille liukuluvuille. Lisäksi se tekee pakollisia kolmesta aiemmin valinnaisesta ominaisuudesta (D3D12_FEATURE_DATA_D3D12_OPTIONS4.Native16BitShaderOpsSupported, _OPTIONS1.WaveOps, _OPTIONS_1.Int64ShaderOps).

Pelaajia kiinnostanee kuitenkin enemmän DXR 1.2 ja sen tuki Shader Execution Reordering -ominaisuudelle ja Opacity Micromaps -ominaisuuden laajennettu tuki. Opacity Micromaps mahdollistaa läpinäkyvän geometrian tunnistamisen, mikä vähentää turhaa työtä esimerkiksi säteenseurannassa. Shadear Execution Reordering puolestaan antaa varjostimille mahdollisuuden neuvoa rautaa laskettavien säteiden optimoimiseksi paremman rinnakkaisuuden saavuttamiseksi.

Microsoft esittelee Shader Execution Reordering -ominaisuutta D3D12RaytracingHelloWorld -sovelluksella ja se on kenen tahansa ladattavissa GitHubista. Ominaisuus on täysin tuettuna NVIDIAlla GeForce RTX 40 -sarjasta lähtien ja Intelillä Arc B -sarjassa, kun AMD:lla Radeon RX 9000 -sarja tukee rajapintaa, muttei toteuta varsinaista varjostinten suoritusjärjestyksen uudelleenjärjestelyä. Microsoftin testien mukaan SER paransi GeForce RTX 4090:n suorituskykyä esimerkkisovelluksessa 40 %, kun osa Arc B -sarjan näytönohjaimista ylsi jopa 90 % parempaan suorituskykyyn SER päällä. Microsoft on sensaatio-otsikoiden vuoksi lisännyt blogiinsa maininnan, että kyse on synteettisestä testistä eikä siinä saatuja parannuksia kannata odottaa sellaisenaan oikeisiin peleihin.

Lähteet: Microsoft (1), (2)
 
Viimeksi muokattu:
tarkoittaako tämä sitä ettei tarvitsisi rouskuttaa prossulla shadereita heti ekana hommana kun avaa pelin tai laiskasti pelatessa aiheuttaen nykimisiä ?
vai onko jonkinlainen säteenseurannan optimointi ?
 
tarkoittaako tämä sitä ettei tarvitsisi rouskuttaa prossulla shadereita heti ekana hommana kun avaa pelin tai laiskasti pelatessa aiheuttaen nykimisiä ?
vai onko jonkinlainen säteenseurannan optimointi ?
Ei tarkottaisi, vaan että itse GPU:lla optimoidaan niiden suoritusjärjestystä tunnistamalla niistä kaavamaisuuksia parempaa rinnakkaissuoritusta ajatellen. Se kaipaa (ja sai) kaverikseen myös OMM:n eli Opacity Micro Mapsit, joiden avulla voidaan jättää puolestaan turhia säteitä laskematta kun tiedetään näkymättömät paikat.
Koitan jos vaan on aikaa laajentaa pakettia sisältämään paremman kuvauksen ja kattamaan ton OMM:n ja muut uuden Agilityn ominaisuuksista, ehkä samalla siirtyy isoksi. Saa nähdä.
 
Viimeksi muokattu:
Tein uutisesta laajemman ja siirsin etusivulle. Ketju siirretty Uutiset-alueelle ja aloitus päivitetty.
 
Viimeksi muokattu:
Mikäköhän siinä on, että AMD on usein viimeisenä tukemassa uusia ominaisuuksia, karkeana yleistyksenä siis. Ei yllätä, että Nv on edellä, mutta Intel myös.
 
Mikäköhän siinä on, että AMD on usein viimeisenä tukemassa uusia ominaisuuksia, karkeana yleistyksenä siis. Ei yllätä, että Nv on edellä, mutta Intel myös.
Ei yllätä sekään, että yleensä nv:llä ne uudet ominaisuudet ovat Nv only. Toisaalta AMD:llä yleensä ne uudet ominaisuudet sitten toimivat kaikkien valmistajien korteilla.

Oma veikkaus on, että AMD ei ole eturintamassa koska niitä uusia ominaisuuksia tukevaa softaa on niin niukasti. Esimerkiksi säteenseurannasta lyötiin aikoinaan kauheasti rumpua, mutta kun se tuli, niin se oli saatavana kourallisessa pelejä. Ei tuollaisessa tilanteessa ole kiire
 
Ei yllätä sekään, että yleensä nv:llä ne uudet ominaisuudet ovat Nv only. Toisaalta AMD:llä yleensä ne uudet ominaisuudet sitten toimivat kaikkien valmistajien korteilla.

Oma veikkaus on, että AMD ei ole eturintamassa koska niitä uusia ominaisuuksia tukevaa softaa on niin niukasti. Esimerkiksi säteenseurannasta lyötiin aikoinaan kauheasti rumpua, mutta kun se tuli, niin se oli saatavana kourallisessa pelejä. Ei tuollaisessa tilanteessa ole kiire
Toisaalta jos tulee jälkijunassa esim. AI-konesalit/dlss/säteenseuranta niin turha itkeä monopoleista tms. kun strategia oli olla osallistumatta markkinan rakentamiseen. Se joka on ekana liikkeellä maksaa hintaa alkuvaiheessa, mutta voi myöhemmin korjata satoa.

Jos on yksi valmistaja jolla on teknologia X niin ihan ymmärrettävää että sillon edetään tahon X omalla toteutuksella. Nyt kun tuo SER on monen valmistajan piireissä olemassa niin toteutus formalisoituu osaksi standardi-rajapintoja. Nvidialla tuli SER:in eka iteraatio 2022 ulos 40x0 sarjassa.
 
Mikäköhän siinä on, että AMD on usein viimeisenä tukemassa uusia ominaisuuksia, karkeana yleistyksenä siis. Ei yllätä, että Nv on edellä, mutta Intel myös.
Lyhyt on muisti väellä. AMD oli pitkään monessa paikkaa edelläkävijänä mutta koska NVIDIAn markkinointikoneisto oli saanut jo markkinat pisteeseen jossa geforcea ostetaan oli toinen parempi tai ei, harvoja niistä standardointiin ajoissa ja ne mitä saatiinkin standardoitua jäi pienelle tuelle usein
 
Lyhyt on muisti väellä. AMD oli pitkään monessa paikkaa edelläkävijänä mutta koska NVIDIAn markkinointikoneisto oli saanut jo markkinat pisteeseen jossa geforcea ostetaan oli toinen parempi tai ei, harvoja niistä standardointiin ajoissa ja ne mitä saatiinkin standardoitua jäi pienelle tuelle usein
On niitä esimerkkejä toisinkin päin. Mutta väistit kysymyksen, miksi Intel on AMD:tä edellä.
 
On niitä esimerkkejä toisinkin päin. Mutta väistit kysymyksen, miksi Intel on AMD:tä edellä.
Intelin on pakko olla jos se haluaa edes jonkinlaisen markkinaosuuden. Ja sillä ei ole juuri muuta millä elvistellä hinnan lisäksi
 
Tästä on siis nyt esimerkkisovelllus/toteutus olemassa. Se, ettei AMD ole toteuttanut rajapinnan ko. ominaisuutta varmaan osittain johtuu siitä että ajuria kehitetään vähän toisella tavalla kuin intelillä ja nvidialla.

Onko tämä nyt directxn oma toteutus eli onko vastaavaa ominaisuutta muilla rajapinnoilla, kuten vulcanille?

Ja vaatiiko tällainen toteutus tuen peliltä erikseen vai toimiiko suoraan ajureista ja onko tietoa tukevatko nykyiset tai tulevat pelit ko. ominaisuutta jollain aikavälillä?
 
Tästä on siis nyt esimerkkisovelllus/toteutus olemassa. Se, ettei AMD ole toteuttanut rajapinnan ko. ominaisuutta varmaan osittain johtuu siitä että ajuria kehitetään vähän toisella tavalla kuin intelillä ja nvidialla.

Onko tämä nyt directxn oma toteutus eli onko vastaavaa ominaisuutta muilla rajapinnoilla, kuten vulcanille?

Ja vaatiiko tällainen toteutus tuen peliltä erikseen vai toimiiko suoraan ajureista ja onko tietoa tukevatko nykyiset tai tulevat pelit ko. ominaisuutta jollain aikavälillä?
Vulkanilla on VK_EXT_ray_tracing_invocation_reorder, joka on uudelleen nimetty NVIDIAn oma laajennos.
 

Statistiikka

Viestiketjuista
304 499
Viestejä
5 162 476
Jäsenet
82 491
Uusin jäsen
tume116

Hinta.fi

Back
Ylös Bottom