Säteenseuranta, RTX, DirectX - Uusi turha hype vai oikeasti toimiva?

En oikein löytänyt parempaakaan threadiä niin lisätään tähän ketjuun Unreal Engine 5 materiaalia. UE5:en early access versio on tarjolla: Unreal Engine 5 is now available in Early Access!

Mukana tulevassa demossa aika perusvaatimukset raudalle: Valley of the Ancient Sample | Unreal Engine Documentation

This sample is especially graphically intensive, and requires a powerful video card to run at a stable framerate. We also recommend installing it on an SSD, as Nanite and Virtual Textures depend on fast read speeds for the best possible results. The recommended hardware specifications are as follows:

Recommended System Specs (100% Screen Percentage)
12-core CPU at 3.4 GHz
64 GB of system RAM
GeForce RTX 2080 / AMD Radeon 5700 XT or higher

 
Kiva olis kokeilla tuota, mutta tässä törmää kyllä siihen harvinaiseen ongelmaan, että 16GB keskusmuistia aivan liian vähän.
 
ue5:ssa näemmä myös dlss. Yritin etsiä, jos amd olisi jotain sanonut ue5:sta, mutta ei osunut google haaviin. Jännä nähdä miten ssd vaikuttaa muistinkulutukseen. Kuitenkin konsoleilla ja nopealla ssd:lla toimii ue5 ihan hyvin 16GB muistilla. Videon kuvahan oli konsoleilla renderöityä.

NVIDIA is working with Epic Games to enable a broad suite of technologies in UE5, starting with two of our most popular features — Deep Learning Super Sampling (DLSS) and NVIDIA Reflex.

DLSS taps into the power of a deep learning neural network to boost frame rates and generate beautiful, sharp images. Reflex aligns CPU work to complete just in time for the GPU to start processing, minimizing latency and improving system responsiveness.

DLSS source code and NVIDIA Reflex is available now in Unreal Engine 5, and we will be releasing the DLSS plugin for UE5 in the coming weeks.

 
ue5:ssa näemmä myös dlss. Yritin etsiä, jos amd olisi jotain sanonut ue5:sta, mutta ei osunut google haaviin. Jännä nähdä miten ssd vaikuttaa muistinkulutukseen. Kuitenkin konsoleilla ja nopealla ssd:lla toimii ue5 ihan hyvin 16GB muistilla. Videon kuvahan oli konsoleilla renderöityä.



Olikos tosta demosta jotakin framerate-statseja konsoleiden osalta? 32 GB RAM on nykyaikaa joka tapauksessa. On vähän katossa tilaa, kun peli ahnehtii.
 
Olikos tosta demosta jotakin framerate-statseja konsoleiden osalta? 32 GB RAM on nykyaikaa joka tapauksessa. On vähän katossa tilaa, kun peli ahnehtii.

PC taitaa olla 30fps noilla suositetuilla spekseillä. Konsoleista en tiedä. Aikaisempi konsolidemo ps5:lla oli 30fps. Mietityttää, että kuinka paljon noihin pc rautavaatimuksiin vaikuttaa se, että DirectStorage ja rautapohjainen purku eivät ole vielä win10:ssa implementoituna. Voisiko pc-versio joutua hitaalle polulle missä cpu:lla puretaan kamaa ja iso määrä ram:ia kuluu cacheksi?
 
AMD:n UE5 blogipostaus. DLSS vs. TSR kamppailua tiedossa. AMD:n postaus on todella hyvä. Käyvät läpi ue:n historiaa ja mitä ue5 tarjoaa.

Temporal Super Resolution: TSR is a new technique of upscaling a lower resolution frame to maximize performance and visual fidelity. AMD has worked closely with Epic to optimize TSR features on Radeon™ powered systems. A standard feature of UE5, TSR is enabled for all GPUs and provides state-of-the-art upscaling not just on PC, but on PlayStation 5, and Xbox Series X/S, too.

 
AMD:n UE5 blogipostaus. DLSS vs. TSR kamppailua tiedossa. AMD:n postaus on todella hyvä. Käyvät läpi ue:n historiaa ja mitä ue5 tarjoaa.




Hyvä juttu, että ainakin UE5:n tulee joku DLSS vastine, mitä AMD:n korteilla voi pyöritellä. Tuo TSR varmasti toimii myös NVIDIA:n korteilla, mutta DLSS aika varmasti niillä parempi.
 
Hyvä juttu, että ainakin UE5:n tulee joku DLSS vastine, mitä AMD:n korteilla voi pyöritellä. Tuo TSR varmasti toimii myös NVIDIA:n korteilla, mutta DLSS aika varmasti niillä parempi.

Toimii myös konsoleilla TSR. Epic:n algoritmi tuo TSR. amd/nvidia/intel optimoivat sen omalle raudallensa.
 
UE5:en dokumentaatiossa on hyvää kamaa

Benefits of Nanite
  • Multiple orders of magnitude increase in geometry complexity, higher triangle and objects counts than has been possible before in real-time
  • Frame budgets are no longer constrained by polycounts, draw calls, and mesh memory usage
  • Now possible to directly import film-quality source arts, such as ZBrush sculpts and photogrammetry scans
  • Use high-poly detailing rather than baking detail into normal map textures
  • Level of Detail (LOD) is automatically handled and no longer requires manual setup for individual mesh's LODs
  • Loss of quality is rare or non-existent, especially with LOD transitions

During rendering: clusters are swapped on the fly at varying levels of detail based on the camera view, and connect perfectly without cracks to neighboring clusters within the same object. Data is streamed in on demand so that only visible detail needs to reside in memory. Nanite runs in its own rendering pass that completely bypasses traditional draw calls

Virtual Textures are not required to be used with Nanite, but they are highly recommended. Virtual Textures are an orthogonal Unreal Engine feature with similar goals for texture data that Nanite achieves with mesh data.
 
PC taitaa olla 30fps noilla suositetuilla spekseillä. Konsoleista en tiedä. Aikaisempi konsolidemo ps5:lla oli 30fps. Mietityttää, että kuinka paljon noihin pc rautavaatimuksiin vaikuttaa se, että DirectStorage ja rautapohjainen purku eivät ole vielä win10:ssa implementoituna. Voisiko pc-versio joutua hitaalle polulle missä cpu:lla puretaan kamaa ja iso määrä ram:ia kuluu cacheksi?
Nyt oli vähän hepreaa, mutta ehkä ymmärrän. Tää konsoleiden "innovaatio" ei oo vielä ajettu winukkaan?
 
Nyt oli vähän hepreaa, mutta ehkä ymmärrän. Tää konsoleiden "innovaatio" ei oo vielä ajettu winukkaan?

Optimaalinen rajapinta ssd levyn käyttämiseen ja datan purkamiseen on vasta tulossa windowsiin. Konsoleissa tuo on jo olemassa. Konsoleissa lisäksi etuna rautapurku niin ei tarvi cpu:ta tai gpu:ta rasittaa. Konsolien tukemat pakkausalgoritmit about puolittavat tekstuurien yms. koon levyllä verrattuna entiseen tilanteeseen. Tuo on tärkeää UE5:en kanssa, kun se pyrkii lennosta lataamaan tarvittavat assetit sen sijaan, että käytettäisiin perinteistä ladataan taso muistiin tapaa. Tuo on tärkeää myös sen takia, että UE5 tarjoaa mahdollisuuden käyttää älyttömän tarkkoja assetteja, jotka eivät muuten mahtuisi muistiin. Spoilerissa microsoftin DirectStorage esitys.
 
Viimeksi muokattu:
ue5:en dokumentaatiossa paljon jännittävää tavaraa. Lumen:in tavoite konsoleille 1080p reso ja 30 tai 60fps riippuen tilanteesta. 1080p:sta skaalataan 4k:hon TRS:an avulla. Kyllä tuossa taitaa olla ihan järeimmillekin pc-raudoille vielä tehtävää, jos haluaa 4k:ta pelailla namit kaakossa isolla resolla ue5 peleissä. Tai sitten tyytyminen dlss/trs:aan ja ylöspäinskaalaukseen. Näyttää olevan myös softa ja rauta säteenseurantaa enginessä.

Lumen uses multiple ray tracing methods to solve Global Illumination and Reflections. Screen traces are done first, followed by a more reliable method.

Lumen uses Software Ray Tracing against Signed Distance Fields by default. This tracing representation is supported on any hardware supporting Shader Model 5 (SM5)

Hardware Ray Tracing supports a larger range of geometry types than Software Ray Tracing, in particular it supports tracing against skinned meshes. Hardware Ray Tracing also scales up better to higher qualities

Lumen defaults for the Epic scalability level are set for a 30 fps budget (8ms Global Illumination and Reflections) at 1080p on next-generation consoles. Lumen relies heavily on Unreal Engine 4's Temporal Upsampling with the new UE5 Temporal Super Resolution algorithm for 4k output. Under the High engine scalability level, Lumen uses defaults targeting 60 fps. Lumen is disabled under Low and Medium scalability levels.

 
Tekstuurien pakkaus on ikivanha keksintö:
Kts esim:Using ASTC Texture Compression for Game Assets

PS5 SSD nopeus:
==>> Pakatulle datalle max 9GB/s (siis ottaa pakkauksen huomioon) Raakanopeus on se 5,5GB/s
Mitä tuo sitten vastaa:
Raakanopeus n 1 DDR2 667 kanava.
Pakattu nopeus: Alle 1 DDR3 1333 kanava.

Eli jos tuo on kovin toimiva järjestelmä, niin mihin näyttiksissä tarvitaan kallista erikoismuistia leveällä väylällä kun sinne voisi nykäistä yhden tai pari DDR4 kampaa, jotka olisivat 17-25 GB/S eli varmasti riittäviä..
 
Viimeksi muokattu:
Tekstuurien pakkaus on ikivanha keksintö:
Kts esim:Using ASTC Texture Compression for Game Assets

Tuo pakkaus mihin linkkaat on "löysä". Löysä sen vuoksi, että tuon pakkauksen on tuettava satunnaisia hakuja, jotta gpu voisi käyttää pakattua tekstuuria. Uusista konsoleista ja DirectStoragesta tuttu pakkaus tulee tuon päälle. Tuplapakkaus puolittaa about tekstuurien koon. Se miten tuo toimii esim. ps5:ssa on, että ssd:lta pyydetään isohkoa palasta tekstuurista(256kB, 512kB tms.), io-ohjaimessa oleva purkupiiri purkaa tiukemman pakkauksen. Purettu tekstuuri siirretään suoraan muistiin. Tuo muistiin siirretty tekstuuri on edelleen pakattu tavalla, jota gpu tukee. Tämä tarkoittaa esim. sitä, että ps5:en ssd, jonka nopeus on 5.5GB/s voi suoltaa purettua dataa levyltä ulos n. 11GB/s. PS5:en purkupiirin maksimi on lähempänä 30GB/s, mutta hyvin harva data pakkaantuu niin tiukkaan. Toinen bonus tässä asiassa on asennusten pienentyminen, kun data levyllä on tiukemmin pakattu. Tän näkee hyvin ps5 pelien koossa. Ratchet&clank, miles morales jne. Yllättävän vähän vievät levytilaa.

PS5:en käyttämä pakkaus on oikeasti vielä vähän monimutkaisempi. Data on järjestelty uusiksi pakkaustiiviyden optimoimiseksi. Mun käsityksen mukaan bcpack mitä microsoft käyttää tekee samanlaista datan uudelleenjärjestelyä pakkaustiiviyden optimoimiseksi.
 
Viimeksi muokattu:
PS5 SSD nopeus:
==>> Pakatulle datalle max 9GB/s (siis ottaa pakkauksen huomioon) Raakanopeus on se 5,5GB/s
Mitä tuo sitten vastaa:
Raakanopeus n 1 DDR2 667 kanava.
Pakattu nopeus: Alle 1 DDR3 1333 kanava.

Eli jos tuo on kovin toimiva järjestelmä, niin mihin näyttiksissä tarvitaan kallista erikoismuistia leveällä väylällä kun sinne voisi nykäistä yhden tai pari DDR4 kampaa, jotka olisivat 17-25 GB/S eli varmasti riittäviä..

Datan uudelleenjärjestely mistä mainitsin lisäsi pakkauksen tiiviyttä. Nykyään saa tekstuureille 1:2 pakkauksen, eli 11GB/s ps5:lla. Osittain tuo pakkaus on myös softaongelma ja ei täysin kovakoodattu.

Sony has previously published that the SSD is capable of 5.5 GB/s and expected decompressed bandwidth around 8-9 GB/s, based on measurements of average compression ratios of games around 1.5 to 1. While Kraken is an excellent generic compressor, it struggled to find usable patterns on a crucial type of content : GPU textures, which make up a large fraction of game content. Since then we've made huge progress on improving the compression ratio of GPU textures, with Oodle Texture which encodes them such that subsequent Kraken compression can find patterns it can exploit. The result is that we expect the average compression ratio of games to be much better in the future, closer to 2 to 1.

Näkisin eri tavalla tuon. Nopeaa muistia tarvitaan vähemmän, kun voidaan pitää lähinnä se data muistissa mitä juuri sillä hetkellä käytetään. Muistin pitää kuitenkin edelleen olla nopeata, että voidaan suorittaa laskentaa.


UE5:en dokkareissa oli tällainen. Iso pyrkimys on siihen, että vain se kama on muistissa mitä oikeasti ns. tarvitaan. Nopea SSD + hyvä api mahdollistaa tuon. Vihdoin ja viimein saadaan ssd:sta oikeasti iloa peleihin.
During rendering: clusters are swapped on the fly at varying levels of detail based on the camera view, and connect perfectly without cracks to neighboring clusters within the same object. Data is streamed in on demand so that only visible detail needs to reside in memory. Nanite runs in its own rendering pass that completely bypasses traditional draw calls

Ja esim. ratchet&clank:Lin tekijät sanoivat näin uudesta enginestään.
 
Viimeksi muokattu:
Okei, jos en ollut jo vakuuttunut, niin nyt olen. Joku kerennyt jo kokeilemaan toimiiko se ollenkaan.


 
Viimeksi muokattu:
Huom!: Vanhoja viestejä voi editoida ja lisätä niihin, eikä tarvitse ripuloida kymmentä postausta putkeen..
 
Kiva olis kokeilla tuota, mutta tässä törmää kyllä siihen harvinaiseen ongelmaan, että 16GB keskusmuistia aivan liian vähän.
Kokeilin nyt kuitenkin ja ihan riittävän hyvin pyörähtää 16 gigallakin, että pääsee ihmettelemään miltä tuo Nanite elävässä elämässä näyttää. Tökkii vähän väliä kun ajaa tuota demoa, mutta ei edes kovin pahasti.
 
Kokeilin nyt kuitenkin ja ihan riittävän hyvin pyörähtää 16 gigallakin, että pääsee ihmettelemään miltä tuo Nanite elävässä elämässä näyttää. Tökkii vähän väliä kun ajaa tuota demoa, mutta ei edes kovin pahasti.
Minkälainen on muu rauta?
 
Nuille Unreal5 demoilla kun onanoi niin kannattaa muistaa pari faktaa:
  • Unreal demot eivät ole koskaan realisoitunut oikeisiin konsolipeleihin oikein mitenkään. Demo on yleensä koko generaation ajan paremman näköinen mitä yksikään kyseisellä enginellä tehty oikea peli joka mahtuu yhdelle blu-ray levylle.
  • Nyt on demoiltu tosi näyttäviä skenejä uskomattoman tarkoilla lähdemateriaaleilla. Miten tuollaisia teratavuluokan assetteja jaellaan loppukäyttäjille? No luonnollisesti ei mitenkään ja peli tulee sillä yhdellä blu-ray levyllä jakeluun. 50gigan day one asset patch päälle niin ollaan vieläkin helvetin kaukana esim 5 teratavua vievistä Quixel Megascaneista joilla engineä demottiin.
Noh, enginehän on vasta previewissä ja Nanitekin on vasta alkutekijöissään. Ns. "oikeat" tuotantovalmiit pelit jotka hyödyntävät näitä hienoja kikkoja viimeisen päälle ovat enemmänkin PS6, Xbox Series Z kamaa ja jollekkin RTX3090:lle nauretaan kun kolmen-neljän vuoden päästä pelataan UE5 tehtyä triple-A peliä AMD:n tai nVidian 200TFLOP+ MCM GPU piireillä.

Nättejä demoja ja hienoa jälkeä toistaiseksi. Olisi kiva nähdä vain oikea peli pyörimässä nyt tuotannossa olevalla raudalla 1440p60fps - 120fps skaalattuna 4k heidän super resolution tekniikalla.
 

Amd rdna 2 näytönohjaimet integroidaan uuden sukupolven Samsungin exynos piirissä jossa on säteenseuranta eli ehkä ensi vuonna säteenseuranta on puhelimien peleissä totta.
 

Amd rdna 2 näytönohjaimet integroidaan uuden sukupolven Samsungin exynos piirissä jossa on säteenseuranta eli ehkä ensi vuonna säteenseuranta on puhelimien peleissä totta.
1 Watin tehobudjetilla ei valitettavasti pitkälle pötkitä.. Lisäksi sirun kokokin on erittäin rajoitettu.. Sitäpaitsi muistelisin, että säteenseuranta on jo ollut jossain puhelin GPU:ssa, Sillä vai ei tehnyt käytännössä mitään..
 
1 Watin tehobudjetilla ei valitettavasti pitkälle pötkitä.. Lisäksi sirun kokokin on erittäin rajoitettu.. Sitäpaitsi muistelisin, että säteenseuranta on jo ollut jossain puhelin GPU:ssa, Sillä vai ei tehnyt käytännössä mitään..

2014 oli tuommoista demoa. Ihan OK ottaen huomioon että 7v sitten ja tehobudjetti tosiaankin 1W. Youtubessa videota jos hakee.
 
Unreal Engine5:en on kyllä jotain muuta. Melko näyttäviä kenttiä jengi rakentelee ue5:en early access versiolla

 
Unreal Engine5:en on kyllä jotain muuta. Melko näyttäviä kenttiä jengi rakentelee ue5:en early access versiolla

Gamers nexus käsitteli tuota UE5:ttä tekniikkauutiskatsauksessa. Epic tietty mainostaa uutta engineään ja lumen on yksi pääfeatureista, joten totta kai sitä hehkutetaan. Silti vähän yllätti tuo boldattu kohta (boldaukset on omia). Epicin mielestä siis säteenseuranta on liian hidasta nykyraudalla, merkattu kehitystyökaluissa vanhentuneeksi ja lumen hoitaa samaa hommaa paremmin. Tietty ko. feature toimii sillä tuhnummallakin raudalla, niin ei ihme, että enginen kehittäjä markkinoi sitä. Tietty Epicin lausunnossa oli, että yhä tehdään töitä Nvidian kanssa RT:n kanssa ja Lumen nopeutuu RT raudalla.

EDIT: lukihan tuossa, että ray tracing rauta parantaa laatua, omiin silmiin osui vain alempi "can accelerate more".

Quick note on the Lumen stuff from Epic's documentation that further clarifies what it's doing: "Lumen uses Software Ray Tracing through Signed Distance Fields by default, but can achieve higher quality on supporting video cards when Hardware Ray Tracing is enabled."

Epic Games this week posted major announcements about its Unreal Engine 5, and we’ve already been using it internally for our upcoming memory timings animations. The Unreal Engine 5 update is important for the hardware market, too, and the reason is made obvious by looking at Epic’s new interface: Ray Tracing is now marked as “deprecated.” Epic determined that real-time ray tracing is, at this point, too costly in performance and too unreliable in deployment, and so has developed its own globally applicable solution called “Lumen.”

Epic said:

“In Unreal Engine 4, features such as Screen Space Global Illumination were not reliable and Ray Tracing Global Illumination (RTGI) was not performant for games with a high enough quality, and didn't integrate with other important systems.”

“Lumen is our fully dynamic real-time global illumination solution that immediately reacts to scene and light change, making for more believable experiences. The GI hooks in directly with our time of day settings, allowing for true physically-based settings for photorealistic environments. Lumen solves dynamic diffuse indirect lighting. For example, light bouncing diffusely off of a surface picks up the color of that surface and reflects the colored light onto other nearby surfaces; this effect is called color bleeding. Meshes in the scene also block indirect lighting, which also produces indirect shadowing.”

Lumen is usable for indirect lighting, global illumination, emissive materials, reflections, and all light types. That includes directional, sky, point, spot, and rect lights. NVIDIA and Epic are still working directly together on RT support, though, and Lumen can accelerate more with RT hardware.

Additionally, Epic announced its Temporal Super Resolution solution to help upscale image quality. Epic said:

“UE5’s new anti-aliasing solution, temporal super resolution, keeps up with all this geometric detail to create sharper, more stable images than before, with quality approaching true native 4K at the cost of 1080p.”
 
Viimeksi muokattu:
Suora triangle based RT on deprekoitu ja RT onkin abstraktoitu Lumenin sisään ja engine käyttää hardware RT:tä aina kun se on järkevää. Iltapäivälehdissä tuo on kääntyny nyt niin että nVidia (ja AMD) on tehnyt nyt väärin kun panostivat RT blokkeihin koska se on "deprekoitu". Kaikki rauta käytetään hyödyksi, nyt kyse on että miten optimoidaan rauta 100% käyttöön.
 
Tarkoittaako tuo käytännössä mitä AMD:n kannalta? Eli tarkoitan tällä sitä, että nykyiset RT toteutukset on optimoitu noille tensor coreille (eli NVIDIAn tekniikalle) niin onko tämä tekniikka sellainen että se skaalaa paremmin suorituskyvyn suhteen AMD:n cu -toteutuksen kanssa (siis suhteessa, ei sitä että AMD:n toteutus olisi nopeampi).

Hardware Unboxed ja muutamat muutkin tosiaan olleet vähän sitä mieltä että AMD:n RT suorituskyky nousee vähitellen uudemmissa peleissä NVIDIAn verrattuna (taas, pääseekö samalle tasolle on toki aivan toinen asia) juuri tuon takia että siirrytään sellaisiin toteutuksiin jotka pyörivät AMD:n korteilla paremmin kuin nuo vanhat.
 
Tarkoittaako tuo käytännössä mitä AMD:n kannalta? Eli tarkoitan tällä sitä, että nykyiset RT toteutukset on optimoitu noille tensor coreille (eli NVIDIAn tekniikalle) niin onko tämä tekniikka sellainen että se skaalaa paremmin suorituskyvyn suhteen AMD:n cu -toteutuksen kanssa (siis suhteessa, ei sitä että AMD:n toteutus olisi nopeampi).

Hardware Unboxed ja muutamat muutkin tosiaan olleet vähän sitä mieltä että AMD:n RT suorituskyky nousee vähitellen uudemmissa peleissä NVIDIAn verrattuna (taas, pääseekö samalle tasolle on toki aivan toinen asia) juuri tuon takia että siirrytään sellaisiin toteutuksiin jotka pyörivät AMD:n korteilla paremmin kuin nuo vanhat.
Siis pohjallahan toteutus on vendor specific eli nVidian raudasta otetaan täysi hyöty irti käyttäen nVidian best practices RT-coreille ja AMD:lla otetaan edelleen myöskin täysi hyöty irti heidän omalla toteutustavallaan. Suhteellinen ero varmaan säilyy edelleen RT raudan osalta eli silloin kun käytetään hardware RT:tä niin nVidia on nopeampi.

Ne skenaariot on asia erikseen joissa AMD:lle on optimoitu RT koodi ja nVidialla se pyörii päin persettä hyödyntäen vain vaikka 20% tehoista. Tuommoisesta tilanteesta voi vain vetää yhden johtopäätöksen että pelinkehittäjä on paska kun ei tee kunnon toteutusta kummankin leirin korteille.
 
Siis pohjallahan toteutus on vendor specific eli nVidian raudasta otetaan täysi hyöty irti käyttäen nVidian best practices RT-coreille ja AMD:lla otetaan edelleen myöskin täysi hyöty irti heidän omalla toteutustavallaan. Suhteellinen ero varmaan säilyy edelleen RT raudan osalta eli silloin kun käytetään hardware RT:tä niin nVidia on nopeampi.

Ne skenaariot on asia erikseen joissa AMD:lle on optimoitu RT koodi ja nVidialla se pyörii päin persettä hyödyntäen vain vaikka 20% tehoista. Tuommoisesta tilanteesta voi vain vetää yhden johtopäätöksen että pelinkehittäjä on paska kun ei tee kunnon toteutusta kummankin leirin korteille.

Tuntematta RT-toteutuksia sen kummemmin, eikö sen pitäisi mennä niin, että pelinkehittäjille on yksi rajapinta (DirectX 12, pelimoottorin oma tms.) ja sen alla sitten kirjastot on toteutettu molemmille laitteille optimoidusti niin, ettei pelinkehittäjän tarvitse miettiä optiomointia eri laitteistoympäristöihin?
 
Tuntematta RT-toteutuksia sen kummemmin, eikö sen pitäisi mennä niin, että pelinkehittäjille on yksi rajapinta (DirectX 12, pelimoottorin oma tms.) ja sen alla sitten kirjastot on toteutettu molemmille laitteille optimoidusti niin, ettei pelinkehittäjän tarvitse miettiä optiomointia eri laitteistoympäristöihin?
Tietääkseni DX api on kuin mikä tahansa hyvä API eli se tarjoaa rajapinnat primitiivioperaatioiden toteutukseen jotka tulee sitten vendoreilta. Pelienginen kehittäjä käyttää sitten näitä rajapintoja luomaan esimerkiksi sen RT renderpathin. Tuon pathin voi tehdä oletuksena vaikka niin että optimoi sen nVidian korteille mutta se pyörii paskasti AMD korteilla. Tarvitaan algoritmiosaamista että renderpath toimii kummankin valmistajan korteilla optimaalisesti.

Ei siis ole olemassa mitään MakeAwesomeRtImage() kutsua. Siihen on monesti syynsä miksi joku peliengine pyörii paremmin nVidia korteilla ja joku paremmin AMD korteilla. Suurin vastuu on enginen kehittäjillä käyttää rajapintoja optimaalisesti kaikkien valmistajan korteilla. E: Jos render enginen teko olisi niin helppoa että wikipediasta kopsatun RT-flowchartin avulla vain kirjoittaisi DX kutsut peräkkäin niin senhän tekisi Pihtiputaan mummokin itse ja tuommoiset turhat Unreal Enginet olisivat vain rahastusta niiltä laiskoilta jotka ei jaksaisi tehdä edes sitä.
 
Oli tuosta Unreal 5:sta jo benchmarkkia saatavilla, yllättäen taas venäläisten toimesta. Eli kehityspaketin mukana ollut Valley Of The Ancient Demo ja ajot sille eri prosuilla/näytönohjaimilla. Asetukset tapissa, resoluution skaalaus pois päältä.

AMD meni kyllä yllättävän kovaa. Normi 6800 paineli 3090:n ohi 1080p resolla. 1440p:lla 6900xt johti vielä yhden fpsn keulalla pakkaa, 3090 meni lopulta 4K:lla vastaavasti yhden fps:n johtoon.

Vram kulutus oli aika maltillista, noin 6.7Gb 4K:lla, vaikka se vaihteli aikalailla kortista toiseen, mutta nuo 6Gb kortit eivät romahtaneet suorituskyvyssä, eli selkeästi tuo osaa skaalata itseään. Prosupuolella Intelit kulki paremmin, mitä 5000 sarjan ryzenit.
 
Gamers nexus käsitteli tuota UE5:ttä tekniikkauutiskatsauksessa. Epic tietty mainostaa uutta engineään ja lumen on yksi pääfeatureista, joten totta kai sitä hehkutetaan. Silti vähän yllätti tuo boldattu kohta (boldaukset on omia). Epicin mielestä siis säteenseuranta on liian hidasta nykyraudalla, merkattu kehitystyökaluissa vanhentuneeksi ja lumen hoitaa samaa hommaa paremmin.

Ei epic noin sanonut. HW säteenseuranta on ue5:ssa laatua parantava, joskin nykyraudalla fps:aa hidastava ominaisuus. Kyse on enemmänkin suorituskyky vs. laatu kysymyksestä

Lumen uses Software Ray Tracing through Signed Distance Fields by default, but can achieve higher quality on supporting video cards when Hardware Ray Tracing is enabled.
Hardware Ray Tracing supports a larger range of geometry types than Software Ray Tracing, in particular it supports tracing against skinned meshes. Hardware Ray Tracing also scales up better to higher qualities — it intersects against the actual triangles and has the option to evaluate lighting at the ray hit instead of the lower quality Surface Cache. However, Hardware Ray Tracing has significant scene setup cost and currently cannot scale to scenes with more than 100,000 instances. Dynamically deforming meshes, like skinned meshes, also incur a large cost to update the Ray Tracing acceleration structures each frame, proportional to the number of skinned triangles.
Limitations of Software Ray Tracing
Software Ray Tracing has some limitations relating to how you should work with it in your projects, and what types of geometry and materials it currently supports.

This is not an exhaustive list of known issues or limitations, but is largely representative of what you should expect while working with Lumen Software Ray Tracing in Unreal Engine 5 Early Access.
Geometry Limitations
  • Only Static Meshes, Instanced Static Meshes, and Hierarchical Instanced Static Meshes are represented in the Lumen Scene.
  • Landscape geometry is not currently represented in the Lumen Scene and therefore does not bounce lighting. This will be supported in a future release of the engine.
Material Limitations
  • World Position Offset (WPO) is not supported.
  • Transparent materials are ignored by Distance Fields and treat Masked materials as opaque. This can cause significant over-shadowing on foliage, which has large areas of leaves masked out.
  • Distance Fields are built off of the properties of the material assigned to the Static Mesh Asset, rather than the override component. Overriding with a material that has a different Blend Mode or Two-Sided property will cause a mismatch between the triangle representation and the Distance Field.
Workflow Limitations
  • Software Ray Tracing requires levels to be made out of modular pieces. Walls, floors, and ceilings should be separate meshes. Large meshes, like mountains, will have poor representations and may cause self-occlusion artifacts.
  • Walls should be no thinner than 10 centimeters (cm) to avoid light leaking.
  • Mesh Distance Field resolution is assigned based on the imported scale of the Static Mesh. A mesh that is imported very small and then scaled up on the component will not have sufficient Distance Field resolution. If you use significant scaling on placed instances in a level, use Distance Field Resolution Scale to compensate.
  • Distance Fields cannot represent extremely thin features, or one-sided meshes seen from behind. Avoid artifacts by ensuring the viewer doesn't see triangle back faces of one-sided meshes.

Perffi benchmarkit on tässä vaiheessa ihan turhia. Engine on niin kesken että hyvin mahdoton sanoa mihin tilanne kääntyy, kun fiitsörit on oikeasti kasassa ja optimoinnit tehty

 
Pitäähän se taas sanoa noita UE5-demoja katsellessa että fotorealistiselta näyttää. Ekan kerran noin tuli sanottua muistaakseni 3dmark 2000:sta.
 
Pitäähän se taas sanoa noita UE5-demoja katsellessa että fotorealistiselta näyttää. Ekan kerran noin tuli sanottua muistaakseni 3dmark 2000:sta.

Unreal enginen demot on aina olleet komeita, pelit on vain harvemmin päässeet demojen tasolle grafiikoiltaan.
 
Legot näyttävät melko hyvälle säteenseurannan avustuksella. Mielenkiintoisen oloinen puzzle-peli.

 
Uusin ue5 engine video demonstroi todella hyvin mikä ero on ei dynaamista valaistusta vs. softa säteenseuranta vs. rauta säteenseuranta. Hienosti ue5:ssa naitetaan softa ja säteenseuranta yhteen vältellen molempien heikkoja puolia. Siihen päälle nanite:lla taiottu supertarkka geometria ja screenspace algoritmiteilla pienet detaljit. Lopputulos on melko uskomatonta reaaliaikaiseksi grafiikaksi.

Videon alkupuolella epicin heput puhuivat TSR algoritmista joka skaalaa 1080p kuvan temporaalisella algoritmilla 4k:ksi. Heidän mukaan kuvanlaatu on liki 4k. Kuulostaa hyvin samanlaiselta lupaukselta kuin dlss.

Linkki osuu sopivaan kohtaan videota
 
Viimeksi muokattu:
Neuroverkoilla lisää vauhtia säteenseurantaan? Toivottavasti tämä esitys tulee nettiin nähtäväksi ilman maksumuuria. Paperi ja koodi on jo netissä.



 
Uusin ue5 engine video demonstroi todella hyvin mikä ero on ei dynaamista valaistusta vs. softa säteenseuranta vs. rauta säteenseuranta. Hienosti ue5:ssa naitetaan softa ja säteenseuranta yhteen vältellen molempien heikkoja puolia. Siihen päälle nanite:lla taiottu supertarkka geometria ja screenspace algoritmiteilla pienet detaljit. Lopputulos on melko uskomatonta reaaliaikaiseksi grafiikaksi.

Videon alkupuolella epicin heput puhuivat TSR algoritmista joka skaalaa 1080p kuvan temporaalisella algoritmilla 4k:ksi. Heidän mukaan kuvanlaatu on liki 4k. Kuulostaa hyvin samanlaiselta lupaukselta kuin dlss.

Tuota on oikeasti hiton kiinnostava enginepäivitys. Ainakin tällä hetkellä siinä on bugi/feature, joka aiheuttaa sen, että geometriakin skaalautuu resoluution mukaan.
Saa nähdä miten se tulee lopulta reagoimaan temporaalisten skaalaimien kanssa. Eli yritetäänkö ultratarkkaa geometriaa työntää pienille resoluutioille, vaikka ne ei erotu niissä vai tuleeko siitä vain natiiviresojen herkkua.
 
Tuota on oikeasti hiton kiinnostava enginepäivitys. Ainakin tällä hetkellä siinä on bugi/feature, joka aiheuttaa sen, että geometriakin skaalautuu resoluution mukaan.
Saa nähdä miten se tulee lopulta reagoimaan temporaalisten skaalaimien kanssa. Eli yritetäänkö ultratarkkaa geometriaa työntää pienille resoluutioille, vaikka ne ei erotu niissä vai tuleeko siitä vain natiiviresojen herkkua.
Niin, eikö koko Naniten idea ole se että geometriabudjetti framelle skaalautuu nimenomaan resoluution mukaan? Mitä järkeä framelle on ladata turhaa geometriaa mikä ei näy missään?
 
Niin, eikö koko Naniten idea ole se että geometriabudjetti framelle skaalautuu nimenomaan resoluution mukaan? Mitä järkeä framelle on ladata turhaa geometriaa mikä ei näy missään?

Temporal tekniikkaa edelleen kehittämällä voisi saada siitä jotain extraa irti. En tiedä vaatisiko se sitten skaalaimen kehittämistä checkerboard tai lomitetun kuvan käyttöön, jotta geometrian saisi paremmin poimittua skaalaukseen mukaan.

On esim unrealin dokkareissakin. Boldaus on oma ja muistin väärin, sen paremman geometriankin saa päälle.

"
Temporal Super Resolution

Nanite micropolygon geometry and the fidelity demands of the next generation of games have increased the amount of detail displayed on screen like never before. To meet these demands, we've written a Temporal Super Resolution algorithm from scratch that replaces UE4's TemporalAA for higher-end platforms.

Temporal Super Resolution has the following properties:

  • Output approaching the quality of native 4k renders at input resolutions as low as 1080p, allowing for both higher framerates and better rendering fidelity.
  • Less ghosting against high-frequency backgrounds.
  • Reduced flickering on geometry with high complexity.
  • Runs on any Shader Model 5 capable hardware: D3D11, D3D12, Vulkan, PS5, XSX. Metal coming soon.
  • Shaders specifically optimized for PS5's and XSX's GPU architecture.
In Unreal Engine 5 Early Access, Temporal Super Resolution is enabled by default in your project settings.

By default, the rendered geometric detail will adapt to the rendering resolution leading to difference seen in the comparison above. However, the geometric details can optionally be tweaked to use same geometry as Native 4K rendering to reach an output a lot closer to native 4k. "
 
Temporal tekniikkaa edelleen kehittämällä voisi saada siitä jotain extraa irti. En tiedä vaatisiko se sitten skaalaimen kehittämistä checkerboard tai lomitetun kuvan käyttöön, jotta geometrian saisi paremmin poimittua skaalaukseen mukaan.

On esim unrealin dokkareissakin. Boldaus on oma ja muistin väärin, sen paremman geometriankin saa päälle.

"
Temporal Super Resolution

Nanite micropolygon geometry and the fidelity demands of the next generation of games have increased the amount of detail displayed on screen like never before. To meet these demands, we've written a Temporal Super Resolution algorithm from scratch that replaces UE4's TemporalAA for higher-end platforms.

Temporal Super Resolution has the following properties:

  • Output approaching the quality of native 4k renders at input resolutions as low as 1080p, allowing for both higher framerates and better rendering fidelity.
  • Less ghosting against high-frequency backgrounds.
  • Reduced flickering on geometry with high complexity.
  • Runs on any Shader Model 5 capable hardware: D3D11, D3D12, Vulkan, PS5, XSX. Metal coming soon.
  • Shaders specifically optimized for PS5's and XSX's GPU architecture.
In Unreal Engine 5 Early Access, Temporal Super Resolution is enabled by default in your project settings.

By default, the rendered geometric detail will adapt to the rendering resolution leading to difference seen in the comparison above. However, the geometric details can optionally be tweaked to use same geometry as Native 4K rendering to reach an output a lot closer to native 4k. "
Aivan en heti omaksunut tuota näkökulmaa että kun TAA:lla renderöidään vaikka 3000x1500 resolla ja skaalataan kuva 4k niin jotain geometria nyansseja voi jäädä uupumaan corner caseissa. Toki tuohon varmaan jotain tweakkeja tulee, mutta puhutaan varmaan juurikin detaileista joita löydetään 200% - 400% zoomauksista kun vierelle saadaan native 4k referenssi renderi johon verrata. Tuskin TAA skaalatusta framesta mitään suurempaa tulee puuttumaan.
 
Temporal tekniikkaa edelleen kehittämällä voisi saada siitä jotain extraa irti. En tiedä vaatisiko se sitten skaalaimen kehittämistä checkerboard tai lomitetun kuvan käyttöön, jotta geometrian saisi paremmin poimittua skaalaukseen mukaan.

UE5:ssa on jo TSR ja tulossa dlss, jotka samplaavat peräkkäiset kuvat hieman eri kohdista. Jos mikään ei liiku niin näistä yhdistetyistä kuvista syntyy ihan aito natiiviresoluution kuva triviaalisti. Riippuen taa-implementaation hyvyydestä ja liikeen määrästä(framejen välinen ero) tulee vaihteleva määrä artifaktaa aidossa pelikuvassa. Kameran ja liikkuvien kohteiden vuoksi molemmat TSR ja DLSS vaativat liikevektorit algoritmin toimintaan.

TAA/DLSS artifaktat korostuvat pienillä resoluutioilla ja pienillä fps:lla tai isoilla muilla muutoksilla kuvassa kuten nopeasti liikkuvat/pyörivät kappaleet. Tämä on kuitenkin softaa ja on mahdollista, että algoritmit paranevat ajan kanssa.

Ideahan nanitessa on tehdä pikselinkokoisia tai pienempiä kolmioita. Eli ei ole bugi vaan ihan ominaisuus. UE5 on suunniteltu niin, että geometria striimataan ja skaalataan resoluution/tarpeen mukaan. Isoimman resoluution kamat ovat levyllä jemmassa ja striimataan muistiin vain tarvittaessa. Samoin tekstuurit haetaan muistiin vain tarvittaessa. Fiksu ratkaisu. Säästää muistia, jos/kun striimaus toimii.
 
Viimeksi muokattu:
However, the geometric details can optionally be tweaked to use same geometry as Native 4K rendering to reach an output a lot closer to native 4k. "

Eikö Nvidian DSR (Dynamic Super Resolution) ollut vähän vastaava? Eli DSR-tuetuissa peleissä sai ''4k kuvaa'' jonka se skaalasi esim. QHD tai FHD -näytölle? Vai onko tuo aivan eri kuin mistä tuossa UE:ssä puhuttiin. Rise Of the Tomb raiderin lisäosaa tuossa pelailin DSR:n kera, ja sillä sai kyllä antialiasingin jättämät rosoiset kasvit ja esineiden sahalaidat aika hyvin piiloon, mutta samalla tietenkin suorituskykyhitti vs QHD-reso oli aivan jäätävä. Nvidia ilmeisesti lopettanut DSR tukemisen, kun ei uudemmissa peleissä ole tullut vastaan, ja Nvidian DSR-sivu on aika kuolleen näköinen.
 
Eikö Nvidian DSR (Dynamic Super Resolution) ollut vähän vastaava? Eli DSR-tuetuissa peleissä sai ''4k kuvaa'' jonka se skaalasi esim. QHD tai FHD -näytölle? Vai onko tuo aivan eri kuin mistä tuossa UE:ssä puhuttiin. Rise Of the Tomb raiderin lisäosaa tuossa pelailin DSR:n kera, ja sillä sai kyllä antialiasingin jättämät rosoiset kasvit ja esineiden sahalaidat aika hyvin piiloon, mutta samalla tietenkin suorituskykyhitti vs QHD-reso oli aivan jäätävä. Nvidia ilmeisesti lopettanut DSR tukemisen, kun ei uudemmissa peleissä ole tullut vastaan, ja Nvidian DSR-sivu on aika kuolleen näköinen.

Se on ihan eri. DSR rendasi pelin isommalla resolla, josta se skaalattiin alaspäin. Eli söi rajusti suorituskykyä, mutta vastineeksi tuli todella hyvä antialiasointi, kuten muistelitkin.
Tuossa unrealissa on siis optiona puskea kohdereson geometria skaalattavalle resoluutiolle ja sitten se on skaalausenginen homma saada siitä jotain irti. Esim normiskaalaukseen voi yrittää käyttää monitorin resoluution mipmappeja (ylitarkkaa, alisoitumista, shimmeriä, mutta enemmän yksityiskohtia) ja siten saada enemmän dataa lähtöresoluutioon, mutta sitten pitää hoitaa myös ne haittapuolet. Ainakin digital foundry suositteli tuota muutosta Niohissa, en muista onko se ollut osassa peleissä "vakiona".

Vähän sama idea siinäkin, käytetään lähtöreson kannalta ylihienoa tavaraa, kun skaalaus saa siitä aavistuksen poimittua mukaansa.
 
Viimeksi muokattu:
Nyt RT:tä Nvidialla kokeiltuani sanoisin että aika turha hype. Testannut vain Cyberpunkissa tosin mutta eroja todellakin saa hakea pois lukien heijastukset ja ruudunpäivitys.
 

Statistiikka

Viestiketjuista
261 542
Viestejä
4 539 744
Jäsenet
74 818
Uusin jäsen
dfens

Hinta.fi

Back
Ylös Bottom