Imagination esitteli CXT-arkkitehtuurin ja 6-portaisen säteenseurantaluokituksen

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 495
img-cxt-rays-your-game-20211122.jpg


Kaotik kirjoitti uutisen/artikkelin:
Imagination on reaaliaikaisen säteenseurannan todellinen pioneeri, joka esitteli toimivaa rautaa jo vuonna 2016. Yhtiön PowerVR GR6500 -grafiikkapiiri kiihdytti useampia vaiheita kuin nykyiset PC-näytönohjainten ratkaisut, mutta suosiota ratkaisu ei saanut taakseen.

Nyt Imagination on julkaissut paitsi uutta rautaa, myös yksinkertaisten oman luokittelunsa eri tasoisille säteenseurantaratkaisuille. Yhtiön mukaan säteenseuranta voidaan jakaa kuuteen eri tasoon:
  • 0 – Prosessorilla pyörivä säteenseuranta
  • 1 – Näytönohjaimella ohjelmallisesti laskettu säteenseuranta
  • 2 – Ray/Box- ja Ray/Triangle -tarkastusten kiihdytys
  • 3 – Bounding Volume Hierarchyn (BVH) prosessointi kiihdyttimillä
  • 4 – BVH:n prosessointi ja säteiden koherentti lajittelu kiihdyttimillä
  • 5 – Koherentin BVH:n prosessointi ja luonti kiihdyttimillä

AMD:n RDNA2-arkkitehtuuri sijoittuu asteikolla luokkaan 2, NVIDIAn ja Intelin luokkaan 3 ja Imaginationin uudet CXT-sarjan GPU:t luokkaan 4.



Imaginationin uusi CXT-sarja pääsi livahtamaan alta useimpien tutkien tämän kuun alkupuolella, vaikka yhtiö onkin nostanut profiiliaan viime aikoina. Yhtiön BXT-arkkitehtuurin grafiikkapiirejä on nähty InnoSiliconin toteuttaman ainakin yhdessä ja mahdollisesti kahdessa kiinalaisvalmisteisessa näytönohjaimessa.

[gallery link="file" columns="2" size="medium" ids="69372,69371"]

CXT-ydin rakentuu yhteensä kuudesta Unified Shading Cluster -yksiköstä, kuudesta Texture Processing Unit -yksiköstä, kolmesta Geometry Rasterizer -yksiköstä ja kolmesta Ray Acceleration Cluster -yksiköstä, jotka jakavat CXT RT3:ksi ristityn L3-tason välimuistin ja firmware-yksikön. Yksi ydin pystyy 1 GHz:n mobiilikonfiguraatiossaan noin 1,5 TFLOPSin FP32-suorituskykyyn, 6 TOPSin INT8-suorituskykyyn ja säteenseurannassa 1,3 GRays/s ja 16 GBoxTests/s lukemiin. Tässä kohtaa on tosin syytä huomioida, ettei GRays/s perustu mihinkään standardiin mittaukseen ja ei välttämättä ole vertailukelpoinen muiden valmistajien vastaavien arvojen kanssa.

Yhdessä CXT-sarjan GPU:ssa voi olla parhaimmillaan neljä CXT-ydintä, jotka kykenevät yhtiön laskelmien mukaan suuremmalla tehobudjetilla noin 1,5 GHz:n kellotaajuuksiin ja siten yli 9 TFLOPSin suorituskykyyn FP32-tarkkuudella ja säteenseurannassa 7,8 GRays/s & 96 GBoxTests/s lukuihin. Imagination lisensoi arkkitehtuuria asiakkailleen ja se on suunniteltu sovitettavaksi mille tahansa prosessille 12 nanometristä pienempään päin.

Lähde: Imagination

Linkki alkuperäiseen juttuun
 
Kuinkakohan nuo tasot näkyvät kuvanlaadussa, suorituskyvyssä, pelituessa ja näyttiksen hinnassa? Se taulukko kiinnostaa varmaan pelaajia eniten.
 
Kuinkakohan nuo tasot näkyvät kuvanlaadussa, suorituskyvyssä, pelituessa ja näyttiksen hinnassa? Se taulukko kiinnostaa varmaan pelaajia eniten.

Kuvanlaadussa ei suoraan mitenkään, tässä on kyse vaan siitä, mitä tehdään raudalla, mitä softalla (ja jos softalla, niin missä ajetulla softalla).
Toisaalta, kuvanlaatua ja suorituskykyä voidaan aina treidata keskenään sillä, montako sädettä/pikseli lasketaan. Parempi suorituskyky tarkoittaa käytännössä tämän takia yleensä parempaa kuvanlaatua.

Kun kaikki tehdään CPUlla softalla, tarvitaan joku 128-ydin-prossu että saadaan kelvollista suorituskykyä.

Kun kaikki tehdään näyttiksellä softalla, tarvitaan muutama todella järeä näyttis, että saadaan kelvollista suorituskykyä.

Tämän jälkeen menee sitten mm. siihen, kuinka paljon tulee kuormitusta joko näyttiksen shader-prossulle tai CPUlle noista "puuttuvista" vaiheista.

AMDllä shaderit joutuu softalla tekemään sitä puun läpikäyntiä joka nVidialla menee raudalla, jolloin AMDllä shaderien kuormitus on suurempi => jää vähemmän shader-kapasiteetia siihen itse värien laskentaan yms. ja toisaalta virtaa kuluu/lämpöä tuotetaan enemmän koska shadereilla tämä puun läpikäynnin tekeminen on vähemmän energiatehokasta kuin raudalla. Mutta itse piiri voi olla sitten pienempi tai niitä shadereita voi olla enemmän kun se puunläpikäyntirauta ei kuluta pinta-alaa.

Mutta nVidiallakin shadereilla tai CPUlla joudutaan tekemään kuitenkin tuota lajittelua sekä puunrakennusta.

Kun nämäkin siirtyy raudalle, ne voidaan tehdä nopeammin ja vähemmän shadereita ja CPUta kuormittaen, jolloin voidaan päästä parempaan nopeuteen esim tilanteissa joissa on paljon dynaamisia (liikkuvia) objekteja samalla kun esim. heikompi CPU riittää.
 
Viimeksi muokattu:
Kuvanlaadussa ei suoraan mitenkään, tässä on kyse vaan siitä, mitä tehdään raudalla, mitä softalla (ja jos softalla, niin missä ajetulla softalla).
Toisaalta, kuvanlaatua ja suorituskykyä voidaan aina treidata keskenään sillä, montako sädettä/pikseli lasketaan. Parempi suorituskyky tarkoittaa käytännössä tämän takia yleensä parempaa kuvanlaatua.

Kun kaikki tehdään CPUlla softalla, tarvitaan joku 128-ydin-prossu että saadaan kelvollista suorituskykyä.

Kun kaikki tehdään näyttiksellä softalla, tarvitaan muutama todella järeä näyttis, että saadaan kelvollista suorituskykyä.

Tämän jälkeen menee sitten mm. siihen, kuinka paljon tulee kuormitusta joko näyttiksen shader-prossulle tai CPUlle noista "puuttuvista" vaiheista.

AMDllä shaderit joutuu softalla tekemään sitä puun läpikäyntiä joka nVidialla menee raudalla, jolloin AMDllä shaderien kuormitus on suurempi => jää vähemmän shader-kapasiteetia siihen itse värien laskentaan yms. ja toisaalta virtaa kuluu/lämpöä tuotetaan enemmän koska shadereilla tämä puun läpikäynnin tekeminen on vähemmän energiatehokasta kuin raudalla. Mutta itse piiri voi olla sitten pienempi tai niitä shadereita voi olla enemmän kun se puunläpikäyntirauta ei kuluta pinta-alaa.

Mutta nVidiallakin shadereilla tai CPUlla joudutaan tekemään kuitenkin tuota lajittelua sekä puunrakennusta.

Kun nämäkin siirtyy raudalle, ne voidaan tehdä nopeammin ja vähemmän shadereita ja CPUta kuormittaen, jolloin voidaan päästä parempaan nopeuteen esim tilanteissa joissa on paljon dynaamisia (liikkuvia) objekteja samalla kun esim. heikompi CPU riittää.

Hyvä tekninen avaus.

Ehkä ajattelin enemmän sellaista markkinamiesten värikoodattua boksia, joka kertoo huutomerkkien säestämänä, että näillä tekniikoilla mahdollistetaan geometrian prosessointi shadereilla, kaikki valot tuhannella säteellä, nyt on mahdollista rendata kaikki kuvan elementit yhdellä korkean tarkkuuden mallilla, cullingia ei enää tarvita ja kärealismi täydellistetään koneoppimisella! Kaikki pyörii 8K 1000Hz 12bit HDR muodossa mobiililaitteella viikon lataamatta. Ja kaikki on mahdollista yhdellä yleisellä API:lla, jota käyttää kaikki pelit.

Ehkä vähän kärjistys, mutta sen porukka haluaa viimein kuulla. Tämmöset kategorisoinnit vaan saa porukan googlettamaan ja pettymys on suuri, kun uus tekniikka mahdollistaa vaan vähän jotain pientä kivaa ja senkin tosi rajatussa ympäristössä ja softan kehittäjän armeliaisuudesta :D
 
Hyvä tekninen avaus.

Ehkä ajattelin enemmän sellaista markkinamiesten värikoodattua boksia, joka kertoo huutomerkkien säestämänä, että näillä tekniikoilla mahdollistetaan geometrian prosessointi shadereilla, kaikki valot tuhannella säteellä, nyt on mahdollista rendata kaikki kuvan elementit yhdellä korkean tarkkuuden mallilla, cullingia ei enää tarvita ja kärealismi täydellistetään koneoppimisella! Kaikki pyörii 8K 1000Hz 12bit HDR muodossa mobiililaitteella viikon lataamatta. Ja kaikki on mahdollista yhdellä yleisellä API:lla, jota käyttää kaikki pelit.

Ehkä vähän kärjistys, mutta sen porukka haluaa viimein kuulla. Tämmöset kategorisoinnit vaan saa porukan googlettamaan ja pettymys on suuri, kun uus tekniikka mahdollistaa vaan vähän jotain pientä kivaa ja senkin tosi rajatussa ympäristössä ja softan kehittäjän armeliaisuudesta :D

Jos halutaan vaan raakaa nopeutta, lisää resoluutiota ja vähemmän kohinanvaimennusefektejä nykypeleille, niin siihen tarvitaan lähinnä vaan lisää raakaa vääntöä niiltä törmäystarkastusyksiköiltä, eikä ominaisuuksilla enää tuon tason 2 jälkeen ole niin paljon väliä, 3 ja 4 ehkä lähinnä parantaa energiatehokkuutta yms.

PowerVR kauppaa säteenjäljitysyksiköitään nimenomaan mobilililaitteisiin, joten PowerVRlle se energiatehokkuus on tärkeämpi kuin AMDlle ja nVidialle, mutta toisaalta, PowerVR on myös ne ehtinyt toteuttaa, koska on tehnyt säteenjäljitysrautaa kauemmin. Eiköhän AMD ja nVidia jossain vaiheessa seuraa perässä, kun ehtivät. Niiden prioriteetit on kuitenkin hiukan eri kuin PowerVRllä, AMD ja nVidia panostavat ensisijaisesti siihen raakaan törmäystarkistusten nopeuteen että saadaan se Cyberpunk pyörimään.


Sen sijaan tuon puunrakennusraudan (taso 5) tarpeellisuuden kannalta hyvin oleellinen kysymys on, että yritetäänkö tehdä pelejä, joissa kaikki on dynaamista (hajoavaa, siirtyvää), vai tyydytäänkö siihen, että maailma on fiksattu ja vain hahmot liikkuu.

Uuden BVH-puun rakentaminen joka frame koko maailmalle on hyvin kallista, ellei maailman geometria ole hyvin yksinkertaista (kuten minecraftissa).

Mutta jos maailmasta esim. 95% on staattista ja vain 5% (hahmot) on liikkuvaa, sen BVH-puun kyllä rakentaa sen 5% osalta joka frame uudestaan softallakin ongelmitta.


Eli tällä hetkellä kun ei olla tasolla 5, joudutaan käytännössä rajoittamaan (ennustamattomalla tavalla) dynaamisen (liikkuvan) geometrian monimutkaisuutta tai määrää huomattavasti (tasolle, joka on yksinkertaisempi kuin mihin rasteroinnilla tällä hetkellä pystytään), tai sellaisen tekeminen kuormittaa esim. näyttiksen shader-prossuja huomattavasti hidastaen kaikkea.

Sitten kun säteenjäljitysrauta pääsee tasolle 5 (ja siinä puunrakennusraudassa on myös riittävästi vääntöä), nämä rajoitukset poistuu, ja voidaan tehdä maailmoja joissa on paljon tarkkaa dynaamista geometriaa ja saada se myös pyörimään nopeasti ja tehokkaasti ilman suurta overheadia.


edit: lisätty sanat "(ennustamattomalla tavalla)"
 
Viimeksi muokattu:
Kiitos huikean mielenkiintoisesta vastauksesta!
Tuo, että joutuu tekemään valintoja ympäristön muokkaantuvuuden ehdoilla, on kyllä hiukan huolestuttavaa. Vaikuttaakohan siihen myös vesi, pilvet, liikkuvat puun oksat, ruohot ja kaikki muu elävöittävä? Vai voikohan liikkeen säännöllinen jatkuminen tai toistuminen tarjota mahdollisuuksia kiertää uudelleenrakennusta? Tää saattaa ohjata RT-pelejä vähän karuun suuntaan.
 
MIlloinkahan joku (nVidia?) julkistaa pelkästään ray tracingiin erikoistuneen lisäkortin (RayX tms.), kuten aikanaan fysiikkakiihdytinkortin PhysX?
Saisivat perittyä hullaantuneilta pelaajilta tuplaryöstöhinnat (tai kai tällaisetkin menisivät suoraan lelurahalaskentaan).
Tosin en osaa arvioida, tulisiko korttien välinen liikenne rajoittavaksi tekijäksi (mutta kai siihen saisi jonkun NVLinkin uudistuneen version samalla).
 
Kiitos huikean mielenkiintoisesta vastauksesta!
Tuo, että joutuu tekemään valintoja ympäristön muokkaantuvuuden ehdoilla, on kyllä hiukan huolestuttavaa. Vaikuttaakohan siihen myös vesi, pilvet, liikkuvat puun oksat, ruohot ja kaikki muu elävöittävä? Vai voikohan liikkeen säännöllinen jatkuminen tai toistuminen tarjota mahdollisuuksia kiertää uudelleenrakennusta? Tää saattaa ohjata RT-pelejä vähän karuun suuntaan.

Pilvet piirretään yleensä vaan päälleliimattuina tekstuureina "taivasboksiin" joka rajaa pelialueen, ne eivät tuo peliin yhtään geometriaa lisää.

Aaltoilevan vedenkään ei pitäisi olla suuri ongelma, sen kanssa pystytäään kyllä kikkailemaan, eli joko esim.

1)
Laskea sille vedelle esim. 60 vaihtoehtoista BVH-puuta eri ajanhetkille kun aalto toistaa itseään esim. sekunnin välein, siten että joka framella uuden puun rakentamisen sijaan vaan valitaan yksi näistä 60stä puusta.

2) Tehdä sille vedenpinnalle vaan ylikokoiset BVH-laatikot jotka kattaa aallon täyden korkeuden että kolmiot pysyy aina laatikoiden sisässä vaikka pinta vähän muuttaakin muotoaan. En tosin tiedä, tukeeko APIt tätä. Ylikokoiset laatikot hidastaa itse säteenjäljitystä inasen, mutta tässä tapauksessa ei yleensä paljoa, koska sen veden yläpuolella tyypillisesti on lähinnä tyhjää ilmaa ja se vedenpinta on suuressa mittakaavassa kuitenki melko tasainen.

Tuulessa heiluvaa oksia ja ruohikkoa voi jossain määrin feikata alpha-tekstuureilla ettei kaikille oksille tarvi aina olla omaa geometriaansa, mutta tämä voi näyttää feikiltä, ja mahdollistaa geometrian muuttumatta heilumisen vain tasossa.

Mutta niille toiminee myös sama temppu kuin vedelle, että esilasketaan n kappaletta BVH-puita niiden paikan vaiheen mukaan.


Eli näkisin, että tuo puunrakentamisen hitaus nykyraudalla tulee ongelmaksi lähinnä ainoastaan kun pelissä muuttuu/voi muuttua jotain oikeasti tavalla, jota ei voi ennalta laskea/ennustaa. Eli kun peliengine mahdollistaa minkä tahansa seinän räjäyttämiseen, tai minkä tahansa puun kaatamisen jne.

Joku Red Faction taisi aikanaan olla ensimmäisiä 3d-pelejä jossa "kaiken sai palasiksi" kun sitä ennen kentät oli ollut melko staattisia.
 
Viimeksi muokattu:
  • Tykkää
Reactions: UX
Menee jo kyllä vähän offtopicin puolelle, mutta itsellä on ikiaikaisena haaveena että vielä minun elinaikanani päästäisiin siihen, että peleissä maailma olisi toteutettu täysin partikkeli- ja sädepohjaisesti. Eli kaikki kappaleet olisi mahdollista räjäyttää molekyylitasolle, kaikki vaikuttaa kaikkeen ja fysiikka toimii luonnollisesti ja valaistus heijastuksineen laskettaisiin aina täydellisesti. Ja ennemmin kyllä lähtisin siitä että materiaalit ja fysiikat pelittää luonnollisesti kuin että staattinen maailma valaistaisiin realistisesti.

edit: Red Factionissakaan ei saanut mitä tahansa seiniä rikki, vaan semmoisia ennalta määrättyjä jotka "eivät vaikuta negatiivisesti pelin kulkuun". Eli yleensä ei pystynyt kaivamaan reittiä suoraan alusta maaliin.
 
Menee jo kyllä vähän offtopicin puolelle, mutta itsellä on ikiaikaisena haaveena että vielä minun elinaikanani päästäisiin siihen, että peleissä maailma olisi toteutettu täysin partikkeli- ja sädepohjaisesti. Eli kaikki kappaleet olisi mahdollista räjäyttää molekyylitasolle, kaikki vaikuttaa kaikkeen ja fysiikka toimii luonnollisesti ja valaistus heijastuksineen laskettaisiin aina täydellisesti. Ja ennemmin kyllä lähtisin siitä että materiaalit ja fysiikat pelittää luonnollisesti kuin että staattinen maailma valaistaisiin realistisesti.

edit: Red Factionissakaan ei saanut mitä tahansa seiniä rikki, vaan semmoisia ennalta määrättyjä jotka "eivät vaikuta negatiivisesti pelin kulkuun". Eli yleensä ei pystynyt kaivamaan reittiä suoraan alusta maaliin.

Teardown yrittää tuonkaltaista ideaa. Voxelipohjainen, kaikki tuhottavissa ja fysiikkapohjaisesti käyttäytyvää

 

Uusimmat viestit

Statistiikka

Viestiketjuista
258 669
Viestejä
4 495 554
Jäsenet
74 270
Uusin jäsen
Jautio

Hinta.fi

Back
Ylös Bottom