• Live: io-techin Tekniikkapodcast tänään perjantaina noin klo 15:05 alkaen. Keskustellaan viikon mielenkiintoisimmista tietotekniikka- ja mobiiliaiheista. Suora lähetys YouTubessa. Tule mukaan katselemaan ja keskustelemaan! Linkki lähetykseen >>

NVIDIA-spekulaatioketju (Lovelace ja tulevat sukupolvet)

Ja siis edelleen ois tulossa muistia mistä ei oo speksejäkään viel tehty? Todella vaikea uskoa, voihan se mahdollista olla, että on vaan nopeaa GDDR6 ja joku päättänyt antaa sille markkinointi nimen mutta silti....
Voisin kuvitella ettei JEDEC ihan hirvittävän mielellään katsoisi moista sooloilua yhdeltäkään muistivalmistajalta.
 
Pistetään taas tiivistelmä:

Alkuperäiset twiitit spoilereissa.







"627mm2 is not the official data I measured it with a vernier caliper. "

"A summary at 7.8 Maybe,
RTX 3090 5248 24G GDDR6X 350W
RTX 3080 4352 10G GDDR6X 320W
RTX 3070Ti 3072 8G GDDR6X 250W
RTX 3070 2944 8G GDDR6 220W For reference only. "

Kommenteissa vielä, kun kysyttiin 3060:aa:
Maybe, 3060 GA106-300 1920. Just a rumor.

Ja loppuun:

"Only my thoughts: NVIDIA has prepared a SKU as BIG NAVI KILLER. It might be RTX 3080Ti, but it doesn't exist now. NOT SKU20 of GA102. "
 
Pistetään taas tiivistelmä:

Alkuperäiset twiitit spoilereissa.







"627mm2 is not the official data I measured it with a vernier caliper. "

"A summary at 7.8 Maybe,
RTX 3090 5248 24G GDDR6X 350W
RTX 3080 4352 10G GDDR6X 320W
RTX 3070Ti 3072 8G GDDR6X 250W
RTX 3070 2944 8G GDDR6 220W For reference only. "

Kommenteissa vielä, kun kysyttiin 3060:aa:
Maybe, 3060 GA106-300 1920. Just a rumor.

Ja loppuun:

"Only my thoughts: NVIDIA has prepared a SKU as BIG NAVI KILLER. It might be RTX 3080Ti, but it doesn't exist now. NOT SKU20 of GA102. "

hintaveikkaus:

3070ti 550e Suomi
3080 820e Suomi
3080ti 1000e Suomi
ja big killer 3090 1300e Suomi
 
3090 vaikuttaa kyllä massiivisen muistimääränsä kanssa enemmän Titan-luokkaan menevältä kortilta kuin suoraan 2080Ti seuraajalta. Toisaalta tuo nimi olisi outo veto siihen luokkaan kun se Titan-brändi on vuosien mittaan sinne kuitenkin rakenneltu.
Vähän ristiriitaista huhuilua vielä.
 
Toivottavasti olisikin noin halpaa :asif:

Juuh eikös se RTX2080Ti ollut jotain 1200€ luokkaa reaalihinta launchissa jos ei niitä aivan afrikan malleja huonoilla jäähyillä lasketa. Tosin muistelisin näidenkin olleen kuitenkin tonnin paikkeilla. Vai oliko tuossa vielä jotain bitcoin lisää silloin mukana.

Nvidian markkina-arvo ohitti Intelin tässä joitain päiviä sitten niin nahkatakilla olisi kyllä varaa laittaa hyvä diili seuraavasta sukupolvesta.
 
Voisin kuvitella ettei JEDEC ihan hirvittävän mielellään katsoisi moista sooloilua yhdeltäkään muistivalmistajalta.
Miksi JEDEC:iä kiinnostaisi pätkän vertaa jos joku valmistaja tekee ihan itse omassa päädyssä pelaten muisteja omalla standardilla, eikä edes yritä väittää niiden olevan minkään JEDEC-standardin mukaisia?
 
Miksi JEDEC:iä kiinnostaisi pätkän vertaa jos joku valmistaja tekee ihan itse omassa päädyssä pelaten muisteja omalla standardilla, eikä edes yritä väittää niiden olevan minkään JEDEC-standardin mukaisia?
Ei välttämättä muuten, mutta jos se ollaan nimeämässä JEDECillä käytössä olevan nimeämiskäytännön mukaan siinä on helppo nähdä ongelmia. Lisäksi kyseisen muistivalmistajan tulevaisuus JEDECin piirissä saattaisi näyttää hyvinkin heikolle sellaisen tempauksen jälkeen.
 
Juuh eikös se RTX2080Ti ollut jotain 1200€ luokkaa reaalihinta launchissa jos ei niitä aivan afrikan malleja huonoilla jäähyillä lasketa. Tosin muistelisin näidenkin olleen kuitenkin tonnin paikkeilla. Vai oliko tuossa vielä jotain bitcoin lisää silloin mukana.

Nvidian markkina-arvo ohitti Intelin tässä joitain päiviä sitten niin nahkatakilla olisi kyllä varaa laittaa hyvä diili seuraavasta sukupolvesta.
1300-1350€ tais olla ennakkovaraukset ja pitkän aikaa julkasun jälkeen. Muistan harkinneeni sitä MSI:n kolmen tuulettimen järkälettä, hintaa oli se 1349€. Eli sitä samaa mitä nytkin, ainakin suomen päädyssä. Jossain muualla ehkä sit halvemmalla. Tuskin oli kryptovaluuttalisää mukana, se buumihan oli siinä 2017 loppuvuonna-2018 alkuvuonna.

Oishan noita hintoja varaa laskea, mutta ilman pakottavaa syytä ei niitä oo oikeastaan järkeä laskea. Pakottava syy sit tietenkin syntyy mikäli AMD:lta saa parempaa hinta/teho-suhdetta, mutta se tuskin tulee vaikuttamaan sen kaikista tehokkaimman kortin hinnoitteluun. Ellei siinä sit oo jotain 500€ rakoa välissä ja tehoero on sen 10%, siinä kohdin olis varmaan monelle aika vaikea perustella sitä lisäinvestointia.
 
3080 900€
3080ti 1300€
3090 2400€
Tässä oma veikkaukseni
Nämä hinnat on nyt ihan vedetty sen verran ylös että ilmeisesti kirjoittajaa ei kiinnosta osuuko oikeaan.

Tuossa ei ole siis järkeä kun katsoo tuon 3090 mutu hintaa ja huhuttuja ydin/suorituskykyä, ei ole edes yritystä ollut järkeistää tuota hintaa kunhan vaan jotain isoa hintaa pääsee foorumille heittämään.

3090 huhutuilla ytimillä ihan Max 1400-1500e mutta saattaa tosin olla "vain"nykyisen 2080Ti hinnoissa.

3080Ti/3090 julkaisu/nimeäminen muutenkin auki joten voi olla ettei 3080Ti vielä edes tule.
 
Nämä hinnat on nyt ihan vedetty sen verran ylös että ilmeisesti kirjoittajaa ei kiinnosta osuuko oikeaan.

Tuossa ei ole siis järkeä kun katsoo tuon 3090 mutu hintaa ja huhuttuja ydin/suorituskykyä, ei ole edes yritystä ollut järkeistää tuota hintaa kunhan vaan jotain isoa hintaa pääsee foorumille heittämään.

3090 huhutuilla ytimillä ihan Max 1400-1500e mutta saattaa tosin olla "vain"nykyisen 2080Ti hinnoissa.

3080Ti/3090 julkaisu/nimeäminen muutenkin auki joten voi olla ettei 3080Ti vielä edes tule.
3080ti tuskin tulee ekassa erässä, sitä roikotetaan amd julkkariin. 3090 on uusi titan, ja hinta sen mukainen. 2500e on varmaan melko lähellä. Tai alakanttiin.
 
3080ti tuskin tulee ekassa erässä, sitä roikotetaan amd julkkariin. 3090 on uusi titan, ja hinta sen mukainen. 2500e on varmaan melko lähellä. Tai alakanttiin.
Ei varmana ole uusi titani.
Titanissa on hieman enemmän ytimiä ja ehdottomasti enemmän Vramia kuin mitä 3090 olisi huhujen mukaan.

Ja meinaatko että ensimmäisten joukossa tulevassa isoimmassa julkaistavassa peli Amperessa olisi vain saman verran ytimiä kuin 2080Ti?
Sieltä tulee peli Ampere jossa on enemmän ytimiä kuin 2080Ti.
Olkoon sen nimi sitten 3080Ti tai 3090.

Mutta 3090(GA102-300) ei tule olemaan Titan.
 
3080ti tuskin tulee ekassa erässä, sitä roikotetaan amd julkkariin. 3090 on uusi titan, ja hinta sen mukainen. 2500e on varmaan melko lähellä. Tai alakanttiin.

Kai 3080 Ti tulee n. kuukauden päästä 3080:sta kuten on pari aikaisempaa sukupolvea tullut. Julkaisussa siis ensin 3080 ja 3070, myöhemmin muut mallit. Tuo 3090 on kyllä hankalaa uskoa että sellaista olisi edes tulossa, jos tulisi niin kai se olisi 3080 Ti:n ja Titanin väliltä.
 
Kai 3080 Ti tulee n. kuukauden päästä 3080:sta kuten on pari aikaisempaa sukupolvea tullut. Julkaisussa siis ensin 3080 ja 3070, myöhemmin muut mallit. Tuo 3090 on kyllä hankalaa uskoa että sellaista olisi edes tulossa, jos tulisi niin kai se olisi 3080 Ti:n ja Titanin väliltä.

Kyllä se 3090 = Titan. RTX Titan on jo julkaistu joten sitä nimeä on hiukan hankala käyttää. Ja 24GB muistikin viittaa siihen että se on Titan, en näe että Titaniin olisi vielä paineita lisätä muistia.
 
Nämä hinnat on nyt ihan vedetty sen verran ylös että ilmeisesti kirjoittajaa ei kiinnosta osuuko oikeaan.

Tuossa ei ole siis järkeä kun katsoo tuon 3090 mutu hintaa ja huhuttuja ydin/suorituskykyä, ei ole edes yritystä ollut järkeistää tuota hintaa kunhan vaan jotain isoa hintaa pääsee foorumille heittämään.

3090 huhutuilla ytimillä ihan Max 1400-1500e mutta saattaa tosin olla "vain"nykyisen 2080Ti hinnoissa.

3080Ti/3090 julkaisu/nimeäminen muutenkin auki joten voi olla ettei 3080Ti vielä edes tule.
Noi hinnat on kaikki alalakanttiin. Jos nvidia julkase vuodatulla refujäähyllä ja satumaan ddr6x muusteilla, hinta tulee 3080 olemaan yli 1000€.

3090 jo muistimäärän takia viittaa titaniin. Kukaan pelaaja ei tule hyötymään 24gb muistimäärstä, joten tää ei ole pelaajille suunnattu kortti.

Jos tota 3090 tullaan myymään 2500€ ddr6x nuisteilla, mä tuun tilaa sellasen.
 
Noi hinnat on kaikki alalakanttiin. Jos nvidia julkase vuodatulla refujäähyllä ja satumaan ddr6x muusteilla, hinta tulee 3080 olemaan yli 1000€.

3090 jo muistimäärän takia viittaa titaniin. Kukaan pelaaja ei tule hyötymään 24gb muistimäärstä, joten tää ei ole pelaajille suunnattu kortti.

Jos tota 3090 tullaan myymään 2500€ ddr6x nuisteilla, mä tuun tilaa sellasen.

Kyllä se 3090 = Titan. RTX Titan on jo julkaistu joten sitä nimeä on hiukan hankala käyttää. Ja 24GB muistikin viittaa siihen että se on Titan, en näe että Titaniin olisi vielä paineita lisätä muistia.
Titan 5376 ydintä 24Gb Ga102 400
3090 5248 ydintä 12Gb Ga102 300

Eli meinaat että nyt julkaistavassa nopeimmassa peli amperessa olisi yhtä monta ydintä kuin 2080Ti :D
Ei tule tapahtumaan.

Kovat on IPC parannukset (3080)tai kellot jos samalla ydin määrällä saadaa riittävä suorituskyky harppaus eli 2080Ti olisi jopa isompi harppaus ollut 1080Ti nähden kuin tuleva Ampere 2080Ti verrattuna, siis tuolla järjellä jos meinaa että 3090 on Titani.

100% varmaa on että sieltä tulee peli Ampere jossa on enemmän ytimiä kuin 2080Ti
Olkoon sitten 3080Ti tai 3090
 
Noi hinnat on kaikki alalakanttiin. Jos nvidia julkase vuodatulla refujäähyllä ja satumaan ddr6x muusteilla, hinta tulee 3080 olemaan yli 1000€.

Ne GDDRX6X:t on tosiaan niin satumaasta, että ei tulla Amperessa näkemään.

Ja kaikki muut huhut samoista lähteistä missä näistä satumaan muisteista puhutaan voi sitten suhteuttaa samaan kohtaan luotettavuusasteikkoa.
 
Mitenkäs muuten Gddr5 erosi Gddr5X jotta se "ansaitsi" X merkinnän.
Eli tarpeeksi nopeaan muistiinko vain päätetään vetästä ruksi perään vai miten tämä Gddr6(X) teoriassa nyt ansaitaan.

Se olisi oikeasti ansainnut nimen "GDDR6";

Muutos GDDR5 => GDDR5X oli käytännössä yhtä suuri/sama kuin oli muutos DDR => DDR2 , DDR2 => DDR3 jne,
eli ulkoisen dataraten tuplaus sisäiseen nähden ja tämän "ruokkiminen " muistipiirin sisäisten dataväylien leveyden tuplaamisella ja tuplamäärän bittejä lataamisesta itse muistisoluista kerralla("prefetch")

Jolloin saadaan siis tuplattua kaista/pin ilman että tarvii pystyä nopeuttamaan itse DRAM-muistisoluja.

Eli DDR5X:ssä tuli jo se kaikkein oleellisin asia jonka "olisi pitänyt tulla GDDR6ssa" ja GDDR6 on siis vaan pientä viilausta (jännitteen pudotus, kanavien koon puolitus ja määrän tuplaus/piiri) tämän päälle.
 
100% varmaa on että sieltä tulee peli Ampere jossa on enemmän ytimiä kuin 2080Ti
Olkoon sitten 3080Ti tai 3090

Onhan 2080:ssakin vähemmän ytimiä kuin 1080ti:ssä. Esim GTX 1080 ja RTX 2070 Super on samalla ydinmäärällä ja tuossa vertailussa Turing on ~30% nopeampi.
Jos vastaavanlainen hyppy saadaan Amperen kanssa niin voi ensin julkaistavista pelikorteista olla nopein 3080 samalla ydinmäärällä ja 20-30% nopeampi kuin 2080ti.

Sitten hieman myöhemmin julkaistaan se ti jossa on ytimiä enemmän...
 
Onhan 2080:ssakin vähemmän ytimiä kuin 1080ti:ssä. Esim GTX 1080 ja RTX 2070 Super on samalla ydinmäärällä ja tuossa vertailussa Turing on ~30% nopeampi.
Jos vastaavanlainen hyppy saadaan Amperen kanssa niin voi ensin julkaistavista pelikorteista olla nopein 3080 samalla ydinmäärällä ja 20-30% nopeampi kuin 2080ti.

Sitten hieman myöhemmin julkaistaan se ti jossa on ytimiä enemmän...
3080 ei tule olemaan nopein peli ampere.
Tuon päälle tulee vielä nopeampi olkoon se sitte 3080Ti tai 3090 mutta sellainen tulee varmasti.
 
Mitä jos 3090 ei olekaan Titan, vaan uusi tuotesegmentti 3080 Ti yläpuolella jolla saadaan korotettua pelinäytönohjainten hintaa vielä enemmän ylöspäin? Perinteisesti Titaneissa ei ole xx80 Ti verrattuna muuta eroa kuin muistin koko, mikä tekee niistä turhia pelikäyttöön, mutta jos 3090 on nopeampi kuin 3080 Ti, niin silloin kaikkein nopeinta haluavien pitäisi maksaa vielä enemmän kuin 2080 Ti maksoi, esim 2000 €. Tiedän että tälläkin foorumilla on ihmisiä jotka ostaisivat sen vaikka maksaisi 3000 €.
 
Titan 5376 ydintä 24Gb Ga102 400
3090 5248 ydintä 12Gb Ga102 300

Tai jospa se on
3090 5376 ydintä 24Gb Ga102 400
3080Ti 5248 ydintä 12Gb Ga102 300

100% varmaa on että sieltä tulee peli Ampere jossa on enemmän ytimiä kuin 2080Ti
Olkoon sitten 3080Ti tai 3090

Todennäköisesti. Mutta kannattaa muistaa että nvidialla voi olla focus nyt RT suorituskyvyn parantamisessa, jotain huhuja on ollut että nelinkertaistuisi RT suorituskyky ja jos turingissa RT lisäsi pintaalaa jonkun lähteen mukaan noin 20% niin jos se RT teho nelinkertaistetaan niin se haukkaa jo melkoisesti tilaa jolloin rasterointi tehon nostamiseen ei välttämättä enää olekkaan niin hirmuisesti paukkuja jäljellä, eikä välttämättä edes tarvitsekkaan olla. 2080Ti:n rasterointi teho on kuitenkin melko kovalla tasolla.

Piirien valmistuskustannukset täytyy kuitenkin pyrkiä pitämään sellaisena että kuluttajatkin niitä ostaa ja jos huhuiltu yli 600mm2 piiri pitää paikkaansa, niin se on todennäköisesti 7nm kalliimpi valmistaa kuin nykyinen TU102 piiri.
Jos se on taas Simsungin prosessilla niin sitten se voi olla halvempi. Mutta riittääkö sitten transistori tiheys siihen että saadaan selleista tehoa ulos mitä fanipojut vaatii.
 
Näistä nyt voi höpistä vaikka kuinka ja paljon mutta melkein järkevin odottaa ja katsoa.

Mutta tämä traversal coprocessor on mielenkiintoinen ja avaisi mahdollisuuksia mukavasti.
Enkä yllättyisi yhtään jos Rtx3060 olisi Rtx2080Ti nopeampi RT suorituskyvyssä.(tälläistäkin huhua oli aikaisemmin)

"NVIDIA could offload the ray tracing hardware away from the Ampere GPU chip. NVIDIA has the RT cores and everything else inside of its Turing GPU, but if we saw some amplification or off-loading of ray tracing to this traversal coprocessor, then things could get very interesting."

Read more: GeForce RTX 3080 and RTX 3090 rumored to pack 'traversal coprocessor'
 
Näistä nyt voi höpistä vaikka kuinka ja paljon mutta melkein järkevin odottaa ja katsoa.

Mutta tämä traversal coprocessor on mielenkiintoinen ja avaisi mahdollisuuksia mukavasti.
Enkä yllättyisi yhtään jos Rtx3060 olisi Rtx2080Ti nopeampi RT suorituskyvyssä.(tälläistäkin huhua oli aikaisemmin)

"NVIDIA could offload the ray tracing hardware away from the Ampere GPU chip. NVIDIA has the RT cores and everything else inside of its Turing GPU, but if we saw some amplification or off-loading of ray tracing to this traversal coprocessor, then things could get very interesting."

Read more: GeForce RTX 3080 and RTX 3090 rumored to pack 'traversal coprocessor'

Tuota oli käyty aikaisemminkin täällä. Patentin mukaan tuo on GPU:n sisällä, eikä erillinen piiri, kuten tuossa uutisessa. Eli vaikka RT suorituskyky olisi jemmattu sinne, niin se haukkaa edelleen oman pinta-alansa piiristä, joka on aina perinteisestä laskennasta tai rasteroinnista pois: piirin koko kun nostaa hintaa, niin on aina pakko tehdä joku kompromissi, jotta saadaan haluttuihin hintaluokkiin tuotteet. Yleensä kate ei ole se valittu kompromissi.

Tuossa traversal coprocessor jutussa voi olla enemmän takana se miten Jensen kuvasi Amperea: Sama arkkitehtuuri eri konfiguraatiolla datakeskuksiin, ammattikäyttöön ja kuluttajille. Joten jos RT on eriytetty omaksi blokikseen, niin se on kai helpompi lisätä kuluttaja piireihin, kun datakeskukset ei sitä tarvitse.
Igors lab spekuloi tuota muuten pidemmälle, eli sen mielestä Nvidia saattaa tehdä erillisen virransyötön tuolle GPU:n RT osiolle parantaakseen piirien energiatehokkuutta.
 
Enkä yllättyisi yhtään jos Rtx3060 olisi Rtx2080Ti nopeampi RT suorituskyvyssä.(tälläistäkin huhua oli aikaisemmin)
Toivottavasti on, muuten AMD mennee ohitse. Xbox series X esitietojen perusteella kykenee laskemaan 380 miljardia törmäystä/leikkausta (intersection) sekunnissa, joka on merkittävästi isompi määrä kuin vaikka 2080ti:n 10 ”Gigasädettä” per sekunti. Eli vaikka nvidia olisi noihin säteisiinsä laskenu mukaan yhden tai jopa kaksi heijastusta niin se on jäljessä aika isolla marginaalilla. Toki vasta testeissä nähdään tämänkin asian oikea laita, mutta olen kyllä aika pettynyt jos alle 4x suorituskyky saadaan verrattuna edelliseen sukupolveen.

Edit: ja ainakin anandtechin artikkelissa on ilmaistu aika vahvasti että nvidian gigarays == miljardia intersectionia sekunnissa.
 
Viimeksi muokattu:
Toivottavasti on, muuten AMD mennee ohitse. Xbox series X esitietojen perusteella kykenee laskemaan 380 miljardia törmäystä/leikkausta (intersection) sekunnissa

Mutta onko toi teho kun koko katiska laitetaan laskemaan vain säteitä ja unohdetaan rasterointi kokonaan?
 
Mutta onko toi teho kun koko katiska laitetaan laskemaan vain säteitä ja unohdetaan rasterointi kokonaan?
Tolla määrällä laskee kaiken säteenjäljityksellä halutessaan, siksi vähän epäilen noin korkeaa markkinointilukua. Ihan yhtälailla ne nvidianki gigarayt on tilanteelle jossa mitään muuta ei tehdä.
 
Tuota oli käyty aikaisemminkin täällä. Patentin mukaan tuo on GPU:n sisällä, eikä erillinen piiri, kuten tuossa uutisessa. Eli vaikka RT suorituskyky olisi jemmattu sinne, niin se haukkaa edelleen oman pinta-alansa piiristä, joka on aina perinteisestä laskennasta tai rasteroinnista pois: piirin koko kun nostaa hintaa, niin on aina pakko tehdä joku kompromissi, jotta saadaan haluttuihin hintaluokkiin tuotteet. Yleensä kate ei ole se valittu kompromissi.

Tuossa traversal coprocessor jutussa voi olla enemmän takana se miten Jensen kuvasi Amperea: Sama arkkitehtuuri eri konfiguraatiolla datakeskuksiin, ammattikäyttöön ja kuluttajille. Joten jos RT on eriytetty omaksi blokikseen, niin se on kai helpompi lisätä kuluttaja piireihin, kun datakeskukset ei sitä tarvitse.
Igors lab spekuloi tuota muuten pidemmälle, eli sen mielestä Nvidia saattaa tehdä erillisen virransyötön tuolle GPU:n RT osiolle parantaakseen piirien energiatehokkuutta.
Ei voi vertailla 1:1 lukuja


"
The number of intersections you need to compute a single ray depends on the scene that you are tracing. In the simplest possible case of a single triangle, that'd be 1 intersection per ray. For nvidia's 10 gigarays, that was measured against some model with a bit over a million triangles. Without knowing how the BVH is constructed, though, no idea how many triangle intersections that needs. If the BVH is perfectly efficient and each volume contains 2 sub-volumes it would need 20 tests for a million triangles. It's unlikely to be that well defined however so twice that might actually be needed.

The other problem is that the 380 billion is a theoretical figure (multiply the number of TMUs by the clock speed and that's what you get), while 10 gigarays is an actual benchmark result. They're only comparable if every CU has 4 intersections to do every clock, and is never stalled waiting for instructions or data. This is not at all realistic, especially for something with pathological memory access patterns like ray tracing. Not to mention that texture mapping will block any intersections from being done. I'd guess that 50% occupancy would be an optimistic result.

Finally, nvidia's RT cores are relatively autonomous and can do the entire BVH traversal on their own. AMD's solution only does the intersection and needs to go back to shaders to actually traverse the BVH. Given shaders still have things to do - like shade the hits from each ray that is cast - a benchmark that only measures intersections without any other shader activity won't accurately represent real performance."
 
Ei voi vertailla 1:1 lukuja


"
The number of intersections you need to compute a single ray depends on the scene that you are tracing. In the simplest possible case of a single triangle, that'd be 1 intersection per ray. For nvidia's 10 gigarays, that was measured against some model with a bit over a million triangles. Without knowing how the BVH is constructed, though, no idea how many triangle intersections that needs. If the BVH is perfectly efficient and each volume contains 2 sub-volumes it would need 20 tests for a million triangles. It's unlikely to be that well defined however so twice that might actually be needed.

The other problem is that the 380 billion is a theoretical figure (multiply the number of TMUs by the clock speed and that's what you get), while 10 gigarays is an actual benchmark result. They're only comparable if every CU has 4 intersections to do every clock, and is never stalled waiting for instructions or data. This is not at all realistic, especially for something with pathological memory access patterns like ray tracing. Not to mention that texture mapping will block any intersections from being done. I'd guess that 50% occupancy would be an optimistic result.

Finally, nvidia's RT cores are relatively autonomous and can do the entire BVH traversal on their own. AMD's solution only does the intersection and needs to go back to shaders to actually traverse the BVH. Given shaders still have things to do - like shade the hits from each ray that is cast - a benchmark that only measures intersections without any other shader activity won't accurately represent real performance."
Vaikka toi nvidian gigarays luku on saatu jotain referenssimallia rendatessa, niin se on valittu sellaiseksi jossa saadaan korkein mahdollinen tulos. Tyypillisempi teho sillä on luokkaa 3,2 GRays/s.

 
Vaikka toi nvidian gigarays luku on saatu jotain referenssimallia rendatessa, niin se on valittu sellaiseksi jossa saadaan korkein mahdollinen tulos. Tyypillisempi teho sillä on luokkaa 3,2 GRays/s.

Ei juurikaan kiinnosta enään mite nopeaa 2080Ti ohjaimen RT on kun on tässä niitä pyöritellyt.
Ampere RT nopeus kiinnostais Cyberpunk 2077

OT
Noiden uusien konsolien RT ei ainakaan vakuuttanut kun Alex(Edit digital foundry) niitä arvioi, kikkailu optimointeja kun ei ole tarpeeksi tehoja mutta ei mikään yllätys kun vasta ensimmäinen RT toteutus Amd raudalla niin pakko niitä on optimoida ja saada pyörimään
mahdollisimman kevyesti ilman liian isoa Perf.Hittiä.
OT
 
Viimeksi muokattu:
Mutta tämä traversal coprocessor on mielenkiintoinen ja avaisi mahdollisuuksia mukavasti.
Enkä yllättyisi yhtään jos Rtx3060 olisi Rtx2080Ti nopeampi RT suorituskyvyssä.(tälläistäkin huhua oli aikaisemmin)

"NVIDIA could offload the ray tracing hardware away from the Ampere GPU chip. NVIDIA has the RT cores and everything else inside of its Turing GPU, but if we saw some amplification or off-loading of ray tracing to this traversal coprocessor, then things could get very interesting."

Read more: GeForce RTX 3080 and RTX 3090 rumored to pack 'traversal coprocessor'

Tuo juttu perustuu täydelliseen aiemman patentin väärinymmärrykseen ja puhtaaseen typeryyteen ja tietämättömyyteen.

Se patentti, mihin tuo perustuu, kertoo sen loogisen rakenteen, miten RTX-yksiköt jo 2000-sarjassa toimii ja loogisesti kytketty piirin muihin osiin eikä sillä ole mitään tekemistä minkään toisen piirin kanssa.

Ne travelsal coprosessorit on jo ne 2000-sarjan"RTX-ytimet".

Kaikki puheet jostain toisesta, erillsestä RT-piiristä on 100% höpöhöpöä.
 
Viimeksi muokattu:
Mitä jos 3090 ei olekaan Titan, vaan uusi tuotesegmentti 3080 Ti yläpuolella jolla saadaan korotettua pelinäytönohjainten hintaa vielä enemmän ylöspäin?

Nimenomaan Titanin ja xx80 Tin välissä on hinnoissa tilaa vaikka kahdellekin tuotteelle. 3090 ei vaan sovi nimenä pelinäyttiksen lippulaivamallille. Alemman pykälän Ti on lähes samantasoinen seuraavan mallin non-Ti:n kanssa.

Mutta kannattaa muistaa että nvidialla voi olla focus nyt RT suorituskyvyn parantamisessa, jotain huhuja on ollut että nelinkertaistuisi RT suorituskyky ja jos turingissa RT lisäsi pintaalaa jonkun lähteen mukaan noin 20% niin jos se RT teho nelinkertaistetaan niin se haukkaa jo melkoisesti tilaa jolloin rasterointi tehon nostamiseen ei välttämättä enää olekkaan niin hirmuisesti paukkuja jäljellä, eikä välttämättä edes tarvitsekkaan olla. 2080Ti:n rasterointi teho on kuitenkin melko kovalla tasolla.

Ainakin yli kaksinkertaistua sen pitäisi että ominaisuus kunnolla yleistyisi. Rauta ei riitä vaan softan pitää tulla myös, toista ei voi olla ilman toista.
 
3090 ei vaan sovi nimenä pelinäyttiksen lippulaivamallille. Alemman pykälän Ti on lähes samantasoinen seuraavan mallin non-Ti:n kanssa.
Miksi ei sovi? Paremminhan se sopii kuin Rtx3080Ti, 3090 kertoo heti että nyt kyseessä on kovempaa rautaa ja hinta olisi nimeämisen ja huhutun +40% suorituskyvyn turvin helppo hinnoitella jopa hieman korkeampaan hintasegmenttiin.

Mitähän alemman pykälän Ti ohjainta nyt tarkoitat? Ei siellä ole mitään Ti ohjainta joka olisi lähes saman tasoisen kuin ei Ti malli.
Ellet tarkoita Rtx3070 vs Rtx3070Ti
Siellä olisi siis
3090
3080
3070Ti
3070

3080Ti voisi tulla myöhemmin 3080 ja 3090 väliin,tilaa on.
 
Todennäköisesti. Mutta kannattaa muistaa että nvidialla voi olla focus nyt RT suorituskyvyn parantamisessa, jotain huhuja on ollut että nelinkertaistuisi RT suorituskyky ja jos turingissa RT lisäsi pintaalaa jonkun lähteen mukaan noin 20% niin jos se RT teho nelinkertaistetaan niin se haukkaa jo melkoisesti tilaa jolloin rasterointi tehon nostamiseen ei välttämättä enää olekkaan niin hirmuisesti paukkuja jäljellä, eikä välttämättä edes tarvitsekkaan olla.
Nvidialla ei ole kortissa RT-ytimiä, vaan törmäystarkastusytimiä. Jos korttiin laitetaan pelkästän niitä, ei sieltä tule mitään kuvaa ulos vaikka kuinka ajetaan 100% RT-engineä.

Sen jälkeen kun törmäyspiste on löydetty RT-säteelle, niin pitää vielä ajaa normaalia shaderia ja laskea mahdollisia sekundäärisäteitä jne.

Törmäystarkastusytimien lisäys on suhteellisen hyödytöntä jos samalla ei lisätä shadereita jolla sitten muokataan törmäyspisteet näkyväksi grafiikaksi.
 
Nvidialla ei ole kortissa RT-ytimiä, vaan törmäystarkastusytimiä. Jos korttiin laitetaan pelkästän niitä, ei sieltä tule mitään kuvaa ulos vaikka kuinka ajetaan 100% RT-engineä.

Sen jälkeen kun törmäyspiste on löydetty RT-säteelle, niin pitää vielä ajaa normaalia shaderia ja laskea mahdollisia sekundäärisäteitä jne.

Törmäystarkastusytimien lisäys on suhteellisen hyödytöntä jos samalla ei lisätä shadereita jolla sitten muokataan törmäyspisteet näkyväksi grafiikaksi.
On ne enemmän kuin törmäystarkistimia, siellä on myös puussa etenemisestä päättävä yksikkö. AMD taas on toteuttamassa juuri tuon että shadereilla lasketaan mihin edetään ja törmäystarkistin tekstuuriprosessorissa hoitaa oman tehtävänsä
 
V100 pinta-ala 815 mm² vs A100 pinta-ala 826 mm². Reilu 2,5 kertainen määrä transistoreja.
Ei olisi mitenkään yllätys, että paranneltu RT-core olisi tehokkaampi, ja ihan suhteessa saman verran pinta-alaa vievänä olisi 4 kertaa nopeampi. Eli 2,5 kertaa enemmän transistoreja, 60% tehokkaampi toteutus, olisi 4 kertainen nopeus.
 
V100 pinta-ala 815 mm² vs A100 pinta-ala 826 mm². Reilu 2,5 kertainen määrä transistoreja.
Ei olisi mitenkään yllätys, että paranneltu RT-core olisi tehokkaampi, ja ihan suhteessa saman verran pinta-alaa vievänä olisi 4 kertaa nopeampi. Eli 2,5 kertaa enemmän transistoreja, 60% tehokkaampi toteutus, olisi 4 kertainen nopeus.
A100:ssa on panostettu todella paljon tensoriyksiköihin, mitkä ovat käsittääkseni todella tiheää logiikkaa, mikä auttaa nostamaan transistoritiheyttä. Olettaen että peli-Ampereissa ei ihan samalla tavalla panosteta siihen tensoripuoleen (koska mm. rt-coret vie tilaa toisin kuin A100ssa) ne ei välttämättä pääse samaan transistoritiheyteen kuin A100.
 
V100 pinta-ala 815 mm² vs A100 pinta-ala 826 mm². Reilu 2,5 kertainen määrä transistoreja.
Ei olisi mitenkään yllätys, että paranneltu RT-core olisi tehokkaampi, ja ihan suhteessa saman verran pinta-alaa vievänä olisi 4 kertaa nopeampi. Eli 2,5 kertaa enemmän transistoreja, 60% tehokkaampi toteutus, olisi 4 kertainen nopeus.

IMHO joku "60% tehokkaampi toteotus per transistori" ei ole realistinen oletus; Ne "tehokkaammat toteutukset" perustuu melkein aina siihen, että tehdään järeämpi toteutus jossa on enemmän transistoreja. Sen sijaan kellotaajuden kasvu antaa potentiaalisesti hiukan "ilmaista tehonlisää"/pinta-ala.

Ja sama pinta-ala tulee "7nm" tekniikalla n. 60% kalliimmaksi kuin "12nm" tekniikalla, koska "7nm" tekniikka vaatii paljon moninkertaisemman valotuksen.

Ja Dennard Scalingin loppuminen tarkoittaa nimenomaan sitä, että valmistustekniikoiden kehittyessä piirien lämpötiheys pyrkii kasvamaan, ja joudutaan pikemminkin suunnittelemaan piirejä, joissa pinta-alaa uhrataan energiatehokkuudelle, jotta saadaan piirin lämmöntuotto/pinta-ala pysymään riittävän pienenä.



Mutta ei niiden RT-ytimien osuus siitä koko piirin pinta-alasta ole kovin suuri. Siellä on ihan hyvin varaa laittaa niitä tuplasti lisää/tehdä niistä tuplasti järempiä ilman että se olisi liikaa pois muualta;

Itse pidän realistisena esim. sitä, että joko 1) jokainen RT-ydin on tuplasti järeämpi, ja niiden määrä nousee melko samassa suhteessa kuin muidenkin laskentayksiköiden määrä nousee, tai 2) niiden RT-ytimien suorituskyky pysyy ennallaan mutta niiden määrä ensin tuplataan ja sitten siihen vielä päälle sama kerorn millä SM-ytimienkin määrä nousee.

Ja tämän päälle sitten se, että kellot nousee parikymmentä prosenttia.

Tällä päästäneen selvästi yli kolminkertaiseen nopeutuksee.
 
Viimeksi muokattu:
Nvidialla ei ole kortissa RT-ytimiä, vaan törmäystarkastusytimiä. Jos korttiin laitetaan pelkästän niitä, ei sieltä tule mitään kuvaa ulos vaikka kuinka ajetaan 100% RT-engineä.

Minä käytän niitä termejä jotka valmistaja tarjoaa.


RT Cores on GeForce RTX GPUs provide dedicated hardware to accelerate BVH traversal and ray / triangle intersection calculations, dramatically accelerating the ray tracing process. On GeForce GTX hardware, these calculations are performed on the programmable shader cores, a resource shared with many other graphics functions of the GPU.

Eli ilmeisesti nvidia sitten valehtelee.
 

Statistiikka

Viestiketjuista
258 232
Viestejä
4 486 787
Jäsenet
74 185
Uusin jäsen
Atte_

Hinta.fi

Back
Ylös Bottom