NVIDIA-spekulaatioketju (Blackwell ja tulevat sukupolvet)

Best buy
Tuli mieleen että 3dfx voodoo:n valmistus alkoi 1995 eli 30 vuotta sitten. Miljoona transistoria. 4 megaa muistia 299 USD

2005 Nvidian huippunäyttis oli 7800 GTX 512 302 miljoonaa transistoria, 512 megaa muistia, 649 USD

ja 2015 GTX TITAN X 8 miljardia transitoria 12 gigaa muistia 999USD

ja 2025 RTX 5090 92 miljardia transistoria 32 gigaa muistia 1999USD


Ei taida löytyä mitään loogista tapaa vertailla sitä miten käytännön suorituskyky on aina kehittynyt 10 vuoden jaksolla?
Kai noita voi verrata monella tapaa, Mä vertaisin niin, että ensin normalisoi suorituskyvyn wattia kohti ja sen jälkeen suorituskyky per mm2. Iso osa suorituskykylisästä on tehty kasvattamalla piirien kokoa ja virrankulutusta. Toki mennävuosien renderöintiteknologia kuten voodoo2 oli puhdasta rasteria mikä on aika pieni osa modernista gpu:sta kun puhutaan shadereista, säteenseurannasta, isojen matriisien kertomisen käsittelystä("ai").

Hinta per mm2 vois olla kans mielenkiintoinen metriikka yhdistää virrankulutusnormalisoituun suorituskykyyn per mm2.
 
1995 299 USD on noin 610$ 2025

2005 649 USD on noin 1040$ 2025

2015 999USD on noin 1330$ 2025

Jos joku hinta/tehovertailee niin kannattanee huomioida myös inflaatio, kun aikaa on mennyt niin kauan tässä välissä?
Lähteenä ChatGPT joten varauksella kannattaa suhtautua noihin numeroihin, en alkanut tarkistamaan.
 
1995 299 USD on noin 610$ 2025

2005 649 USD on noin 1040$ 2025

2015 999USD on noin 1330$ 2025

Jos joku hinta/tehovertailee niin kannattanee huomioida myös inflaatio, kun aikaa on mennyt niin kauan tässä välissä?
Lähteenä ChatGPT joten varauksella kannattaa suhtautua noihin numeroihin, en alkanut tarkistamaan.
välistä unohtui myös titan rtx 2499USD (2018)
 
1995 299 USD on noin 610$ 2025

2005 649 USD on noin 1040$ 2025

2015 999USD on noin 1330$ 2025

Jos joku hinta/tehovertailee niin kannattanee huomioida myös inflaatio, kun aikaa on mennyt niin kauan tässä välissä?
Lähteenä ChatGPT joten varauksella kannattaa suhtautua noihin numeroihin, en alkanut tarkistamaan.
Täytyisi ottaa huomioon myös noussut tulotaso. Vertaisi suoraan kuinka suuri osa mediaanikuukausitulosta menee korttiin.

Tässä vuoden 2017 rahassa. Eituo hyvin paljoa merkkaa.
1736927068424.jpeg
 
Viimeksi muokattu:
RTX 4090 FE:ssa on yksi parhaimmista jäähyistä ja sen lisäksi kortti käyttää lämpötyynyä GPU:n ja jäähyn välissä tahnojen sijaan. Kyseinen lämpötyyny on yksi syy miksi FE pärjää hyvin myös lämpötesteissä. Työlistalla olisi vastaava toteutus nykyiselle Zotac RTX 4090:lle, ehkä enemmänkin sisällön kuin varsinaisen tarpeen vuoksi.

Tuoreesta videostani löytyy graafiset palkit 50- ja 40-sarjojen oleellisimmista spekseistä. Ainakin itselle tuo ero 5090 hyväksi on astetta helpompi verrattavissa, kuin pelkkien numeroiden muodossa. :)

(Video keskittyy siis lähinnä omien näkemysten ja mielipiteiden esittämiseen koskien koko julkaisua.)

1736886035562.png
Mistä tämä taulukko on peräisin?

Tensor Core ‑lukemat eivät lainkaan pidä paikkaansa. Esimerkiksi RTX 5090:ssä on 680 Tensor-ydintä.

Joko Y-akselilta puuttuu TOPS-merkintä, tai taulukon laatija on sekoittanut Tensor Core ‑lukemat ja TOPS-lukemat keskenään.
 
Poimin tuohon ohjaimet 10 vuoden välein, en hinnan perusteella. Toki eka voodoo on siitä huono vertailukohta että se on hetkessä aika pienellä budjetilla tehty eikä edusta aikansa isoimpia ja kehittyneimpiä piirejä samaan tapaan kuin myöhemmät näyttikset.
ymmärrän, mutta titan rtx ja sen "korkea" hinta on tärkeä osa sitä yhtälöä mihin 90 sarjalaisten hinta perustuu, kun nvidia tajusi titan rtx kohdalla että kortille jolle ei pitäisi hintajouston mukaan olla kysyntää meni silti kaupaksi niin lamppu syttyi. Titan RTX 2499USD vs RTX 2080Ti 999USD

1736928920376.png
 
Amerikassa best buy listannut sivuille 5090 fe 1999$. NewEgg:ssa muutama AIB-malli näkyvillä ilman hintaa.
 
ymmärrän, mutta titan rtx ja sen "korkea" hinta on tärkeä osa sitä yhtälöä mihin 90 sarjalaisten hinta perustuu, kun nvidia tajusi titan rtx kohdalla että kortille jolle ei pitäisi hintajouston mukaan olla kysyntää meni silti kaupaksi niin lamppu syttyi. Titan RTX 2499USD vs RTX 2080Ti 999USD
Titanit osuu myös jollain tapa AI juttuihin. Tiedän tosi paljon pajoja missä oli titaneita käytössä AI ja compute juttujen takia eivätkä ne koskaan nähneet pelejä. GPU Konesalit ei ollut kovin juttu esim 2012 kun alex-net keksittiin. Alex-netin voi ihan perustellusti nähdä gpu ja ai boomin aloituskohtana vaikka alku ei ollut räjähtävä kuin tutkijaipiireissä ja harvoissa yrityksissä(google, nvidia jne)
 
Parempaa tietoa 40x0 vs. 50x0 suorituskyvystä. Jos käsitin wccftechin artikkelin oikein nämä luvut ovat nvidialta peräisin

1736952181470.png



---

Ilmeisesti korttien arvostelijat saaneet ajurit. Alkaa varmaan tulemaan vuotoja suorituskyvystä kun tuskin kaikilla arvostelijoilla moraali pitää


edit. Postausta korjattu. wccftech päivitti artikkelia ja 4090 vs. 5090 nopeusero 30% ei 15% kuten alkuperäisessä artikkelissa oli
 
Viimeksi muokattu:
Mistä tämä taulukko on peräisin?

Tensor Core ‑lukemat eivät lainkaan pidä paikkaansa. Esimerkiksi RTX 5090:ssä on 680 Tensor-ydintä.

Joko Y-akselilta puuttuu TOPS-merkintä, tai taulukon laatija on sekoittanut Tensor Core ‑lukemat ja TOPS-lukemat keskenään.
Kiitos huomiosta! Kieltämättä asia on kenties puolitarkoituksella ilmaistu sekavasti NVIDIAn sivustolla. Kävin kuitenkin lisäämässä tiedon yksiköistä videon alle. Suhteelliset erot sentään ovat kuitenkin samoja. :)
 
Parempaa tietoa 40x0 vs. 50x0 suorituskyvystä. Jos käsitin wccftechin artikkelin oikein nämä luvut ovat nvidialta peräisin

katso liitettä 1460885


---

Ilmeisesti korttien arvostelijat saaneet ajurit. Alkaa varmaan tulemaan vuotoja suorituskyvystä kun tuskin kaikilla arvostelijoilla moraali pitää

+25% kulutusta ja +15% tehoa. Ei hyvältä näytä
 
+25% kulutusta ja +15% tehoa. Ei hyvältä näytä
Katsellaan miten kulutus realisoituu... Voipi olla ettei ime maksimiwatteja peruskuormalla. Ei 4090:enkaan keskiarvokulutus isolla määriällä pelejä mitattuna osu 450W:iin(alle 400W). Voi olla, että jos on pelkkä raster+rt käytössä niin ei syö maksimiwatteja. Maksimit alkaa löytymään kun laitetaan dlss myös päälle niin tensoriytimetkin lähtee käyntiin syömään virtaa.

---

Lisätietoa fe jäähystä. Kovia väitteitä nvidialta.
The RTX 50 FE can maintain around 30-35 dBA with a load of up to 600W.
Photo-2025-01-08-13-26-40-1456x1092.jpg

 
Viimeksi muokattu:
Parempaa tietoa 40x0 vs. 50x0 suorituskyvystä. Jos käsitin wccftechin artikkelin oikein nämä luvut ovat nvidialta peräisin
Wccftech sekoili ton kanssa, nyt päivitetty artikkeli ja siellä lukee

GeForce RTX 5090 vs RTX 4090 (Native RT / No DLSS) = +30%

Jostain syystä olivat myös tuon oleellisen slaidin jättäneet artikkelistaan pois, löytyy TPU:lta:

the-cards-07.jpg
 
Parempaa tietoa 40x0 vs. 50x0 suorituskyvystä. Jos käsitin wccftechin artikkelin oikein nämä luvut ovat nvidialta peräisin

katso liitettä 1460885


---

Ilmeisesti korttien arvostelijat saaneet ajurit. Alkaa varmaan tulemaan vuotoja suorituskyvystä kun tuskin kaikilla arvostelijoilla moraali pitää

Onkohan artikkelia korjattu vai miksi tässä on luvut erilaiset. Joka tapauksessa tämän mukaan 4090 olisi vielä reippaasti tehokkaampi kuin 5080, kun monet täällä miettivät että päivittäisivät 4090 --> 5080.
Näyttökuva 2025-01-15 164129.png



Edit. Täällä näköjään jo keskusteltiinkin asiasta, olin hidas
 
Vähän niin kuin corejen määrästä päättelinkin, että köyhille siis täysin softapäivitys kun 5070 on ~~tasoissa 4070 Superin kanssa samaan hintaan. Lisäksi 5070 vetää 30 wattia enemmän virtaa.
 
Vähän niin kuin corejen määrästä päättelinkin, että köyhille siis täysin softapäivitys kun 5070 on ~~tasoissa 4070 Superin kanssa samaan hintaan. Lisäksi 5070 vetää 30 wattia enemmän virtaa.
Nuo kortit ovat aikaisemmin olleet niin power limit rajoitteisia, että varmaan sen takia sitä on nostettu vain, eikä sen takia että piiri olisi vähemmän energiatehokas.
 
5090 FE joutuu kyl käyttämään kaikki kikat kirjasta et saa järkevää jäähdytystä aikaseks. Veikkaan et se käy silti täydellä kuormalla aika lämpösenä ja voi olla haastavaa sitä jäähytellä etenkin jossain ITX kopassa missä ilma ei muutenkaan kierrä järkevästi.

Toki tuossa on lämmönjohtavuus kondiksessa kun piiri on saatanan iso ja nestemetallit välissä, mut silti vähän epäilen et tolla jäähyllä saa ihmeitä aikaan
 
Nuo kortit ovat aikaisemmin olleet niin power limit rajoitteisia, että varmaan sen takia sitä on nostettu vain, eikä sen takia että piiri olisi vähemmän energiatehokas.
Veikkaan, että oli myös muistikaistarajoitteisempia 40x0 sarjan kortit. Kiitos gddr7:en isomman kaistan eri yksiköt voivat toimia paremmin yhtä aikaa == vaatii lisää virtaa. Ehkä myös arkkitehtuuriparannukset mahdollistavat parempaa yhtäaikaista toimintaa(parempi shader reordering toteutus esim)

GDDR7 vaatinee enempi virtaa kun mahdollistaa isommat siirtonopeudet. 5090:en tapauksessa myös isompi määrä muistipiirejä. Ei tule nopeammat muistit ilmaiseksi virrankulutuksen kannalta.
 
Ehkä se isoin 5090 ostokiima vähän laantui vaikka onhan tuo 30% parannus myös iso. Tuo hyppy vain mistä tahansa muusta kortista 4090 korttiin oli ihan älytön parannus varsinkin säteenseurannassa, että ei varmaan vastaavaa kokemusta ihan lähitulevaisuudessa tule.

4090 pitää siis paikkansa toiseksi tehokkaimpana pelikorttina todennäköisesti 6000-sarjaan asti. Sinällään kyllä harmi, odotin että rasterointisuorituskyky ei kauheita parannuksia kokisi uudessa sukupolvessa, mutta säteenseurantaan toivoin isoa hyppyä. Nyt se iso hyppy säteenseurantasuorituskykyyn olikin vain DLSS4...
 
Ehkä se isoin 5090 ostokiima vähän laantui vaikka onhan tuo 30% parannus myös iso. Tuo hyppy vain mistä tahansa muusta kortista 4090 korttiin oli ihan älytön parannus varsinkin säteenseurannassa, että ei varmaan vastaavaa kokemusta ihan lähitulevaisuudessa tule.

4090 pitää siis paikkansa toiseksi tehokkaimpana pelikorttina todennäköisesti 6000-sarjaan asti. Sinällään kyllä harmi, odotin että rasterointisuorituskyky ei kauheita parannuksia kokisi uudessa sukupolvessa, mutta säteenseurantaan toivoin isoa hyppyä. Nyt se iso hyppy säteenseurantasuorituskykyyn olikin vain DLSS4...
Vähän epäilen ettei rasteri enää parane tulevaisuudessakaan. Seuravassa sukupolvessa rasterin merkitys entistä pienempi kun siellä 2027 paikkeilla alkaa olemaan next gen konsolitkin tulossa missä tehot riittää path tracingiin. Joutuu hyväksymään sen, että tulevaisuudessa on 1080p, 1440p, 4k path tracing kortteja kera ai:n
 
Blackwell:ssa enemmän uutta kuin prosentit kertovat. Läppäreihin virrankulutusta alaspäin, klusterit säteenseurannassa auttavat useammalla tavalla, eri asioiden priorisointia ja yhtäaikaista ajamista parannettu jne. Artikkelissa paljon enemmän asiaa kuin mitä lainauksissa on.
Ada also partitioned the FP32 cores into two blocks, one that could purely execute FP32 and one that could execute both FP32 & INT32 formats. With Blackwell, NVIDIA has doubled its INT32 GPU throughput which can help accelerate workloads such as Work Graphs and Shader Execution, and 5th Gen Tensor Cores also offer the aforementioned doubled throughput.

Blackwell also improves SER (Shader Execution Reordering) by 2x by reordering the neural models and the standard shading models and putting the same work together in an organized fashion.
4th Gen RT Cores introduce various new capabilities, such as a Triangle Cluster Intersection Engine which replaces the previous Triangle Intersection Engine which is optimized for Mega Geometry and can handle clusters of Mega Geometry and standard geometry much more efficiently
The new rail gate system is particularly useful in laptops as it reduces leakage by a major margin.
The new memory interface also offers twice the efficiency of GDDR6 in terms of PJ/bit. This will be very useful in mobility "Max-Q" designs where efficiency matters the most.
 
Viimeksi muokattu:


Tuommoinen preview löyty youtubesta. Vaikeahan tuostakin on arvioida miltä tuo latenssi käytännössä tuntuu jne, mutta kyllähän tässä itsellä kuume nousee kovaa tahtia.
 
Ajatuksissa ollut päivittää 4070Ti -> 5080, noin 1300-4000eur hintaan, mutta ei tuo ero ihan niin massiivinen ehkä olekaan, että saapa nähdä. Ehkä jään odottamaan jos tuosta 5080:sta tulisi reilummalla muistilla jokin malli myöhemmin..
 
Veikkaan, että oli myös muistikaistarajoitteisempia 40x0 sarjan kortit.
Muistaakseni 4070 Ti vs 4070 Ti Super tehoero jäi hyvin pieneksi, vaikka jälkimmäisessä oli 33% enemmän muistikaistaa, joka viittaisi siihen, että alkuperäinen muistikaista oli oikein mitoitettu.
The new memory interface also offers twice the efficiency of GDDR6 in terms of PJ/bit. This will be very useful in mobility "Max-Q" designs where efficiency matters the most.
Tuossa lainauksessa varmaan yksikkö hieman pielessä. En haluaisi olla huoneessa (tai edes samassa kaupungissa), kun tietokone käynnistyy ja ensimmäisen bitin liikahtaessa muistiväylällä vapautuu petajouleissa mitattava määrä lämpöenergiaa.
 
Viimeksi muokattu:
Muistaakseni 4070 Ti vs 4070 Ti Super tehoero jäi hyvin pieneksi, vaikka jälkimmäisessä oli 33% enemmän muistikaistaa.
40x0 sarjassa on enemmän rajotteita sen suhteen mitä saa ajettua yhtä aikaa versus 50x0.
NVIDIA is introducing a new programmable Coprocessor known as Amp which sits at the front of the GPU, and interacts differently with the different cores on the GPU while understanding what's running on them, what's being done on them, and scheduling precisely the specific workload for the right core.

Parannettu SER vähentää aikaa missä odotellaan muistia kun shaderit saadaan sortattu paremmin optimaaliseen ajojärjestykseen.

int32/fp32 yhtä aikaa parantaa suorituskykyä versus ada missä oli mahdollisuus joutua odottamaan.

---

Piirien koot
1736959061328.png
 
Viimeksi muokattu:

Uusimmat viestit

Statistiikka

Viestiketjuista
264 839
Viestejä
4 583 586
Jäsenet
75 510
Uusin jäsen
Kassu6

Hinta.fi

Back
Ylös Bottom