NVIDIA-spekulaatioketju (Blackwell ja tulevat sukupolvet)

Mun testeissä gpt-oss:120b tuntunut aika pätevältä. Ensimmäinen malli pitkään aikaan mikä sykäyttää. Vaatii tosin 80GB muistia. Mulle aika nollapäivitys olis 32GB->48GB. Jos meinais isompaa hyötyä saada niin tarvisi olla 96GB versio kortista.

Massimies toki vois oistaa gb300 työkoneen. 288GB hbm3e + 496GB erittäin nopeaa koherenttia muistia cpu:n puolesta(nvlink c2c väylä) mitä voi myös käytellä ihan eri tavalla kuin jos pitäisi swapata pcie:n yli

1755766797316.png

Oon vähän pyöritellyt tuota RTX Pro 6000:sta mutta koska se on niin kallis pitää tyytyä odottelemaan seuraavaa versiota. Jos sen seuraavan 6000 mallin muistimäärä taas nousis.. olis se 9000 euroa paljon paremmin käytetty.. sitä kun pitää sitten käyttää vuosia. Se jakoon tullut täys versio Deepseekistä tais viedä jotain 1.5tb .. Rubin versio tuollaisesta GB300 laitteesta saman tyylisillä kertaluokan muistimäärän kasvuilla niin avot. . sit on jo hetkes kapasiteettia. Jos nopea arvauksen hinnasta heittäis tuosta Dellistä. Oiskohan 45 000$ :hmm:...edit googlettelin vähän. ja veikkaavat 90K hintaa.
 
Oon vähän pyöritellyt tuota RTX Pro 6000:sta mutta koska se on niin kallis pitää tyytyä odottelemaan seuraavaa versiota. Jos sen seuraavan 6000 mallin muistimäärä taas nousis.. olis se 9000 euroa paljon paremmin käytetty.. sitä kun pitää sitten käyttää vuosia. Se jakoon tullut täys versio Deepseekistä tais viedä jotain 1.5tb .. Rubin versio tuollaisesta GB300 laitteesta saman tyylisillä kertaluokan muistimäärän kasvuilla niin avot. . sit on jo hetkes kapasiteettia. Jos nopea arvauksen hinnasta heittäis tuosta Dellistä. Oiskohan 45 000$ :hmm:...edit googlettelin vähän. ja veikkaavat 90K hintaa.
En tiedä miten nvidia pystyisi 60x0 sarjan pelikorttipohjaisissa pro piireissä nostamaan muistinmäärää nykyisestä. Blackwell pro kortit käyttävät jo clamshellia, 3GB piirejä ja 512bit muistiväylää. Ei kai muistiväylää pelipiireissä enää levennetä, hbm muistit pelipiireissä epätodennäköistä? Teoriassa voisi olla yli 3GB kokoisia gddr7 muistipiirejä mutta realistisesti ei kai sellaisista ole edes ollut huhuja?

Aika pieni mutta teoreettinen mahdollisuus olisi 2x384bit muistiväylän piirit chiplettinä mutta ei sellaisestakaan ole edes huhuja.

Jos GB300 NVL:en missä 72xgpu maksaa 3M$ niin voisin kuvitella dellin hinnaksi 3M$/72 = about 42k$. Jos se on tuota kalliimpi niin parempi ostaa vain konesalia ellei ole jotain pakottavaa syytä saada konetta työpöydälle. Konesalihärpättimessä järeä nestejäähy, virransyöttö, nvlink kytkin yms. mitä ei tuollaisessa 1gpu härvelissä tarvi, pitäisi näkyä hinnassa.
 
Viimeksi muokattu:
Jos GB300 NVL:en missä 72xgpu maksaa 3M$ niin voisin kuvitella dellin hinnaksi 3M$/72 = about 42k$.
Jonkun analyytikon (Loop Capital Markets) mukaan Apple osti noita miljardilla ja maksoi 3,7-4 miljoonaa kappaleelta. 4M/72 = 56k USD. Ja luulis että miljardilla kun ostaa niin saa paljousalea...

Muutenkin NVL72:ssa on 36 Grace CPU:ta eli puolikas per GPU. GB300 työasemassa saa kokonaisen CPU:n per GPU.

 
Jonkun analyytikon (Loop Capital Markets) mukaan Apple osti noita miljardilla ja maksoi 3,7-4 miljoonaa kappaleelta. 4M/72 = 56k USD. Ja luulis että miljardilla kun ostaa niin saa paljousalea...

Muutenkin NVL72:ssa on 36 Grace CPU:ta eli puolikas per GPU. GB300 työasemassa saa kokonaisen CPU:n per GPU.

NVL72:ssa on myös kasa nvlink kytkimiä+johdotusta että mistä tahansa gpu:sta saa nopean yhteyden mihin tahansa muuhun gpu:hun. Mukana tulee myös jääkaappipakastimen kokoinen nestejäähdytinyksikkö. 100kW+ edestä myös virransyöttöä. Monella tapaa pöytäkone gb300 dell:lta yksinkertaisempi ja bulkkiosista kasattu versus gb300 nvl72.

1755777905864.png


Vaikeapa noista on sanoa varmaksi muuta kuin, että jos gb300 dell workstation maksaa suhteessa liikaa niin fiksu ostaa/vuokraa konesalia eikä osta pömpeliä pöydälle.
 
Viimeksi muokattu:
NVL72:ssa on myös kasa nvlink kytkimiä+johdotusta että mistä tahansa gpu:sta saa nopean yhteyden mihin tahansa muuhun gpu:hun. Mukana tulee myös jääkaappipakastimen kokoinen nestejäähdytinyksikkö. 100kW+ edestä myös virransyöttöä. Monella tapaa pöytäkone gb300 dell:lta yksinkertaisempi ja bulkkiosista kasattu versus gb300 nvl72.


Vaikeapa noista on sanoa varmaksi muuta kuin, että jos gb300 dell workstation maksaa suhteessa liikaa niin fiksu ostaa/vuokraa konesalia eikä osta pömpeliä pöydälle.

Kuten ehdotitkin.. Sitä tapahtuu paljon. Esim tämä pieni uutinen antaa osviittaa.

"LIVINGSTON, N.J., March 10, 2025 /PRNewswire/ -- CoreWeave today announced a deal to deliver AI infrastructure to OpenAI, expanding OpenAI's compute capacity for training and delivering its latest models at scale to its hundreds of millions of users around the world. The contract value for this strategic deal is up to $11.9 billion. As part of this deal, OpenAI will become an investor in CoreWeave through the issuance of $350.0 million of CoreWeave stock."

CoreWeave:lla vuokraustaso vissiin aika hyvissä käyttöasteissa. Ulkomuistista en muista, että miten hyvät prosentit niillä oli.

Aikoinaan tuli pohdittua sitäkin ulottovuutta, että monille junnuille on 4080 nvidian Geforce Now palvelun kautta selkeästi edullisempi ratkaisu. jos esim 25 eur / kk .. tekee se 25eur x 24 = 600 eli puolet 5080 hinnasta.
tuo 24kk on siis siksi, että se on suunnilleen näyttisten julkaisu sykli. 600 euroa säästöä + sähkölaskusäästöt ilman, että yhtenä generaationa ei ostakkaan omaa

En tiedä onko tuota Geforce Now palvelua tarjolla esim Suomessa ja hinta voisi tosiaan olla ainakin tuo 25 eur .. kun 19.99 on dollarihinta jenkeissä.
 
Kuten ehdotitkin.. Sitä tapahtuu paljon. Esim tämä pieni uutinen antaa osviittaa.

"LIVINGSTON, N.J., March 10, 2025 /PRNewswire/ -- CoreWeave today announced a deal to deliver AI infrastructure to OpenAI, expanding OpenAI's compute capacity for training and delivering its latest models at scale to its hundreds of millions of users around the world. The contract value for this strategic deal is up to $11.9 billion. As part of this deal, OpenAI will become an investor in CoreWeave through the issuance of $350.0 million of CoreWeave stock."

CoreWeave:lla vuokraustaso vissiin aika hyvissä käyttöasteissa. Ulkomuistista en muista, että miten hyvät prosentit niillä oli.

Aikoinaan tuli pohdittua sitäkin ulottovuutta, että monille junnuille on 4080 nvidian Geforce Now palvelun kautta selkeästi edullisempi ratkaisu. jos esim 25 eur / kk .. tekee se 25eur x 24 = 600 eli puolet 5080 hinnasta.
tuo 24kk on siis siksi, että se on suunnilleen näyttisten julkaisu sykli. 600 euroa säästöä + sähkölaskusäästöt ilman, että yhtenä generaationa ei ostakkaan omaa

En tiedä onko tuota Geforce Now palvelua tarjolla esim Suomessa ja hinta voisi tosiaan olla ainakin tuo 25 eur .. kun 19.99 on dollarihinta jenkeissä.
On tuo GFN tarjolla Suomessakin. Jos ostaa 6kk kerrallaan niin hintaa on 109,99€ eli 18,33€/kk. Kuukausi kerrallaan maksaa 21,99€. Tuon miettimäsi 2 vuotta saisi siis 6kk tilauksilla hintaan 440€ eli vielä reilusti halvemmalla kuin mainittu 600€.
 
Kuten ehdotitkin.. Sitä tapahtuu paljon. Esim tämä pieni uutinen antaa osviittaa.
Nvidian tuloksesta ja tuloskasvustahan tuon näkee suoraan. AI konesali suurinpiirtein 10x versus pelipuoli. Konesalipuolessa toki sisällä muutakin kuin gpu:ta, esim. verkkopuolikin(ex mellanox) 2x pelipuolen liikevaihto.

Se mitä yritin sanoa jos nyt vielä alleviivaa, että dellin 1xgb300 serverin hinta on oltava järkevä suhteessa hyötyyn ja vaihtoehtoihin jos aikovat sitä oikeasti myydä. Toinen alleviivaus, konesalirauta per gpu on paljon eksoottisempi kuin massavalmistettava 1gpu serveri. Korjaan mun alkuperäisen arvion hinnasta 4miljoonaa/72:lla arvaukseksi. 1-3 miljoonaa / 72 mitä alunperin ehdotin oli vanha hinta mikä oli arvioitu gb200 nvl72:lle. Näemmä hinta pompahtanut gb200 nvl72 - gb300 nvl72 siirtymässä.

Applen 1 miljardi kauppa on vielä pieni diili. Meta&co ostaa kymmenillä miljardeilla, kuten myös xAI.
 
Nvidian kaikki seuraavat konesalipiirit ohittaneet tapeout vaiheen. 6 piiriä lienee: gpu, cpu, io-piiri, nvlink, infiniband, silicon photonics piiri?

Jensenin sanoin:
Huang said he came to thank TSMC, where they have taped out six brand-new chips, including a new GPU and a silicon photonics processor for Nvidia's next-generation Rubin-architecture supercomputers. Tape out refers to finalizing the design of a chip so production can begin

"This is the first architecture in our history where every single chip is new and revolutionary," he said. "We've taped out all of the chips."
 
Juu metalla on hiukan lähtenyt mopo käsistä. Nää on toki vanhoja uutisia. Kohta perustavat varmaan jonkun oman firman nimeltä Meta Power inc. :lol:Metan oma ydinvoimala yksikkö.


"The first multi-gigawatt data centre, called Prometheus, is expected to come online in 2026, Zuckerberg said.
He said one of the sites would cover an area nearly the size of Manhattan (59.1 sq km/22.8 sq miles).
Meta has invested heavily in efforts to develop what it called "superintelligence" - technology that it said could out-think the smartest humans.
The company, which has made most of its money from online advertising, generated more than $160bn in revenue in 2024."
 
Juu metalla on hiukan lähtenyt mopo käsistä. Nää on toki vanhoja uutisia. Kohta perustavat varmaan jonkun oman firman nimeltä Meta Power inc. :lol:Metan oma ydinvoimala yksikkö.


"The first multi-gigawatt data centre, called Prometheus, is expected to come online in 2026, Zuckerberg said.
He said one of the sites would cover an area nearly the size of Manhattan (59.1 sq km/22.8 sq miles).
Meta has invested heavily in efforts to develop what it called "superintelligence" - technology that it said could out-think the smartest humans.
The company, which has made most of its money from online advertising, generated more than $160bn in revenue in 2024."
Eipä nuo muut isot sen vähempää sijoita ai-konesaleihin. Microsoft jotain 80 miljardia+- ja hommasivat three mile islandin ydinvoimalan mitä ajetaan ylös. Amazon, google yms. ihan samoissa luvuissa myös. Jos ei sijoita, ei voi voittaa. Tekevät rakentamisesta huolimatta megavoittoja, kai se on parempi käyttää rahoja tulevaisuuteen kuin tehdä nokiat. xai:lla 200k gpu klusteri ja rakentavat seuraavaa mihin tulee mahtumaan miljoona gpu:ta Musk’s xAI buys overseas power plant to power one million AI GPUs data center

Apple pelaa ihan penneillä versus muut.
 
Nvidia hot chips konferenssissa kertonut tarkempia tietoja gb200/gb300 nvl72 räkeistä

1756108663985.png

1756108724014.png


4M$ hökötys, 120kW, nestejäähy, aika iso
The top of the rack houses the switches. Directly underneath, there's the rack power supply. What it does is it brings in the high-voltage AC from the data center and then converts it to DC output to the DC buck bar in the back of the rack.

Directly under the power supply, we have the compute trays. So in GB200, they have 300 chips within 10 compute trays, followed by nine switch trays, and then another eight compute trays. Each of those compute trays is capable of 80 FP4 Petaflops. The entire system, when we tie it all together with the switches, is capable of 1.4 exaflops. The entire system is approximately 120 kilowatts. Each compute tray is around 7 kilowatts. The whole system is tied together using the NVLink spine.
1756108758119.png

 
Blackwell Ultraan on tulossa PCIe Gen 6.
Tuskin on tulossa kuluttajamalleihin aivan näin varhaisessa vaiheessa, kun ei ole prosessori/emolevytukeakaan vielä.
 
Noissa Nvidian bokseissa nousee ai-käytön teho aika hyvin sukupolvesta toiseen. Samaa tekee toki AMD. AMD:llä merkittävä iso hyppäys tulee siinä kohtaa kun AI-kortit pohjaavat uusiin CDNA next / UDMA prossuihin ja HBM4 muisteihin.

wccftech tehnyt kohtuu hyviä koontiartikkeleita. Hot Chips julkistusten tiimoilta.


NVIDIA Dissects Its GB10 Superchip For DGX AI PCs: 3nm With 20 ARM v9.2 CPU Cores, 1000 TOPS NVFP4 Blackwell GPU, LPDDR5x-9400 Memory Support, 140W TDP

 
Nvidia julkaisi konesaliin uuden cpx kiihdyttimen mikä tulee tarjolle 2026 lopulla. CPX voi olla samankaltainen kuin 6090:en. Ehkä mielenkiintoisin asia 128GB gddr7-muisti. 4GB gddr7 piirit tulossa vaikka tällaisia ei kai ole kukaan taho julkaissut?


 
Viimeksi muokattu:
saas nähdä millon suomessa on niin paljo isoja data centtereitä että alkaa kiinteistöjen hintoja laskemaan. Jenkkilässähän on jokusia paikkoja jo missä sen huminan tuntee jo sisäseinään koskemall-
 
Nvidia julkaisi konesaliin uuden cpx kiihdyttimen mikä tulee tarjolle 2026 lopulla. CPX voi olla samankaltainen kuin 6090:en. Ehkä mielenkiintoisin asia 128GB gddr7-muisti. 4GB gddr7 piirit tulossa vaikka tällaisia ei kai ole kukaan taho julkaissut?

128GB kelpais kyllä. Voipi olla, että se 128GB tulee vain 6000 malliin. eli hypätään 96GB sta 128:gigaan mikä olisi reilusti pienempi gen to gen hyppy. Ihan ok parannus silti. 5GB moduulitkin tulee ajan myötä. Nvidia toki tietää julkaisusyklit ja patistaa mm DDR6 muistien aikaisempaa julkkaria, että saa enemmän kaistaa DDR -osuuteen palvelimissaan.
 
128GB kelpais kyllä. Voipi olla, että se 128GB tulee vain 6000 malliin. eli hypätään 96GB sta 128:gigaan mikä olisi reilusti pienempi gen to gen hyppy. Ihan ok parannus silti. 5GB moduulitkin tulee ajan myötä. Nvidia toki tietää julkaisusyklit ja patistaa mm DDR6 muistien aikaisempaa julkkaria, että saa enemmän kaistaa DDR -osuuteen palvelimissaan.
Huhuja ollut 64Gb==8GB piireistäkin ainakin samsungiin liittyen. Ehkä AI boomi johtaa siihen, että tuollaisia piirejä oikeasti tulee. Nvidia lienee niin iso ja rikas asiakas, että voi ajaa piirikehitystä. Tais gddr6x:kin pysyä käytännössä nvidia spesifisenä teknologiana eikä muita (merkittäviä?) käyttäjiä.

---

Mietiskelin, että kuinkahan paljon cpx piirejä menee kaupaksi? Ennustavat, että gb200 nvl72:sta myydään noin 30000 tänä vuonna. Jos nvidia myisi jokaisen tuollaisen cpx:lla varustttuna niin cpx-piirejä menisi 30000*72 = 2.160miljoonaa vuodessa. Tämä varmaankin olisi enemmän kuin mitä 5090:ia myydään vuodessa. Toki matematiikka ei toimi kun gb200:en lisäksi myydään gb300:ia. Toisaalta cpx on "vain" inferenssiin tarkoitettu niin pitäisi jotenkin pystyä erottamaan training ja inference kysyntä toisistaan jos haluaisi tehdä paremman arvion. Puhuttaneen kuitenkin yli miljoonasta cpx-piiriistä per vuosi.
 
Nvidiahan vois ostaa yhden tollasen muistivalmitajan ei tartteis enää jossitella :psmoke:. Ottamatta kantaa onko se viisasta. Kilpailuviranomaiset kyllä herkästi lopettaanvidian valtaushankkeet eivät Armiakaan saaneet ostettua.
 
miks muuten yleensä puhutaan ai boomista tai kuplasta kun se ei oo menossa mihinkään vaan vain adoptio kiihtyy kunnes siitä tulee status quo
 
miks muuten yleensä puhutaan ai boomista tai kuplasta kun se ei oo menossa mihinkään vaan vain adoptio kiihtyy kunnes siitä tulee status quo
Tässä vaiheessa ei taida plussalla olla kuin konesalien pystyttäjät (sisältäen siis rautavalmistajat kuten Nvidia), joten kyllähän tuo melkoinen kupla vielä on odottamassa, että tuleeko koko hommasta kaupallisesti kannattavaa vai puhkeaako kupla.
Jos kupla puhkeaa, niin investoinnit niihin konesaleihinkin romahtaa ja Nvidian markkina-arvosta todennäköisesti sulaa sievoinen siivu pois, sillä nythän sitä on kasvattanut vain odotukset, että piireillä riittää kysyntää.
 
Tässä vaiheessa ei taida plussalla olla kuin konesalien pystyttäjät (sisältäen siis rautavalmistajat kuten Nvidia), joten kyllähän tuo melkoinen kupla vielä on odottamassa, että tuleeko koko hommasta kaupallisesti kannattavaa vai puhkeaako kupla.
Jos kupla puhkeaa, niin investoinnit niihin konesaleihinkin romahtaa ja Nvidian markkina-arvosta todennäköisesti sulaa sievoinen siivu pois, sillä nythän sitä on kasvattanut vain odotukset, että piireillä riittää kysyntää.
Kyllähän tiettyjä ominaisuuksia liiotellaan vielä, mutta fakta on kuitenkin että tietokannat opettavat jo itseänsä ja on moni homma missä suht yksinkertaisellakin agentilla voidaan korvata järkyttävä määrä ihmistunteja. Varmaan joku pieni notkahdus voi tulla aina markkinoilla mutta on kyllä ns. big picture on mielestäni aivan nähtävissä.
 
Pitkä haastis jenseniltä linkin videolla. Jos nvidian tulevaisuus kiinnostaa niin hyvä kuunneltava. Keskustelun kannalta oleellinen osa, nvidian kaikilla softareilla ja piirisuunnittelijoilla AI avustimet käytössä. Jensen sanoo, että avustimista iso apu työtehon kanssa, syy siihen miksi nvidia pystyy puskemaan nyt vuosittain ulos uudet piirit konesaliin. Tähän tietenkin päälle auto/robotiikkapuoli, peligpu:t, mediatek ja intel yhteistyön windows koneet(tulossa, ei julkaistu),... gb300:enkin joka korvasi alle vuosi sitten myyntiin tulleen gb200:en on uusi piiri. gb300:ssa uhrattu muita tarkkuuksia fp4 suorituskyvylle. fp4 tarkkuus mitä openai:n gpt5:en ja open source mallit käyttävät paljon.

Piireistä jensen puhui, että katsovat AI:ta järjestelmä/konesalitason haasteena, eivät piirihaasteena. Ts. Yrittävät rakentaa optimoituja ratkaisuja konesalikoossa eikä vain ai-kiihdytinpiiriä. Samaan liittyen vuosittainen päivitys ei ole vain super ai gpu vaan koko konesalipiiripino(6 uutta piiriä+cpx 2026) ja softapino. AI inferenssi GPU jakaantuu kahtia 2026 lopussa kun tulee prefill gddr7 muisteilla oleva cpx piiri ja tokeninluontipiiri hbm muisteilla(rubin). Jensen vihjasi, että kun katsoo ai:ta konesalitason haasteena niin muitakin kiihdyttimiä olisi mahdollista luoda. Ehkä taskipohjaiset kiihdyttimet ovat tapa millä konesalitasolla saadaan suorituskykyä skaalattua ylöspäin ilman että hinta ja virrankulutus pompsahtaa massiivisesti. CPX gddr7 muisteilla huokeampi kuin ajaa prefill vaihde kalliilla rubin+hbm-piirillä.

Jensen/Nvidia näkee, että inferenssipuolella tulee olemaan valtava määrä kysyntää laskentateholle. Voihan tuo olla, että käy kuten internetin kanssa. On kupla joka poksahtaa mutta siitä huolimatta internet tapahtuu. Toisaalta sellainen iso ero dot.com:iin että firmat tekevät oikeasti voittoa, myös ne jotka investoivat kymmeniä/satoja miljardeja konesaliin versus dot.com missä pelattiin mielikuvitusrahalla, kuvitelmilla ja firmat eivät todellakaan tehneet voittoa.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://www.youtube.com/watch?v=pE6sw_E9Gh0


Because the prefill stage during inference tends to heavily utilize compute (FLOPS) and only lightly use memory bandwidth, running prefill on a chip with lots of expensive HBM featuring very high memory bandwidth is a waste. The answer is a chip that is skinny on memory bandwidth and relatively fat on compute. Enter the Rubin CPX GPU
 
Viimeksi muokattu:
Nyt kun RTX 5070 Superista on alkanut liikkua huhuja, täytyy todeta, että Nvidian logiikka vaikuttaa jälleen varsin erikoiselta.

Kortissa olisi väitetysti 18 Gt VRAM:ia, mutta vain noin +4,17 % enemmän ytimiä (6400 vs. 6144) ja +8 TMU verrattuna tavalliseen
RTX 5070.

Samaan aikaan RTX 5070 Ti
tarjoaa noin +40 % enemmän laskentayksiköitä (CUDA ja TMU) verrattuna huhuttuun RTX 5070 Superiin, mutta -2Gt vähemmän videomuistia.

Juuri se tekee tilanteesta hämmentävän — koska 18Gt videomuistista olisi todennäköisesti ollut enemmän hyötyä juuri Ti-mallissa, jolla on enemmän laskentatehoa.
 
Nyt kun RTX 5070 Superista on alkanut liikkua huhuja, täytyy todeta, että Nvidian logiikka vaikuttaa jälleen varsin erikoiselta.

Kortissa olisi väitetysti 18 Gt VRAM:ia, mutta vain noin +4,17 % enemmän ytimiä (6400 vs. 6144) ja +8 TMU verrattuna tavalliseen
RTX 5070.

Samaan aikaan RTX 5070 Ti
tarjoaa noin +40 % enemmän laskentayksiköitä (CUDA ja TMU) verrattuna huhuttuun RTX 5070 Superiin, mutta -2Gt vähemmän videomuistia.

Juuri se tekee tilanteesta hämmentävän — koska 18Gt videomuistista olisi todennäköisesti ollut enemmän hyötyä juuri Ti-mallissa, jolla on enemmän laskentatehoa.
Nvidia ei tee uusia piirejä supereihin. Nvidia käyttää samoja gb202, gb203, gb205 piirejä supereissa mutta konfiguroidaan eri tavalla. Tästä tulee rajoitteet miten voi cu-yksiköitä lisätä. Ei voi tehdä kuin pieniä viilauksia, nostaa vähän virrankulutusta ja kelloja ylöspäin. Muisti kiitos 3GB piirien isoin vipu mistä voi vääntää.
 
Nyt kun RTX 5070 Superista on alkanut liikkua huhuja, täytyy todeta, että Nvidian logiikka vaikuttaa jälleen varsin erikoiselta.

Kortissa olisi väitetysti 18 Gt VRAM:ia, mutta vain noin +4,17 % enemmän ytimiä (6400 vs. 6144) ja +8 TMU verrattuna tavalliseen
RTX 5070.

Samaan aikaan RTX 5070 Ti
tarjoaa noin +40 % enemmän laskentayksiköitä (CUDA ja TMU) verrattuna huhuttuun RTX 5070 Superiin, mutta -2Gt vähemmän videomuistia.

Juuri se tekee tilanteesta hämmentävän — koska 18Gt videomuistista olisi todennäköisesti ollut enemmän hyötyä juuri Ti-mallissa, jolla on enemmän laskentatehoa.

RTX 5070 on GB205 piirillä ja siinä on 192-bittinen muistiväylä
TRX 5070 Ti on GB203 piirillä ja siinä on 256-bittinen muistiväylä

nVidia ei julkaise epäsymmetrisillä muistikonfiguraatioilla varustettuja kortteja, joten samoja piirejä käyttämällä RTX 5070 Super on mahdollista varustaa vain 12, 18 tai 24 gigan muistimäärällä ja RTX 5070 Ti Super taasen 16, 24 tai 32 gigan muistilla. Ja todennäköisesti jos tulee, niin nimeomaan 24 gigan muistilla (joskin 16 mahdollinen kanssa ja 24 sitten varattu vain 5080 Superille, joka sekin samasta piiristä tehty).

5070 tuolla 12 gigan muistilla on turhan vähän suhteessa kortin suorituskykyyn ja aiheuttaa pullonkaulan nyt ja tässä useissa peleissä, mutta 16 gigaa tuossa Ti-mallissa taasen ei ole liian vähää, vaan kortin suorituskyky ei riitä pyörittämään pelejä sellaisilla asetuksilla, joissa 16 gigaa muistia ei riitä
 
Nvidian syksyn GTC-eventti washington d.c:ssa tiistaina 28.10. Mielenkiintoista on kerrotaanko lisätietoja vera-rubin-cpx-... paketista vai ei. Voi olla, että antavat murusia ja "täydempi" esittely kevään gtc-messuilla. Nvidia on varmistanu, että nuo piirit+verkkopuoli+silicon photonics piiri ovat jo ohittaneet tapeout vaiheen. Siinä ja siinä onko nvidia saanut piirejä takaisin+toimimaan jos/kun tapeout tapahtui kesäkuun alkupuolella.

Pregame suomenaikaa 15:30 ja jensenin keynote 19:00.
1760809100072.png


Keynoten kuvaus
Don’t miss NVIDIA CEO Jensen Huang live at the Walter E. Washington Convention Center. In this must-see keynote, he'll reveal how AI infrastructure and AI factories that generate intelligence at scale are powering a new industrial revolution. Be the first to hear about groundbreaking innovations transforming every industry and application—from science and quantum computing to telecommunications, healthcare, and robotics.

GTC:n sisältö normaaliin tapaan ilmaiseksi netin läpi jos rekisteröityy webbisivuille. Listaa sessioista. NVIDIA GTC Washington, D.C. : AI Conference, Oct 27–29, 2025
 
mutta 16 gigaa tuossa Ti-mallissa taasen ei ole liian vähää, vaan kortin suorituskyky ei riitä pyörittämään pelejä sellaisilla asetuksilla, joissa 16 gigaa muistia ei riitä
Pakko palata tähän — tuo väite ei pidä paikkaansa. Esimerkiksi Indiana Jones and the Great Circle olisi RTX 5070 Ti:llä muuten pyörinyt DLLS Quality + 4K Supreme / Full Path Tracing -asetuksilla, mutta 16 Gt VRAMia rajoitti käytännössä asetustasoksi Very High. Myös Spider-Man 2 pyöri käytännössä hyvin 4K:n maksimi-asetuksilla (täysi säteenseuranta) DLLS Quality + MFG×4 -konfigilla — kunnes peli lopulta kaatui VRAM puutteen vuoksi.

Toivottavasti RTX 5070 Ti Superissa olisi 24 Gt muistia ja hieman enemmän ytimiä/RT-yksiköitä; silloin voisi hyvinkin olla mahdollista nähdä se todellinen
"RTX 4090-tasoinen" suorituskyky, jota Jensen valheellisesti hehkutti RTX 5070:sta..
 
Viimeksi muokattu:
Esimerkiksi Indiana Jones and the Great Circle olisi RTX 5070 Ti:llä muuten pyörinyt DLLS Quality + 4K Supreme / Full Path Tracing -asetuksilla, mutta 16 Gt VRAMia rajoitti käytännössä asetustasoksi Very High.
Aina tämä Indy korostuu näissä, joten täytyy myös aina koittaa selventää, että vain se texture pool size on rajoittava tekijä ja nimensä mukaisesti kyse on vain poolista, joka ei vaikuta laatuun vaan ainoastaan paljonko tavaraa pidetään VRAM:issa ja Supreme on tarkoituksella vedetty överiksi 4090/5090 varten.
Eli Supreme poolin kun tiputtaa Very High:lle, niin 16GB riittää. Spidermanista en osaa sanoa mitään, koodattu päin sitä itseään jos vetää itsensä jojoon VRAM:in loputtua.
 
N2 prosessille ainakin lupaillaan parempaa SRAM tiheyttä, mutta milloin mahdollisesti sitten nähtäisiin näytönohjaimissa


4000 sarjahan tosiaan sai mukavasti teholisäystä juurikin välimuistin kasvatuksen ansiosta vs 3000 sarja (kellotkin tosin nousi).
5000 sarjassa sitten isointa piiriä kasvatettiin, jonka myötä saatiin lisää muistikaistaakin.
6000 saa melkoisen tempun tehdä, että kuluttajakortit ison hypyn enää saisi, joten olettama on, että enemmän ja parempaa AI softaa kylkeen luomaan illuusiota tehonlisäyksestä.

Eiköhän se ole N3 60x0 sarjalle samaan tapaan kuin rubin ja rubin cpx: NVIDIA Unveils Rubin CPX: A New Class of GPU Designed for Massive-Context Inference

Jos saa hakea takavasemmalta ideoita niin konesali vera-rubin:ssa on erillinen 5nm io-piiri. Jos nvidia tekisi chipletin pelipuolelle niin välimuisti ja io-ongelman skaalaus ratkeaisi käyttämällä vanhempaa prosessia io-piirille. Toisaalta tässä on omat ongelmansa, paketointikapasiteetti ja hinta myös pompsahtaa versus monoliitti.



Tämä ehkä oikeampi paikka jatkaa. N3 on todennäköinen 60 sarjalle.

AMD:n tuleva MI450 käyttää "2nm" prosessia joten on mahdollista että seuraavan sukupolven kuluttajakortit on myös samalla prosessilla.
 
Tämä ehkä oikeampi paikka jatkaa. N3 on todennäköinen 60 sarjalle.

AMD:n tuleva MI450 käyttää "2nm" prosessia joten on mahdollista että seuraavan sukupolven kuluttajakortit on myös samalla prosessilla.
Jos/kun nvidia käyttää 2nm prosessia niin kai ne sen kapasiteetin käyttäisivät konesalipiireihin joka on 10x+ suurempi bisnes kuin 60x0 piirit. Ensimmäinen vera-rubin, rubin cpx varmistettu 3nm ja io-piiri 5nm. Nvidia tosin vuosittaisessa päivityssyklissä niin ei olisi yllätys jos rubin ultra tai mikä se päivityspiirin nimi nyt onkin tulisi 2nm:lla.

60x0 sarja tuskin tulee ennen 2027. Vielä ei oikein mitään huhuja. Sit kun alkaa kuuluun huhuja, että tapeout tehty niin siitä vajaa vuosi ja 60x0 kaupoissa.
 
Nvidialla on vera-rubin konesalipiirit takaisin labrassa. Jensen esittelee piirejä gtc-keynotessa. Sanoi, että konesaleissa ehkä vuoden päästä, ehkä aikaisemmin. Kun saavat konesalipiirit + niiden 2027 päivitykset alta pois niin nvidialla aikaa keskittyä pelipiireihin?
1761672545036.png
 
Jos Jensen Huang (meidän kesken Jeke-Huke) sattuu soittamaan niin sanon ettei tarvi kiirehtiä uusien pelikorttien kanssa, oisko 2028 alku sopiva seuraaville F5 ränkytyksille :)
 
Nvidialla on vera-rubin konesalipiirit takaisin labrassa. Jensen esittelee piirejä gtc-keynotessa. Sanoi, että konesaleissa ehkä vuoden päästä, ehkä aikaisemmin. Kun saavat konesalipiirit + niiden 2027 päivitykset alta pois niin nvidialla aikaa keskittyä pelipiireihin?
1761672545036.png
Vaihtoehtoisesti siellä on useampi insinörtti töissä ja saman sukupolven kortteja suunnitellaan enemmän ja vähemmän samanaikaisesti..
Valmistuksen aloitusta sitten lähinnä porrastetaan valmistajien resurssipulan takia..

Toki 4xxx -> 5xxx parannus oli (n10%) Ja:
1. Isompi piiri huipulle.
2. Muutamia uusia HW ominaisuuksia.
------------------------------------
Epäilisin, jotta kohta 1 ei toteudu, jos pelipuolellakin ei siirrytä HBM muisteihin.
ja vaikka kohta 2 toteutuisi, niin vaatinee sitten peleiltä tukea.. Tokkopa lannattaa odotella kummoista suorituskyky hyppäystä.. Ehkä lähinnä RT puolella tapahtuu..

Muistien määrän nostokin taidetaan ulosmitata jo tulevissa korttien super versioissa, poislukien 5090, jossa on jo selkeästi enemmän, kuin tarpeeksi muistia muutenkin pelikäyttöön..
 
Jos Jensen Huang (meidän kesken Jeke-Huke) sattuu soittamaan niin sanon ettei tarvi kiirehtiä uusien pelikorttien kanssa, oisko 2028 alku sopiva seuraaville F5 ränkytyksille :)
Eläpä höpsi. Rasvaat sen F5:n kunnolla ja aletaan hakkaamaan tuossa vuoden päästä taas! :thumbsup: Cyberpunkki ei mee vielä 4k240Hz native ultra ultra path-traced! :)
 
Vaikea uskoa että sieltä mitään uutta pelipiiriä.varsinaisesti tulisi ihan hetkeen. Viimeaikaisen ai pöhinäkaupat ristiin tekivät sen, että muistin hinta hyppäsi kovasti. Tähänkin mennessä hbm muistit ovat olleet kortilla ja nyt näyttävät DDR muistit seuraavan perässä. Noissa monessa kaupassa ensi vuosi on takaraja, joten siellä on kova paine saada megaprojektit valmiiksi ja täten hintapainetta nostamiseen on myös muistien osalta.
 
Vaihtoehtoisesti siellä on useampi insinörtti töissä ja saman sukupolven kortteja suunnitellaan enemmän ja vähemmän samanaikaisesti..
Valmistuksen aloitusta sitten lähinnä porrastetaan valmistajien resurssipulan takia..
Tiedän kontaktien kautta, että nvidialla sama porukka tekee saman työvaiheen eri piirien kanssa. Tyyliin piirit menee peräkkäin vaikka a,b,c liukuhihnatyylillä ja sama tyyppi tekee saman asian eri piireihin. Toki nvidialla on useita tiimejä kun esim. verkkopuolen(ethernet, infiniband) piirit ovat mellanoxin peruja ja israelissa. Samaa tekevät arkkitehtuuripuolellakin. Suunnittelevat "legoja", esim. uuden tensoriytimen mikä menee konesalipiiriin ja samalla siitä riisutun version mikä menee pelikortteihin ja mahdollisesti kolmannen erillisen version mikä saattaa olla autopiireissä gpu:n lisäksi. Arkkitehtuuri menee tyypille joka suorittaa konkreettisen lohkon suunnittelun ensin konesalipiiriin. Kun konesalipiiriin tarkoitettu lohko on valmis sama heppu suunnittelee annetun arkkitehtuurin pohjalta pelikorttiin tulevan lohkon.

Jos tyypin X erikoisosaaminen on esim. layout niin ei se tee layouttaamista 6kk vuodessa ja 6kk lomaa vaan suunnitellaan niin että se saa tehdä layouttaamista 12kk/vuodessa, ts. piirit peräkkäin. Tämä yleistys, mutta noin se suurinpiirtein menee. Toki nvidia varmasti on kasvattanut tiimejä kun heillä on entistä enemmän piirejä mitä tehdään ja useammin. Esim. gb200 oli 2024 työn alla ja gb300 oli uusi piiri(design, tapeout, maskit,...) ja tuli ulos 2025. GB300 ei noudattanut normaalia refresh-kaavaa missä uudelleenkäytetään vanhaa piiriä.

Työvoimaa ei voi palkata rajattomasti kun heitä ei ole saatavilla eikä kannata palkata jos tekijälle ei riitä töitä vuoden ympäri. Sama juttu pätee erittäin vaikeisiinkin asioihin kuten piirin henkiinherättämiseen ja debuggaamiseen. Hyvät tyypit jotka osaavat todella harvassa.

Nämä uudet piirit vera-rubiniin liittyen tapeout vaiheen ohittaneet ja ainakin osa noista labrassa takaisin
  • Vera CPU
  • Rubin GPU
  • CX9 Super NIC
  • NVLink 144 scale-up switch
  • Spectrum X scale-out scale-across switch
  • silicon photonics processor
Tuohon päälle toki rubin cpx, autopuolen piirit, vera rubin ultra päivitys, mediatek ja intel yhteistöihin gpu chipletit ja ne pelipuolen piirit.
 
Viimeksi muokattu:
Eiköhän niillä seuraavat pelipiiritkin ala olla labratestissä lähiaikoina. Vuotta ennen launchia on normisettiä. Niistä ei vaan tarvitse hirveästi kertoa kun ei sijoittajia kiinnosta. AI -jutuista on pakko puhua reilummin etukäteen koska sijoittajat ja koska konesaliraudan tilausajat. Uutta datacenteriä täynnä Vera Rubinia ei voi tilata launchipäivänä vaan tämmöiset tilaukset tehdään vuosia etukäteen.
 
Eiköhän niillä seuraavat pelipiiritkin ala olla labratestissä lähiaikoina. Vuotta ennen launchia on normisettiä. Niistä ei vaan tarvitse hirveästi kertoa kun ei sijoittajia kiinnosta. AI -jutuista on pakko puhua reilummin etukäteen koska sijoittajat ja koska konesaliraudan tilausajat. Uutta datacenteriä täynnä Vera Rubinia ei voi tilata launchipäivänä vaan tämmöiset tilaukset tehdään vuosia etukäteen.
En usko että on pelipiirit menneet edes tapeouttiin asti vielä olettaen että julkaisu 2027 keväällä,... Kai ne superit vuoden verran on myynnissä ennen kuin 60x0 sarja tulee ulos.

Tapeout kun tapahtuu niin melko varmasti siitä vuotaa tieto ulos. Kesäkuun alulla vuosi tieto, että konesalipiirien tapeout done ja piti kutinsa. Veikkaan että joskus loppukevät-alkukesä välissä aletaan vuotamaan pelipiirien tapeoutin tapahtuneen.
 
Riippuu siitä mikä on pelipiirien aikataulu. Blackwell myöhästyi, joka vähän sotki normaalisti syksylaunchia odottavien korttivalmistajien juttuja. Jatkuuko kaava tästä vai yritetäänkö kiriä takaisin että seuraavat tulisivat jo syksyllä 2026. Jos joulumarkkina 2026 on tähtäimessä, tällöin tapeoutin olettaisi tapahtuvan vielä tämän vuoden puolella.
 
Riippuu siitä mikä on pelipiirien aikataulu. Blackwell myöhästyi, joka vähän sotki normaalisti syksylaunchia odottavien korttivalmistajien juttuja. Jatkuuko kaava tästä vai yritetäänkö kiriä takaisin että seuraavat tulisivat jo syksyllä 2026. Jos joulumarkkina 2026 on tähtäimessä, tällöin tapeoutin olettaisi tapahtuvan vielä tämän vuoden puolella.
En usko, että tulee joulumarkkinalle 2026 perustuen superien ajoitukseen. Tapeoutista vuotaa kyllä tieto aasiasta ihan kuten konesalipiirienkin kanssa. Jos rubin cpx on 6090:en niin se tulee 2026 lopulla. Onko rubin cpx 6090:en, tuskin.
 

Statistiikka

Viestiketjuista
296 177
Viestejä
5 065 661
Jäsenet
81 038
Uusin jäsen
Monttinen11

Hinta.fi

Back
Ylös Bottom