NVIDIA-spekulaatioketju (Lovelace ja tulevat sukupolvet)

Nyt jo kaupoissa oleva RTX 4070 Super toi mukanaan n. 16 % nopeamman sirun verrattuna perus-4070:aan. Viimeisimpien ennakkotietojen mukaan 4070 Ti Super on 3DMarkissa vain 8 % nopeampi kuin perus-4070 Ti. Se on selkeästi vähemmän kuin mitä moni, allekirjoittanut mukaanlukien, odotti. Tämän 4070 Ti Superin suurin myyntivaltti näyttäisikin olevan tuo kasvanut 16 Gt muistikapasiteetti. Muutoin kortti ei juuri hurraa-huutoja kerää.

 
Nyt jo kaupoissa oleva RTX 4070 Super toi mukanaan n. 16 % nopeamman sirun verrattuna perus-4070:aan. Viimeisimpien ennakkotietojen mukaan 4070 Ti Super on 3DMarkissa vain 8 % nopeampi kuin perus-4070 Ti. Se on selkeästi vähemmän kuin mitä moni, allekirjoittanut mukaanlukien, odotti. Tämän 4070 Ti Superin suurin myyntivaltti näyttäisikin olevan tuo kasvanut 16 Gt muistikapasiteetti. Muutoin kortti ei juuri hurraa-huutoja kerää.

Taitaa mennä niin että 4070 super toi lisätehoa, 4070ti super on lisämuistia ja 4080 super halvempi hinta. Vähän eri kulma joka kortissa mitä on parannettu.
 
Taitaa mennä niin että 4070 super toi lisätehoa, 4070ti super on lisämuistia ja 4080 super halvempi hinta. Vähän eri kulma joka kortissa mitä on parannettu.
Joo, alkaa näyttää enemmän ja enemmän sille, että kaikki nämä Superit ovat nyt niitä näytönohjaimia, joita RTX 40 sarjan laukaisussa olisi pitänyt alun perinkin olla.
 
Joo, alkaa näyttää enemmän ja enemmän sille, että kaikki nämä Superit ovat nyt niitä näytönohjaimia, joita RTX 40 sarjan laukaisussa olisi pitänyt alun perinkin olla.
Veikkaan, että on miljardi syytä miksi meni näin. ts. jos nvidia myi vaikka 10 miljoonaa näyttökorttia viime vuonna ja niissä jokaisessa oli satanen preemiota hinnassa versus superit niin se oli miljardin nettovoitto. Nyt puristellaan tyhjät pois ja myydään varastot loppuun, että loppuvuodesta/2025 alussa saadaan blackwell julkaisulle tilaa. Tarvis olla kovempaa kilpailua, että lähtis turhat ilmat pois hinnoista.
 
Nyt jo kaupoissa oleva RTX 4070 Super toi mukanaan n. 16 % nopeamman sirun verrattuna perus-4070:aan. Viimeisimpien ennakkotietojen mukaan 4070 Ti Super on 3DMarkissa vain 8 % nopeampi kuin perus-4070 Ti. Se on selkeästi vähemmän kuin mitä moni, allekirjoittanut mukaanlukien, odotti. Tämän 4070 Ti Superin suurin myyntivaltti näyttäisikin olevan tuo kasvanut 16 Gt muistikapasiteetti. Muutoin kortti ei juuri hurraa-huutoja kerää.

En oikein usko, että vanhan 4070 Ti:n - tai muidenkaan 4000-sarjalaisten - omistajat olisi näiden se pääkohderyhmä.

Vertailu on relevantimpaa 3000-sarjalaisiin tai vieläkin vanhempiin.

Jos ero esim. 3080 jää liian pieneksi, jää kyllä nämä väliin ja katseet suoraan 5000-sarjaan. Mikä oli alunperinkin suunnitelma.
 
En oikein usko, että vanhan 4070 Ti:n - tai muidenkaan 4000-sarjalaisten - omistajat olisi näiden se pääkohderyhmä.

Vertailu on relevantimpaa 3000-sarjalaisiin tai vieläkin vanhempiin.
Alla vastaukseni
Joo, alkaa näyttää enemmän ja enemmän sille, että kaikki nämä Superit ovat nyt niitä näytönohjaimia, joita RTX 40 sarjan laukaisussa olisi pitänyt alun perinkin olla.
 
Mä oon miettinyt, että 50x0/rdna4:sta pykälää liian hyvä kortti ostaen ja sitten skippaa ainakin yhden sukupolven. Ei se niin paha ole laittaa kertarykäisyllä enemmän korttiin kiinni jos/kun päivitysväli on tyyliin 4v tai pidempi. Tuskin tulee mitään sellaista uusissa korteissa mikä pakottaa päivittämään, kun ominaisuus X puuttuu. Kaukana on ne ajat, kun vanha kortti muuttui 1-2vuoden välein verkonpainoksi.
 
Tuskin tulee mitään sellaista uusissa korteissa mikä pakottaa päivittämään, kun ominaisuus X puuttuu.
Tuotahan NVIDIA yrittää hieman muun muassa tulevilla DLSS päivityksillä tehdä. Mutta joo, kyllä monikin ostaja pitää kortistaan kiinni nykyisin aiempaa pidempään.
 
Tuotahan NVIDIA yrittää hieman muun muassa tulevilla DLSS päivityksillä tehdä. Mutta joo, kyllä monikin ostaja pitää kortistaan kiinni nykyisin aiempaa pidempään.
Mun kirjoissa dlss oli kiva juttu mutta ei mikään pakkopäivitys. Säteenseurannan ja ai:n kanssa meni kauan, että ne alkoivat olemaan "must have" juttuja vaikka niiden potentiaaliin uskoin heti. Tosin vieläkin osa porukasta kampeaa dlss:aa ja säteenseurantaa vastaan.

En oikein osaa kuvitella mikä se seuraava must have juttu olisi minkä 60x0 sarja voisi tuoda ja mitä ei 50x0 sarja tukisi. 50x0 sarjaan on huhuttu uusittua arkkitehtuuria. Ehkä tuo mahdollistaa paremman suorituskykyhyppäyksen kuin mitä on viime vuosina nähty.

Kuvittelen, että seuraava iso epäjatkuvuuskohta on sellainen missä kortit keskittyvät pääasiassa säteenseurantaan ja konealgoritmeihin perinteisen rasteroinnin kustannuksella. Tätä saataneen odotella vielä kauan.
 
Viimeksi muokattu:
Mä oon miettinyt, että 50x0/rdna4:sta pykälää liian hyvä kortti ostaen ja sitten skippaa ainakin yhden sukupolven. Ei se niin paha ole laittaa kertarykäisyllä enemmän korttiin kiinni jos/kun päivitysväli on tyyliin 4v tai pidempi. Tuskin tulee mitään sellaista uusissa korteissa mikä pakottaa päivittämään, kun ominaisuus X puuttuu. Kaukana on ne ajat, kun vanha kortti muuttui 1-2vuoden välein verkonpainoksi.
Tätä jo useamman vuoden itsekin harrastanut:
gtx780 -> gtx1080 -> rx6800xt eli aina yksi sukupolvi jää välistä. Seuraavana tosiaan rdna4 tai 5000 -sarjan kortti luultavasti. Tuolla saa aaina sen yhden sukupolven mennä ihan huipputehoilla ja seuraavan sukupolven mid-high tehoilla.

780 taisi olla aika lähellä 970, ehkä vähän jäi, 1080 oli sama kuin 2070 ja 6800xt lähellä 7800xt:tä tai 4070:stä.
 
Onko 4060 ja 4060 Ti supereista vielä mitään huhuiluja ollut liikkeellä?
Ei tiettävästi ja lieneeköhän Nvidialla edes kiinnostusta lähteä moisia tuomaan, sillä:
- 4060 Super pitäisi hypätä AD106 piiriin, koska normaali 4060 on jo täysi AD107
- 4060 Ti Super pitäisi olla täysi AD106 piiri, jotta saisi hieman tehoeroa perus Ti
- täysi AD106 on jo käytössä mobiilipuolella, jossa menekki lienee ihan kohtuullista
- (4070 Ti Super ja 4080 Super ainakin speksien valossa voisi myös meinata, että 9728 shaderin AD103 piirit [poistuva 4080] kelpaavat mobiilipuolelle, jolloin heikommista piireistä tehtiin 4070 Ti Super ja paremmista 4080 Super)
Edit: 4060 sarjan suurin ongelma lienee muistikaista ja AD106 piirillä sitä ei lisää saada. 4070 kun taas on AD104 piiristä jo varsin leikelty malli ja jää mallistoon uusien Superien rinnalle, niin ei sen allekaan oikein 10/12GB 4060 Ti Superia mahdu.

 
Viimeksi muokattu:
Vastaus on odottaa että 4070 hinnat laskevat ja laskea se "superiksi" 4060-sarjalle vaikkei tarra vaihtunutkaan.

4060 on oikeasti 4050 johon tuli väärä tarra ja niin rampautettu että noiden ostaminen nyt vaan on vähän niin ja näin.
 
Vastaus on odottaa että 4070 hinnat laskevat ja laskea se "superiksi" 4060-sarjalle vaikkei tarra vaihtunutkaan.

4060 on oikeasti 4050 johon tuli väärä tarra ja niin rampautettu että noiden ostaminen nyt vaan on vähän niin ja näin.

RTX 4070 olis kyllä sekin saanut olla 4060 ti... Superi olisi ollut hyvä alkuperäisenä 4070:nä.
 
Ei tiettävästi ja lieneeköhän Nvidialla edes kiinnostusta lähteä moisia tuomaan, sillä:
- 4060 Super pitäisi hypätä AD106 piiriin, koska normaali 4060 on jo täysi AD107
- 4060 Ti Super pitäisi olla täysi AD106 piiri, jotta saisi hieman tehoeroa perus Ti
- täysi AD106 on jo käytössä mobiilipuolella, jossa menekki lienee ihan kohtuullista
- (4070 Ti Super ja 4080 Super ainakin speksien valossa voisi myös meinata, että 9728 shaderin AD103 piirit [poistuva 4080] kelpaavat mobiilipuolelle, jolloin heikommista piireistä tehtiin 4070 Ti Super ja paremmista 4080 Super)
Edit: 4060 sarjan suurin ongelma lienee muistikaista ja AD106 piirillä sitä ei lisää saada. 4070 kun taas on AD104 piiristä jo varsin leikelty malli ja jää mallistoon uusien Superien rinnalle, niin ei sen allekaan oikein 10/12GB 4060 Ti Superia mahdu.

Vähän samoja juttuja vilkaisin techpowerupin sivuilta pikaisesti, eli teoriassa olisi mahdollista mutta mitkälie saannit noilla piireillä. Voihan se olla että noita täysiä ja huonompia AD106 on keräilty vuoden päivät varastoon, mitkälie saannit noilla. Mobiilipuolelle riittänee huonommatkin yksilöt kun ne on kellotaajuuksien osalta niin kuristettuja.
 
Vastaus on odottaa että 4070 hinnat laskevat ja laskea se "superiksi" 4060-sarjalle vaikkei tarra vaihtunutkaan.

4060 on oikeasti 4050 johon tuli väärä tarra ja niin rampautettu että noiden ostaminen nyt vaan on vähän niin ja näin.

Tällä kertaa sekä Nvidia että AMD nimesi kortit "uusiksi" koska pystyivät...

Normaalitilanteessa:
Nvidia
4060 olisi pitänyt olla 4050 tai 4050 ti
4060 ti olisi pitänyt olla 4060
4070 olisi pitänyt olla 4060 ti
4070 ti olisi pitänyt olla 4070
4080 olisi pitänyt olla 4070 ti
4080 super olisi pitänyt olla 4080

AMD
7700 XT olisi pitänyt olla 7700
7800 XT olisi pitänyt olla 7700 XT
7900 GRE olisi pitänyt olla 7800
7900 XT olisi pitänyt olla 7800 XT
7900 XTX olisi pitänyt olla 7900 XT
 
Samsungilla 37 Gbps ja SK Hynixillä 35,4 Gbps GDDR7 16Gb -piirit tuloillaan. Aika iso hyppy nopeudessa tämän genin G6X 21-24 Gbps piireihin, kapasiteetti tosin sama.

Asiasta kirjoitti Techradar ja lähteenä heillä helmikuussa järjestettävän alan konferenssin ohjelmaläpyskä.


 
Samsungilla 37 Gbps ja SK Hynixillä 35,4 Gbps GDDR7 16Gb -piirit tuloillaan.
Hyvin on Samsung saanut kehitettyä muistejaan: viime vuoden heinäkuussa Videocardz kirjoitti että Samsungilla olisi 32 Gbps muistit ja nyt sitten jo tuo 37 Gbps.

Mikä lie sitten tehonkulutus (hukkalämmön tuotto) näillä piireillä? PC Gamer sanoi että energiatehokkuus parani 20 % mutta voihan se kokonais-Wattien kulutus silti olla isompi kuin G6X:n.
 
Uskooko et tulee ti mallia ja titania, vai onko huuhaata?


Jos Nvidialla on kertynyt varastoon iso määrä laadukkaita AD102 piirejä ja/tai RTX 6000 Adan myynti sakkaa pahasti, niin kai tuo mahdollista on, että niistä halutaan eroon vielä ennen 50-sarjan julkaisua.
Alkaa olla kyllä tosin kiire saada pihalle, jos halutaan ettei potentiaaliset ostajat jää odottamaan uusia kortteja.
 
Jos Nvidialla on kertynyt varastoon iso määrä laadukkaita AD102 piirejä ja/tai RTX 6000 Adan myynti sakkaa pahasti, niin kai tuo mahdollista on, että niistä halutaan eroon vielä ennen 50-sarjan julkaisua.
Alkaa olla kyllä tosin kiire saada pihalle, jos halutaan ettei potentiaaliset ostajat jää odottamaan uusia kortteja.
Toinen mahis on että AD102-pohjaiset RTX 6000 ja L40 myyvät ihan hyvin, mutta Geforceen tuleva Blackwell päätyy ensin juuri tuonne ammattilaissegmenttiin syrjäyttäen Adan. Olis sitten pieni aikaikkuna jolloin Adasta valmistetaan pelkästään Geforce kortteja ja 48 Gt:n AD102 saisi pienen alen Titanin muodossa.

3090 Ti:n tuli myyntiin n. 7kk ennen 4090:tä. Jos se tuotti Nvidialle siitä huolimatta hyvin, niin miksipä ei tekisi samaa uudestaan... :)

Mutta joo, RGT ei taida olla ihan varmin lähde, joten en löisi vetoa sen puolesta että 4090S & Titan on oikeasti tulossa.
 
Viimeksi muokattu:
Uskooko et tulee ti mallia ja titania, vai onko huuhaata?


En jaksa klikata. Mitä tuo myöhästyminen on kerrottu olevan? Sijoittajille esitellyissä roadmapeissa on kuluttaja blackwell olut 2025 alkupuolelle sijoitettu. Huhuajat keksii omia juttuja koko ajan klikkien perässä.
 
En jaksa klikata. Mitä tuo myöhästyminen on kerrottu olevan? Sijoittajille esitellyissä roadmapeissa on kuluttaja blackwell olut 2025 alkupuolelle sijoitettu. Huhuajat keksii omia juttuja koko ajan klikkien perässä.
Sori, en malttanut vastustaa kiusausta
1706620048391.jpeg

;)
 
En jaksa klikata. Mitä tuo myöhästyminen on kerrottu olevan? Sijoittajille esitellyissä roadmapeissa on kuluttaja blackwell olut 2025 alkupuolelle sijoitettu. Huhuajat keksii omia juttuja koko ajan klikkien perässä.
Ada-next tosiaan roadmapissa heti alkuvuodesta 2025, mutta samanaikaisesti voi olla totta että RTX 50 -sarja launchaisi vasta jollain myöhemmällä kvartaalilla jos niitä siruja alkuun hyödynnetään muissa tuotekategorioissa.
 
Eipä ole mitään tarvetta julkaista RTX 4090:n yläpuolelle uutta 40 sarjan näytönohjainta ennen kuin kuluttaja-Blackwell saapuu 2025 kauppoihin. Ei AMD pysty kilpailemaan tuolla tasolla.
 
Epäilen, että suurin ajuri 5090/... on AI markkina. Jos kysyntä AI puolella pitää niin gddr7 piireillä sais tehtyä 72GB pro kortin. 72GB muistilla oleva tensorikiihdytetty kortti todennäköisesti myy kuin kilju kuopion markkinoilla. Hintaakin saa pyytää 10k$/kortti pintaan. Nykyisetkin ad102 pro kortit hinnakkaita tyyliin tämä: NVIDIA RTX 6000 Ada Generation Graphics Card Riippuen ja roikkuen tilanteesta niin nvlink saattaisi tehdä paluun. Voisi yhdistää kaksi pro korttia yhteen niin saa 144GB muistin. Tuollainen 144GB muistia alkaa riittämään melko isojen mallien inferenssikäyttöön.
 
Vähän pohdituttaa tämä Nvidian meininki ns. Quadro-luokan ohjaimissa. Ada-generaatiossa tiputettiin NVLink pois, jolloin 2xA6000 oli ja on edelleen moneen käyttötarkoitukseen houkuttelevampi kuin RTX 6000 Ada ihan puhtaasti muistimäärän takia. En yhtään ihmettelisi jos tuo on selvästi tiputtanut RTX 6000 Adan myyntejä siitä mitä olisi voinut ajatella NVLinkin kanssa, ja siten niitä piirejä johonkin 4090 Ti:hin saattaisi hyvinkin löytyä jemmasta.

"Normaalissa" julkaisusyklissä voisi odottaa uusien työasemakorttien julkaisua tämän vuoden loppupuolella. Mutta onko noista vielä tihkunut minkäänlaisia huhuja? Erityisesti kiinnostaisi tiedot NVLinkin paluusta ja/tai muistimääristä, sillä olisi mielestäni hieman erikoinen tilanne että käytännössä maksimimuistimäärä työasemakäytössä tipahti 2xA6000:n 96GB:stä RTX 6000 Adan 48 GB:hen, ja jos nyt seuraavalla generaatiolla ei päästäisi vähintään tuonne 96GB tai mieluiten sen yli.
 
kopite7kimi huhuilee, että isoin kuluttajablackwell tulisi 512bit gddr7 muistiväylällä. En tiedä pitäisikö uskoa tuota, mutta kai se on mahdollista ottaen huomioon AI puolen kysynnän ja miten tuollainen 512bit muistiväyläkortti(muistin määrä) voisi myydä erittäin kalliilla ai-devaajille/inferenssiin jne.

Jos olettaa, että piirit kaupanhyllyllä ihan loppuvuodesta/aikaisin alkuvuodesta 2025 niin piirisuunnittelun pitäisi olla valmis, tapeout tehty jne. Ei isoa gpu piiriä ihan hetkessä saada kaupanhyllylle siitä kohtaa kun tapeout on tehty ja tiedot tsmc:n serverillä mistä alkaa ensimmäisten piirien valmistusprosessi. Myöhemmin nvidian päädyssä ensimmäisten piirien henkiinherättäminen, debuggaaminen, riskivalmistuspäätös, massavalmistuspäätös jne.

 
Viimeksi muokattu:
Epäilen, että suurin ajuri 5090/... on AI markkina. Jos kysyntä AI puolella pitää niin gddr7 piireillä sais tehtyä 72GB pro kortin. 72GB muistilla oleva tensorikiihdytetty kortti todennäköisesti myy kuin kilju kuopion markkinoilla. Hintaakin saa pyytää 10k$/kortti pintaan. Nykyisetkin ad102 pro kortit hinnakkaita tyyliin tämä: NVIDIA RTX 6000 Ada Generation Graphics Card Riippuen ja roikkuen tilanteesta niin nvlink saattaisi tehdä paluun. Voisi yhdistää kaksi pro korttia yhteen niin saa 144GB muistin. Tuollainen 144GB muistia alkaa riittämään melko isojen mallien inferenssikäyttöön.

AI hommat sotkevat aika pahasti sitä jos haluaa kortin pelikäyttöön.

Tuntuu siltä, että nVidia on todella pitkään alimitottanut VRAM:n määrää melkein joka kortissa ettei vahingossakaan haittaisi parempien ohjaimien myyntiä. PS5:n julkaisu tarkoitti sitä, että pelikäytössä PC:llä alle 16Gb korteilla ei ollut jatkuvuutta. nVidialla piti silloin olla vähintään 3090. Ne köykäisemmät 8Gb kortit sopivat sitten vaikka CAD:n, Blenderiin tai johonkin Adoben softan tarpeisiin. Peleissä alkoivat köhiä todella nopeasti.

AMD osunut pelipuolella paljon paremmin sweet spottiin mitä tulee VRAM:n määrä/flopsit/muistikaista. Epäilen vähän että nVidian markkina-asema on niin vahva että tarkoituksella tekevät rampautettuja että aina voisi ostaa paremman mallin ratkaistakseen jonkun ongelman mutta sitten taas jarruttaa jostain toisesta ominaisuudesta, että jos kaikki herkut haluaa niin 4090 vaan sitten.
 
Ihan todella todella vaikea uskoa mihinkään 72GB 5090-kortteihin, kun Nvidia on työasemakorteissakin pantannut muistimäärien lisäyksiä yli 48 GB:n nyt jo 3 sukupolvea. Sille puolelle alkaa olla "pakko" julkaista järeämpiä kortteja, mutta epäilen että yli 32 GB pelikortteja saataisiin 5000-sarjaan.
 
Tuossahan juuri sanottiin että ilmeisesti AI-puoli on saanut nVidian pihtaamaan muistien määrän kanssa.
Tuo väite nyt ei ainakaan pidä paikkaansa. AI devaajien tarvimat muistimäärät ovat sellaisia ettei niitä saisi edes lähtöönsä laitettua pelikorttiin. H200:ssa esimerkiksi muistia 141GB. h200:ia yleensä kytketän 8+ kipaletta yhteen muistiavaruuteen nvlinkin avulla kun ei isot mallit mitä pilvessä ajetaan mahdu yhden h200:en muistiin. nvlink tarjoa yhtenäisen muistiavaruuden. Microsoft esimerkiksi osti nvidialta kustomoidun 32gpu härvelin ai käyttöön missä noiden 32 gpu:n muistit saadaan yhtenäiseen muistiavaruuteen.

Pelikorttien muistimäärät on mitä on hinta ja suorituskykyrajotteiden vuoksi. Nvidia hakenut suorituskykyä lisäämällä ison cachen piireihin. Cachen koko optimoitu niin, että kortit profiloituu 1080p, 1440p ja 4k korteiksi. 1080p korttiin ei hyödytä laittaa isompaa muistia, kun muistikaistarajoitteen vuoksi suorituskyky ei skaalaa 1440p resoluutioon.

Toinen pointti on se, että jos korttien hintaa nostetaan tyyliin 100e muistimäärän tuplaantuessa niin ei ne käy enää kaupaksi. Tai toisinpäin sanoen, jos hinnat pidetään entisellään samalla kun muistinmäärää lisätään niin pelibisneksen voitot katoavat.
 
Toinen pointti on se, että jos korttien hintaa nostetaan tyyliin 100e muistimäärän tuplaantuessa niin ei ne käy enää kaupaksi. Tai toisinpäin sanoen, jos hinnat pidetään entisellään samalla kun muistinmäärää lisätään niin pelibisneksen voitot katoavat.

Esim. 8Gt->16Gt ei kyllä maksa 100e lisää...

Ja isojen mallien koulutukset on oma juttunsa, mutta olen ymmärtänyt että myös muussa AI-käytössä kuten inferenssissä tai pienemmissä malleissa muistista olisi hyötyä, en tosin ole tutustunut kovin tarkasti asiaan.
 
Ihan todella todella vaikea uskoa mihinkään 72GB 5090-kortteihin, kun Nvidia on työasemakorteissakin pantannut muistimäärien lisäyksiä yli 48 GB:n nyt jo 3 sukupolvea. Sille puolelle alkaa olla "pakko" julkaista järeämpiä kortteja, mutta epäilen että yli 32 GB pelikortteja saataisiin 5000-sarjaan.
48GB on fyysinen rajoite 384bit gddr6x muistiväylää käytettäessä. Jos kopite7kimin huhuama 512bit kortti tulee niin siitä saadaan tehtyä pro kortti 96GB gddr7 muisteilla.

Jos olisin nvidia niin miettisin asiaa sen kautta, että parempi kannibalisoida omaa bisnestä itse kuin antaa mahdollisuus kilpailijalle. Ts. laittaisin nvlinkin myös 512bit korttiin ja tekisin plivi-inferenssikäyttöön versiota missä 2xgpu yhdessä kortissa yhdistettynä nvlinkillä. Yhteensä 192GB muisti ja myisin noita sikakalliilla. Tämä tekisi kilpailijoiden elämän vaikeaksi inferenssipuolella. Pelaajille myisin edelleen pienemmällä muistilla olevaa korttia, kun ei peleissä enempää tarvi. Pro käyttäjät ostaa kalliin pro kortin missä sama piiri mutta eri muistikapasiteetti(ja ehkä nvlink tuki).
 
Tuo väite nyt ei ainakaan pidä paikkaansa. AI devaajien tarvimat muistimäärät ovat sellaisia ettei niitä saisi edes lähtöönsä laitettua pelikorttiin.

Riippuu sovelluksesta. Esimerkiksi AI superresolution on huomattavan kevyttä kamaa. Lisäksi sillä voi olla eroa että onko kyse trainingistä vai tuotannossa ajosta. Voihan sitä vaikka testata, että training yleensäkin pelaa CPU:lla, sitten laittaa sen rouhimaan jossain pilvessä vuokrakoneilla mallit ja sitten sitä harjoitettua mallia hyödyntää toisaalla omalla halvemmalla raudalla.

En väitä olisin ihan syvällä tässä asiassa, mutta suurimmassa osassa nVidian kuluttajakortteja on pitkään ollut naurettavan vähän VRAM:ia.
 
Esim. 8Gt->16Gt ei kyllä maksa 100e lisää...

Ja isojen mallien koulutukset on oma juttunsa, mutta olen ymmärtänyt että myös muussa AI-käytössä kuten inferenssissä tai pienemmissä malleissa muistista olisi hyötyä, en tosin ole tutustunut kovin tarkasti asiaan.

Iso raha on tällä hetkellä konesalipuolen ratkaisuissa. Pelikortteja ei voi mennä mitenkään massiivisesti AI käyttöön, kun katsoo mikä on pelipuolen liikevaihdon kehitys. Pelipuolen liikevaihto lähinnä näivettynyt samalla kun konesalipuoli mennyt katosta läpi. Varmaan 4090:en myynti osittain ai devaajien koneisiin, mutta silläkin puolella voi miettiä että onko parempi ostaa ns. kalliille työntekijälle 48GB pro kortti/pääsy konesaliin vai kituutella pelikortilla. Aika on rahaa ja AI devaajat ei ole halpoja toisin kuin kertasijoitus gpu:hun. Piilaaksossa hyvä ai devaaja maksaa miljoona+/vuosi. Ihan sama maksaako työkone 5k$ tai 20k$, kun pelkkä työntekijän palkka on ihan järjettömän kova versus työväline.

4060:sta on 16GB versio. Sai aika tyrmäkysen arvosteluissa. GDDR7 tarjoaa 1GB, 2GB ja 3GB moduulit. 3GB moduuli mahollistaa 50% muistimäärän lisäyksen versus gddr6x kortit samalla muistikaistan leveydellä. Huhuissa on ollut, että julkaisussa olisi vain 1GB ja 2GB moduuleita käytössä. Ehkä super malleissa saadaan 3GB moduuleilla 50% muistimäärän lisäys.

If you're not happy about the level of performance offered by the RTX 4060 Ti 8GB, spending $100 more to get double the VRAM isn't a good move
 
Joo vaikka muistinälkäiset LLM:t nyt kovassa huudossa ovatkin, niin ei ne silti ole kuin suhteellisen pieni osa malleista. Todella isoa osaa malleista pyörittelee jopa 12 GB korteilla, eli ihan älytöntä puhua siitä ettäkö AI-devaajien tarvitsemat muistimäärät olisi aina siellä sadoissa gigoissa.
 
Joo vaikka muistinälkäiset LLM:t nyt kovassa huudossa ovatkin, niin ei ne silti ole kuin suhteellisen pieni osa malleista. Todella isoa osaa malleista pyörittelee jopa 12 GB korteilla, eli ihan älytöntä puhua siitä ettäkö AI-devaajien tarvitsemat muistimäärät olisi aina siellä sadoissa gigoissa.
H100 80GB, H200 141GB, amd:n mi300x 192GB. Noi on ne mitkä myy tällä hetkellä AI boomiin. Nvidian pelikorttipuoli myy "huonosti" versus konesali. Perustelu myynnille lainauksissa ja linkin päässä.

Q4 2024:lla nvidian konesalipuoli kasvoi vuodentakaiseen kvartaaliin verrattuna 409%
  • Fourth-quarter revenue was a record $18.4 billion, up 27% from the previous quarter and up 409% from a year ago. Full-year revenue rose 217% to a record $47.5 billion.

samaan aikaan pelipuoli kasvoi 15%. Huomionarvoista, että verrokkikvartaali vuoden takaa oli erityisen huono, kun siinä kohtaa oli menossa covid19 bust. Hyllyt oli täys tuotetta mitkä oli jääneet myyjille käsiin
  • Fourth-quarter revenue was $2.9 billion, flat from the previous quarter and up 56% from a year ago. Full-year revenue rose 15% to $10.4 billion.


Konesali 18 miljardia vs. pelimyynti 3miljardia kvartaalissa kun miettii niin ei ole vaikea mieltää missä tuotteissa ai boomin tuoma kysyntä on. Se, että joku kotona vähän testailee chatbottia tai ajaa photohop fireflyta ole se juttu mistä tällä hetkellä AI-liikevaihto tulee nvidialle. Pelaajille 36GB 512bit blackwell 2.5ke+ hintaan. Pro käyttäjille 72GB, 96GB ja dual nvlink 192GB.

Ei mun ole vaikea kuvitella, että 512bit blackwell tai 512bit dual nvlinkillä kytketty blackwell myisi kuin häkä ai puolelle. Hinnan voi asettaa etenkin 2GB ja 3GB moduuleita käyttäville korteille niin että markkina segmentoituu peli ja pro kortteihin ja hintapisteet ihan erit.

Ottaisin 512bit huhun kuitenkin suolan kera. Kauan on aikaa siitä, kun viimeksi on nähty 512bit muistiväylällä oleva kuluttajakortti.
 
Viimeksi muokattu:
H100 80GB, H200 141GB, amd:n mi300x 192GB. Noi on ne mitkä myy tällä hetkellä AI boomiin. Nvidian pelikorttipuoli myy "huonosti" versus konesali. Perustelu myynnille lainauksissa ja linkin päässä.

Q4 2024:lla nvidian konesalipuoli kasvoi vuodentakaiseen kvartaaliin verrattuna 409%


samaan aikaan pelipuoli kasvoi 15%. Huomionarvoista, että verrokkikvartaali vuoden takaa oli erityisen huono, kun siinä kohtaa oli menossa covid19 bust. Hyllyt oli täys tuotetta mitkä oli jääneet myyjille käsiin



Konesali 18 miljardia vs. pelimyynti 3miljardia kvartaalissa kun miettii niin ei ole vaikea mieltää missä tuotteissa ai boomin tuoma kysyntä on. Se, että joku kotona vähän testailee tai ajaa photohop fireflyta ole se juttu mistä tällä hetkellä AI-liikevaihto tulee nvidialle. Pelaajille 36GB 512bit blackwell 2.5ke+ hintaan. Pro käyttäjille 72GB, 96GB ja dual nvlink 192GB.

Ei mun ole vaikea kuvitella, että 512bit blackwell tai 512bit dual nvlinkillä kytketty blackwell myisi kuin häkä ai puolelle. Hinnan voi asettaa etenkin 2GB ja 3GB moduuleita käyttäville korteille niin että markkina segmentoituu peli ja pro kortteihin ja hintapisteet ihan erit.

Ottaisin 512bit huhun kuitenkin suolan kera. Kauan on aikaa siitä, kun viimeksi on nähty 512bit muistiväylällä oleva kuluttajakortti.

Niin, niitä pienemmillä muistimäärillä olevia kortteja on konesalit ja työasemat täynnä. Niille ei ole niin valtavaa kysynnän muutosta olemassa, koska tosiaan ne työasemakorttienkin maksimimuistimäärät ovat olleet siinä 48 GB:ssä jo todella pitkään.

Suurimmat tuotot tietenkin tulee sieltä, missä saa mahdollisimman ison hinnoittelupreemion. Tällä hetkellä se on noissa todella suurimuistisissa AI-kiihdyttimissä, mitä ei vielä ole konesalit täynnä, ja joille ei oikeastaan ole niitä vaihtoehtoja työasemapuolellakaan. Niinpä Nvidia saa hinnoitella ne käytännössä ihan miten lystää, ja tuotot on sen mukaisia. Se ei kuitenkaan kerro millään tavoin siitä, ettäkö valtaosa AI-devaajien kehittämistä malleista tarvitsisi tuon kokoisia kortteja.

Ja kyllä, niille suurimuistisille korteille on kysyntää, minullakin. Mutta ne on silti vain hyvin pieni osa kaikista malleista ja projekteista missä niitä lopulta tarvitaan.
 
Niin, niitä pienemmillä muistimäärillä olevia kortteja on konesalit ja työasemat täynnä. Niille ei ole niin valtavaa kysynnän muutosta olemassa, koska tosiaan ne työasemakorttienkin maksimimuistimäärät ovat olleet siinä 48 GB:ssä jo todella pitkään.

Suurimmat tuotot tietenkin tulee sieltä, missä saa mahdollisimman ison hinnoittelupreemion. Tällä hetkellä se on noissa todella suurimuistisissa AI-kiihdyttimissä, mitä ei vielä ole konesalit täynnä, ja joille ei oikeastaan ole niitä vaihtoehtoja työasemapuolellakaan. Niinpä Nvidia saa hinnoitella ne käytännössä ihan miten lystää, ja tuotot on sen mukaisia. Se ei kuitenkaan kerro millään tavoin siitä, ettäkö valtaosa AI-devaajien kehittämistä malleista tarvitsisi tuon kokoisia kortteja.
Pointti noissa luvuissa etten usko esimerkiksi hypoteettisen 36GB 512bit blackwellin astuvan nykyisen ai rahanpainamisen varpaille. Toisaalta 72GB, 96GB ja mahdollinen tuplakortti nvlinkillä vois olla rahanpainokoneita inferenssipuolelle ja tekisivät kilpailijoiden elämän hankalaksi. Jos jää jarrutteleen käy kuin nokialle symbianin kanssa.

Toinen puoli asiaa hbm muistien vaatima paketointi ja hbm3e muistien rajallinen tuotantomäärä. Gddr7 kortit voi olla hyvä tapa parantaa saatavuutta
 
Pelikorttien muistimäärät on mitä on hinta ja suorituskykyrajotteiden vuoksi. Nvidia hakenut suorituskykyä lisäämällä ison cachen piireihin. Cachen koko optimoitu niin, että kortit profiloituu 1080p, 1440p ja 4k korteiksi. 1080p korttiin ei hyödytä laittaa isompaa muistia, kun muistikaistarajoitteen vuoksi suorituskyky ei skaalaa 1440p resoluutioon.

Vuonna 2020

Radeon RX 6800 $579
-13056 Gflops single
-16 GB VRAM
-512 GB/s (128Mb cache 1432.6Gb/s)
-250 W

Ja tuo pyöritää edelleen pelejä

Samaan aikaan nVidia:

GeForce RTX 3070 $499
-17660 Gflops single
-8Gb VRAM
-448Gb/s
-220 W

GeForce RTX 3080 $699
-25060 Gflops single
-12Gb VRAM
-760Gb/s
-350 W

GeForce RTX 3090 $1499
-29280 Gflops single
-24Gb VRAM
-935.8GB/s
-350 W


Ja vastaava linja jatkui nVidialla 4xxx sarjassa. AMD tuntuu balansoivan korttia paremmin pelisuorituskykyyn.

Ja siis itsehän olin nVidia fani sieltä Geforce 2 MX:stä saakka mutta sitten kun RTX:t tuli niin pelikäyttöä silmällä pitäen ei oikein ole vakuuttanut speksit. Minulla siis vielä nVidia mutta tarkoitus olisi uusia tietokone kohta.
 

Statistiikka

Viestiketjuista
262 807
Viestejä
4 566 389
Jäsenet
75 024
Uusin jäsen
Tähtisaari

Hinta.fi

Back
Ylös Bottom