NVIDIA-spekulaatioketju (Blackwell ja tulevat sukupolvet)

Olihan tuosta jo digital foundryn previkkaa. Ainakin cp2077:ssa parantaa kuvanlaatua versus dlss3. Transformer pohjainen neuroverkko on vähän erilainen kuin CNN:t. Todellisuus lienee sama kuin ennenkin, ei täydellinen mutta paranee versio versiolta.

FP4:een liittyen sanoivat edellisen postauksen nvidian videossa "for 50 series users lower memory usage and faster performance". Ei tuo lause oikein selity millään muulla kuin fp4:en käytöllä. Ei välttämättä kaikki kerrokset ole fp4:sta niin siksi sanoin vähentää muistin kulutusta enkä esimerkiksi "Puolittaa" muistinkulutuksen.


Tää on jotenkin mun mielestä vähän surulliseen taittuva video. Siis eikö saatana löydy parempaa peliä kun tänä vuonna 5v täyttävä Cyberpunk 2077 näyttämään noita uusia efektejä ja jippoja? Lisäks nVidia on oletettavasti pakottanut käyttämään prosentteja raakojen FPS-lukujen sijaan, sillä muutenhan tuossa paljastuis et yllätys yllätys, yli 4v vanha peli pyörii varsin pelattavalla frameratella myös niillä 40-sarjan korteilla, niistä ei välittömästi tullu SER-jätettä nyt kun 50-sarja julkistettiin ja lukotettiin DLSS4 houkuttelevin ominaisuus yksinoikeudeks sille, kuten viime sukupolvessakin tehtiin. Siitä en tiedä mikä totuus on et lukittiinko se 50-sarjalle puhtaasti sen takia et aiemmissa ei riitä puhti, mut mun mielestä niillä voi olla haasteita selitellä mustaa valkoseks siinä vaiheessa kun joku RTX 5060 tukee tota DLSS4, mut sit taas RTX 4090 ei.
 
Tää on jotenkin mun mielestä vähän surulliseen taittuva video. Siis eikö saatana löydy parempaa peliä kun tänä vuonna 5v täyttävä Cyberpunk 2077 näyttämään noita uusia efektejä ja jippoja? Lisäks nVidia on oletettavasti pakottanut käyttämään prosentteja raakojen FPS-lukujen sijaan, sillä muutenhan tuossa paljastuis et yllätys yllätys, yli 4v vanha peli pyörii varsin pelattavalla frameratella myös niillä 40-sarjan korteilla, niistä ei välittömästi tullu SER-jätettä nyt kun 50-sarja julkistettiin ja lukotettiin DLSS4 houkuttelevin ominaisuus yksinoikeudeks sille, kuten viime sukupolvessakin tehtiin. Siitä en tiedä mikä totuus on et lukittiinko se 50-sarjalle puhtaasti sen takia et aiemmissa ei riitä puhti, mut mun mielestä niillä voi olla haasteita selitellä mustaa valkoseks siinä vaiheessa kun joku RTX 5060 tukee tota DLSS4, mut sit taas RTX 4090 ei.
Ei tuosta videosta kannata yrittää tehdä suorituskykypäätelmiä kun koko pointti on vaan esitellä dlss4 fiitsöreitä. Digital Foundry ihan uskottava 3rdparty tekemään tuollaista esittelyä kun a) eivät ole nvidia b) hyvä maine kuvanlaatuasioiden suhteen.

Suorituskykylukemat ja laajempi otanta saadaan siinä kohtaa kun nda loppuu ja tulee arvostelut ulos.
 
Olihan tuosta jo digital foundryn previkkaa. Ainakin cp2077:ssa parantaa kuvanlaatua versus dlss3. Transformer pohjainen neuroverkko on vähän erilainen kuin CNN:t. Todellisuus lienee sama kuin ennenkin, ei täydellinen mutta paranee versio versiolta.

FP4:een liittyen sanoivat edellisen postauksen nvidian videossa "for 50 series users lower memory usage and faster performance". Ei tuo lause oikein selity millään muulla kuin fp4:en käytöllä. Ei välttämättä kaikki kerrokset ole fp4:sta niin siksi sanoin vähentää muistin kulutusta enkä esimerkiksi "Puolittaa" muistinkulutuksen.


Olen katsonut jo videon kerran ja 12 minuutin kohdalla mainitaan, että tuo transformer model tulee kaikille RTX korteille aina 2000 sarjasta asti, joten se ei selitä tensoritarvetta, mutta nuo kaksi lisäframea kyllä sitä kaivannee.
Muistinkulutuksen tippuminenkaan ei tainnut olla mitenkään sidottu 5000-sarjaan, tuossa Nvidian DLSS videolla on "4K DLSS FG", ei "DLSS 4 FG":

1736359053637.png

Joten edelleen jäitä hattuun, on sellaiset markkinapöhinät päällä, että pitää rauhassa odotella kolmannen osapuolen testit useamman generaation välillä, kunhan uudet ajurit/DLSS paketit on jaossa.
 
Multitronicilla jo listattu 5080 hintoja jotka eivät ole 9999€ - Komponentit > Näytönohjaimet > GeForce RTX 50

1750 - 1850€ riippuen mallista, toivottavasti eivät pidä paikkaansa...
1736359950257.png


Sveitsissä listattu myös ja euroiksi käännettynä 1373€
AMP extreme on 1449€

Tuo Solid on käytännössä "hinnat alkaen" kortti ja saa olla melkoinen hüllü että 500€ enemmän siitä maksaa :kahvi:
 
Olen katsonut jo videon kerran ja 12 minuutin kohdalla mainitaan, että tuo transformer model tulee kaikille RTX korteille aina 2000 sarjasta asti, joten se ei selitä tensoritarvetta, mutta nuo kaksi lisäframea kyllä sitä kaivannee.
Muistinkulutuksen tippuminenkaan ei tainnut olla mitenkään sidottu 5000-sarjaan, tuossa Nvidian DLSS videolla on "4K DLSS FG", ei "DLSS 4 FG":

1736359053637.png

Joten edelleen jäitä hattuun, on sellaiset markkinapöhinät päällä, että pitää rauhassa odotella kolmannen osapuolen testit useamman generaation välillä, kunhan uudet ajurit/DLSS paketit on jaossa.
Perus spekulointia eikä mitään markkinointipöhinää.

videolla sanoivat aika yksiselitteisesti: "DLSS4 also introduces a more powerful transformer model for super resolution, ray reconstruction and dlaa using four x more tensor core processing power to reconstruct images at even better image quality for all rtx owners".

4x tensori vaatimus ei tietenkään tarkoita 4x hitaampaa suoritusta koska dlss:n sisällä on muutakin kuin tensorioperaatioita. Taitaa olla jopa niin, ettei tensoriopsit vie edes suurinta osaa dlss käyttämästä ajasta.
 
Tää on jotenkin mun mielestä vähän surulliseen taittuva video. Siis eikö saatana löydy parempaa peliä kun tänä vuonna 5v täyttävä Cyberpunk 2077 näyttämään noita uusia efektejä ja jippoja? Lisäks nVidia on oletettavasti pakottanut käyttämään prosentteja raakojen FPS-lukujen sijaan, sillä muutenhan tuossa paljastuis et yllätys yllätys, yli 4v vanha peli pyörii varsin pelattavalla frameratella myös niillä 40-sarjan korteilla, niistä ei välittömästi tullu SER-jätettä nyt kun 50-sarja julkistettiin ja lukotettiin DLSS4 houkuttelevin ominaisuus yksinoikeudeks sille, kuten viime sukupolvessakin tehtiin. Siitä en tiedä mikä totuus on et lukittiinko se 50-sarjalle puhtaasti sen takia et aiemmissa ei riitä puhti, mut mun mielestä niillä voi olla haasteita selitellä mustaa valkoseks siinä vaiheessa kun joku RTX 5060 tukee tota DLSS4, mut sit taas RTX 4090 ei.
Pelasin cyberpunkkia 2.0 päivityksen jälkeen ja 4k näytöllä 4080 kaipaa lisää tehoja jos on RT päällä, samoin Alan Wake 2 ottaisin lisää freimejä.

Mutta, päivitystä katson revikoiden jälkeen.
 
Tää on jotenkin mun mielestä vähän surulliseen taittuva video. Siis eikö saatana löydy parempaa peliä kun tänä vuonna 5v täyttävä Cyberpunk 2077 näyttämään noita uusia efektejä ja jippoja? Lisäks nVidia on oletettavasti pakottanut käyttämään prosentteja raakojen FPS-lukujen sijaan, sillä muutenhan tuossa paljastuis et yllätys yllätys, yli 4v vanha peli pyörii varsin pelattavalla frameratella myös niillä 40-sarjan korteilla, niistä ei välittömästi tullu SER-jätettä nyt kun 50-sarja julkistettiin ja lukotettiin DLSS4 houkuttelevin ominaisuus yksinoikeudeks sille, kuten viime sukupolvessakin tehtiin. Siitä en tiedä mikä totuus on et lukittiinko se 50-sarjalle puhtaasti sen takia et aiemmissa ei riitä puhti, mut mun mielestä niillä voi olla haasteita selitellä mustaa valkoseks siinä vaiheessa kun joku RTX 5060 tukee tota DLSS4, mut sit taas RTX 4090 ei.
Phantom Liberty julkaistiin syksyllä 23 ja samoihin aikoihin tuli path tracing mukaan. PT ei pyöri käytännössä ollenkaan millään asetuksella 30-sarjalaisten kanssa ja 40-sarjassakin saa ihan varmasti käyttää kaikki DLSS-temput, jos haluaa sulavaa ruudunpäivitystä.
 
Multitronicilla jo listattu 5080 hintoja jotka eivät ole 9999€ - Komponentit > Näytönohjaimet > GeForce RTX 50

1750 - 1850€ riippuen mallista, toivottavasti eivät pidä paikkaansa...
Hyi sstana :sick:

Kyllä tuo 5070ti tulee olemaan satasia yli tonnin sitten myös. Vaikka juuri möin 3080ti:n pois niin ei kyllä paljoa AI freimit napostele noilla hinnoilla. Ostan 4080 Superin käytettynä, riittää ihan hyvin 4k/60fps pelaamiseen, ja säästän matkalla pankkiin. Tai sitten jos AMD vetää sellaisen kanin hatusta, että on pakko ostaa niin ostan sen. Kyllä Nvidia ”pilasi” PC - pelaamisen tuolla RT:llä. Ei tässä mitään Mufasaa olla katsomassa vaan pelejä pelaamassa niin ihan hyvin oltaisiin pärjätty leivotuilla assetseilla. Nykyään AAA Pelit on yhtä suttua, flikkeröintiä ja smearinkia kun lyödään peli kaikkea huttua täyteen millä ei ole pelattavuuden tai ulkoasun osalta mitään merkitystä ja korteissa ei riitä jerkku pyörittää niitä. Sitten homma ”korjataan” helvetin kalliilla korteilla missä maksat softasta joka työntää lagisia feikki frameja ruudulle.

Ai, että kun välillä löytyy onneksi indie helmi missä on menty tekstuurit edellä ja peli on terävän sekä selkeän näköinen ja pyörii perunalla.

Kyllä minä olen sen verran old school , että tykkään suorasta laskentatehosta, kuumasta huoneesta ja hien hajusta… ostan 7900xtx, ostan kaks ja vedän ne siltaan.

Anteeksi ränttäys, mutta nvidia voisi periaatteessa haistaa paskan :D
 
Viimeksi muokattu:
"Alkaen" hinnoiteltuja malleja on kourallinen julkaisussa ja sitten kk tolkulla vain noita ylihinnoiteltuja OC malleja saatavilla. Tuli sellainen Déjà-vu

osto housut valuu jalasta jos FE ei saa blokkia ja AIB kortit hinnoiteltu kuin niissä tulisi kullalla päällystetty blokki mukana
 
Viimeksi muokattu:
Tuo Asuksen ROG Astral 5080 kiinnostaa kun kauan ollut vain hyviä kokemuksia puljun Strix-jäähyistä jos hinta on yhtään samaa kaavaa kuin 4080 Super Strixin kohdalla.
 
5090FE 2450€ ei vaikuta enää NIIN kalliilta. Kuitenkin 32 gigaa muistia myös AI-hommiin.
Saahan (ehkä, joskus) sieltä Nvidialta suoraan myös sen 5080FE:n 1229€.
Multitronicin hinnat mahdollisesti ovat vielä pelkkiä placeholdereita, ei ainakaan toivottavasti kukaan moisia summia noista maksa ettei myyjät huomaa, että näihin voi laittaa minkä katteen haluaa.
 
Saahan (ehkä, joskus) sieltä Nvidialta suoraan myös sen 5080FE:n 1229€.
Multitronicin hinnat mahdollisesti ovat vielä pelkkiä placeholdereita, ei ainakaan toivottavasti kukaan moisia summia noista maksa ettei myyjät huomaa, että näihin voi laittaa minkä katteen haluaa.
Tässäkin sukupolvessa näemmä toistuu se ongelma et FE on halvin kortti ja samalla myös todennäkösesti yks parhaista. Jos siihen vielä tulee tollanen lisämauste et noi hinnat alkaen-paskamallit AIB tarjoamana maksaa siitä 1700€ ylöspäin niin vähän veikkaan et siellä voi olla sit muutama kaveri jonottamassa sitä FE:tä.

Toivotaan et multitronicin hinnat on pelkkä placeholder, koska jos ei niin kyllähän sit 3080 jaksaa vielä pari vuotta lisää. Poljen ku tulpatonta mopoa ja pieksen kun vuokrattua muulia. Ja sit ihmettelen parin vuoden päästä kun se RTX 6080 maksaakin jo yli 2000€.
 
Nvidian blogipostaus uusista ja parannetuista mediaominaisuuksista.
GeForce RTX 50 Series GPUs deliver a generational leap in NVIDIA encoders and decoders with support for the 4:2:2 pro-grade color format, multiview-HEVC (MV-HEVC) for 3D and virtual reality (VR) video, and the new AV1 Ultra High Quality mode.
Livestreamers can also benefit from NVENC — 5% BD-BR video quality improvement for HEVC and AV1 — in the latest beta of Twitch’s Enhanced Broadcast feature in OBS, and the improved AV1 encoder for streaming in Discord or YouTube.
The first, Studio Voice, enhances the sound of a user’s microphone to match that of a high-quality microphone. The other, Virtual Key Light, can relight a subject’s face to deliver even coverage as if it were well-lit by two lights.

RTX Video — an AI feature that enhances video playback on popular internet browsers like Google Chrome and Microsoft Edge, and locally with Video Super Resolution and HDR — is getting an update to decrease GPU usage by 30%, expanding the lineup of GeForce RTX GPUs that can run Video Super Resolution with higher quality.

The GeForce RTX 5090 GPU is equipped with three encoders and two decoders, the GeForce RTX 5080 GPU includes two encoders and two decoders, the 5070 Ti GPUs has two encoders with a single decoder, and the GeForce RTX 5070 GPU includes a single encoder and decoder
 
Millon näistä julkaistaan arvosteluja?
tämä. Siis mihin asti pitää odottaa, johonkin tämän kuun loppuun asti tai jotain?
Olen yrittänyt etsiä netistä arvosteluja, mutta ei löydy mitään. Joku asiasta paremmin tietävä osaisi varmaankin vastata siihen milloin nuo arvostelut ilmestyvät.
 
Millon näistä julkaistaan arvosteluja?

tämä. Siis mihin asti pitää odottaa, johonkin tämän kuun loppuun asti tai jotain?
Olen yrittänyt etsiä netistä arvosteluja, mutta ei löydy mitään. Joku asiasta paremmin tietävä osaisi varmaankin vastata siihen milloin nuo arvostelut ilmestyvät.
Sitten kun tulevat myyntiin. Aika usein arvostelut saa julkaista tyyliin päivää ennen.
 
Multitronicilla jo listattu 5080 hintoja jotka eivät ole 9999€ - Komponentit > Näytönohjaimet > GeForce RTX 50

1750 - 1850€ riippuen mallista, toivottavasti eivät pidä paikkaansa...
Jos nämä osoittautuvat oikeaksi niin herääkin kysymys että myykö nVidia omaa korttiaan reilusti pienemmällä katteella kun AIB kortteja?
Ainahan AIB korteissa on ollut lisää (jollakinhan se niidenkin bisness on pyörittävä) mutta 30% on kyllä aika paljon.

Nuo Zotacin hinnat tuossa muodossaan enteilisivät kyllä aika lähelle sitä mitä Vex vuodossaan ennusteli Asuksen 5080 hinnoiksi (siis vero ja valuuttamuutokset huomioiden) joten kyllähän tässä käy mielessä että nVidialla huomattiin närkästys 5080 hintoihin ja oman kortin hintaa on paljon helpompi loppumetreillä sorvata kun lähteä avaamaan AIB:ien kustannusrakennetta tuotteelle joka on ollut jo valmistuksessa hyvän tovin...

EDIT: Sveitsin hinnoista tehty karkea suomi muunnos:
1373 eur / 1,081 = 1 270,12 eur (alviton)
1270,12 eur * 1,255 = 1 594,00 eur.

elii kyllä se tuollakin matikalla menee sinne 1600 euron kohdille.
(ja 1600 / 1229 on 1,30)
 
Viimeksi muokattu:
Kannattaa myös huomioida että Sveitsissä on 8.1% alv vrt. Suomen 25.5% :kahvi:
On mahdollista että hinnat sijoittuvat tuonne 1700 €+:n tasolle, mutta epäilen vahvasti, että FE-version ja basic-kortin välillä olisi Suomessa 500 euron ero. Olisi melko älytöntä.

4080 superin FE-mallin hinta suomessa julkaisussa oli 1149€. Nyt 5080 FE:n hinta on 1229€, kuitenkin 4080 Super strixin hinta oli jukaisun tienoilla:

Jimm's ja Verkkokauppa.com: 1389 €
Proshop: 1469 €
hinta.fi-linkki

Näin ollen 4080 Super Strixin ja FE-mallin välinen hintaero oli 240 €.

Onko mahdollista että 5080 FE:n ja 5080 AIB:n välillä olisi tuo 500 euron ero? Kyllä, mutta perustelisiko tuota esim 1.5% alvin nousu? Jos näin, niin melko mielenkiintoiset laskukaavat AIB-valmistajilla. :kahvi:

Joka tapauksessa varmaan parin viikon sisään selviää lopullinen totuus.

300€ korotuksen esim Astral hilavitkutin mallista vielä "ymmärtäisin", mutta Zotacin hinnat alkaen -mallin 500€ premium lisä on vähän vaikea niellä...
 
Multitronicilla jo listattu 5080 hintoja jotka eivät ole 9999€ - Komponentit > Näytönohjaimet > GeForce RTX 50

1750 - 1850€ riippuen mallista, toivottavasti eivät pidä paikkaansa...
Tuohan menee juuri sen mukaan, mitä itse aikaisemmin arvelin todellisiksi myyntihinnoiksi:
Näitten näytönohjainten hinnat ovat jo lähtökohtaisesti (FE-mallit) sen verran pöyristyttäviä, että jos joku tuollaisen 5080/90 -mallin haluaa, niin sitten ostaa vaikka hintaan laitettaisiin muutama satanen lisää.
Ja jos ei heti osta kovilla hinnoilla, niin voi käydä ettei sitten saa ollenkaan.
Kaikki kyllä käyvät kaupaksi.
 
Jos nämä osoittautuvat oikeaksi niin herääkin kysymys että myykö nVidia omaa korttiaan reilusti pienemmällä katteella kun AIB kortteja?
Ainahan AIB korteissa on ollut lisää (jollakinhan se niidenkin bisness on pyörittävä) mutta 30% on kyllä aika paljon.
Onhan tästä ollut juttua että AIBt ei oikein tykkää siitä että nvidia polkee hintoja omilla FE korteilla. EVGA lopetti yrityksenä kokonaan pääosin Nvidian takia, mitä rivien välistä luki.

Nvidialla on vähemmän kuluja, kun jää siitä yksi porras pois, mutta luulen että ennemminkin Nvidialla on nyt "loputtomasti" rahaa tuotekehitykseen, niin voivat tyytyä pienempään katteeseen suhteessa valmistuskustannukset vs AIBt.
 
Onhan tästä ollut juttua että AIBt ei oikein tykkää siitä että nvidia polkee hintoja omilla FE korteilla. EVGA lopetti yrityksenä kokonaan pääosin Nvidian takia, mitä rivien välistä luki.

Nvidialla on vähemmän kuluja, kun jää siitä yksi porras pois, mutta luulen että ennemminkin Nvidialla on nyt "loputtomasti" rahaa tuotekehitykseen, niin voivat tyytyä pienempään katteeseen suhteessa valmistuskustannukset vs AIBt.
Tämä on kyllä tosi kuin vesi.
Mielenkiintoista nähdä että miten tuo hintaero skaalautuu 5070 ja 5070 Ti malleihin. Jos se pysyy prosentuaalisesti samana niin AIB 5070 maksaakin 970 euroa ja AIB 5070 Ti maksaa 1200 euroa.
 
Onhan tästä ollut juttua että AIBt ei oikein tykkää siitä että nvidia polkee hintoja omilla FE korteilla. EVGA lopetti yrityksenä kokonaan pääosin Nvidian takia, mitä rivien välistä luki.

Nvidialla on vähemmän kuluja, kun jää siitä yksi porras pois, mutta luulen että ennemminkin Nvidialla on nyt "loputtomasti" rahaa tuotekehitykseen, niin voivat tyytyä pienempään katteeseen suhteessa valmistuskustannukset vs AIBt.
AIB:n mielestä nvidia myy liian halvalla, kuluttajan mielestä kalliilta. Ei voittavia arpoja tarjolla.
 
Palstan useista nvidia keskusteluita seuranneina havainto on että nykyisilläkin FE hinnoilla osa porukasta väittää nvidian ylihinnoittelevan ja riistävän.
Hohhoijaa... Kukaan ei väitä että Nvidia riistää kuluttajia FE hinnoilla suhteessa AIB-kortteihin. Vai pivottasitko täysin eri asiaan kuin mistä lainaamassasi swttiin viestissä oli kyse?
 
Nvidia kertoi miten Digits GB10:ssa on nvlink c2c:lla laitettu nvidian gpu ja mediatekin arm cpu yhteen. Huomionarvoista gpu:n pään iso cache joka on muistikoherentti ja nopeasti myös cpu:n saavutettavissa. Jännää miten muistiohjaimet ovat cpu:n puolella ja gpu:n tarvii mennä cachen ja nvlink c2c:n läpi että pääsee muistiin käsiksi.

Lieköhän gb10 tyylinen paketointi tulisi huhuttuihin mediatek arm cpu + nvidia gpu windows 11 läppäreihin(chiplet huhuissa)? Vai ehkä liian kallis/hidas paketointitapa ja tulee huhutut läppärit jollain toisella tavalla rakennettuna kuluttajakoneisiin?

Tän tyyppinen paketointi voi olla myös miten rubin(tms.) seuraava kuluttaja gpu niittaa 2xchiplet yhteen yhdeksi isoksi gpu:ksi tai ehkä gpu ja cache+io chipletit missä gpu 3nm ja cache+io piiri voisi olla 4nm tms. Konesali blackwell:ssa tuo piirien välinen kaista on 10TB/s. Miten lie kehittyy kun mietitään 2v-3v päähän tulevaisuuteen ja seuraavaan kuluttaja gpu:hun.

1736426999775.png

1736427043817.png

1736427062070.png

 
Mitenhän tämän suorituskyky AI hommissa verrattuna 5090.
Nvidia kertoi miten Digits GB10:ssa on nvlink c2c:lla laitettu nvidian gpu ja mediatekin arm cpu yhteen. Huomionarvoista gpu:n pään iso cache joka on muistikoherentti ja nopeasti myös cpu:n saavutettavissa. Jännää myös se, että muistiohjaimet ovat cpu:n puolella ja gpu:n tarvii mennä cachen ja nvlink c2c:n läpi että pääsee muistiin käsiksi.

Lieköhän gb10 tyylinen paketointi tulisi huhuttuihin mediatek arm cpu + nvidia gpu windows 11 läppäreihin(chiplet huhuissa)? Vai ehkä liian kallis/hidas paketointitapa ja tulee huhutut läppärit jollain toisella tavalla rakennettuna kuluttajakoneisiin?

1736426999775.png

1736427043817.png

1736427062070.png

 
Mitenhän tämän suorituskyky AI hommissa verrattuna 5090.
1PFlop fp4 suorituskykyä ai homissa, lienee hitaampi kuin 5090 mutta nopeampi kuin 4090. 128GB unified muistia niin voi ajaa yhdellä koneella 200B fp4 mallia versus 32GB muistia 5090 tai 24GB 5090. Boxissa on nopea linkki minkä avulla saa kaksi noita kytkettyä yhteen ja tuplattua muistiavaruuden(400B fp4 mallit). Ainakin 4090 ja varmaan myös 5090 on rajoitettu fp16/fp32 akkumulaationopeutta. GB10 tuskin on rajoitettu.

Superpieni pönttö, toimii tavistöpselistä, hinnat alkaen 3000$ ja toukokuussa myyntiin. Kai tuota laitetta myydään muistinmäärä ja hinta edellä + sama arkkitehtuuri kuin konesalissa jos haluaa mahdollisimman helpon tavan debugata konesalikuormia omalla pöydällä.
1736427475531.webp

 
1PFlop fp4 suorituskykyä ai homissa, lienee hitaampi kuin 5090 mutta nopeampi kuin 4090.
On se toki nopeampi jos lasketaan että 4090 FP4 flopsit on 0. Mutta 4090:ssä on 1,3 petaflopsia 4090:ssä @ FP8, eli Digitsissä on vähemmän silloinkin kun sillä ajetaan FP4 formaatissa ja selvästi alle puolet silloin kun FP4:ää ei voi hyödyntää (mikä on keissi erittäin usein).

Muistikaista myös vähän mysteeri, saattaa jäädä puoleen tai vain neljännekseenkin 4090:n kaistasta.
 
On se toki nopeampi jos lasketaan että 4090 FP4 flopsit on 0. Mutta 4090:ssä on 1,3 petaflopsia 4090:ssä @ FP8, eli Digitsissä on vähemmän silloinkin kun sillä ajetaan FP4 formaatissa ja selvästi alle puolet silloin kun FP4:ää ei voi hyödyntää.

Muistikaista myös vähän mysteeri, saattaa jäädä puoleen tai vain neljännekseenkin 4090:n kaistasta.
Paljon riippuu miten mittaa ja mikä gb10 cachen koko ja toimivuus on. Ajattelin siinä "hitaampi" jutussa fp16/fp32 kuormia mitä käytetään jos finetunettaa omia malleja. fp16/fp32 akkumulaationopeus puolitettu 4090:ssa ja täysi nopeus vain pro korteissa kuten ada rtx 6000.

Linkkasin tuon kuitenkin enempi se mielessä, että lieköhän nvlink c2c ratkaisu nähdään mediatek+arm win11 läppäreissä ja/tai rubin-generaation kuluttajatuotteissa? Murusia voi yrittää seurata. Ehkä nvidia rakentaa pikkuhiljaa kuluttajatuotteitakin chiplet suuntaan. Huhuissahan oli, että gb202 olisi sisäisesti suunniteltu niin, että cache toimisi kuin chiplet jos/kun tulevaisuudessa oikeasti niitatan vaikka 2x256bit piirit yhteen tai ehkä cache+io siirretään omalle piirillensä.
 
Ajattelin siinä "hitaampi" jutussa fp16/fp32 kuormia mitä käytetään jos finetunettaa omia malleja. Tuo fp16/fp32 akkumulaationopeus puolitettu 4090:ssa ja täysi nopeus vain pro korteissa kuten ada rtx 6000.
Speksien osalta toi Digits vaikuttaa omaan silmään paremmin inferenssiin soveltuvaksi, mutta en kyllä juuri treenaamisesta tiedä.

Kuinka usein tätä akkumulaationopeutta hyödynnetään todellisuudessa? Mulla ei käsitystä.
 
Speksien osalta toi Digits vaikuttaa omaan silmään paremmin inferenssiin soveltuvaksi, mutta en kyllä juuri treenaamisesta tiedä.

Kuinka usein tätä akkumulaationopeutta hyödynnetään todellisuudessa? Mulla ei käsitystä.
Kavereilla firma joka kustomoi geneeristä open source kielimallia suomeksi suomalaisille asiakkaille niche käyttötapaukseen. Niillä on 2x4090 ajossa pari viikkoa kun tekevät uuden julkaisun kielimallista. fp16/fp32 akkumulaatiota tarvii kun opetushommissa ei fp8 tarkkuus riitä toisin kuin inferenssissä. Ei fp16/fp32 käyttö varmaan kovin harvinaista ole pikkupajoissa joilla ei syystä tai toisesta ole varaa/intoa pro-kortteihin tai konesalimaksuihin. Sama juttu varmaan kouluissa, tutkijoilla yms. joilla on rajotteita sen suhteen kuinka kalliita työlaitteita on vara ostaa. Kaverit kyllä aluksi käytti jotain pilveä, mutta laskivat että heille halvempi laittaa 4090:sta ajoon.

Mulle jäi digitsistä käsitys, että sitä markkinoidaan devausalustaksi eikä loppukäyttäjätuotteena. Kehittelet ja debuggaat lokaalisti digitsin avulla kielimallia joka on "konesalikokoinen, 200B/400B fp4). Tuotantoon kun menee niin laitetaan konesaliin. Tärkeämpää varmaan se, että isot mallit toimivat ja voi debugata/kehitellä eikä ehkä niinkään se että mallin nopeus olisi optimaalinen(muistikaista)
With Project DIGITS, users can develop and run inference on models using their own desktop system, then seamlessly deploy the models on accelerated cloud or data center infrastructure.
 
Menee muuten aika hyvin yksiin 5070:n FP4 flopsien (0,99 petaflops) kanssa tuo laite.

Muistikaistaa joku arvelee localllama subredditissä olevan 273GB/s eli alle puolet 5070:n kaistasta. Tämä olis 256-bittisellä väylällä ja 8533MT/s piireillä.

Melko tuhnua on ajella niitä isompia kielimalleja tuolla kaistalla, toivottavasti on 512-bittinen sittenkin.

 
Tuo huijaus FPS nosto lisää viivettä 50+ ms, sehän tosi paljon.

Pelejä ei tarvitse optimoida hyvin kun luotetaan tuohon.
 
Tuo huijaus FPS nosto lisää viivettä 50 ms+ sehän tosi paljon.

Pelejä ei tarvitse optimoida hyvin kun luotetaan tuohon.
 
Tuo huijaus FPS nosto lisää viivettä 50+ ms, sehän tosi paljon.

Pelejä ei tarvitse optimoida hyvin kun luotetaan tuohon.
50ms(digital foundryn mittaukset) on kokonaisviive, ei 50ms lisää viivettä. Ei viive ole 0ms ilman framegenia. 0ms viive tarkoittaisi että pelin fps olisi ääretön ja renderöinti, fysiikka jne. ei veisi mitään aikaa. Jos 50ms on laskettu hiiren napista näytölle 0ms olettaisi myös ettei ohjaimessa, näytössä jne. ole mitään viivettä.

Vanha DF:n video niin latenssi ilman framegeniä jossain 30ms+ paikkeilla. Framegen lisännee latenssia about 20ms-30ms riippuen ja roikkuen. Peruslatenssi toki paljon siitä miten säädät asetukset kun jos fps on 30 tai 60 tai 120 niin latenssi on eri. Lähde aikaleimalla

1736433147149.png

 
Viimeksi muokattu:
50ms(digital foundryn mittaukset) on kokonaisviive, ei 50ms lisää viivettä. Ei viive ole 0ms ilman framegenia. 0ms viive tarkoittaisi että pelin fps olisi ääretön ja renderöinti, fysiikka jne. ei veisi mitään aikaa. Jos 50ms on laskettu hiiren napista näytölle 0ms olettaisi myös ettei ohjaimessa, näytössä jne. ole mitään viivettä.

Vanha DF:n video niin latenssi ilman framegeniä jossain 30ms+ paikkeilla. Framegen lisännee latenssia about 20ms-30ms riippuen ja roikkuen. Peruslatenssi toki paljon siitä miten säädät asetukset kun jos fps on 30 tai 60 tai 120 niin latenssi on eri. Lähde aikaleimalla

1736433147149.png


Verrokkina DF testasi viiveitä eräällä vanhalla videolla ”PS-stream vs Xbox Cloud” ja lokaalisti konsoleilla cyberpunk 60fps pelaamisessa oli vajaa 60ms klick-to-photon latenssi eli isompi mitä 4x framegenin kans PC.
 
Verrokkina DF testasi viiveitä eräällä vanhalla videolla ”PS-stream vs Xbox Cloud” ja lokaalisti konsoleilla cyberpunk 60fps pelaamisessa oli vajaa 60ms klick-to-photon latenssi eli isompi mitä 4x framegenin kans PC.
Ohos... Joku gamepadikin taitaa olla 20ms latenssia. +- jotain. Voi ajatella että ei framegen pelaajat saa aina bonuksena reflex2 toteutuksen kun framegen sen vaatii. Ehkä pelintekijä ei optimoisi latenssia/reflex2 jos nvidia ei puskisi framegenia. Kaikki voittavat?

---

imho. framegen on hyvä keksintö kunhan sitä ei väärinkäytä. Ensin fps ja latenssi kohdalleen. Jos monitorissa vielä varaa framegen päälle. Jos pelaa jotain kilpailullista pumpum peliä niin taitaa porukka karsia asetukset minimiin, fps maksimiin ja framegen ei ole millään tavalla relevantti. Reflex2+warp taas voi olla erittäinkin järkevä kilpapeleissä.

Single player silmäkarkkipeleissä arvoa on silläkin miltä peli näyttää, slow is not smooth.

30fps->60/120fps paska idea kun oli framegen tai ei niin 30fps on imho. tökkivä. 30fps kakkaa ei voi kiillottaa.
72fps->144fps framegen on mulle jo sietoisa mutta joku toinen voi pitää 72fps lähdemateriaalia liian huonona
120fps->240/480fps konversio. Vaikea uskoa, että tässä enää latenssi tuntuisi ja lounas on ilmainen?
 

Statistiikka

Viestiketjuista
264 239
Viestejä
4 579 347
Jäsenet
75 376
Uusin jäsen
Tonde_34

Hinta.fi

Back
Ylös Bottom