• TechBBS-foorumin Piparkakkutalokisa 2024 -äänestys käynnissä! Käy äänestämässä 22 osallistujan joukosta kolme mielestäsi hienointa kilpailutyötä ja osallistu arvontaan! Linkki äänestykseen >>>

NVIDIA-spekulaatioketju (Lovelace ja tulevat sukupolvet)

Kyllä se varmaan on ihan basic business ABC oppikirjaliike. Eli tehdään voittoa. Miljardi on kuitenkin miljardi siellä viivan alla.

Ilmeisesti annat kuitenkin ymmärtää että luopumalla pelipuolesta saataisiin datacenter puolen tulos isommaksi? NVidian toimarin on tehtävä lain mukaan tehtävä osakkeenomistajille tulosta. Jos tuo on nuin selkeä ja tietoinen päätös että ajamalla pelipuoli alas nousisi tulos selvästi niin se on linnatuomio kun sitä ei olla tehty jo.

Huolenpitovelvollisuus (fiduciary duty) on oikeudellinen velvollisuus toimia toisen osapuolen parhaaksi. Se on tunti turpaan ja linnaan jos tässä huomataan että Jensseni on pitänyt pelipuolta pystössä vain sitä varten kun on kiva olla gamer.
Laki ei velvoita yritystä ja/tai toimaria tekemään suurinta mahdollista tulosta.
 
Laki ei velvoita yritystä ja/tai toimaria tekemään suurinta mahdollista tulosta.

Laki ei, mutta yhtiön hallitus vaatii eli käytännössä enemmistöosakkaat ja se on heidän toimesta kengän kuva perseelle toimitusjohtajalle ja uutta tilalle aina heti ensimmäisenä jos ei olla tyytyväisiä tulokseen.
 
Parasta tässä on se, että kun on maksanut 500€ prossusta, 2500€ näyttiksestä (esimerkiksi balttiarallaa 5090) ja tietty muut osta vielä päälle, niin perus AAA pelit näyttää halvoilla konsoleilla ”lähes” yhtä näteiltä mutta ruudunpäivitys jää sitten 4k resoilla pienemmäksi.

Tavan harrastamaton olan yli katsoja ei huomaa eroa jos molemmat kiinni vaikka OLED telkuissa, ihmettelee vaan miksi toinen setti maksaa muutaman tonnin enemmän 🤷‍♂️

Siltin 5090.

Kannattaa myös huomioida jos tuolla kulmalla ajattelee, niin 4090:kin kantaa tässä vaiheessa vielä nykyisen ja sitäkin seuraavan konsolisukupolven yli ellei enemmänkin ja sillä paremmalla suorituskyvyllä olettaen, että kortti pysyy vaan hengissä. Ja toisekseen mikäli laaduksi riittää se mitä konsolit piirtää, niin eihän silloin osteta kuin se low-end kortti tai korkeintaan keskiväli.
 
Niin, siis kasvuhan on ainoa keino yrityksellä pysyä pystyssä oli se sitten 10 tuhannen euron liikevaihdolla tai kymmenen miljardin liikevaihdolla. Ei se peli siitä miksikään muutu.
Onhan noita arvo/osinkoyrityksiä joissa bisnes ei juurikaan kasva. Keskitytään marginaalin parantamiseen esimerkiksi toimintaa tehostamalla, halventamalla tai hintoja nostamalla(yikes).

Nvidian seuraava kasvupyrähdys lienee robotiikka ja ehkä arm-läppärit. Ilmeisesti robotiikkapuolella tehty läpimurtoja joiden ansiosta isaac/omniverse/... simulaattoreista saadaan virtuaalisesti opetettu robotti toimimaan oikeassa maailmassa. Robotiikka ja autopuolelle 2025 aikana uusi embedded suoritinyksikkö(thor). 2025 aikana pitäsi myös tulla mersulta nvidian rautaa käyttävää autoa. Lasken autot osaksi "robotiikkaa".
In the past 12 months... (this gap) has matured sufficiently that we can now carry out experiments in simulation, combining with generative AI, that we could not do two years ago. We provide the platform for enabling all of these companies to do any of those tasks"


Mielenkiinnolla odotan julkistaako nvidia tai nvidia+mediatek arm läppäreitä ces:ssa.Voi olla että liian aikaista olettaen että läppärit myynnissä alkusyksystä. Ehkä kuitenkin computex paikka missä kerrotaan nvidiapohjaisista arm läppäreistä. Nvidia pääsee markkinaan mihin aikaisemmin ei voinut(igpu läppärit, mini pc:t)
 
Kannattaa myös huomioida jos tuolla kulmalla ajattelee, niin 4090:kin kantaa tässä vaiheessa vielä nykyisen ja sitäkin seuraavan konsolisukupolven yli ellei enemmänkin ja sillä paremmalla suorituskyvyllä olettaen, että kortti pysyy vaan hengissä. Ja toisekseen mikäli laaduksi riittää se mitä konsolit piirtää, niin eihän silloin osteta kuin se low-end kortti tai korkeintaan keskiväli.

Joo totta tämäkin. Konsolitaso ja max 60fps onnistuu pienemmälläkin sijoituksella.

Meneekö siltin koko konsolin elinkaaren eos, mutta aika jyrkästi alkaa laitteet maksaa jos tuolla aallon harjalla keikkuu. Ja saahan toki edellisestä huippukortista hyvät vauhdit uuteen.
 
Ehkä sitä olis sit jopa julkasussa saatavilla ku ei kelpaa työkäyttöön ja AI leikkeihin ja kaikkien mielestä liian vähän muistia.
Uskon että 5080:iä saa helposti tosiaan, vahva tuoksu on, että samanlainen väliinputoaja kuin 4080 oli. 5090:t ja 5070 ti:t menee taas kuin kuumille kiville jos vaan hinta jossain järkevissä summissa verrattuna 4000-sarjaan.
 
Tää on nyt vänän mistä tykkää maksaa... Aika marginaalissa on ne pelit missä 4090 teho loppuisi. Toki kaikki saa loppumaan kun ottaa jotain extreme modeja vielä mukaan. Aika harvoin sitä jaksaa kuitenkaan ostaa aivan uunituoreita pelejä mistä saisi parhaan hyödyn kortille. Ne kun yleensä maksaa reilusti ja bugit kaupan päälle. Vähän aikaa odottelee niin saa halvemmalla ja parempana.

Pre 4090 aikaa kaikki teho oli tarpeen jos 4k:lla pelas. Tuli itse maksettua 2200€ käytetystä 3090:sta ja alla oli 3080ti. Eli tehoeroa joku 5%... Mutta sekin 5% tuli tarpeeseen. 4090:n jälkeen on kyllä todella meh. Okei omista peleistä saan cyberpunkilla tekstuuri modeilla fps:t sinne alle 30, että joutuu laittamaan dlss:n päälle, jotta pääsee yli 60. Voisin myös ottaa tekstuuri modit vittuun, mutta en mä nyt oli paria tonnia maksamassa, että kourallinen pelejä toimii hulluilla asetuksilla täysillä.

4k:lla pelannut siitä asti kun ensimmäiset pc:lle ulostavat 60hz hdmi 2.0 4:4:4 telkkarit tuli myyntiin eli 2014. 8v siinä sai kitkuttaa ties millä nuhapumpuilla, mutta 4090 tarjosi kertaheitolla autuuden. 5090 tulee tarjoamaan vain marginaalista parannusta siihen hyppyyn mikä tuli nähtyä edellisellä kerralla.

Toki ymmärrän jos joku maksaa... Eihän nämä usein mene järjellä vaan tunteella.


Itse mielenkiinnolla odottelen tulevalta launtsilta lähinnä. Mitä ne hinnat oikeasti on ja missä kastissa amd painii. Veikkaan, että amd painii 5070/ti teholuokassa ja 5080/5090 maksaa ns. aivan hitokseen. 5080 melken sen mitä 4090 ja 5090 sitten tonnin enemmän. Nuhapumpputier 5060/ti tuskin yllättää sekään. Varmaan raflaavat marginaaliset tehoerot suoritustehossa edellisiin paitsi kun pistetään hokkuspokkus uusimmat dlss:ät päälle mitä ei vanhoille tietenkään tuoda niin päästään paperilla taas hienoihin kymmenien prosenttien tehoeroihin valituissa peleissä ja voidaan naamanäkkärillä taas myydä tuoretta rautaa kansalle...

Mutta noin yleisesti on vähän vaikea jatkossa päivitellä kun ei ole tollasta perustavaa laatua olevaa ongelmaa (reson aiheuttama tehovajaus) kurottavana kiinni. 8k reson tarkkuus on niin tarkka, että ei. Nyt jo 48" ja 4k on fine. En äkkiä keksi kuin vr:n pitäisi kehittyä niin paljon lisää, että sitä voisi oikeasti käyttää arkipäiväisesti eli tyyliin korvaisi näytön. Siinä reson ja tehon nälkä on varmaan pohjaton kun pikseliverkko on aivan silmillä.
Kyllä aika monessa pelissä on saanut 4090:n kanssa karsia asetuksia. Äkkiseltään mitä tulee mieleen niin tuo mainitsemasi Cyberpunk ilman mitään modeja, Silent Hill 2, Black myth Wukong taisi olla resolution scale 60% + fg että pääsi noin 80-100fps, Stalker 2, Indiana jones, uusin codi… Nyt kun miettii niin aika isossa osaa uusia pelejä pitää kyllä asetuksia karsia, että saa sen sulavan 80-100fps ja itselläni se yleensä tarkoittaa DLSS balanced + fg.

Mutta tuo trendi on nyt näkynyt lähinnä viimeisen vuoden aikana. Yhtään vanhemmat pelit kyllä yleensä pyörivät itselleni täydellisesti asetukset tapissa.
 
Uskon että 5080:iä saa helposti tosiaan, vahva tuoksu on, että samanlainen väliinputoaja kuin 4080 oli. 5090:t ja 5070 ti:t menee taas kuin kuumille kiville jos vaan hinta jossain järkevissä summissa verrattuna 4000-sarjaan.
Eikä 24GB muistin säästäminen mahdolliselle 5080 Ti:lle ole yhtään hullumpi arvaus. Aika näyttä.
 
Uskon että 5080:iä saa helposti tosiaan, vahva tuoksu on, että samanlainen väliinputoaja kuin 4080 oli. 5090:t ja 5070 ti:t menee taas kuin kuumille kiville jos vaan hinta jossain järkevissä summissa verrattuna 4000-sarjaan.
Eli 5070 ti pitäisi olla halvempi kuin 4070 ti oli (939€).
Tuskin tulee hinnanlaskua vaan hieman korotusta. Oma veikkaus ovh 990€ ja todelliset hinnat 1050-1200€. (Ehkä alkuun pieni erä ovh hinnalla)

Ihan liikaa ylemmän keskiluokan kortista.
 
Onko mitään arvioita ollut, kuinka paljon 5070 ti saattaisi olla rtx 3080:a nopeampi? Tuo potentiaalisesti ainut mahdollinen noista uusista, jos hinta/nopeus jotenkin kohtaisi.
 
Onko mitään arvioita ollut, kuinka paljon 5070 ti saattaisi olla rtx 3080:a nopeampi? Tuo potentiaalisesti ainut mahdollinen noista uusista, jos hinta/nopeus jotenkin kohtaisi.
Käsittääkseni rasteraatio arvioitu olevan Rtx 4080 tasolla ja säteenseuranta parempi. Sitten päälle jos Nvidia saa jotain dlss/neural rendering tms asiaa josta hyötyä sillä Rtx 5xxx sarjaan.
 
Onko mitään arvioita ollut, kuinka paljon 5070 ti saattaisi olla rtx 3080:a nopeampi? Tuo potentiaalisesti ainut mahdollinen noista uusista, jos hinta/nopeus jotenkin kohtaisi.
Tuijottamalla pelkkiä speksejä 5070 Ti pitäisi olla hieman 4070 Ti Superia nopeampi (pelkän shader countin perusteella) ja täten TPU:n relative performance graafia katsomalla arvio olisi ehkä 35-40% nopeampi.
Tähän toki sitten frame genit, parempi RT suorituskyky yms., niin pelistä riippuen voi olla selkeämpikin ero.
 
Tuijottamalla pelkkiä speksejä 5070 Ti pitäisi olla hieman 4070 Ti Superia nopeampi (pelkän shader countin perusteella) ja täten TPU:n relative performance graafia katsomalla arvio olisi ehkä 35-40% nopeampi.
Tähän toki sitten frame genit, parempi RT suorituskyky yms., niin pelistä riippuen voi olla selkeämpikin ero.
Olisi aika erikoista jos uusi malli olisi noin saman tehoinen kuin vanha. En tuohon itse usko kyllä. Oma arvaus on, että 5080 on lähellä, mut alle 4090 ja 5070ti on jossain 4080ti:n(korjaus: siis tietenkin 4080 superin) ja 4090:n välimaastossa.
 
Viimeksi muokattu:
Minkäköhänlainen jytkäle tuo ~600W 5090 tulee olemaan... :nb:

Onneksi tuli pistettyä tuo 1200W virtis, vaikka pitkään meinasin vaan 1000W:n ostaa uuteen kokoonpanoon.
 
Viimeksi muokattu:
Olisi aika erikoista jos uusi malli olisi noin saman tehoinen kuin vanha. En tuohon itse usko kyllä. Oma arvaus on, että 5080 on lähellä, mut alle 4090 ja 5070ti on jossain 4080ti:n ja 4090:n välimaastossa.
Uusi GDDR7 muisti voi siivittää 5070 Ti:n jonnekin 4080/4080S tienoille (Ti:tä kun ei ole olemassa), mutta muistikaistan ollessa edelleen 256bit hyvin todennäköisesti kauaksi jäädään vielä 4090:stä.
Toki olisi mukava olla väärässä ja että blackwell arkkitehtuuri itsessään toisi suuren harppauksen, mutta pessimisti ei pety.

5070 Ti ja 5080 kun taas ei suurta eroa ole, niin voi olla että ehkä 4080S ja 4090 puoliväliin päästään sen kanssa.
 
5080 tuskin ylittää 4090 tehoa paitsi RT:ssä johtuen Kiinan vientirajoituksista ja siitä ettei ole 5080D mallia.

Muu vaatisi että pelikorteissa on erikseen rampautettu laskentapuolta niin että nuo rajoitukset ei pauku.
 
Kuullostaa jo vähän siltä että jos noi hinnat ovat realismia (en luota, Jensen on tunnettu vetämään kaneja hatusta juuri ennen showta) niin 5080 olis kannattanut myydä nimellä 5090 ja 5090 kutsua Titaniksi :D

Tietty olisi tuonut ongelman että jos "5090" on hitaampi kuin 4090 niin kansa kurnuttaa...
 
Heh, jos hintahuhut pitää paikkansa ja AMD ei pysty tarjoamaan mitään kunnollista, niin jää 3080 vieläkin koneeseen. Ostetaan uutta jos joskus vielä tulee jotain järkevää markkinoille. Reilun tonnin hinnan olisin voinut ottaa inflaationa edellisestä ostoksesta ja antanut anteeksi naurettavat 4000-sarjan hinnat.
 
Kuullostaa jo vähän siltä että jos noi hinnat ovat realismia (en luota, Jensen on tunnettu vetämään kaneja hatusta juuri ennen showta) niin 5080 olis kannattanut myydä nimellä 5090 ja 5090 kutsua Titaniksi :D

Tietty olisi tuonut ongelman että jos "5090" on hitaampi kuin 4090 niin kansa kurnuttaa...
9800GTX taisi olla hitaampi kuin 8800GTX joissain tilanteissa, joten ei sinällänsä uusi juttu. Muistiakin taisi olla vähemmän. :D
 
9800GTX taisi olla hitaampi kuin 8800GTX joissain tilanteissa, joten ei sinällänsä uusi juttu. Muistiakin taisi olla vähemmän. :D
Mutta se oli myös reippaasti halvempi. 8800GTX launchasi hintaan $599 joka oli aikoinaan mallia "hui, aivan järjetöntä". 9800GTX oli julkaisussa $299 joten ei haitannut jos se oli "vain" 8800GTX-tasoa. Oi noita aikoja kun top of the line kortti maksoi kolme sataa taalaa...

Jos NVIDIA julkaisisi nimellä 5090 kortin joka olis hitusen 4090 hitaampi mutta maksais tonnin, ja perään Titaanin joka sit olis melkein tuplahintainen, jengi kenties hyväksyisi sen. Nyt jos käy niin että 5080 maksaa 1200 tms jenkki MSRP ja 5090 on kaks tonnia+ niin kurnutusta tulee ihan varmasti :D

No, nämä nyt on tällaisia spekulaatio-käsienheilutteluja. Hintoja emme vielä tiedä ja koska kilpailua ei tällä hetkellä ole, NVIDIA voi pyytää korteista jotka ovat nopeampia kuin 7900XTX aivan mitä haluaa...
 
Sinänsä jos NVIDIA haluaa rahastaa korteillaan, niin tämä on ihan ok. Jos kerran ostaja siitä haluaa tolkuttomia summia maksaa, niin ei kait siitä vähempää kannata pyytää.

Uusimpien korttien huonoimpana asiana pitäisin sitä, jos sieltä tulee taas joku dlss versio, joka ei toimi kuin uusimmilla korteilla ("rautarajoitteiden takia"). Veikkaan vaikka, että joku RT kiihdytykseen viritetty kiihdytinjono ei toimi vanhemmilla korteilla (tai joku pakkaus algoritmi jolla muistia kuluu hivenen vähemmän, mutta joka tukahduttaa edellisen sukupolven vähämuistisia kortteja enemmän kun eivät voi sitä hyödyntää). Muistin kohdalla säästäminen on sitten se toinen harmittava juttu, mutta siitä säästäminen ei sentään huononna edellistä sukupolvea suoraan (ellei sinne tosiaan keksitä jotain edellä mainittua).
 
4090:en teoriassa 450W, keskiarvo isossa määrässä pelejä jää alle 400W. imho. ihan ok. että laittavat teoreettisen virrankulutuksen ylös niin ne jotka haluaa saa löysät irti piiristä. Positiivisena puolena pienelläkuormalla ja/tai alikellotettuna varmaan vähävirtaisempi ja hiljainen kun jäähdytys mitoitettu massiiviseksi.

Uusi kone kasattu ja toimiva. Enää puuttuu 5090:en. 9700x:an vois vaihtaa keväällä nopeampaan kunhan amd:n 9950x3d:ta:ta saa hyllystä.

Jos nvidia rahastaa niin voi kysyä miksi amd ja intel ei tee samaa... Ehkä asiat ei ole niin yksinkertaisia kuin kuvittelisi.
 
No tietysti siksi, koska AMD ja Intel ei pysty myymään tuotteita ilman kilpailua toisin kuin nVidia huippunäyttissegmentissä? :hmm:
Miksi AMD tai Intel ei sitten tee huippunäyttistä, kun tätä foorumia lukemalla vois luulla, että se on halpaa kuin saippua ja sillä takoo satumaisia voittoja? Kannattaisi varmaan ostaa Intelin ja AMDn osakkeita ja ehdottaa yhtiökokouksessa huippunäytönohjaimen tekemistä alle 1000€ hintalapulla. Olen varma että kyseinen bisnes-idea otettaisiin aplodein vastaan. Mikähän on, kun eivät ole vielä itse tuota tajunneet? :confused: :confused: :confused:
 
Niinhän siellä edellisessä sukupolvessa tehtiin ja toivotaan että hinta/laatusuhde osuu vielä reilusti paremmin tässä sukupolvessa (koska huippukortit eivät tue nykyistä strategiaa eli markkinaosuuden nostoa). Toki voidaan kysyä tuleeko valittu strategia raudan takia, vai tuliko strategia ensin. Sinänsä tuolla ei toki ole väliä jos hinnat ovat hyvät.

Toki AMDlta löytyy myös niitä ammattikortteja kuten nvidialtakin.
 
Miksi AMD tai Intel ei sitten tee huippunäyttistä, kun tätä foorumia lukemalla vois luulla, että se on halpaa kuin saippua ja sillä takoo satumaisia voittoja? Kannattaisi varmaan ostaa Intelin ja AMDn osakkeita ja ehdottaa yhtiökokouksessa huippunäytönohjaimen tekemistä alle 1000€ hintalapulla. Olen varma että kyseinen bisnes-idea otettaisiin aplodein vastaan. Mikähän on, kun eivät ole vielä itse tuota tajunneet? :confused: :confused: :confused:
Tarkoitatko sanoa että jos yksi onnistuu siinä, onnistuvat tietenkin kaikki muutkin? Vai mitä tällä oli tarkoitus sanoa?

Kilpailun puute tuossa segmentissähän nimenomaan tarkoittaa että muilta puuttuu osaaminen siihen ja siksi Nvidia saa kääriä isot rahat niistä, ei sitä että muut olisivat vaan päättäneet jättäytyä pois koska eivät halua osallistua. Ei esim. Nokian puhelinvalmistus kuollut siksi että eivät halunneet tehdä parempaa tai että huippupuhelinten kauppa ei olisi kannattavaa (onneksi siinä sentään Android puhelimista on hyvä vastus Applelle, kun taas näytönohjaimissa asia on toisin).
 
Osa Nvidian hinnoittelusta lienee heidän märästä ajatuksesta siirtyä pelaamisen Adobeksi. Eli Geforce Now palvelun käyttäjämäärien kasvattaminen. 2 vuotta x 21,99 € /kk = ~ 527,76 eur
 
Tarkoitatko sanoa että jos yksi onnistuu siinä, onnistuvat tietenkin kaikki muutkin? Vai mitä tällä oli tarkoitus sanoa?
Osasta kirjoituksista jää kuva, että nvidia vain helposti rahastelee ja nauraa matkalla pankkiin. Ehkä se ei kuitenkaan ole rahastusta vaan raakaa työtä mitä tarvii tehdä että kalliimmat tuotteet saa tehtyä ja myytyä. Termistä rahastus jää mielikuva, että helppoa hommaa, kusetusta. Jos on noin niin miksi amd/intel ei ole apajilla?

Arvelen että etenkin 4090/5090:sta ja niiden pro versiota ada rtx 6000 jne. kannattelee muut ostajat kuin pelaajat. AMD:n mukaan tämä segmentti on 10% koko pelimarkkinasta. Onko tuosta 10%:sta edes puolet pelaajia?

Iso piiri == kallis suunnitella, kallis tapeout, kallis valmistaa. Ei kannata kovin pienillä tuotantomäärillä tehdä kun "kehitys&valmistuskulut" laitetaan myytyjen piirien hintaan. Jos ei AI pajat, simulaatiopajat sun muut pro käyttäjät ostaisi ad102 ja gb202 pohjaisia tuotteita niin piirit jäis varmaan tekemättä. AMD/Intel kun ei ole noissa markkinoissa mukana niin heidän piiriä tuskin ostettaisiin samalla tapaa kuin nvidiaa(Cuda, softatuki, rapids, omniverse, isot kielimallit(cuda, tensoriytimet, softatuki&optimoinnit) jne).

esim. omniverseen uponnee 4090:sta ja 5090:sta. Robotiikka, tehtaiden suunnittelu, itseajavat autot jne. mihin omniverseä käytetään


rapids ison datan käsittelyyn. Kiihdyttää esim. pandasin/pythonia. Tätä menee varmaan firmoille kovaa, amd/intel ei (vielä?) tee vastaavaa: RAPIDS


LLama3.3 70B ja moni muu malli optimoitu niin, että mahtuu juuri ad102 pohjaisen ada rtx 6000:en muistiin(48GB). PRO kortteja isommalla muistilla menee rikkaammille ai pajoille devaajien koneisiin, ci järjestelmiin jne. Köyhemmät/pikkupuljut ostaa 4090:sta. Esim. mun kavereiden pikkufirmassa on 2x4090 kielimallien tuunaamista varten.
 
Miksi AMD tai Intel ei sitten tee huippunäyttistä, kun tätä foorumia lukemalla vois luulla, että se on halpaa kuin saippua ja sillä takoo satumaisia voittoja? Kannattaisi varmaan ostaa Intelin ja AMDn osakkeita ja ehdottaa yhtiökokouksessa huippunäytönohjaimen tekemistä alle 1000€ hintalapulla. Olen varma että kyseinen bisnes-idea otettaisiin aplodein vastaan. Mikähän on, kun eivät ole vielä itse tuota tajunneet? :confused: :confused: :confused:

Ei se näyttiksen *tekeminen* ole niin kallista, mutta suunnittelu on. Ei tätä pitäisi olla niin vaikeaa tajuta.
 
Onko ihan Metalta sanottu noin vai mistä tällainen käsitys?
No mitäpä luulet että miksi tällä hetkellä 48GB on maaginen numero johon mahdutetaan esim. 4bit kvantisoitu versio llama3.3 70b:sta? Occam's razor.

ada rtx 6000 silleen hyvä versus 4090:en ettei siinä ole fp16/fp32 suorituskykyä hidastettu niin pro käytössä(mallien tuunaaminen firmalle sopivaksi) nopeus muuta kuin 4090:lla.

 
No mitäpä luulet että miksi tällä hetkellä 48GB on maaginen numero johon mahdutetaan esim. 4bit kvantisoitu versio llama3.3 70b:sta. Occam's razor.
Omaa mutua siis ok.

Miksi juuri tämä 4-bittiseksi puristettu epävirallinen kvantti on se maaginen valinta? Itse ajelen pienempää kvanttia 24 gigaisella, joten Llama 3 70B on suunniteltu sille ihan yhtä paljon? Meta julkaisi mallin BF16 muodossa, joten se on suunniteltu 2x80 Gt Hopperille, koska se vaatii reippaasti yli 100 Gt muistia.

Miten Occamin partaveitsi osoittaa juuri tuohon ~4-bittiseen?
 
Omaa mutua siis ok.

Miksi juuri tämä 4-bittiseksi puristettu epävirallinen kvantti on se maaginen valinta? Itse ajelen pienempää kvanttia 24 gigaisella, joten Llama 3 70B on suunniteltu sille ihan yhtä paljon? Meta julkaisi mallin BF16 muodossa, joten se on suunniteltu 2x80 Gt Hopperille, koska se vaatii reippaasti yli 100 Gt muistia.

Miten Occamin partaveitsi osoittaa juuri tuohon ~4-bittiseen?
Yritin väittää, että ad102 on mahdollinen isoilta osin sen vuoksi että sekä peliversiota(4090) ja pro versiota(ada rtx 6000) menee pro käyttöön huomattavia määriä. AMD:n mukaan ad102 markkinan koko on 10% koko pelimarkkinasta. Kuinka iso osa tuosta 10%sta menee pelaajille? Jos puuttuisi pro markkina niin olisiko tuota piiriä edes kannattanut tehdä?

Ehkä on sattumaa ehkä ei että mallit on viritetty niin että ne mahtuvat juuri 24GB ja 48GB muisteihin jotka löytyy 4090 ja ada rtx 6000.
 
Meinaatko, että suunnitteleminen ei ole osa sitä tekemistä?

Totta kai meinaan että suunnittelu ei ole osa näyttiksen tekemistä eli valmistusta. Se on siitä erillinen asia, ja se on syy miksi AMD ja Intel ei pääse kilpailemaan huippunäyttiksissä. Kyllä TSMC painaisi huippupiirejä myös heille, jos olis näyttää valmis designi. :rolleyes:
 
Totta kai meinaan että suunnittelu ei ole osa näyttiksen tekemistä eli valmistusta. Se on siitä erillinen asia, ja se on syy miksi AMD ja Intel ei pääse kilpailemaan huippunäyttiksissä. Kyllä TSMC painaisi huippupiirejä myös heille, jos olis näyttää valmis designi. :rolleyes:
Lainasit kuitenkin viestiä, jossa aivan selkeästi tekemisellä viitataan koko prosessiin jonkun ideasta aina lopputuotteeksi.
 
Ehkä on sattumaa ehkä ei että mallit on viritetty niin että ne mahtuvat juuri 24GB ja 48GB muisteihin jotka löytyy 4090 ja ada rtx 6000.
Ei ole viritetty juuri noihin kokoihin. Meta on julkaissut vain ja ainoastaan BF16 mallin. Yhteisö on tämän jälkeen luonut erilaisilla kvantisointimetodeilla vaikka minkäkokoisia versioita.

Täältä löytyy llama.cpp/GGUF formaatissa montaa kokoa, myös sellaiset jotka sopivat nätisti vaikkapa 32Gt tai 64Gt muisteihin:

Minkä tahansa noista voit ottaa käyttöön vaikka Ollamassa.
 

Uusimmat viestit

Statistiikka

Viestiketjuista
263 672
Viestejä
4 573 584
Jäsenet
75 229
Uusin jäsen
mikke1103

Hinta.fi

Back
Ylös Bottom