NVIDIAn seuraavan sukupolven Tesla-laskentakorttien odotetaan tarjoavan 70 - 75 % parempaa suoritusk

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 626
iu-big-red-200-supercomputer-20200204.jpg



NVIDIAn odotetaan esittelevän seuraavan sukupolven arkkitehtuurinsa kuluvan kevään aikana, todennäköisimmin omassa GTC-tapahtumassaan maaliskuussa. Huhuissa on pyörinyt useimmiten koodinimi Ampere, mutta myös Hopperista on kuultu mainittavan.

Indianan yliopisto on tilannut itselleen Crayn Shasta-arkkitehtuuriin perustuvan Big Red 200:ksi nimetyn supertietokoneen. Big Red 200 sai osakseen kunnian olla maailman ensimmäinen käyttöön otettu Shasta-supertietokone, jonka lisäksi sen kesällä tapahtuvan päivityksen myötä se tulee olemaan yksi ensimmäisistä NVIDIAn seuraavan sukupolven Tesla-laskentakortteja käyttävistä supertietokoneista. Tällä hetkellä käyttöön otetussa konfiguraatiossa on käytössä yhteensä 1344 Epyc 7742 -prosessoria (Rome) jaettuna 672 kahden prosessorikannan yksikköön. Tesla-päivityksen jälkeen supertietokoneen teoreettinen numeronmurskauskyky tulee olemaan lähellä 8 petaFLOPSia.

Big Red 200 oli tarkoitus varustaa ensin V100-laskentakorteilla, mutta seuraavan sukupolven julkaisun läheisyys sai yliopiston odottamaan muutamia kuukausia netotakseen uuden arkkitehtuurin tuomia mahdollisuuksia ja noin kahden petaFLOPSin edestä lisäsuorituskykyä. Indianan yliopiston edustajan mukaan NVIDIAn seuraavan sukupolven laskentakorttien odotetaan olevan noin 70 – 75 % suorituskykyisempiä nykyisiin Volta-arkkitehtuurin Tesla V100 -laskentakortteihin verrattuna ja niiden toimitusten pitäisi tapahtua kesän aikana.

Valitettavasti tällä hetkellä ei ole tiedossa, tulevatko NVIDIAn seuraavan sukupolven Tesla-laskentakortit perustumaan samaan arkkitehtuuriin, kuin työpöytänäytönohjaimet. Useimmissa sukupolvissa näytönohjaimet ja laskentakortit ovat käyttäneet samaa arkkitehtuuria, mutta viimeiset sukupolvet tekivät tähän poikkeuksen. NVIDIAn nykyinen lippulaiva-laskentakortti V100 perustuu Volta-arkkitehtuuriin, josta ei julkaistu ikinä kuluttajakäyttöön suunnattuja piirejä. Tuoreempaa Turing-arkkitehtuuria käytetään myös laskentakorteissa, mutta siihen perustuvaa lippulaivatason laskentapiiriä NVIDIA ei ole julkaissut.

Lähde: The Next Platform

Huom! Foorumiviestistä saattaa puuttua kuvagalleria tai upotettu video.

Linkki alkuperäiseen uutiseen (io-tech.fi)

Palautelomake: Raportoi kirjoitusvirheestä
 
Viimeksi muokattu:
Titan V taisi olla ihan kuluttajille.
Teoriassa myös kuluttajien ostettavissa mutta ei sitä kuluttajille oltu ikinä suunnattu, $3000 hintaa ja Jensenkin puhui nimenomaan tutkijoista ja tiedemiehistä kohdeyleisönä.
 
Teoriassa myös kuluttajien ostettavissa mutta ei sitä kuluttajille oltu ikinä suunnattu, $3000 hintaa ja Jensenkin puhui nimenomaan tutkijoista ja tiedemiehistä kohdeyleisönä.
Joo, ei pelaajille suunnattu vaikka siihenkin soveltui.
 
Mitähän mahtaa vaikuttaa se, että HBM2-muistit ovat nopeutuneet aika lailla. Voltassa oli 1,75 Gbps HBM2-muistia. Sekä Hynix että Samsung ovat julkistaneet 3,2 Gbps HBM2E-muisteja, mutta saa nähdä, että tuleeko ihan nopeaa. Muistaakseni Voltankin julkistuksen aikoihin oli 2 Gbps muistia saatavilla.
 
Onkohan nämä nyt sitten puhtaasti laskentakortteja, eli pystyyköhän mitenkään käyttämään grafiikan tuottamiseen, eli ajurituki grafiikalle jää nähtäväksi. Luulisi olevan aika kovaa rautaa DXR:ssä tuollainen 70-75% parannus.

Toki eiköhän 7nm tuo myös grafiikkapuolelle parannuksia. Jos katsoo tämän sukupolven kortteja, niin AMD:n 7nm 5700XT on aika kova pala tietynlaisella kuormalla jopa 2080-mallia vastaan.

Saisi tulla chiplet suunnittelu graffapuolellekin.
 
Viimeksi muokattu:
Onkohan nämä nyt sitten puhtaasti laskentakortteja, eli pystyyköhän mitenkään käyttämään grafiikan tuottamiseen, eli ajurituki grafiikalle jää nähtäväksi. Luulisi olevan aika kovaa rautaa DXR:ssä tuollainen 70-75% parannus.

Toki eiköhän 7nm tuo myös grafiikkapuolelle parannuksia. Jos katsoo tämän sukupolven kortteja, niin AMD:n 7nm 5700XT on aika kova pala tietynlaisella kuormalla jopa 2080-mallia vastaan.

Sasii tulla chiplet suunnittelu graffapuolellekin.
Tuo ei ota millään tapaa kantaa mahdolliseen DXR-suorituskykyyn tai edes onko tuossa RT coreja. Tällä hetkellä ei tiedetä tuoko NVIDIA laskentapuolelle ja pelipuolelle yhden ja saman vai kaksi eri arkkitehtuuria ja millä aikataululla, tai sitä että vaikka ne olisivat samaa arkkitehtuuria, tuleeko suurinta piiriä lainkaan käyttöön pelipuolella.
 
Muistini mukaan Turing ja Volta arkkitehtuurit ovat työpöytäkäytössä lähes identtisiä suorituskyvyltään, eli voisi odottaa samankaltaista suorituskykyparannusta myös työpöydälle.
 
Muistini mukaan Turing ja Volta arkkitehtuurit ovat työpöytäkäytössä lähes identtisiä suorituskyvyltään, eli voisi odottaa samankaltaista suorituskykyparannusta myös työpöydälle.

Ellei kyse olekkin vähän erillaisemmasta laskennasta. Videocardz uutisoinnista:

Note: It appears that neither IU nor NVIDIA mentions next-gen GPUs. They do mention that Big Red 200 will use ‘Tensor Core GPU’, which is basically a rebadged Tesla V100 (reference).

  • Big Red 200 will feature NVIDIA’s next-generation GPUs
  • Those GPUs will be added to Big Red 200 this summer
  • New silicon is 70-75% faster than current-gen (in deep learning?)
  • Big Red 200 is expected to be 8x faster than Big Red 2
 
Teoriassa myös kuluttajien ostettavissa mutta ei sitä kuluttajille oltu ikinä suunnattu, $3000 hintaa ja Jensenkin puhui nimenomaan tutkijoista ja tiedemiehistä kohdeyleisönä.

Ihan myös käytännössä kuluttajien ostettavissa oli. ;)

Mutta joo, se että jotain voi ostaa, ei todellakaan tarkoita sitä että se olisi kuluttajille suunnattua. Mielenkiinnolla odotan että mikä on nyt tensor- ja cuda-corejen välinen suhde. Joko saataisiin korttia missä aletaan vähentää cuda-puolta uudempien laskentayksiköiden lisäämiseksi.
 
Olisi mielenkiintoista tietää minkälaisesta laskentatehosta puhuvat? Onko tarve tehdä tekoälylaskentaa, jolloin lisäämällä tensoriytimien määrää piirin muiden osien kustannuksella saisi Nvidia nopeasti suuretkin määrät lisää laskentatehoa. Luukuttivathan jo silloin V100-julkistuksessa kuinka lähtee yli 100TFLOPS tensoriytimistä. Perinteisempi FP32 kun on kuitenkin "vain" 15TFLOPS. Toisaalta olihan Nvidian vanhemmasta P100 hyppäys uudempaan V100: FP32 10,6TFLOPS -> 15TFLOPS eli voihan tuossa olla perää ilman tensorisäätöäkin.
 

Statistiikka

Viestiketjuista
261 396
Viestejä
4 534 077
Jäsenet
74 805
Uusin jäsen
Sosracing

Hinta.fi

Back
Ylös Bottom