- Liittynyt
- 14.10.2016
- Viestejä
- 22 623
NVIDIA esitteli GTC-konferenssissaan keväällä Volta-arkkitehtuuriin perustuvan Tesla V100 -laskentakortin Mezzanine- eli SXM2-version. Nyt yhtiö on esitellyt myös samaan GV100-grafiikkapiiriin perustuvan PCI Express -väyläisen laskentakortin tieteelliseen laskentaan ja koneoppimiseen. Volta-arkkitehtuurin uutena ominaisuutena laskentakortissa on erillisiä tensor-ytimiä, jotka nopeuttavat merkittävästi koneoppimista.
Tesla V100:n PCI Express -versio käyttää SXM2-version tapaan osittain karsittua GV100-piiriä. Koko piirissä on yhteensä 84 SM-yksikköä, mutta julkaistuissa laskentakorteissa niistä on käytössä vain 80. Käytännössä 80 SM-yksikköä tarkoittaa 5120 FP32-CUDA-ydintä, 2560 FP64-CUDA-ydintä ja 640 Tensor-ydintä. Kukin Tensor-ydin suorittaa ”D = A x B + C” -laskutoimituksia 4 x 4 -matriiseilla ja kykenee yhteensä 64 FMA-operaatioon ((Fused Multiply-Add) FP16-kertolasku, FP32-akkumulaatio) kellojaksossa.
GV100-grafiikkapiiri toimii Tesla V100 PCIe -versiossa maksimissaan noin 1370 MHz:n kellotaajuudella, mikä tarkoittaa 28 TFLOPSin FP16-suorituskykyä, 14 TFLOPSin FP32-suorituskykyä, 7 TFLOPSin FP64-suorituskykyä ja lopulta 112 TFLOPSin suorituskykyä Tensor-laskuissa. GV100-grafiikkapiirin tukena on 16 gigatavua (4 x 4 Gt) 1,75 Gbps:n HBM2-muistia, mikä yhdessä 4096-bittisen muistiväylän kanssa tarkoittaa 900 Gt/s:n muistikaistaa.
Hieman SXM2-versiota matalammat kellotaajuudet ovat mahdollistaneet laskentakortin TDP-arvon laskemisen 300:sta 250 wattiin. Laskentakortti jäähtyy passiivisesti luottaen räkkipalvelinten riittävään ilmanvaihtoon. Kuten tyypillistä, laskentakortissa ei ole lainkaan näyttöliittimiä eli se ei sovellu pelaamiseen.
NVIDIAn Tesla V100 PCIe saapuu myyntiin tarkemmin määrittelemättömänä ajankohtana tämän vuoden aikana. NVIDIA ei ole vielä paljastanut laskentakortin hintaa.
Huom! Foorumiviestistä saattaa puuttua kuvagalleria tai upotettu video.
Linkki alkuperäiseen uutiseen (io-tech.fi)
Viimeksi muokattu: