- Liittynyt
- 21.06.2017
- Viestejä
- 7 245
Unohdat nyt sen että Amperessa on tuplat fp32 laskentaa per SM. Vaikka Ampere ei välttämättä saakkaan irti sitä mitä Turing Tflopseistaan, niin en usko että 80CU:ta vielä riittäisi "selvästi" päihittämään 68SM:n Amperen. Se että riittääkö tuo edes AMD:lle, riippuu miten korkealle se saa kellonsa ja miten paljon Amperen laskentanopeus peleissä jää teoreettisesta(Paljon liukulukuja koodissa -> lähellä maksimia, skalaaria -> lähellä minimiä).
Vaan kovin huonosti se tupla fp32 tuntuu realisoituvan kun nyt on jo jotain OpenCL testejäkin tullut julki eikä niissäkään päästä lähimainkaan hyödyntämään sitä kaikkea potentiaalia niin on aika selvää että siellä muistikaista tai jokin muu on pullonkaulana. Muistikaistaahan esim. ei ole suhteessa mitenkään järisyttävästi tullut lisää.
Toinen vaihtoehto on että alkaa hakata powerlimittiin. Ei se tupla FP32 meinaan ilmaiseksi tule niin voi hyvinkin olla että sitä ei vaan voida käyttää niin tehokkaasti.