LLVM/Clang 9.0 sai tuen Zen 2 -prosessoreille

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 745
Phoronix on huomannut LLVM:n Clang -kääntäjän tuoreimman version sisältävän tuen AMD:n tuleville Zen 2 -prosessoreille (znver2).
Toinen suosittu kääntäjä GCC (GNU Compiler Collection) sai alustavan Zen 2 -tukensa jo viime vuonna.
Sekä LLVM/Clangin että GCC:n Zen 2 -tuki pohjaa Zen 1 -tukeen, jonka päälle on lisätty uusina käskyinä Cache Line Write Back (CLWB), Read Processor ID (RDPID) ja Write Back and Do Not Invalidate Cache (WBNOINVD).

Lähde: AMD Zen 2 "znver2" Support Lands In LLVM Clang 9.0 - Phoronix
 
Tästä voinee päätellä, että AVX-512 ei ole zen2ssa tuettuna, koska sitä ei näy tässä tuon tukemissa käskykantalaajennoksissa.
 
Taitaa tuetaan, mutta toteutus on onnettoman hidas, joten ei kannata lisätä kääntäjän optioihin.

Ei ole kovin realistinen olettamus.

Jos AVX-512 olisi tuettu, Järkevä oletus olisi, että siellä voisi olla joitain onnettoman hitaita mikrokoodilla suoritettavia käskyjä, joita ei kannata käyttää, mutta monet muut käskyt olisivat järkevännopeuksisia (pilkkominen kahteen osaan, sama thoughput-nopeus kuin AVX2lla, mutta säästettäisiin käskyjen määärän kautta fetch-puolessa ja käskyvälimuistissa).

Tällöin kääntäjän kannattaisi optimoida siten, että se välttää vain niitä tiettyjä onnettoman hitaita käskyjä.

AVX-512 nelinkertaistaa arkkitehtuurillisesti näkyvän vektorirekisteritilan(tuplaa sekä leveyden että määrän, 512 tavua => 2kiB, 2-säikeisen SMTn kanssa 1 kiB => 4 kiB), joten sen poisjättäminen on sen kannalta ihan ymmärrettävää. Kun rekisterien uudelleennimeämisen takia fyysisen rekisterifileen(PRF) koon pitää vielä käytännössä olla moninkertaisesti tuon. Muutaman kilotavun PRF on aika paljon helpompi tehdä nopeaksi kuin joku >10 kilotavun PRF.
 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
264 218
Viestejä
4 575 881
Jäsenet
75 398
Uusin jäsen
xJuusox

Hinta.fi

Back
Ylös Bottom