AMD Zen

Sehän olisi kova, jos Zen 2:n IPC parannus oli sen 10-15%, mitä oli joissain AMD:n powerpointeissa esitelty. Toisaalta "Zen 1":sen kanssakin jo mentiin sen 40%:n parannuksen yli (oliko se 52%), että tiedä sitten millaisia parannuksia on odotettavissa. 10-15% olisi nykyisillä kelloillakin aika hyvä suoritus mielestäni. Tietty jos vielä kellot nousisi 4-4,5GHz:n maastoon niin mikä ettei.
Toisaalta onhan tuo Intelkin saanut melko samasta arkkitehtuurista revittyä lisää IPC:tä jo monta sukupolvea.
 
Zen 1:n AMD kierrätti osia Excavatorista ja lämmöntuoton takia tiettyjä asioita jätettiin pois. Kierrätetyt osat uusimalla ja lämmöntuoton takia pois jätetyt mukaan ottamalla 15% voisi olla mahdollinen.

Zen 1:ta on turha verrata Bulldozer-arkkitehtuuriin. Täysin eri lähtökohdat suunnittelussa eikä Bulldozeria alunperinkään suunniteltu korkean IPC:n prosessoriksi.
 
Zenin nextgeniä ajatellen, mitä mieltä porukka on tästä:

Globalfoundries "uhoaa" että tuleva 7nm prosessi tulisi olemaan 5GHz nopeuksille optimoitu:

https://www.globalfoundries.com/sites/default/files/product-briefs/7lp-product-brief.pdf

Kun taas nykyinen prosessin alue on 3GHz

https://www.globalfoundries.com/sites/default/files/product-briefs/product-brief-14lpp.pdf

Millaista realistista kellotaajuuden nousua on lupa odottaa?

Jos oletetaan että tuo on faktaa (eikä esim. markkinapuhetta) voisi helposti laskea: nykyisin 3.8-4.1GHz kellotus ja maksimi "buusti" 4.1GHz kun nykyisen alueen optimointi on 3GHz
=>
Tulevaisuuden 6GHz "buusti" ja 5.8-6GHz kellotus jos "alin" normaali nopeus on r7 versioissa (verrokkina 1700 ja nykyinen 3GHz tieto) 5GHz ja turbo 5.7GHz.

Itse suhtautuisin "hieman" varovaisemmin ja olisin tyytyväinen jos nousua tulee jopa ½-1GHz.
 
Itse suhtautuisin "hieman" varovaisemmin ja olisin tyytyväinen jos nousua tulee edes ½-1GHz.
Jos saataisiin nykyisellä about Broadwell-E kellotaajuuskohtaisella suorituskyvyllä (IPC) kahdeksan ydintä kellotettua 4.2-4.4, niin olisin jo tosi tyytyväinen, siihen sitten mahdollisimman kovat parannukset energiatehokkuuteen, niin saadaan kivat eco-friendly-prossut ja lämmöt pysyy hyvin kurissa kellotettunakin ja prossujäähyn ei tarvi olla mikään custom loop.

Näillä oltaisiin mielestäni erinomaisissa asetelmissa, mutta toinen juttu on, että riittääkö se kilpailuvaltiksi Inteliä vastaan, koska ei siellä aleta jarruttelemaan, jos alkaa näyttää siltä, että pitäisi voittaa markkinaosuuksia entistä paremmin takaisin.

Ryzen 2:ssa on ilman muuta parempi IPC myös mutten usko siinäkään olevan yhden ytimen nopeudella panostusta nykyistä enempää.
Missä näin on sanottu ja mitä muuta olen missannut Zen 2:n parannuksista?
 
Jos saataisiin nykyisellä about Broadwell-E kellotaajuuskohtaisella suorituskyvyllä (IPC) kahdeksan ydintä kellotettua 4.2-4.4, niin olisin jo tosi tyytyväinen, siihen sitten mahdollisimman kovat parannukset energiatehokkuuteen, niin saadaan kivat eco-friendly-prossut ja lämmöt pysyy hyvin kurissa kellotettunakin ja prossujäähyn ei tarvi olla mikään custom loop.

Näillä oltaisiin mielestäni erinomaisissa asetelmissa, mutta toinen juttu on, että riittääkö se kilpailuvaltiksi Inteliä vastaan, koska ei siellä aleta jarruttelemaan, jos alkaa näyttää siltä, että pitäisi voittaa markkinaosuuksia entistä paremmin takaisin.


Missä näin on sanottu ja mitä muuta olen missannut Zen 2:n parannuksista?

Joo Ryzen 2 on varmasti huonompi IPC kuin ekassa versiossa
Ootko huomannut muuten että taivas on sininen ja vesi on märkää?
pitääkö nekin googlella hakea sulle jostain? hä?
 
Zen 1:n AMD kierrätti osia Excavatorista ja lämmöntuoton takia tiettyjä asioita jätettiin pois. Kierrätetyt osat uusimalla ja lämmöntuoton takia pois jätetyt mukaan ottamalla 15% voisi olla mahdollinen.
Öö, wat? Nyt jotain lähdettä näille.
Zen on puhtaalta pöydältä suunniteltu arkkitehtuuri, ei siihen "kierrätetä" vanhasta arkkitehtuurista yhtään mitään osia. Aikataulut siellä painoi päälle eikä lämmöntuotto.
 
Öö, wat? Nyt jotain lähdettä näille.
Zen on puhtaalta pöydältä suunniteltu arkkitehtuuri, ei siihen "kierrätetä" vanhasta arkkitehtuurista yhtään mitään osia. Aikataulut siellä painoi päälle eikä lämmöntuotto.

Miksi kierrätystä? Koska aikataulut. Ottamalla tiettyjä osia Excavatorista (hieman muokattuna, totta kai) saadaan prosessori nopeammin markkinoille. AMD itse sanoi noin, enkä jaksa etsiä missä koska Zen juttuja on miljoona.

Lämmöntuoton suhteen AMD jätti jotain pois ja jotain toteutti pelkästään lämmöntuoton pitämiseksi kurissa. Esim L1 välimuistista pystyy lukemaan 2 kertaa kellojaksossa mutta kirjoittamaan vain kerran. 2+2 olisi tehokkaampi kuin 2+1, AMD valitsi silti 2+1 koska kirjoituksia on vähemmän kuin lukuja. Hyöty? Pienempi lämmöntuotto.
 
Miksi kierrätystä? Koska aikataulut. Ottamalla tiettyjä osia Excavatorista (hieman muokattuna, totta kai) saadaan prosessori nopeammin markkinoille. AMD itse sanoi noin, enkä jaksa etsiä missä koska Zen juttuja on miljoona.
Nyt kyllä väitän että muistelet ihan omiasi. Zen on puhtaalta pöydältä suunniteltu arkkitehtuuri joka valmistetaan täysin eri prosessilla. Joitain asioita on voitu suunnitella siten, että ne sopivat sekä Zeniin että Excavatoriin (muistiohjain saattaa esimerkiksi olla "sama") mutta ei se tarkoita että se kierrätetty olisi
Lämmöntuoton suhteen AMD jätti jotain pois ja jotain toteutti pelkästään lämmöntuoton pitämiseksi kurissa. Esim L1 välimuistista pystyy lukemaan 2 kertaa kellojaksossa mutta kirjoittamaan vain kerran. 2+2 olisi tehokkaampi kuin 2+1, AMD valitsi silti 2+1 koska kirjoituksia on vähemmän kuin lukuja. Hyöty? Pienempi lämmöntuotto.
Luulin että tarkoitit jotain "kunnon ominaisuuksia", tuo että "enemmän on parempi" pätee miltei mihin tahansa jos muulla ei ole väliä.
 
Nyt kyllä väitän että muistelet ihan omiasi. Zen on puhtaalta pöydältä suunniteltu arkkitehtuuri joka valmistetaan täysin eri prosessilla. Joitain asioita on voitu suunnitella siten, että ne sopivat sekä Zeniin että Excavatoriin (muistiohjain saattaa esimerkiksi olla "sama") mutta ei se tarkoita että se kierrätetty olisi

Väitän Ryzenin olevan puhtaalta pöydältä suunniteltu arkkitehtuuri johon tiettyjä osia on otettu Excavatorista ja muokattu Ryzenille paremmin sopiviksi. Excavatorin suunnittelu aloitettiin 2011-2012 ja se julkaistiin 2015 joten Excavatorin osia on todennäköisesti suunniteltu Ryzen mielessä.

Väittäisin myös Zen 2:n arkkitehtuurin valmistuneen samaan aikaan kuin Zenin (syyskuu 2015), jolloin Jim Keller jätti AMD:n. Eli Zen 2 on täysin puhtaalta pöydältä suunniteltu ja Zeniin otettiin osia Excavatorista jossain määrin muokaten. Zen 2 on se mikä Ryzen olisi ollut ellei olisi tarvinnut kiirehtiä. Mikäli Zen 2 oikeasti tulee noin puolen vuoden-9 kuukauden päästä ulos, arkkitehtuuri on täytynyt olla valmiina jonkin aikaa.

Luulin että tarkoitit jotain "kunnon ominaisuuksia", tuo että "enemmän on parempi" pätee miltei mihin tahansa jos muulla ei ole väliä.

Vaikea sanoa mitä ne "kunnon ominaisuudet" olivat joita Ryzeniin ei laitettu. Zen 2:n tullessa ollaan todennäköisesti viisaampia.
 
Zenin nextgeniä ajatellen, mitä mieltä porukka on tästä:

Globalfoundries "uhoaa" että tuleva 7nm prosessi tulisi olemaan 5GHz nopeuksille optimoitu:

https://www.globalfoundries.com/sites/default/files/product-briefs/7lp-product-brief.pdf

Kun taas nykyinen prosessin alue on 3GHz

https://www.globalfoundries.com/sites/default/files/product-briefs/product-brief-14lpp.pdf

Millaista realistista kellotaajuuden nousua on lupa odottaa?

...
No nykyinen on Samsungilta lisensoitu ja Samsung on kehittänyt sen pääasissa matkapuhelinpiiri valmistusta silmälläpitäen eli pieni kulutus ja pienemmät kellot kun taas GF:n tärkein asiaksas on AMD:n prosessorit jotka tarvii korkeita kelloja eli se 7 nm kehitetään eri tarkoitukseen joten selvä kelloparannus on siksi mahdollien, mutta en siihen 5Ghz usko ennen kuin näen mutta jo se 3,5-4Ghz normi taajuus ja 4,5 Ghz turbo olisi kova juttu (ts kellotamalla voisi saada kaikki ytimet siihen 4,5Ghz asti kohtuu hyvällä tuurilla).
 
Viimeksi muokattu:
Sehän olisi kova, jos Zen 2:n IPC parannus oli sen 10-15%, mitä oli joissain AMD:n powerpointeissa esitelty. Toisaalta "Zen 1":sen kanssakin jo mentiin sen 40%:n parannuksen yli (oliko se 52%), että tiedä sitten millaisia parannuksia on odotettavissa. 10-15% olisi nykyisillä kelloillakin aika hyvä suoritus mielestäni. Tietty jos vielä kellot nousisi 4-4,5GHz:n maastoon niin mikä ettei.
Toisaalta onhan tuo Intelkin saanut melko samasta arkkitehtuurista revittyä lisää IPC:tä jo monta sukupolvea.
Itse epäilen että sen Zen2:n IPC parannus jää johonkin 5% luokkaan joka sekin riittä jos GF saa aikaan valmistusprosessin jolla ne kellot nousee lähelle Intel kilpailijoita jolloin AMD pärjäisi sillä että tarjoaa 1-2 ydintä enempi kuin Intel.
 
Itse epäilen että sen Zen2:n IPC parannus jää johonkin 5% luokkaan joka sekin riittä jos GF saa aikaan valmistusprosessin jolla ne kellot nousee lähelle Intel kilpailijoita jolloin AMD pärjäisi sillä että tarjoaa 1-2 ydintä enempi kuin Intel.

Ryzenin IPC on jo nyt tasoissa Kaby/sky kanssa, jopa hiukan parempi kun testataan samoilla kelloilla. Intelin ainut etu on parempi kulku. Eli kun AMD saa tuon kulkupuolen kuntoon mahdollisesti seuraavassa versiossa ja lisää IPC:tä, niin puhutaan todella vahvasta uudelleen tulemisesta.
Toki sitä ei tiedä mitä Intel keksii, mutta eihän nuo ole viimeseen 10v juurikaan mitään keksineet niin mikä nyt muutamassa vuodessa muuttuisi?
 
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.


CPUtilasto.JPG


Ryzenillä näytäis menevän aika lujaa just nyt Linuksen tilaston mukaan.

Jos katselee noiden prosessorien hintoja niin AMD:t on keskimäärin kallimpia kuin Intelit eli AMD:lle taitaa tuon mukaan tulla voittoa tällehetkellä enempi kuin Intelille !

Markinaosuus.JPG


Myös AMD:n markkinaosuus on noussut ihan hyvälle tasolle.

Kun AMD saa Ryzen Aput myyntiin tuo markkiaosuus voi ihan hyvin kasvaa yli 40% osuuden joka varmasti laittaa Intelillä kaikkimahdolliset hälyytyskellot soimaan.
 
Viimeksi muokattu:
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.


CPUtilasto.JPG


Ryzenillä näytäis menevän aika lujaa just nyt Linuksen tilaston mukaan.

Jos katselee noiden prosessorien hintoja niin AMD:t on keskimäärin kallimpia kuin Intelit eli AMD:lle taitaa tuon mukaan tulla voittoa tällehetkellä enempi kuin Intelille !

Markinaosuus.JPG


Myös AMD:n markkinaosuus on noussut ihan hyvälle tasolle.

Kun AMD saa Ryzen Aput myyntiin tuo markkiaosuus voi ihan hyvin kasvaa yli 40% osuuden joka varmasti laittaa Intelillä kaikkimahdolliset hälyytyskellot soimaan.

Tarkennus: En nyt osaa sanoa kuinka laaja otanta noissa oli, mutta kyseessähän on vain ostot Amazonista(?) ja vain tuotteet joita ostaessa käytetty Linus techtipsin koodia tms. systeemiä minkä avulla ovat sitten saaneet seurattua katsojakunnan ostoksia... eli ei kauheen tarkkaa dataa maailman mittakaavassa.
 
Tarkennus: En nyt osaa sanoa kuinka laaja otanta noissa oli, mutta kyseessähän on vain ostot Amazonista(?) ja vain tuotteet joita ostaessa käytetty Linus techtipsin koodia tms. systeemiä minkä avulla ovat sitten saaneet seurattua katsojakunnan ostoksia... eli ei kauheen tarkkaa dataa maailman mittakaavassa.
Jokatapauksessa mielenkiintoinen lähtökohta ja argumentti, kun keskustellaan menekistä. Isommalla datamäärällä sitten vähän tuntuvampia tuloksia.
 
Tarkennus: En nyt osaa sanoa kuinka laaja otanta noissa oli, mutta kyseessähän on vain ostot Amazonista(?) ja vain tuotteet joita ostaessa käytetty Linus techtipsin koodia tms. systeemiä minkä avulla ovat sitten saaneet seurattua katsojakunnan ostoksia... eli ei kauheen tarkkaa dataa maailman mittakaavassa.
Juu ei se tietenkään tarkasti korreloi suuremmassa mittakaavassa tuotekohtaisesti mutta kyllä se varmaan noiden isoimpien linjojen suhteen pätee ts AMD on tulossa kovaa takaisin prossumarkkinoille.
 
Tännää AMD julkaisi Ryzen Pro prossut. Virallinen muistituki 2667 Mhz ja vähäisellä performansehitillä toimiva muistin cryptaus.

Käytännössä virallinen muistituki 2666 MHz asti varmaan tuli, koska AGESA saatu sille tasolle että se toimii jo luotettavasti, ja toiminee varmaan ihan yhtä hyvin kuluttajamalleissa ajan tasalla olevalla BIOSilla.

Kummallisuus markkinasivun mukaan on FMA4 tuki AMD Ryzen™ 7 PRO 1700X

verrattuna Ryzeniin jossa on FMA3 AMD Ryzen™ 7 1700X | AMD

Onko tuo virhe vai palaako AMD sittenkin taas FMA4 käskyihin?

Agner Fog jo Zen-analyyseissään huomasi FMA4n toimivan ryzenilla vaikka ryzenin ei pitänyt sitä tukea eikä cpuid raportoinut sen olevan tuettu.

Agner`s CPU blog - Test results for AMD Ryzen

Villi spekulaatio:

Zenistähän löytyi bugi FMA3-käskystä.

Jospa sama bugi oli myös FMA4-käskyissä, ja AMD oli jo julkaisuun mennessä löytänyt bugin FMA4-käskyn yhteydessä, mutta ei ehtinyt vielä korjata sitä, ja luuli, että se vaivaa vain FMA4-käskyä eikä vaivaa FMA3-käskyä, ja tämän takia oli disabloinut FMA4-käskyn virallisen tuen.

Nyt kun bugi on korjattu, FMA4-tuki on voitu "virallisesti enabloida".
 
Viimeksi muokattu:
Ja vielä tuosta FMA4-käskystä:

Jos FMA3 on raudalla tuettu, FMA4:n tukeminen sen lisäksi ei maksa prosessorin "takapäässä" eli itse laskentayksiköissä yhtään mitään. FMA3 on kuitenkin käytännössä toteutettu FMA4-mikro-operaatiolla(siten että kohderekisterikentäksi laitetaan sama kuin yksi lähderekisterikentistä), ja ainoa asia mitä FMA4n tukeminen tällöin vaatii lisää on että käskydekooderi dekoodaa x86n FMA4-opkoodin täksi samaksi mikro-operaatioksi(mutta siten että jokainen rekisterikenttä on omansa).
 
Viimeksi muokattu:
Villi spekulaatio:

Zenistähän löytyi bugi FMA3-käskystä.

Jospa sama bugi oli myös FMA4-käskyissä, ja AMD oli jo julkaisuun mennessä löytänyt bugin FMA4-käskyn yhteydessä, mutta ei ehtinyt vielä korjata sitä, ja luuli, että se vaivaa vain FMA4-käskyä eikä vaivaa FMA3-käskyä, ja tämän takia oli disabloinut FMA4-käskyn virallisen tuen.

Nyt kun bugi on korjattu, FMA4-tuki on voitu "virallisesti enabloida".
Voishan tuo olla mennyt noinkin, mutta tuntuu oudolta että FMA4 koodiin liittyvää bugia ei olisi sitten myös tarkistettu FMA3 puolella. Tietysti sellainen tapaus että jostakin syystä luulivat bugin vaativan myös tuon FMA4 käskyn kohteen osoittamisen.
 
Onkin muuten hauska nähdä tulevaisuudessa miten FMA käskyjä käyttävät sovellukset sitten toimivat. Nythän pääsee vertaamaan sellaisia omenoita keskenään joiden erona on tuo tuetun FMA käskyjoukon tyyppi. Eli löytyykö softassa eroa jos sitä ajetaan FMA4 käskyillä vai FMA3 käskyillä.
 
Jos näihin on yhtään uskomista niin aika hyvin on AMD saanut jalansijaa lyhyessä ajassa: AMD CPU Share up 10.4% in Q2, Its Largest Gain vs. Intel in History

Tuliko Ryzen myyntiin maaliskuun alussa?
"It’s important to note that because PassMark’s market share data is based on benchmark submissions it counts actual systems in use"

Eiköhän ne ole juuri Ryzenistä johtuvia testausten kasvuja kun kuka muka innolla testaisi FX tai nylkyisiä Apu prossoreja, sinällään markkinaosuudesta puhuminen on harhauttavaa kun kyseessä on PassMark testitietokanta jossa tietenkin täysin uusi prosessori arkkitehtuuri korostuu kun sitä testataan innokkaammmin kuin jotain vanhaa.
 
"It’s important to note that because PassMark’s market share data is based on benchmark submissions it counts actual systems in use"

Eiköhän ne ole juuri Ryzenistä johtuvia testausten kasvuja kun kuka muka innolla testaisi FX tai nylkyisiä Apu prossoreja, sinällään markkinaosuudesta puhuminen on harhauttavaa kun kyseessä on PassMark testitietokanta jossa tietenkin täysin uusi prosessori arkkitehtuuri korostuu kun sitä testataan innokkaammmin kuin jotain vanhaa.
No samalla lailla porukka testailee niitä uusia Intel-prossujaan kun niitä ostavat. Siinä mielessä tuo kertoo hyvin mihin päin markkinat ovat menossa.
Tässä lisää grafiikkaa viimeisiltä kuukausilta. Ei kyllä ole globaalia statistiikkaa vaan perustuu ymmärtääkseni Mindfactoryn myyntilukuihin:
uzyiz6mud27z.jpg

Aineisto täällä: https://i.imgur.com/x4PoE1B.jpg

Redditistä tämä referoitu. Kritiikkiä herättänyt maailmoja syleilevä otsikko, mutta ainoalla alueella jolla Zeniä nyt myydään eli DIY-puolella luvut näyttäisivät olevan tätä luokkaa. Jenkeissä ilmeisesti enemmän 70-30, mutta silti kaikki vastaan tulleet luvut ovat näyttäneet vähintään kahden numeron kasvua AMD:lle niissä segmenteissä missä Zen tarjolla. Threadripperistä meuhkataan, mutta se on kuitenkin pienen piirin säätöä. Jos AMD:n menestymisestä on kiinnostunut niin enemmänkin kannattaa olla kiinnostunut EPYCin ja tulevien läppäri/"mobiili"puolen ratkaisujen kanssa. Niissä kun tulee muutamakin prosentti kasvua, niin massat ovat jo valtavia.
 
Viimeksi muokattu:
Mielenkiintoista juttua Ryzenin kehityksestä.

Chipmaker AMD Makes a Big Bet on Brand-New Tech

Saivat testauksen aloittamista edeltävänä päivänä tiedon, että eka piiriversio on DOA. Siinä sitten äkkiä keksiä purkkakorjausta, että testauksen voi edes aloittaa jollakin tasolla.
Ilmeisesti vika oli "korjattavissa" piirin ylemmillä kerroksilla, jolloin vielä sopivan keskeneräiset piirit sai toimiviksi vain kuukauden viivästyksellä.
Ja joku toinenkin pikakorjaus lopulta löytyi niin ei mennyt koko kuukausikaan hukkaan.
 
Mielenkiintoista juttua Ryzenin kehityksestä.

Chipmaker AMD Makes a Big Bet on Brand-New Tech

Saivat testauksen aloittamista edeltävänä päivänä tiedon, että eka piiriversio on DOA. Siinä sitten äkkiä keksiä purkkakorjausta, että testauksen voi edes aloittaa jollakin tasolla.
Ilmeisesti vika oli "korjattavissa" piirin ylemmillä kerroksilla, jolloin vielä sopivan keskeneräiset piirit sai toimiviksi vain kuukauden viivästyksellä.
Ja joku toinenkin pikakorjaus lopulta löytyi niin ei mennyt koko kuukausikaan hukkaan.
Mielenkiintoinen artikkeli. Yllättävää että ovat satsanneet Radeoniin noin paljon; heidän suurin yksikkönsä, 3200 työntekijää. Siihen nähden yllättävää että Vegan kanssa on ollut niinkin vaikeaa.
 
Mielenkiintoinen artikkeli. Yllättävää että ovat satsanneet Radeoniin noin paljon; heidän suurin yksikkönsä, 3200 työntekijää. Siihen nähden yllättävää että Vegan kanssa on ollut niinkin vaikeaa.
GPU:sta on spesiaali varianteja kaikissa konsoleissa näytönohjaimien lisäksi joten niistä on useampia versioita kuin AMD:n prossoriytimistä ja sitten noiden konsolipiirien suunnittelu taitaa olla kokonaisuutena siellä Radeon yksiköissä (siis mukaanlukein sen CPU osuuden sovittamisen).
 
GPU:sta on spesiaali varianteja kaikissa konsoleissa näytönohjaimien lisäksi joten niistä on useampia versioita kuin AMD:n prossoriytimistä ja sitten noiden konsolipiirien suunnittelu taitaa olla kokonaisuutena siellä Radeon yksiköissä (siis mukaanlukein sen CPU osuuden sovittamisen).

Käsittääkseni PS4n ja Xbox One:n GCN-ytimet olivat täysin identtisiä, ja ihan samoja kuin jonkun (ensimmäisen sukupolven?) PC-GCN-näyttisten ytimet.

Mutta se muu logiikka niiden ympärillä toki vaihtelee jonkin verran, esim. Xbox Onessa oli se oma eDRAMinsa.

Ja Playstation 4 Pro sitten sisältää ihan omat ytimensä joita ei ole missään PC-näytönohjaimessa; Nämä ovat välimalleja Polariksesta ja Vegasta. Muuten melko lähellä Polarista mutta sisältää jo 2*fp16-vektorien laskennan kellojaksossa joka linjalla, jota ei normaalissa Polariksessa ole mutta Vegassa on
 
GPU:sta on spesiaali varianteja kaikissa konsoleissa näytönohjaimien lisäksi joten niistä on useampia versioita kuin AMD:n prossoriytimistä ja sitten noiden konsolipiirien suunnittelu taitaa olla kokonaisuutena siellä Radeon yksiköissä (siis mukaanlukein sen CPU osuuden sovittamisen).

Käsittääkseni PS4n ja Xbox One:n GCN-ytimet olivat täysin identtisiä, ja ihan samoja kuin jonkun (ensimmäisen sukupolven?) PC-GCN-näyttisten ytimet.

Mutta se muu logiikka niiden ympärillä toki vaihtelee jonkin verran, esim. Xbox Onessa oli se oma eDRAMinsa.

Ja Playstation 4 Pro sitten sisältää ihan omat ytimensä joita ei ole missään PC-näytönohjaimessa; Nämä ovat välimalleja Polariksesta ja Vegasta. Muuten melko lähellä Polarista mutta sisältää jo 2*fp16-vektorien laskennan kellojaksossa joka linjalla, jota ei normaalissa Polariksessa ole mutta Vegassa on
Juu PS4:ssa ilmeisesti ihan suoraan Polaris-ytimet. Tuleva Xbox X taas käyttää ihan omia "customised compute units"-grafiikkayksiköitä. Vaikea uskoa että olisi joku täysin oma ratkaisunsa vaan TFLOPSien valossa nekin vain korkeammalle kellotettuja Polariksia: PS4 36xGCN 911MHz -> 4,9TFLOPS vs. Xbox X 40x??? 1172MHz -> 6,1TFLOPS.

Itse piirivariantteja on kyllä CPU-puolella enemmän Zenin nyt levitessä joka paikkaan. Näyttispuolella se softapuoli on vain paljon haastavampaa. CPU:lle on jo aika selvä tietty matalan tason työrooli/käskykanta jonka se tulee täyttää ja vaatii käytännössä enää vähän erikoisohjausta OS-tasolla. GPU:n massiivinen rinnakkaisuus ja useat rajapinnat (Vulkan, DXnn, Physix etc) vaativat taas huomattavan paljon enemmän optimointeja, jotta uinuva laskentateho saadaan hyötykäyttöön. Taitaa olla nykypäivän piiripuolen kuninkuuslaji noiden high-end GPU:iden rakentelu, ajureiden kirjoittelu ja kaiken yhteenlittäminen tekoäly-, laskenta-, peli- yms-käyttöön.
 
Hieman offtopic mutta tuosta tiled rasteroinnista kun on nyt jaksettu jauhaa niin mahtaisiko joku muistaa että mikä oli se kohu joskus ehkä 10v sitten kun jompi kumpi valmistajista toi jonkun uuden ominaisuuden että ei rendattu jotain juttuja jotka oli toisten objektien takana tai jotain, saivat tällä 3d karkkimarkissa valtavan hyödyn ja alettiin syyttää huijaamisesta. Oliko se joku 3d karkkimarkki "optimointi" pelkästään vai ihan oikea ominaisuus joka otettiin laajemmin käyttöön?
 
Hieman offtopic mutta tuosta tiled rasteroinnista kun on nyt jaksettu jauhaa niin mahtaisiko joku muistaa että mikä oli se kohu joskus ehkä 10v sitten kun jompi kumpi valmistajista toi jonkun uuden ominaisuuden että ei rendattu jotain juttuja jotka oli toisten objektien takana tai jotain, saivat tällä 3d karkkimarkissa valtavan hyödyn ja alettiin syyttää huijaamisesta. Oliko se joku 3d karkkimarkki "optimointi" pelkästään vai ihan oikea ominaisuus joka otettiin laajemmin käyttöön?
Kysymys oli aivan eriasiasta silloin renderöitiin etukäteen vain testin yhtärataa kulkevan näkymän ruudulla näkyvä osa joka ei tietenkään vastaa mitään todellista pelitilannetta jossa pelaaja voi kääntyä toiseen suuntaan milloin haluaa, eli näytönohjaimessa ei ollut mitään tiled renderöinti ominaisuutta vaan kyseessä oli täysi kusetus jota olisi ollut täysin mahdoton toteuttaa missään oikeassa pelissä.

Kyro ja Kyro 2 oli todellisia ja todella nopeita tiled rendering piirejä mutta niiden kehittäjä heitti hanskat tiskiin siinävaiheessa kun olisi pitänyt alkaa tekemään DX7 T&L tuellisia kortteja (Kyro 2 oli softa DX7 T&L tuella nopeampi kuin ensimmäiset rauta DX7 T&L Geforcet).
 
Hieman offtopic mutta tuosta tiled rasteroinnista kun on nyt jaksettu jauhaa niin mahtaisiko joku muistaa että mikä oli se kohu joskus ehkä 10v sitten kun jompi kumpi valmistajista toi jonkun uuden ominaisuuden että ei rendattu jotain juttuja jotka oli toisten objektien takana tai jotain, saivat tällä 3d karkkimarkissa valtavan hyödyn ja alettiin syyttää huijaamisesta. Oliko se joku 3d karkkimarkki "optimointi" pelkästään vai ihan oikea ominaisuus joka otettiin laajemmin käyttöön?
Kusetus se oli. nVidia oli laskenut tarkalleen mitä 3DMarkin vakioajon aikana ruudulla näkyy ja ajurit rendasivat tasan sen eikä mitään enempää vaikka olisi pitänyt. Firma jäi siitä kiinni kun joku oli ostanut 3DMarkin pro version, jossa pystyi itse muuttamaan sitä reittiä ja kun reitiltä siityi pois, niin tulokset ruudulla käsittääkseni muuttuivat varsin mielenkiintoisiksi.
 
Hieman offtopic mutta tuosta tiled rasteroinnista kun on nyt jaksettu jauhaa niin mahtaisiko joku muistaa että mikä oli se kohu joskus ehkä 10v sitten kun jompi kumpi valmistajista toi jonkun uuden ominaisuuden että ei rendattu jotain juttuja jotka oli toisten objektien takana tai jotain, saivat tällä 3d karkkimarkissa valtavan hyödyn ja alettiin syyttää huijaamisesta. Oliko se joku 3d karkkimarkki "optimointi" pelkästään vai ihan oikea ominaisuus joka otettiin laajemmin käyttöön?

Tämä video kannattaa katsoa:
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.


Lyhyt selitys: Kortilla on supernopeaa muistia, jota kutsutaan cacheksi. Se on suoraan piirillä, mutta sitä on paljon vähemmän (joitakin megatavuja), kuin kortin muistia, jota on useampi gigatavu. Sinne tallennetaan useasti käytettyä tietoa.

Esimerkin vuoksi sanotaan nyt , että on 5x nopeampaa hakea tietoa cachesta. En ole hirveän väärässä.

Nvidia on oppinut jakamaan yhden framen sellaisiin alueisiin (Tile), että suuri osa tiedosta löytyy cachesta. Näin sitä ei tarvitse hakea muistista , joka olisi sen 5x hitaampaa. Jos kaikki tieto löytyisi cachesta, olisi kortti 5x nopeampi.

Lisäksi tämä vähentää muistiväylän käyttöä, kun sieltä ei tarvitse joka pikselille hakea erikseen, vaan suuri osa löytyy sieltä cachesta. Lisäksi Nvidia on kasvattanut cachen kokoa pari viime generaatiota, niin voi hyvin olla jo AMD:ta edellä siinä suhteessa.

--

AMD:n tekniikka ei ole ihan sama ja siitä on niin vähän tietoa, että en oikeasti osaa sanoa, saadaanko sillä samanlaisia hyötyjä. Päällä se ei joka tapauksessa ollut Vegaa testatessa.

--

TL;DR: Ei ole kikka. Katso video.
 
TL;DR: Ei ole kikka. Katso video.

Juu en ole sitä ollut inttämässä edes että olisi kikka, muistu vaan mieleen toi karkkimarkki kikkailu ja en muistanut että oliko se täysin kusetusta vaiko joku fiksu optimointi joka olisi sittemmin otettu laajemmalti käyttöön. Lähinnä ajatus oli että mikäli se olisi ollut optimointi joka laajemmin otettiin käyttöön, niin samaa olisi mahdollista odottaa tuolta AMD:n vastaavalta härveliltä mikä se ei ole käytössä vielä, mistä ei ole varmuutta edelleenkään että onko vaiko eikö kun AMD pitää radiohiljaisuutta.
 
LoyvV7MqQD_v33C8alq4CA.png

CompuBench - performance benchmark for various compute APIs (OpenCL, RenderScript)
Intelikin julkaisi kunnolliset prossut kilpailemaan AMDtä vastaan ja benchaa hyvin :vihellys:

Tuossa ilmeisesti ekana on OpenCL-implementaation tehnyt firma. Eli Ryzen pärjää paremmin Intelin OpenCL-implementaatiolla kuin AMDn omalla.

Tuolla nuo tarkemmat tiedot:

Intel(R) Ryzen 7 1700X Eight-Core Processor performance in CompuBench - performance benchmark for various compute APIs (OpenCL, RenderScript)


Siellä näkyy mm.
  • CL_DEVICE_NAME: AMD Ryzen 7 1700X Eight-Core Processor
  • CL_DEVICE_VENDOR: Intel Intel® Corporation
 
Tuossa ilmeisesti ekana on OpenCL-implementaation tehnyt firma. Eli Ryzen pärjää paremmin Intelin OpenCL-implementaatiolla kuin AMDn omalla.

Tuolla nuo tarkemmat tiedot:

Intel(R) Ryzen 7 1700X Eight-Core Processor performance in CompuBench - performance benchmark for various compute APIs (OpenCL, RenderScript)


Siellä näkyy mm.
  • CL_DEVICE_NAME: AMD Ryzen 7 1700X Eight-Core Processor
  • CL_DEVICE_VENDOR: Intel Intel® Corporation

Niin tai siis ohjelma on käännetty Intelin kääntäjällä joka edelleen suosii Intelin omia tuotteita joka sillä kustannuksella että omat uudet prosessorit eivät välttämättä toimi hyvin niiden ohjelmien kanssa jotka sillä intelin kääntäjällä on käännetty, kunnes intel julkasee uuden version kääntäjästä ja kyseinen ohjelma käännetään uudelleen.
Eli siis intel uppiniskaisesti käyttää omaa medotia tunnistamaan prosessorin, cpuid:stä ja cpu family. Jos nuo ei natsaa, niin kääntäjä käyttää geneeristä profiilia jossa 32-bit puolella mennään i386 käskyillä ja x64 puolella sse2 käskyillä.
Muut kääntäjät nuuskuttaa prosessorilta että mitä käskyjä se tukee ja sen mukaan sitten optimoi.

EDIT: Lisätään tähän vielä linkki aitoon Ryzen tulokseen, kun avaatte molemmat linkin niin sieltä voi ihastella kuinka karsitulta toi CL_DEVICE_EXTENSIONS näyttää verrattuna Intelin "valmistamaan" Ryzeniin :D
 
Viimeksi muokattu:
Niin tai siis ohjelma on käännetty Intelin kääntäjällä...

OpenCL-implementaatio sisältää sen kääntäjän, jolla se OpenCL-koodi käännetään.

Sillä, millä kääntäjällä host-koodi on käännetty, ei ole mitään väliä, eikä mitkään sen ominaisuudet vaikuta tähän.

Eli siis intel uppiniskaisesti käyttää omaa medotia tunnistamaan prosessorin, cpuid:stä ja cpu family. Jos nuo ei natsaa, niin kääntäjä käyttää geneeristä profiilia jossa 32-bit puolella mennään i386 käskyillä ja x64 puolella sse2 käskyillä.
Muut kääntäjät nuuskuttaa prosessorilta että mitä käskyjä se tukee ja sen mukaan sitten optimoi.

Se, että Ryzen on Intelin OpenCL-implementaatiolla selvästi nopeampi kuin AMDn omalla vaan kertoo sen, että Intel on LOPETTANUT niiden rumien temppujen tekemisen mitä se aiemmin teki, ja nyt tuottaa Ryzenillekin hyvää koodia cripplaamatta sitä.

EDIT: Lisätään tähän vielä linkki aitoon Ryzen tulokseen, kun avaatte molemmat linkin niin sieltä voi ihastella kuinka karsitulta toi CL_DEVICE_EXTENSIONS näyttää verrattuna Intelin "valmistamaan" Ryzeniin :D

Kyllä se Intelin OpenCL-implementaatiolla ajettu tulos on ihan yhtä lailla aito tulos.

Se, mitä extensioneita tuetaan riippuu siitä OpenCL-implementaatiosta.

Kun noita tuettuja extensioneita katsoo niin huomaa että Intelin implementaatio tukee esim. montaa Applen omaa extensiota. Hyvin ymmärrettävää, kun Intelin prossuja käytetään Applen koneissa, niin Apple on halunnut tuen näille jotta näytä käyttävä Applen koodi toimii myös silloin kun sitä ajetaan CPUlla. AMDn prossuja taas ei applen koneissa käytetä, joten AMDllä ei ole niin suurta intressiä tukea Applen omia extensioneita.
 
Viimeksi muokattu:
OpenCL-implementaatio sisältää sen kääntäjän, jolla se OpenCL-koodi käännetään.

Sillä, millä kääntäjällä host-koodi on käännetty, ei ole mitään väliä, eikä mitkään sen ominaisuudet vaikuta tähän.



Se, että Ryzen on Intelin OpenCL-implementaatiolla selvästi nopeampi kuin AMDn omalla vaan kertoo sen, että Intel on LOPETTANUT niiden rumien temppujen tekemisen mitä se aiemmin teki, ja nyt tuottaa Ryzenillekin hyvää koodia cripplaamatta sitä.

Tuohan juuri todistaa sen että EI ole lopettanut :D Etkö ymmärrä että noi kovat tulokset on ajettu feikatulla cpuid:llä jolloin on saatu intelin math lib käyttöön?
 
Tuohan juuri todistaa sen että EI ole lopettanut :D Etkö ymmärrä että noi kovat tulokset on ajettu feikatulla cpuid:llä jolloin on saatu intelin math lib käyttöön?

Mitä ihmettä nyt tarkkaan ottaen oikein edes tarkoitat "feikatulla cpuid"llä?

Tämä oli jo tuolla aiemmassa viestissäni:

Tuolta intelin implementaatiolla ajetusta device-infosta:
intel ryzen 1700x device info sanoi:
  • CL_DEVICE_NAME: AMD Ryzen 7 1700X Eight-Core Processor

Ihan oikein menee device name. Ei sisällä mitään feikkiä. Intelin OpenCL-ajoympäristö tasan tarkkaan tietää ajautuvansa AMDn prossulla.
 
Device vendor toisessa Intel, toisessa AuthenticAMD. Testissä EI pysty valitsemaan että kenen math libillä testi ajetaan.

Feikatusta cpuid:stä voit lukea lisää täältä
Agner`s CPU blog - Intel's "cripple AMD" function

Ja reddit keskustelua aiheesta voit seurata täältä
Kyllä tuossa tällä hetkellä kaikki viittaa siihen että ainut oikea ero että toinen käyttää Intelin OpenCL-ajuria, toinen AMD:n. Se, miten prosessori sitten saadaan käyttämään Intelin ajuria on kysymysmerkki
 
Device vendor toisessa Intel, toisessa AuthenticAMD. Testissä EI pysty valitsemaan että kenen math libillä testi ajetaan.

Device vendor on se, kenen OpenCL-ajoympäristöä(eli siis käytännössä OpenCL-kääntäjää) käytetään. Tällä ei ole mitään tekemistä cpuid:n kanssa.

Käytännössä:
Intelin OpenCL-ajoympäristö osaa käyttää kaikkia x86-prossuja ja Intelin iGPUita
AMDn OpenCL-ajoympäristö osaa käyttää kaikkia x86-prossuja ja AMDn GPUta
nVdian OpenCL-ajoympäristö osaa käyttää nVidian GPUita. (CUDA-wrapperin kautta)
 
Kyllä tuossa tällä hetkellä kaikki viittaa siihen että ainut oikea ero että toinen käyttää Intelin OpenCL-ajuria, toinen AMD:n. Se, miten prosessori sitten saadaan käyttämään Intelin ajuria on kysymysmerkki

Ajamalla windowsia virtuaali ympäristössä esim linuksissa xenin alla ja feikkaamalla CPUID kuten olen nyt koittanut kertoa jo useamman viestin ajan.
 
Ajamalla windowsia virtuaali ympäristössä esim linuksissa xenin alla ja feikkaamalla CPUID kuten olen nyt koittanut kertoa jo useamman viestin ajan.

Edelleen olen jo kaksi kertaa osoittanut että mitään cpuid:tä ei ole feikattu koska se näkyy aivan oikein tuossa CL_DEVICE_NAME:ssa.


Jos nyt yrittäisit perehtyä vähän paremmin siihen, miten OpenCL toimii.


pieni vihje: Luonnoin TTYllä kurssia, jolla opetetaan OpenCL-ohjelmointia. (TIE-51257: Parallel Embedded Computing)
 
Edelleen olen jo kaksi kertaa osoittanut että mitään cpuid:tä ei ole feikattu koska se näkyy aivan oikein tuossa CL_DEVICE_NAME:ssa.


Jos nyt yrittäisit perehtyä vähän paremmin siihen, miten OpenCL toimii.


pieni vihje: Luonnoin TTYllä kurssia, jolla opetetaan OpenCL-ohjelmointia. (TIE-51257: Parallel Embedded Computing)

Saat luennoida ihan vaikka valkoisessa talossa. Jos et halua faktoja nähdä niin se ei ole minun ongelma. Testiohjelmassa EI voi valita kenen tekemää OpenCL rajapintaa käytetään ja ohjelma on käännetty intelin kääntäjällä. Ainoa keino vaihtaa sitä kenen CL:llä ajellaan on valehdella CPUID ja family joka käy selväksi jos olisit viitsinyt lukea sen linkin jonka laitoin jossa myös kerrotaan hyvin selväksi MIKSI ohjelmat käyttäytyvät eri tavalla kun käytetään Intelin kääntäjää.
 
Se, miten prosessori sitten saadaan käyttämään Intelin ajuria on kysymysmerkki

Asennetaan se koneelle.

CPUn kanssa kyse ei ole samalla tavalla ajurista kuin näyttiksen, CPUlla pyörivän OpenCL-ajoympäristön ei tarvi tehdä mitään sellaisia matalan tason juttuja, mihin esim. normaalikäyttäjän oikeudet eivät riitä, se on oikeastaan kirjasto(joka sisältää kääntäjän) eikä ajuri.

Tämän jälkeen OpenCL:n clGetPlatformIDs -metodi palauttaa listan, jossa näkyy yhtenä valmistajana Intel. Kun tälle kutsuu clGetDeviceIds-metodia, näkyy siellä CPU-laitte , riippumatta siitä minkä merkkinen se CPU oikeasti on.

edit: korjattu hiukan yksityiskohtia
 
Viimeksi muokattu:
Saat luennoida ihan vaikka valkoisessa talossa. Jos et halua faktoja nähdä niin se ei ole minun ongelma.

Tiedän faktat aika paljon sinua paremmin tästä.

Testiohjelmassa EI voi valita kenen tekemää OpenCL rajapintaa käytetään

OpenCL-ohjelmat kutsuvat aina alussa ohjelman metodia, jolla haetaan koneessa olevat OpenCL-ajoympäristöt, ja ohjelma voi näistä valita haluamansa.

clGetPlatformIDs

Tämän jälkeen haetaan lista sen ajoympäristön tukemista laitteista:

clGetDeviceIDs

ja ohjelma on käännetty intelin kääntäjällä.

Slllä, millä host-ohjelma on käännetty ei ole mitään väliä.

OpenCL-ajoympäristö kääntää sen OpenCL-koodin käytännössä aina sen ohjelman ajamisen aikana. (tai no, on olemassa myös keinoja joilla sen käännetyn OpenCL-ohjelman voi myös tallentaa ja ladata myöhemmin, joten AINA oli hiukan liian vahva sana. Mutta mitään ohjelmaa ei toimiteta valmiiksikäännetyn OpenCL-koodin kanssa, jos käännös tallennetaan, se tehdään sitten asennuksen jälkeen ekalla käynnistyskerralla tms.)

Ainoa keino vaihtaa sitä kenen CL:llä ajellaan on valehdella CPUID ja family

clGetPlatformIDs

Mitäs tämä OpenCL:n metodi sitten tekee? ;)

Tai jos koneelle on asennettu vain AMDn OpenCL-ajoympäristö muttei Intelin OpenCL-ajoympäristöä, kummankohan softa löytää? Siinä ei paljoa cpuid paina.

Sama toisinpäin.

joka käy selväksi jos olisit viitsinyt lukea sen linkin jonka laitoin jossa myös kerrotaan hyvin selväksi MIKSI ohjelmat käyttäytyvät eri tavalla kun käytetään Intelin kääntäjää.

Kyseinen linkkisi ei liity millään tavalla OpenCL:ään josta olet pihalla kuin lumiukko.

Tuo testi sen sijaan oli OpenCL-testi, ja siinä on täysin irrelevanttia, millä kääntäjällä se host-koodi on käännetty, kun kaikki suorituskykykriittinen koodi käännetään sillä ajoympäristön kääntäjällä.
 
Viimeksi muokattu:
Ainut tietty se että jos se Intelin CPU toteutus barffaa jos sitä ajaa AMD:llä ilman CPUID:n vaihtoa. Totahan voi joku viitseliäs testata miten se näkyy jos Ryzenille asentelee sekä Intelin että AMD:n CPU runtimet.
 

Uusimmat viestit

Statistiikka

Viestiketjuista
297 499
Viestejä
5 070 324
Jäsenet
81 337
Uusin jäsen
jmmaenp

Hinta.fi

Back
Ylös Bottom