AMD Zen

Techspotilla oli ihan mielenkiintoinen "artikkeli" Ryzenistä Nvidian 1070 ja 1080Ti-näytönohjaimilla. Itseäni ainakin kiinnostaa 1070 GTX:n omistajana, miten R1600/1700 suoriutuu "tehorajoitteisen" 1070 GTX:n kanssa (vs. 7700K). Noissa testeissä ihan mukavasti. 1080Ti:n kanssa erot oli (joissain peleissä) aika isoja, mutta 1070 GTX:n kanssa AMD suoriutui hienosti. Josko varovasti taas vetäisi Ryzen ostohousuja jalkaan käytetyn haswelin ja 7700K:n sijasta. :)

Simulating AMD Ryzen 5 1600X, 1500X Gaming Performance
 
Koneessa pitää olla Creators Update versio Windows 10:stä. Se tulee sen mukana.

Asensin päivityksen manuaalisesti hakemalla Windows Assistant joka sen asensi. En löytänyt mitään Gameing mode juttua koneesta mutta googlettelu tuotti tulosta ja pelissä pitää painaa win+g näppäimiä jotta tuo avautuu. Miten ihmeessä tuollaista voi tietää kun sitä ei millään tavalla mainosteta. No pistin Bioshockin päälle ja painan tuota yhdistelmää mutta mitään ei tapahdu. Sitten kokeilen painaa tuota Firefoxissa niin sitten avautuu ikkuna joka kysyy (is this a game?). Eli en ainakaan saanut sitä tuossa pelissä toimimaan.

EDIT: Todella kömpelö tämä foorumi lainausten kanssa kun näyttää ainoastaan viimeisimmän lainauksen. Mutta Gaming modeen siis liittyi.

EDIT2: Vanha kunnon uudelleenkäynnistys auttoi :vihellys:
 
Viimeksi muokattu:
Asensin päivityksen manuaalisesti hakemalla Windows Assistant joka sen asensi. En löytänyt mitään Gameing mode juttua koneesta mutta googlettelu tuotti tulosta ja pelissä pitää painaa win+g näppäimiä jotta tuo avautuu. Miten ihmeessä tuollaista voi tietää kun sitä ei millään tavalla mainosteta.
Kyllä Microsoft on minusta aika kovastikin rumpua lyönyt tuosta gaming modesta. Täälläkin oli siitä pitkä ketju spekulaatiota. Ja asetusten alla on erikseen "Gaming" asetukset, joten ei tuon löytäminen minusta ole edes vaikeaa vaikka ei pääsisi edes nettiin Googlea käyttämään.
 
En nyt mitään isoja eroja huomannut 0-3 fps muutoksia kun fps:t oli jotain 200 :d Mutta tostakin pari klikkausta enemmän ja enemmän vaivaa kuin hyötyä. Eri asia jos sen saisi yhdellä klikkaukselle kaikille käynnistyville peleille aina päälle asetus.
 
Eri asia jos sen saisi yhdellä klikkaukselle kaikille käynnistyville peleille aina päälle asetus.
Onhan se päällä oletuksena. Aloitus-> Asetukset -> Pelaaminen (löytyy kaikki asetukset siihen). Pelipalkin oletusnappi on Xbox- ohjaimen X- näppäin.
 
Onko jonnekkin foorumilla koottu toimivia emoa + muisti settäjä?
Hirveästi näyttää olevan muisti ongelmia jengillä ja jäätävää säätämistä.
Helpottaa hommaamista ku ei tarvii juosta vaihtamassa kampoja...tulee ihan amd:n 754 ajat mieleen.

Toivottavasti 11.päivän julkaisu toisi tullessaan kapuloita intelin rattaisiin niin pääsis tuosta intelin ikeen alta.
 


Mukava nähdä että jo tässä vaiheessa Ryzen voittaa joissain peleissä 1080p resolla 7700k kellotettuna 5Ghz.

Onko jonnekkin foorumilla koottu toimivia emoa + muisti settäjä?
Hirveästi näyttää olevan muisti ongelmia jengillä ja jäätävää säätämistä.
Helpottaa hommaamista ku ei tarvii juosta vaihtamassa kampoja...tulee ihan amd:n 754 ajat mieleen.

Toivottavasti 11.päivän julkaisu toisi tullessaan kapuloita intelin rattaisiin niin pääsis tuosta intelin ikeen alta.

Tällä hetkellä Samsungin B die muistit toimivat lähes kaikkien emolevyjen kanssa 3200Mhz asti. Mm G.Skillin monet CL14 muistit (3000, 3200) ovat näitä samsungin muisteja, tarkemman listan löytää näiltä AMD ketjuista, muistaakseni eilen tai toissapäivänä oli puhetta näistä.

Viimeisimmissä BIOS päivityksissä on myös muiden halvempien muistien tuki on parantunut ja hyvin varmasti saavat korjattua loputkin muistit toimimaan spekstatuilla taajuuksilla.
 
Aikasemmin mainitisin että pcper oli tekemässä ytimien välistä latency testausta eri muisteilla. Tulokset löytyvät heidän uudesta R5 revikastaan.

ccxlatency2.png


The Ryzen 5 Review: 1600X and 1500X Take on Core i5 | CCX Latency Testing - Pinging between threads
 
Mitähän tässä oikee tapahtuu?
Saman efektin saa ilmeisesti näkyviin kaikilla Ryzeneillä eli nVidia on joko optimoinut ajurinsa täysin Intelille tai sitten niissä on ikävä bugi koska Ryzenin kanssa ne hukkaavat tehoja johonkin.
 
Mitähän tässä oikee tapahtuu?


Nvidian ajuri jotenkin solmussa.

3a8lgbc0lxqy.png

Saman efektin saa ilmeisesti näkyviin kaikilla Ryzeneillä eli nVidia on joko optimoinut ajurinsa täysin Intelille tai sitten niissä on ikävä bugi koska Ryzenin kanssa ne hukkaavat tehoja johonkin.
Onko tuo 480 noin paljon tehokkaampi kuin 1060?
 
Onko tuo 480 noin paljon tehokkaampi kuin 1060?
Joku selitti sen niin, että kun CPU on tapissa nVidia hirttää osittain kiinni koska se käyttää CPU pohjaista scheduleria. AMD:llä se scheduler on raudassa, joten tuo RX480 painaa täysillä myös CPU:n ollessa tapissa. En tiedä pitääkö paikkansa, mutta rumalta tuo kuitenkin näyttää nVidian suhteen.
 
@TheMeII, Itselläni RX 480 kiinni Ryzenissä ja ihan hyvin se pyörittää. Tehoero näiden välillä on kasvanut RX 480 suuntaan kun ajurit kehittyneet jne.
 
Joku selitti sen niin, että kun CPU on tapissa nVidia hirttää osittain kiinni koska se käyttää CPU pohjaista scheduleria. AMD:llä se scheduler on raudassa, joten tuo RX480 painaa täysillä myös CPU:n ollessa tapissa. En tiedä pitääkö paikkansa, mutta rumalta tuo kuitenkin näyttää nVidian suhteen.

Ei selitä R7 sarjan huonoa suorituskykyä kun cpu cyclejä pitäs olla reilusti vapaana pelikäytössä. Veikkaan että nvidialla on vaa reilusti isompi overhead Ryzen prossuilla verrattuna Intelin prossuihin. Ei vaa kukaa näytä niitä itse threadien kuormia process hackerilla. Kaikilla on vaa generic cpu usaget näkyvissä.
 
RX 480:lla R7 1800x ja i5 7400 ei käytännössä eroa, eli bottleneckkaako tuossa siis RX480 ?
 
RX 480:lla R7 1800x ja i5 7400 ei käytännössä eroa, eli bottleneckkaako tuossa siis RX480 ?
Todennäköisesti, mutta tuon 1060:n pitäisi tehdä sama myös Ryzenilla jos homma toimisi oikein ja sitä se ei tee tuon testin perusteella.
 
Juu totta, taitaa Nvidialla jotain tosi pahasti solmussa tuolla:lol:

Niinhän tuo näyttää, mutta jossain pelissä heillä toimii ihan hyvin. Veikkaan että nvidian ajurit ovat niin monimutkaiset että he eivät voi tehdä mitään yleispätevää fiksausta , vaan pitää jopa tehdä pelikohtaisia optimointeja. Näitä tuskin enää vanhempiin peleihin tehdään.

Edit:

Lisätään selvennykseksi että tarkoitin nimenomaan nvidian tekemiä ajuripohjaisia optimointeja eri peleille, en itse pelin päivitystä tarkoittanut. Tosin tämä on osaltani hakuammuntaa ja joku paremmin tietävä voisi asiaa valaista että voiko näin olla.
 
Viimeksi muokattu:
Niinhän tuo näyttää, mutta jossain pelissä heillä toimii ihan hyvin. Veikkaan että nvidian ajurit ovat niin monimutkaiset että he eivät voi tehdä mitään yleispätevää fiksausta , vaan pitää jopa tehdä pelikohtaisia optimointeja. Näitä tuskin enää vanhempiin peleihin tehdään.
Mutta tuo yllä mainittu peli ei ole ainoa josta olen nähnyt tuollaiset graafit. AdoredTV taisi olla ensimmäinen testaaja, joka huomasi tuon kusemisen nVidialla. Noita löytyisi varmaan useampi lisää, jos joku vain jaksaisi testailla samaan tyyliin pelit läpi.
 
Mutta tuo yllä mainittu peli ei ole ainoa josta olen nähnyt tuollaiset graafit. AdoredTV taisi olla ensimmäinen testaaja, joka huomasi tuon kusemisen nVidialla. Noita löytyisi varmaan useampi lisää, jos joku vain jaksaisi testailla samaan tyyliin pelit läpi.
Tuo kiinnostaisi itseänikin ja myös päteekö kaikkiin Nvidian kortteihin vai vaan tiettyihin kuten tämä 1060.

Täytyy vissiin odotella vegaa ennenkuin uskaltaa tehdä päätöksiä hankinnasta :tdown:
 
Ei selitä R7 sarjan huonoa suorituskykyä kun cpu cyclejä pitäs olla reilusti vapaana pelikäytössä. Veikkaan että nvidialla on vaa reilusti isompi overhead Ryzen prossuilla verrattuna Intelin prossuihin. Ei vaa kukaa näytä niitä itse threadien kuormia process hackerilla. Kaikilla on vaa generic cpu usaget näkyvissä.
En minäkään (jostain syystä??) ole seurannut CPU:n käyttöastetta, mutta GTX980 SLI:n käyttöaste esim. FarCry4:ssa on n.45%/gpu fps:n ollessa 60-100.
Ei kyllä GPUGrid:kään kuormita kuin 70-90%, mutta toisaalta CPU:lla on 16 threadia käytössä GPU:iden lisäksi.
 
onko Ryzen pelatessa "pehmeämpi" käyttää vai onko kyse vain punalaseista?
4 erilaista kokoonpanoa, 3 testaajaa, pelkkää pelaamista. Huomataanko eroja?

 
onko Ryzen pelatessa "pehmeämpi" käyttää vai onko kyse vain punalaseista?
4 erilaista kokoonpanoa, 3 testaajaa, pelkkää pelaamista. Huomataanko eroja?
Kyllähän tuosta saa sen kuvan, että fps mittarit ovat lähinnä e-peniksen venytykseen tarkoitettuja. Jos eroa ei kerran huomaa ilman testisoftia, niin ei niillä ole mitään käytännön merkitystä.
 
onko Ryzen pelatessa "pehmeämpi" käyttää vai onko kyse vain punalaseista?
4 erilaista kokoonpanoa, 3 testaajaa, pelkkää pelaamista. Huomataanko eroja?


[offtopic]En tiedä muista, mutta itse en katso mitään reviewejä tai testejä jne videoilta. Ei aika riitä siihen. 1-2 min pitää irrota oleelliset pointit, jolloin voi tehdä päätöksen lukeeko kokonaan artikkelin. Videoilla tämä harvoin onnistuu. Katsoo minuutin ja vasta alkulogot on menneet ohi.

Toivomuksena siis videoiden linkkaajille, että jos mitenkään jaksatte laittaa sen pointin+conclusionin, joka videolla on, pelkän videon linkkaamisen sijasta tekstillä "mielenkiintoinen video" varustettuna.
[/offtopic]
 
[offtopic]En tiedä muista, mutta itse en katso mitään reviewejä tai testejä jne videoilta. Ei aika riitä siihen. 1-2 min pitää irrota oleelliset pointit, jolloin voi tehdä päätöksen lukeeko kokonaan artikkelin. Videoilla tämä harvoin onnistuu. Katsoo minuutin ja vasta alkulogot on menneet ohi.

Toivomuksena siis videoiden linkkaajille, että jos mitenkään jaksatte laittaa sen pointin+conclusionin, joka videolla on, pelkän videon linkkaamisen sijasta tekstillä "mielenkiintoinen video" varustettuna.
[/offtopic]

OK
Idea:
"
System 1:
Asus Strix X99
Intel 5960X @ 4.2ghz
GSkill 16-16-16-38 DDR4 @3200 (dual channel)
(silly x99 and still having memory compatibility issues)
Intel 750 1.2tb SSD

System 2:
ASRock X370 Taichi
Ryzen 1800x @ 4.1ghz
GSkill DDR4-3200 @ 16-16-16-34 3200mhz
OCZ RD400 NVMe

System 3:
ASUS Strix Z270g uAtX
Intel 7700k @ 4.5ghz
GSkill DDR4-3200 @ 16-16-16-34 3200mhz
Intel 750 1.2tb SSD

System4:
Gigabyte Aorus Gaming 5
Ryzen 1700X @ defaults
GSkill DDR4-3200 @ 16-16-16-34 3200mhz
Intel NVMe PCIe SSD 1.2tb

All systems used the NVidia GTX 1080, but we also did some pre-test testing with the ASUS Strix Fury to rule out nvidia/driver/dx11/dx12 issues. There is something interesting there, but the performance gap was there between the i7and ryzen.
"

3 testaajaa, 4 kokoonpanoa. Eivät tiedä muuta kuin numerot (eli mitä koneet ovat syöneet paljastetaan vasta lopussa).

Käyttäjät huomasivat Fallout 4 ja GTA V ongelmia eniten kokoonpanoilla 1 ja 3.
Ongelmat olivat erittäin pieniä ja yleisesti sanoen KAIKKI testikokoonpanot toimivat sulavasti eikä eroja huomannut oli käytössä sitten 1080p tai 4k resoluutio.
 
Tästä videosta näkee aika hyvin mitä eroja tulee eri näytönohjaimilla ja muisteilla.
Käytössä on 4GHz kellotettu Ryzen 7 prosessori, muistit 2133 - 3200, näytönohjamet 1080TI, 1070 ja 1060.
JOS pelaa 1080p ja kortin teho on VÄHINTÄÄN 1080TI luokkaa nopeaan muistiin kannattaa panostaa (eroa tulee jopa ~40%) JOS pelaa 1070 tai alle tehoisella näytönohjaimella 2400 muisti taitaa olla nyt parhaassa hinta/laatu suhteessa.
 
OK
Idea:
"
System 1:
Asus Strix X99
Intel 5960X @ 4.2ghz
GSkill 16-16-16-38 DDR4 @3200 (dual channel)
(silly x99 and still having memory compatibility issues)
Intel 750 1.2tb SSD

System 2:
ASRock X370 Taichi
Ryzen 1800x @ 4.1ghz
GSkill DDR4-3200 @ 16-16-16-34 3200mhz
OCZ RD400 NVMe

System 3:
ASUS Strix Z270g uAtX
Intel 7700k @ 4.5ghz
GSkill DDR4-3200 @ 16-16-16-34 3200mhz
Intel 750 1.2tb SSD

System4:
Gigabyte Aorus Gaming 5
Ryzen 1700X @ defaults
GSkill DDR4-3200 @ 16-16-16-34 3200mhz
Intel NVMe PCIe SSD 1.2tb

All systems used the NVidia GTX 1080, but we also did some pre-test testing with the ASUS Strix Fury to rule out nvidia/driver/dx11/dx12 issues. There is something interesting there, but the performance gap was there between the i7and ryzen.
"

3 testaajaa, 4 kokoonpanoa. Eivät tiedä muuta kuin numerot (eli mitä koneet ovat syöneet paljastetaan vasta lopussa).

Käyttäjät huomasivat Fallout 4 ja GTA V ongelmia eniten kokoonpanoilla 1 ja 3.
Ongelmat olivat erittäin pieniä ja yleisesti sanoen KAIKKI testikokoonpanot toimivat sulavasti eikä eroja huomannut oli käytössä sitten 1080p tai 4k resoluutio.
Mulla näköjään meni ohi tuo että 1800X kellotettu 4,1 GHz. Katoin tuon videon aikasemmin jo aika vakuuttavaa :) Kertoko muuten missään paljonko tarvi volttia 4,1 GHz:lle?
 
Mulla näköjään meni ohi tuo että 1800X kellotettu 4,1 GHz. Katoin tuon videon aikasemmin jo aika vakuuttavaa :) Kertoko muuten missään paljonko tarvi volttia 4,1 GHz:lle?

Näköjään saaneet toimimaan myös 4.2GHz kun tätä videota katsoo (saman emolevyn arvostelu)

Tuon videon alla on myös CPU-Z tulokset mistä näkee (ainakin teoriassa) voltit myös. Tosin väitän että noin alhaiset tulokset eivät pidä paikkaansa. Katselen vielä videota joten en ole 100% varma näytetäänkö esim. kellotus tuossa. Taitaa mainita että 1.46V 4.2GHz kohdassa 14:29
 
Näköjään saaneet toimimaan myös 4.2GHz kun tätä videota katsoo (saman emolevyn arvostelu)

Tuon videon alla on myös CPU-Z tulokset mistä näkee (ainakin teoriassa) voltit myös. Tosin väitän että noin alhaiset tulokset eivät pidä paikkaansa. Katselen vielä videota joten en ole 100% varma näytetäänkö esim. kellotus tuossa. Taitaa mainita että 1.46V 4.2GHz kohdassa 14:29

Alhainen CPU-Z tulos. Ite saan 4 GHz:lla 2347/21019
 
Agner Fog saanut analysoitua Zen-arkkitehtuurin ja kirjoitellut siitä kappaleen

http://www.agner.org/optimize/microarchitecture.pdf


Mielenkiintoinen yksityiskohta minkä bongasin, ensin vähän historiallista taustaa:

Alunperin Pentium Pro:ssa oli 16-bittisen koodin suorituskyvylle pullonkaulana se, että se ei ymmärtänyt, että 16-bittisten rekisterien 8-bittisten alirekisterien(esim. AL ja AH) välillä ei todellisuudessa ole riippuvuuksia, ja tämän takia suorituskyky joillain 16-bittisillä ohjelmilla oli Pentium Pro:ssa huono. Tämä sitten korjattiin/optimoitiin Pentium 2:ssa.

Selitys tälle oli se, että Intel oli luullut, että siinä vaiheessa kun pentium Pro tulee markkinoille, ei 16-bittisen koodin suorituskyky ole enää tärkeää vaan kaikki tärkeä suorituskykykriittinen koodi on 32-bittistä kooodia jossa osittaisrekistereillä ei kikkailla, mutta sitten mm. microsoft päätti jättää windows 95een (ja 98iin) paljon enemmän 16-bittistä koodia pellin alle, mm. grafiikkarajapintoihin, kuin mitä alunpeirn oli aikonut.


No, miten tämä liittyy Zeniin ja tuohon Agner Foxin analyysiin siitä: Bongasin tuolta, että nyt Zenissä on sama rajoite kuin alunperin Pentium Pro:ssa oli. Mutta nyt n. 21 vuotta myöhemmin 16-bittisen koodin suorituskyvyllä ei tosiaankaan ole enää mitään väliä, ja tämä on ihan hyvä kompromissi.
 
Viimeksi muokattu:
Mutta tosiaan vielä lisäkommentteja noiden Agner Fogin analyysien pohjalta:

* Normaalisti pystytään ottamaan(liukuhihnan etupäässä, ennustaen) yksi haarautuminen kahden kellojakson välein(tämä ei koske haarautumisen tarkastamista, joka tapahtuu liukuhinan loppupäässä, näitä voi ilmeisesti tehdä 2/kellojakso)
* Mutta, maksimissaan viiden mikro-operaation looppeja voidaan suorittaa yhdessä kellojaksossa(jolloin siis hyppy joka kellojakso) suoraan micro-op-välimusitista(joka on vähän kuin L0-käskyvälimuisti, mutta sisältää jo dekoodattuja käskyjä) ja täältä voidaan muutenkin ladata 5 käskyä kellojaksossa.
* Nämä 5 micro-operaatiota voivat olla peräisin jopa kuudesta alkuperäisestä x86-käskystä, jos vertailu- ja haarautumiskäskyt on dekooderissa yhdistetty. (tämä on leveämpi kuin mikään x86-prossu tähän mennessä)
* Kokonaisluku-ALUt on melko kaikkivoipia, lähinnä vain kerto- ja jakolaskut on rajoitettu vain tietyille ALUille.

Ehkä yllättävimpiä on kuitenkin seuraavat:
* Tämä(käytetään nyt "tämä"- eikä "tuo"--sanaa kun kirjoitan tätä zenillä ;) ) pystyy samaan aikaan suorittamaan sekä 256-bittisen liukuluku-AVX-SIMD-FMA:n että 256-bittisen liukuluku-AVX-SIMD-yhteenlaskun, ei FMA ei varaakaan liukulukujen yhteenlaskuyksiköitä kokonaan. (tosin ilmeisesti ei pysty tätä aivan joka kellojaksossa jatkuvasti vain vaan välillä). Tähän väitteeseen tosin suhtaudun hiukan epäillen.
* Vaikka FMA4-käskyjä ei virallisesti tueta, eikä prosessorin CPUID kerro niiden olevan tuettuja, ne tuntuvat silti toimivan
 
Viimeksi muokattu:
Mulla on juurikin kyseinen muistikitti (HX426C15FBK2/16) ja se on toiminut ilman ongelmia kaikilla Ryzen alustoilla, joilla sitä on testattu (ASUS C6H, MSI X370 Titanium, Myrtle) 2666MHz CL16-16-16-30 asetuksilla.
Ne joilla on kyseisen kitin kanssa ongelmia, kertokaas muistin eräkoodi (tarran toinen rivi, "Assy in" tekstin yläpuolella). Omat on CSMM1691664 koodilla.
koodi noissa on DTMH1611706
 
Zenistä löytynyt bugi virtual 86(v86)-moodista.

Eli 16-bittisten softien ajo 32-bittisten käyttiksen (tai DOSin jossa käytössä EMM386) alla on särki, INT-käsky jonka pitäisi kutsua keskeytyskutsurutiinia(käytetään siis käytännössä DOSin käyttöjärjestelmärutiinien kutsumiseen) kutsuu väärää osoitetta.


Virtual 86-tila ei muutenkaan ole tuettu 64-bittisen käyttiksen päällä, sen takia tätä bugia ei varman huomattu aiemmin kun käytännössä kukaan ei ole käyttänyt ryzeniä 32-bittisellä käyttiksellä, yrittäen ajaa siinä DOS-softia.

Nykyään DOS-softia tyypillisesti ajetaan Dosboxilla joka on puhdas emulaattori eikä käytä v86-tilaa, ja Dosboxin toimintaan tämä bugi ei vaikuta.


VME Broken on AMD Ryzen | OS/2 Museum


INT on käsky joka käytännössä varmasti suoritetaan mikrokoodilla, joten tämä bugin pystyy käytännössä varmasti korjaamaan mikrokoodipäivityksellä, joka tulee uuden BIOS-version mukana. Odotellaan pari kuukautta, niin eiköhän sitten tule BIOS-päivitys joka korjaa tämän.



Mutta sinänsä tämä bugi on tärkeä virstanpylväs siitä, että PC-tietokoneet ovat VIHDOIN saavuttaneet tilan, että käytännössä ketään ei enää haittaa, vaikka yhteensopivuus alkuperäiseen x86een on rikottu ;) (tosin v86-tilahan ei varsinaisesti ole 8086n ominaisuus vaan se tuli vasta 386ssa, se on 386n ominaisuus yhtensopivuuden säilyttämiseksi 8086een), ihan puhtaassa 8086-tilassa ryzen toiminee ongelmitta.
 
Viimeksi muokattu:
Hyvä niille, jotka ovat ostamista lykänneet. Hinnan pudotusta luvassa. Lähtee kohta R7 1700 arviolta vähän päälle 300 €. Olisiko noin 325 €.

AMD Trims Prices of the Ryzen 7 1700 and 1700X

En olisi arvannut että hinnat näin äkkiä ropisee.
Vaikuttaa vähän siltä et laskevat perustasoja jotta voivat aloittaa Threadripperit alemmalta lähtötasolta. Olis aika AMD:n tapaista odotella eka Intelin hinnat (jotka tuli jo) ja sitten sen mukaan suunnitella omat hinnat jotta saa iskettyä kunnolla. Kuvittelisin, että pian tulee hintatietoja julkisuuteen.
 
Viimeksi muokattu:
Amd pistänyt julkiseen jakoon software optimization guiden 17h perheen prossuille. Onko tuossa mitään uutta tietoa http://support.amd.com/TechDocs/55723_SOG_Fam_17h_Processors_3.00.pdf
?

Tämä huomio, minkä Agner Fox teki omissa analyyseissään on vihdoin selitetty virallisesti:

AMD optimization manual sanoi:
Pipes 0 and 1 support operations that require three operands. When three operands are required for an operation, it uses ones of the source busses normally allocated to pipe3, which can block any execution in pipe3. If data for pipe3 or the 3rd operand can be bypassed from a result generated that same cycle, then pipe3 can execute an operation even when either pipe0 or pipe1 require a third source.

Eli liukuhihnoissa 0 ja 1 on täydet FMA-yksiköt, FMAn suorittamiseen ei tarvita liukuhihnojen 2 ja 3 yhteenlaskuyksiköitä.

Sen sijaan rekisterien lukuportteja liukuhihnoissa 0 ja 1 on vain 2 kussakin, jolloin kolmas operandi pitää saada "lainaamalla" rekisterinlukuporttia kakkoselta. Jos tämä arvo tuleekin bypassaamalla suoraan edelliseltä operaatiolta, eikä sitä lueta rekistereistä, silloin on mahdollista suorittaa kahden FMAn kanssa rinnakkain jopa 2 muuta liukuluku-/SIMD-operaatiota.

Vaikuttaa fiksulta rakenteelta, rekisterifileportit on kalliita(kellotaajuuden ja sähkönkulutuksen näkökulmasta), itse laskentayksiköt ei niinkään, ne maksaa lähinnä transistoreita jotka nykyään on melkein ilmaista.


Yksi lisähuomio:

latauskäskyt joissa kolmioperandinen osoite tai esim. skaalattu indeksi maksavat yhden kellojakson ylimääräistä viiveeseen

Toinen:

Vaihtaminen normaalin L1I-kakusta tulevan x86-fetchin ja looppikakusta tulevan micro-op-fetchin välillä tehdään käytännössä 64 tavun granulatiteetilla.

Tämän takia looppien pitäisi mielellään loppua aina 64:llä jaolliseen osoitteeseen, jotta looppikakusta saadaan maksimaalinen hyöty irti.


(tässä ei mitään uutta, mutta liittyy aiheeseen)

Normaalilla x86-fetchillä voidaan siis fetchata ja dekoodata maksimissaan 4 käskyä/kellojakso, looppikakusta voidaan fetchata 8 mutta rename-vaihe rajoittaa prosessorin etupään kuitenkin kuuteen käskyyn/kellojakso.
 
Viimeksi muokattu:
Videocardzilta löytyi Epyc prossujen tuotevalikoima "hintoineen" ja jonkinlainen suorituskyky verrokki vastaavan hintaisiin xeoneihin. En ota kantaa kuin todenmukainen leakki on.

AMD EPYC 7000 series specs and performance leaked | VideoCardz.com

Ensimmäisenä itellä herää kysymys, että miten "EPYC 1-Socket CPUs"-sarja eroaa muista?
Kuten Threadripper tuossa totesi, ko. prossut käyvät vain yhden Socketin emoihin. Intelillä on ollut täysin vastaava käytäntö että eri Socket-määrille on eri prosessorisarjat.
 
Kuten Threadripper tuossa totesi, ko. prossut käyvät vain yhden Socketin emoihin. Intelillä on ollut täysin vastaava käytäntö että eri Socket-määrille on eri prosessorisarjat.

Tällästä vähän itekin ajattelin, mutta kun en noista serveripuolen vehkeistä ole niin perillä, niin en tiedä mitä etua tällä haetaan.
 
Tällästä vähän itekin ajattelin, mutta kun en noista serveripuolen vehkeistä ole niin perillä, niin en tiedä mitä etua tällä haetaan.

Hintasegmentointia. Kahden soketin kokoonpanoissa toimivista voidaan pyytää suurempaa hintaa.
 
Zenin nextgeniä ajatellen, mitä mieltä porukka on tästä:

Globalfoundries "uhoaa" että tuleva 7nm prosessi tulisi olemaan 5GHz nopeuksille optimoitu:

https://www.globalfoundries.com/sites/default/files/product-briefs/7lp-product-brief.pdf

Kun taas nykyinen prosessin alue on 3GHz

https://www.globalfoundries.com/sites/default/files/product-briefs/product-brief-14lpp.pdf

Millaista realistista kellotaajuuden nousua on lupa odottaa?

Edit: ilmeisesti linkit ei enää toimi (tabletilla atm ja noi pdf:t ei tällä pelitä)

Tuossa kuitenkin kuva:


oajvimprrw3z.png
 
Viimeksi muokattu:
Zenin nextgeniä ajatellen, mitä mieltä porukka on tästä:

Globalfoundries "uhoaa" että tuleva 7nm prosessi tulisi olemaan 5GHz nopeuksille optimoitu: ...
...Millaista realistista kellotaajuuden nousua on lupa odottaa?

Ei kai tuo vielä seuraaviin zen+:siin ennätä? Niidenhän kai piti tulla melko pian ensivuoden puolella, jos en väärin muista:btooth:

Eiköhän tuolla prosessilla päästäisi jo 4,5GHz+ luokkaan, mikäli on jo käytössä seuraavissa zeneissä. Tuskin niin optimistisesti GF uutisoi, ettei siihen pystyisi. 5Ghz tosin tuntuu hieman utopialta 8 corelle ainakin :think:
 
Zenin nextgeniä ajatellen, mitä mieltä porukka on tästä:

Globalfoundries "uhoaa" että tuleva 7nm prosessi tulisi olemaan 5GHz nopeuksille optimoitu:

https://www.globalfoundries.com/sites/default/files/product-briefs/7lp-product-brief.pdf

Kun taas nykyinen prosessin alue on 3GHz

https://www.globalfoundries.com/sites/default/files/product-briefs/product-brief-14lpp.pdf

Millaista realistista kellotaajuuden nousua on lupa odottaa?

Edit: ilmeisesti linkit ei enää toimi (tabletilla atm ja noi pdf:t ei tällä pelitä)

Tuossa kuitenkin kuva:


oajvimprrw3z.png

Ottamatta kantaa näiden luotettavuuteen, voidaan todeta että nykyinen 14LPP tosiaan on aika optimaalinen tuolla 3GHz alueella. Harvat Ryzenit kulkee 4GHz ja vain muutamat yksilöt yltää yli 4.2GHz kestävillä jännitteillä. Jos tuo 5GHz toteutuisi ja max kellotukset olisi 5.5GHz+ niin se olisi kyllä aivan mieletön hyppäys nykyiseen. Pelkästään prossu joka boostailisi 5.5GHz yhden/kahden säikeen osalta olisi aika kovaa valuuttaa.

Jotenkin en vain jaksa uskoa että olisi noin kovaa nousua tulossa. Jos on, niin kyllä kelpaa. :D
 

Statistiikka

Viestiketjuista
258 402
Viestejä
4 489 882
Jäsenet
74 154
Uusin jäsen
Almedin

Hinta.fi

Back
Ylös Bottom