Video: AMD Ryzen with Radeon Vega -prosessoreiden ensituntumat

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Vaatisi myös niiden johtojen vetämisen paketoinnissa.
...
Tuo kai se merkittävin seikka on kun pääosa Ravenriidgeistä tulllaan kumminkin myymään merkkikokoonpanoissa (sekä kannettava että pöytäkone) niin että niiden ostajilla ei ole aikomustakan lisätä siihen koneeseen yhtään mitään (ei edes näytönohjainta) niin AMD:n on järkevää käyttää tuo kustannusten säästö hyväksi koska AMD kilpaile niissä merkkikone diileissä suoraan Intelin prosessoreja vastaan ja niissä diileissä hinta merkkaa enempi kuin se että onko lopullinen kone riittävänhyvä pelaamiseen (Ravenridge) vai ei (Intel).
 
...
Kysymys onkin nimenomaan ymmärtämättömyydestä , kuten @Kaotik viestissään ¤83 totesi ; on olemassa vain yksi Raven joka on mobiiliversio
Ei HBM tai HBM2 kytköksiä
Juuri niin kyse on ymmärtämättömyydestä kun ei ole olemassa mitään "Raven" CPU:ta tai "Rave" GPU:ta tai "Rave" Apua se Raven yksin ei merkaa mitään liityen AMD:hen, se Rave on Engalantia ja Suomeksi käännettynä se on Korppi.

Niin kyllä on olemassa yksi Ravenridge josta on sekä mobiili että työpäytä versiota sen mukaan aivan samoin kuin Intelilläkin on yhdesta ja samasta prosesorista sekä mobiili että työpöytäversioita kumallakin valmistajalla erot sen mobiili ja työtpöytäversion välillä on sama eli mobiiliversioiksi menee sellaisia prosessoriyksiköitä jotka tarvii vähempi vollteja joten ne kulutta vähempi Wattaja ja siten tarvii vähempi jäähdytystä ja pärjää pienemmällä akulla minkälisäksi niitä mobiiliversiota ei koskaa ajeta yhtäkorkeilla kelloilla kuin työpöytäversioita.


Sitä minä en tajua että miten sinä tästä että on vain yksi Ravenridge voit hypätä siihen päätelmään että Raveridgessä ei ole Vega GPU ydintä minä en tajua, kun kaikki linkkaamasi lähteet sanoo että Ravenridgessä on Vega GPU ydin tuosta voi vetää vain sen johtopäätöksen että sinulla on joku kumma salaliittoteoria sen suhteen että kaikkilähteet valehtelevat sinulle silloin kun ne sanovat että Raveridgessä on Vega GPU ydin.


Se että sinä yrität suurentamanttomasta ydinkuvasta tihrustella että missähän tässä on "erillinen PCIE ohjain" tajuamatta että se on käytännössä mahdotonta kertoo ymmärryksestäsi kun se PCIE ohjain osa on fyysisesti niin pieni että ei sitä noista kuvista voi erottaa täysin erillisenä (sen voi erotta milläalueella on IO:ta mutta sitä mikä siitä IO:sta on nimeomaan PCIE väyliä on mahdoton noista kuvista erottaa).


Tässä PCI väylämäärässä aiheutta sekaannusta se etä AMD puhuu siitä mitä väyliä tulee siitä prosessorista fyysisesti ulos mutta Intel tykkää puhua siitä väylämäärästä joka on prosessorilla ja piirisarjalla yhteensä (koska suoraan Intel prosessoreista tulee väyliä todellisuudessa suhteellisestivähän tämä on omiaa hämärtämään todellisuuskuvaa).

8:aa ajattelin, kiireessä kirjoitin 4, Mutta joka tapauksessa 8 PCIe linjaa ei sekään veisi mainittavasti tilaa sieltä piisirulta.

1151 on nimenomaan halppisalusta, aivan tarkalleen, siksi myös AM4 on (siinä on niin vähän enemmän, että se ei nosta sitä pois siltä alueelta, VARSINKIN tuon prossun kanssa.)
...
Tämä liittyy juuri siihen että AMD ja Intel puhuu toistensa ohi silloin kun ne puhuu prosessorin tukemista väylistä kun Intel niputtaa puheeseensa myös sen prosessorille tarkoitetun piirisarja väylät.
 
Viimeksi muokattu:
AM4 läpyskä: siinä on ne johdot jokatapauksessa, joten tuo on silkka tekosyy.
...
Ei ole kun se ei ole AMD:n kuluerä mitä vetoja se OEM valmistaja haluaa sille AM4 emolleen AMD:n kuluerä on se mitä vetoja on sen prosessori paketoinnissa eli puhut täysin asian vierestä.

... GPU vie myöskin tilaa paljon sieltä piisirulta, joten silläkin on tilaa niille johdotuksille, joten sekään ei ole, kuin tekosyy.. ...
GPU:n johdotukset ei ole siinä prosessorin paketoinissa vaan sillä piisirulla jolla ne CPU ja GPU ytimetkin on ja piisirulla johdotuksien vaatima tila/kustannus on sen verran pieni että niiden olemassolo tai olemattomuus ei ole niin iso kustannuserä eli se onko niitä vetoja piisirulla vai ei ratkaistaan muilla perusteilla ts mitä tuotteita siitä piisirusta on tarkoitus tehdä ratkaise ne vedot mitä on sillä piisirulla eli puhut täysin asian vierestä.
 
Viimeksi muokattu:
...

Höpöphöpö, kun otat jimmssin sivut ja katsot, mitä siellä on, niin on täysin selkiö, että tuollaisia erittäin marginaalilaitteita ei toinna edes mainita. 1151:seen saa yhden näyttiksen täysin ongelmitta kiinni, eikä edes nopeaa M2 levyä sen lisäksi ilman potentiaalista pullonkaulaa, joten se on halppisalusta i/o on hyvin rajoitettu ja samoin muistikaista 2kpl DDR4 kanavaa GPU+DMA+6 HT ydintä on erittäin rajoitettu. 20xx:t ovat sitten kalliimpia alustoja ja sitten on palvelimille omansa ja nuo sulautettuihin tms tarkoitetut räpellykset, joita ei juuri sellaisenaan edes myydä missään.

Elitismi on hieno sana, mutta se ei muuta 1151:stä mihinkään halppisalustasta.
Tuon sinun logiikasimukaan Intelin ja AMD:n HED alustat on keskihintaisia kuluttaja-alustoja mielestäni tuollainen päätelmä on vailla pohjaa ja luettavissa täysin vain ja ainoastaan elitistiseksi näkökulmaksi.

Niin muuten niitä Intelin oikeita halppisalustoja on Jimmsin sivulla vaikka kuinkapaljon niissä on integroitu CPU (ja usein myös läppäri tai OEM päytäkone paketointin sen alustan ympärillä).

AMD:llä olisi nyt semihyvä tilanne demota heterogenous computingiä noilla prossu+GPU yhdistelmillä, jos ne on tehty oikeasti järkevästi. Veikkaan vain, että mitään ei kuulu, TS AMD möhlii homman ja hyvä tilaisuus valuu viemäriin..
Muna/kana ongelma ei ole AMD:n syy sillä tuo APU:n sisäinen heterogenous computing olisi hyvin järkevä ratkaisu moneen käyttötilanteeseen mutta jos/kun Ravenridge on ensimmäinen tuote joka siihen oikeasti pystyisi ei tietenkään voi olla olemassa valmiiksi merkittävää määrää sovelluksia jotka sitä hyödyntäisi (AMD:n muna/kana ongelmaa ei yhtään helpota se että softatuen yleistymistä blokkaa tehokkaasti Nvidian hallitseva asema suljetuilla Cuda ja Physx toteutuksillaam kun Nvidian itresseissä ei ole tukea kunnolla AMD:n heterogenous computingia).

Hommaa auttaisi jos Intel olisi suunitellut prosessorinsa siitä näkökulmasta että niiden integroitu GPU voisi olla muussakäytössä silloin kun kone käyttää erillistä GPU:ta näytökuvan luomiseen mutta Intel ei ole tehnyt mitään tämänsuuntaisen tuen ylläpitämiseksi päinvastoin Intel panostaa siihen että iGPU suljetaan ja sen Wattiresrvi käytetään CPU ytimien hyväksi, mutta uskon että tähän tulee muutos nyt kun Kudori on Intelillä koska Kudori varmasti tähtää siihen että se Intel prosessorin integroitu GPU olisi muutakin kuin pakollinen ylimääräinen härpäke joka prosessorissa on pakko-olla että sen saa myydyksi.
 
Viimeksi muokattu:
Ravenissa on (ehkä) GPUssä 2MB l2 muistia
Onko toi kammoissa vai sirussa
L2 kammoisa vai sirussa kysymys kertoo suoraa että et ensikään tiedä/ymmäärrä mitä L2 tarkoittaa.

Aina kun puhutaa L1 tai L2 välimuistista (oli se sitten CPU:ssa tai GPU:ssa) se on siinä sirussa koska L1 ja L2 viittaa aina sisäiseen välimuistiin.

L3 on pikkaisen eritilanteessa kun menneisyydessä sillä viitattiin prosessorin koteloinnissa tai prosessorin piirilevyllä olevaan L3 muistipiiriin mutta nykyisissä CPU:ssa ja GPU:ssa myös L3 on aina sillä sirulla.
 
...
(Ja Summit Ridgellä taas muistin kellotaajuuden nosto nopeuttaa huomattavasti pääasiassa sen takia, että siinä muistin kellotajuuden kasvatus pienentää myös toisen puolen L3-välimuistien viivettä, ei sotketa sitä nyt tähän)
...
Tai sotketaan sen verran että haluaisin nähdä Raveridge prosessoriartikkelissa testattavan tätä että onko Raveridgessä muutosta tämän L3:n ja keskusmuistin sidonnaisuuden suhteen verrattuna aikaisempii Ryzen prosessoreihin, kun tuo on merkittävä heikkous aikaisemmissa Ryzeneissä koska sen takia Ryzen ottaa keskimääräistä suuremman hitin tehoonsa silloin kun siiinä käytetään halvempia ja hitaampia keskusmuisteja ts tällä on merkitystä sillloin kun ostaja harkitsee edullisemman pään Ravenridge OEM pöytäkonetta tai varsinkin läppäriä (kun niistä ei varmastikaan löydy 3200 muisteja).

Varsinkin edullisenpään litteissä läppäreissä hitaat keskusmuistit voi olla ongelma kun ne voi olla tilan ja kustannussäästö syistä juotettuna suoraan emolle eli et voi jälkikäteen päivitää niitä muisteja nopeammiksi vaikka tahtoisit.

Ts en tarkoita sitä että testattaisiin miten hitammat keskusmuitit vaikutaa pelitehoon kun se kytkös on päivänselvä vaan haluan että testattaisiin että miten ne vaikutta juuri tuohon L3 viiveeseen koska sillä on merkitystä silloinkin kun Ravenridgen yhteydessä käytetään erillistä näytönohjainta tai kun Ravenridgellä tehdään jotain muuta kuin GPU:ta hyödyntävää.
 
Viimeksi muokattu:
L2 kammoisa vai sirussa kysymys kertoo suoraa että et ensikään tiedä/ymmäärrä mitä L2 tarkoittaa.

Aina kun puhutaa L1 tai L2 välimuistista (oli se sitten CPU:ssa tai GPU:ssa) se on siinä sirussa koska L1 ja L2 viittaa aina sisäiseen välimuistiin.

L3 on pikkaisen eritilanteessa kun menneisyydessä sillä viitattiin prosessorin koteloinnissa tai prosessorin piirilevyllä olevaan L3 muistipiiriin mutta nykyisissä CPU:ssa ja GPU:ssa myös L3 on aina sillä sirulla.

Ei vaan "sisäisin" välimuisti on L1, sitä "ulompi" on L2 jne. Siksi L2 välimuisti voi ihan mainiosti olla prosessorin ulkopuolella.

Esim. Pentium aikakaudella L2 välimuisti oli emolevyllä. K6-3 ja Pentium II toivat sen emolevyltä lähemmäs prosessoria ja itse asiassa K6-3:n tapauksessa emolevyn välimuistista tuli L3.
 
Ei vaan "sisäisin" välimuisti on L1, sitä "ulompi" on L2 jne. Siksi L2 välimuisti voi ihan mainiosti olla prosessorin ulkopuolella.

Esim. Pentium aikakaudella L2 välimuisti oli emolevyllä. K6-3 ja Pentium II toivat sen emolevyltä lähemmäs prosessoria ja itse asiassa K6-3:n tapauksessa emolevyn välimuistista tuli L3.
Ota huomion millä tasolla asiasta puhuin en puhunut siitä miten ne toimii vaan siitä missä ne fyysisesti nykyään sijaitsee.

Enkä nähnyt syytä perääntyä historiassa niin kaus että oltaisiin ajasssa ennen kysyjän todennäköistä syntymää (kun oma prosessorien käyttöhistoria yltää niin kaus että se L1 muistikin oli yhdessä välissä suuri uutuus jota ei aikaisemmassa prosessorissa ollut ollenkaan (ei ulkoisena eikä sisäisenä).


(jumankauta että tää prossu on nopee kun sen taaajuus on 4,7 kilohertziä (siis ei Gigahertziä eikä edes Megahertziä vaan 4,7 khz)

(jaa että tämän uuden prosessorin päälle täytyy laittaa alumiinisiili )

(jaa että tällä uudella prosessorilla sen alumiinisiilen ja prosessorin välissä pitäisi olla jotain ihme tahnaa (heetkonen kun mä laitoin tahnaa tuon siilinalle niin tämän prosessorinhan pystyy ylikellottamaan :geek:)

(no seuraavaksi olenkin sitten tilaamassa suoraan Japanista siiliä uuden prosessorin ylikellotusta varten :D
(kauppiksessa sattui vierailemaan yksi yrittäjä jolla oli vienti/tuonti bisnes suoraan Japaniin se että yrityksellä oli ulkomaankauppaa Japaniin oli silloin vielä harvinaista (jup Internet ei ollut vielä olemassa nykyisessä mielessä joten ei ollut mitään mahiksia että pystyisin itse suoraan tilaamaan jotain Japanista)))
 
Viimeksi muokattu:
[offtopic]



CPUlla pääasiassa muistin VIIVE, ei kaistanleveys tai samanaikaisten accessien määrä. Mikään suurempi muistikanavamäärä ei auta siihen viiveeseen yhtään.

(Ja Summit Ridgellä taas muistin kellotaajuuden nosto nopeuttaa huomattavasti pääasiassa sen takia, että siinä muistin kellotajuuden kasvatus pienentää myös toisen puolen L3-välimuistien viivettä, ei sotketa sitä nyt tähän)



Intel teki sen jotta sai kaistaa nopeammalle näyttikselle. Uusissa intelin prossuissa sama ongelma on ratkaistu eri tavalla, laittamalla HBM-muistilla varustettu erillisnäyttis samaan pakettiin CPUn kanssa.

Ja Crystall Well nopeutti hiukan myös CPUta koska se tarjosi 64 tai 128 megaa L3L4-kakkua jolla oli paljon nopeampi viive. Ei pääasiallisesti sen kaistan takia.

edit: hups, kirjoitin vahingossa alun perin "L3"- kun piti kirjoittaa "L4"

[/offtopic]

Siinä vaiheessa, kun haut jonoutuvat, niin tietenkin myös se kaista vaikuttaa. Jos muistihakuun menee vaikka "tunti", koska kaista on pieni ja puolentunnin päästä ekan haun aloittamisesta tulee toinen haku, niin se joutuu odottamaan ensin jo sen puolituntia, ennenkuin pääsee edes alottamaan.

Jos taas kaista on iso, niin eka haku on jo valmis, kun seuraava tulee, jolloin se pääseekin aloittamaan heti.

----------
Niin... Tuo L4 auttoi myös prossua, eli muistisysteemin nopeutus auttoi selkeästikin asiaa, eli musitisysteemissä on yksi selkeä pullonkaula.

Ja jos AMD:kin tuplasi nyt L2:n , niin selkeästikin on haluttu parantaa juurikin tuota muistisysteemin pullonkaulaa. Pari DDR4 muistikanavaa nyt vain on onnettoman vähän suurelle coremäärälle tai tuollaisella cpu+GPU yhdistelmälle.

Jos pelikonsoleista nähtiin, miten jo todella umpipaska prossu + ei mitenkään hirmunopea GPU kärsi nimenomaan muistikaistarajoituksesta todella rajusti. Myöskään nopea cache alue ei vain pelastanut tilannetta (vaikka jonkinverran auttoikin).

Lisäksi on hieman yltiöoptimistista mielestäni olettaa, että eri corejen prosessit sattuvat käsittelemään niin pientä muistialuetta, että ne mahtuvat noihin nykyistenkään kokoisiin cachemuisteihin. Ohjelmien viemä kokonaismuistimäärä on kasvanut kuitenkin kokoajan,. eikä ne yleensä varaa vain sitä muistia ihan vain koristeeksi, vaan sitä myös välillä luetaan. Ohjelmat kutenkin yleensä ovat vähintään satoja megoja. Jopa jokin niinkin simppeli,. kuin selain vie helposti esim 200 megaa.. (tällähetkellä selainten prosessit vievät esim gigatavukaupalla, vaikka sieltä on karsittu kaikki mainoshöttö pois).
------------------------------

Jos joku tekee jonkin uuden systeemin, eikä käytä sitä mihinkään, niin riski sille, että kukaan muukaan ei käytä sitä mihinkään kasvaa suureksi. Siksi AMD:n pitäisi nyt tehdä ehdottomasti GPU computing demoja, jotta kaikki näkisivät, miten paljon GPU voi auttaa laskennassa eri tapauksissa. Luulisi, että esim kuvankäsittelyohjelmiin ym voitaisiin tehdä tuolla kiihdytyksiä.
 
Siinä vaiheessa, kun haut jonoutuvat, niin tietenkin myös se kaista vaikuttaa.

... mutta tämä vaan on normaalilla CPU-workloadeilla erittäin harvinainen tilanne.

Jos muistihakuun menee vaikka "tunti", koska kaista on pieni ja puolentunnin päästä ekan haun aloittamisesta tulee toinen haku, niin se joutuu odottamaan ensin jo sen puolituntia, ennenkuin pääsee edes alottamaan.

Jos taas kaista on iso, niin eka haku on jo valmis, kun seuraava tulee, jolloin se pääseekin aloittamaan heti.

Väärin.

Muisti on liukuhihnoitettu.

Seuraavan muistiaccessin voi aloittaa siinä vaiheessa kun edellinen on vielä tulossa.

Yhden 64-tavuisen välimuistilinjan siirtäminen 64-bittisellä muistikanavalla vaatii 8 peräkkäistä siirtoa. Tarkoittaa siis että jollain DDR4-2666lla yhden välimuistilinjan siirtämiseen menee 3ns aikaa, tai siis aina 3ns välein pystytään SIIRTÄMÄÄN uusi välimuistinlinja. Mutta sen muistin hakuaika kokonaisuudessaan on luokkaa parikymmentä nanosekuntia(riippuen hyvin paljon aika monesta eri seikasta, ), siirto voidaan aloittaa vasta parikymmntä nanosekuntia sen jälkeen kun muistiaccessi aloitetaan.

Hetkellä X tulee muistiaccessi
Hetkellä X+3 tulee toinen muistiaccessi (joka osuu eri välimuistilijaan)
Hetkellä X+6 tulee kolmas muistiaccessi (joka osuu eri välimuistilinjaan)
...

Hetkellä X+24 ensimmäisen muistiaccessi saadaan tehtyä
Hetkellä X+27 toinen muistiaccessi saadan tehtyä
Hetkellä X+30 kolmas muistiaccessi saadaan tehtyä

Ja tämä tehdään vielä molemmille muistikanaville rinnakkain.

Siellä pitää olla ihan järkyttävä määrä yhtäaikaisia L3-missejä menossa, että edes kaksikanavainen DDR4 saadaan saturoitua.

Niin... Tuo L4 auttoi myös prossua, eli muistisysteemin nopeutus auttoi selkeästikin asiaa, eli musitisysteemissä on yksi selkeä pullonkaula.

JOSSAIN on aina pullonkaula.

Ja kun pullonkaula on VIIVEESSÄ eikä kaistanleveydessä, ei sen kaistanleveyden kavattaminen auta käytännössä yhtään mitään.

Ja jos AMD:kin tuplasi nyt L2:n , niin selkeästikin on haluttu parantaa juurikin tuota muistisysteemin pullonkaulaa.

Mistä Ihmeen L2n tuplaamisesta oikein höpiset? Raven Ridgessä on ihan yhtä paljon L2sta kuin Summit Ridgessä, ja Zenissä on ihan yhtä paljon L2-kakkua/ydin kuin Excavatorissa per "ydin" (mutta puolet vähemmän kuin Excavatorissa/säie, ja puolet vähemmän kuin Bulldozerissa per "ydin", neljäsosa siitä mitä bulldozerissa/säie.)

Ja L3n määrän/ydin AMD nimenomaan PUOLITTI Summit Ridgestä Raven Ridgeen. Koska Raven Ridge on työpöytä- ja läppäriprossu, ei serveriprossu. Työpöytäworkloadeilla pienempikin L3 on ihan riittävä, mutta koska Zeppelin-piiriä käytetään myös EPYCeissä, niihin tarvi isoa L3-välimuistia

Pari DDR4 muistikanavaa nyt vain on onnettoman vähän suurelle coremäärälle tai tuollaisella cpu+GPU yhdistelmälle.

Ei, vaan se parikin DDR4-muistikanavaa on hyvin vaikea saada saturoitua millään normaalilla CPU-workloadilla vaikka ytimiä olisi enemmänkin.

Tehokas GPU sitten tarvii paljon enemmän sitä kaistaa. Mutta joku 4-kanavainen DDR4-muistikanavaa olisi silti aivan liian vähän kunnolla tehokkaan näyttiksen tekemiseen, ihan laastaria avomurtumaan.

Että ne tehokkaat GPUt vaatii silti jotain muuta, nopeampaa muistia, jolloin se nelikanavainenkin DDR4 olisi niille täysin turhaa, kun sillä on jo nopeampi oma muistinsa.

Eli olet hirveällä vänkäämisellä vaatimassa asiaa, joka työpöytä-CPU-käytössä "korjaa" käytännössä olemattoman pullonkaulan, mutta joka olisi silti tehokkaalle GPUlle aivan liian hidas ettei sitä voisi käyttää.

Tai siis haukkumassa alustat huonoksi, koska ne ei tee sinun haluamaasi
väärää ja hyvin turhaa "korjausta" hyvin pieneen muka-pullonkaulaan.

Jos pelikonsoleista nähtiin, miten jo todella umpipaska prossu + ei mitenkään hirmunopea GPU kärsi nimenomaan muistikaistarajoituksesta todella rajusti. Myöskään nopea cache alue ei vain pelastanut tilannetta (vaikka jonkinverran auttoikin).

öö? Miten se niistä muka nähtiin?

Ja jos tämä pitää paikkaansa, tällä nimenomaan todistetaan edellistä pointtiani. Se tehokas GPU tarvii enemmän kaistaa kuin mikään nelikanavainenkaan DDR4 pystyy tarjoamaan, joten sille pitää olla jotain nopeampaa muistia, jolloin sen normaalin DRAMin kaistanleveyden tuplaaminen on turhaa, kun sitä ei sille tehokkaalle intergroidulle näyttikselle kuitenkaan käytetä.

Lisäksi on hieman yltiöoptimistista mielestäni olettaa, että eri corejen prosessit sattuvat käsittelemään niin pientä muistialuetta, että ne mahtuvat noihin nykyistenkään kokoisiin cachemuisteihin. Ohjelmien viemä kokonaismuistimäärä on kasvanut kuitenkin kokoajan,. eikä ne yleensä varaa vain sitä muistia ihan vain koristeeksi, vaan sitä myös välillä luetaan.
Ohjelmat kutenkin yleensä ovat vähintään satoja megoja. Jopa jokin niinkin simppeli,. kuin selain vie helposti esim 200 megaa.. (tällähetkellä selainten prosessit vievät esim gigatavukaupalla, vaikka sieltä on karsittu kaikki mainoshöttö pois).

... mutta kun niitä huteja tulee, niitä tulee tarpeeksi harvakseltaan, että se muistikaista saturoituu erittäin harvoin. Se, mikä ratkaisee, on se muistin VIIVE, ei kaistanleveys. Koska se viive ratkaise, kauanko se ohjelma joutuu sitä dataa odottelemaan ennen kuin se pääsee jatkamaan taas toimintaansa.

Ja silloinkin kun tulee pari peräkkäistä accessia peräkkäisiin osoitteisiin muistiin, jota ei alunperin ollut L3-välimuistissa, välimuisti hoitaa homman kotiin: Vain ekasta seuraa L3-miss, kerralla kun ladataan koko välimuistilinja niin seuraavilla, viereiseen osoitteeseen menevillä accesseilla välimuisti jo osuu.
 
Viimeksi muokattu:
... mutta tämä vaan on normaalilla CPU-workloadeilla erittäin harvinainen tilanne.



Väärin.

Muisti on liukuhihnoitettu.

Seuraavan muistiaccessin voi aloittaa siinä vaiheessa kun edellinen on vielä tulossa.

Yhden 64-tavuisen välimuistilinjan siirtäminen 64-bittisellä muistikanavalla vaatii 8 peräkkäistä siirtoa. Tarkoittaa siis että jollain DDR4-2666lla yhden välimuistilinjan siirtämiseen menee 3ns aikaa, tai siis aina 3ns välein pystytään SIIRTÄMÄÄN uusi välimuistinlinja. Mutta sen muistin hakuaika kokonaisuudessaan on luokkaa parikymmentä nanosekuntia(riippuen hyvin paljon aika monesta eri seikasta, ), siirto voidaan aloittaa vasta parikymmntä nanosekuntia sen jälkeen kun muistiaccessi aloitetaan.

Hetkellä X tulee muistiaccessi
Hetkellä X+3 tulee toinen muistiaccessi (joka osuu eri välimuistilijaan)
Hetkellä X+6 tulee kolmas muistiaccessi (joka osuu eri välimuistilinjaan)
...

Hetkellä X+24 ensimmäisen muistiaccessi saadaan tehtyä
Hetkellä X+27 toinen muistiaccessi saadan tehtyä
Hetkellä X+30 kolmas muistiaccessi saadaan tehtyä

Ja tämä tehdään vielä molemmille muistikanaville rinnakkain.

Siellä pitää olla ihan järkyttävä määrä yhtäaikaisia L3-missejä menossa, että edes kaksikanavainen DDR4 saadaan saturoitua.



JOSSAIN on aina pullonkaula.

Ja kun pullonkaula on VIIVEESSÄ eikä kaistanleveydessä, ei sen kaistanleveyden kavattaminen auta käytännössä yhtään mitään.



Mistä Ihmeen L2n tuplaamisesta oikein höpiset? Raven Ridgessä on ihan yhtä paljon L2sta kuin Summit Ridgessä, ja Zenissä on ihan yhtä paljon L2-kakkua/ydin kuin Excavatorissa per "ydin" (mutta puolet vähemmän kuin Excavatorissa/säie, ja puolet vähemmän kuin Bulldozerissa per "ydin", neljäsosa siitä mitä bulldozerissa/säie.)

Ja L3n määrän/ydin AMD nimenomaan PUOLITTI Summit Ridgestä Raven Ridgeen. Koska Raven Ridge on työpöytä- ja läppäriprossu, ei serveriprossu. Työpöytäworkloadeilla pienempikin L3 on ihan riittävä, mutta koska Zeppelin-piiriä käytetään myös EPYCeissä, niihin tarvi isoa L3-välimuistia



Ei, vaan se parikin DDR4-muistikanavaa on hyvin vaikea saada saturoitua millään normaalilla CPU-workloadilla vaikka ytimiä olisi enemmänkin.

Tehokas GPU sitten tarvii paljon enemmän sitä kaistaa. Mutta joku 4-kanavainen DDR4-muistikanavaa olisi silti aivan liian vähän kunnolla tehokkaan näyttiksen tekemiseen, ihan laastaria avomurtumaan.

Että ne tehokkaat GPUt vaatii silti jotain muuta, nopeampaa muistia, jolloin se nelikanavainenkin DDR4 olisi niille täysin turhaa, kun sillä on jo nopeampi oma muistinsa.

Eli olet hirveällä vänkäämisellä vaatimassa asiaa, joka työpöytä-CPU-käytössä "korjaa" käytännössä olemattoman pullonkaulan, mutta joka olisi silti tehokkaalle GPUlle aivan liian hidas ettei sitä voisi käyttää.

Tai siis haukkumassa alustat huonoksi, koska ne ei tee sinun haluamaasi
väärää ja hyvin turhaa "korjausta" hyvin pieneen muka-pullonkaulaan.



öö? Miten se niistä muka nähtiin?

Ja jos tämä pitää paikkaansa, tällä nimenomaan todistetaan edellistä pointtiani. Se tehokas GPU tarvii enemmän kaistaa kuin mikään nelikanavainenkaan DDR4 pystyy tarjoamaan, joten sille pitää olla jotain nopeampaa muistia, jolloin sen normaalin DRAMin kaistanleveyden tuplaaminen on turhaa, kun sitä ei sille tehokkaalle intergroidulle näyttikselle kuitenkaan käytetä.



... mutta kun niitä huteja tulee, niitä tulee tarpeeksi harvakseltaan, että se muistikaista saturoituu erittäin harvoin. Se, mikä ratkaisee, on se muistin VIIVE, ei kaistanleveys. Koska se viive ratkaise, kauanko se ohjelma joutuu sitä dataa odottelemaan ennen kuin se pääsee jatkamaan taas toimintaansa.

Ja silloinkin kun tulee pari peräkkäistä accessia peräkkäisiin osoitteisiin muistiin, jota ei alunperin ollut L3-välimuistissa, välimuisti hoitaa homman kotiin: Vain ekasta seuraa L3-miss, kerralla kun ladataan koko välimuistilinja niin seuraavilla, viereiseen osoitteeseen menevillä accesseilla välimuisti jo osuu.

Eli siis kokoajan paisuvien ohjelmien toimesta luetaan montaa asiaa yhtäaikaa, kun threadien määrä lisääntyy nykyprossuissa kookoajan, eli siis lisäkaistasta olisi nimenomaan hyötyä, enenevässämäärin.

Selkeästikin jo melkoisen tehoton GPU (joka esim Intelin Iriksessä on) hyötyy todella reippaasti siitä lisäkaistasta, kuten kaikki testit noilla prossuilla osoittivat.
 

Voisitko pelkän megaquottaamisen sijasta yrittää LUKEA sen viestini. (ja ymmärtää sen) ?


Tässä muuten vielä vähän benchmarkkia siitä, paljonko CPU hyötyy lisäkaistasta. Tässä 6-ydin-prossu.

Quad-channel RAM vs. dual-channel RAM: The shocking truth about their performance

Pelikäytössä tai työpöytäsoftissa ei siis MITÄÄN väliä, noissa pelitesteissä dual-channel oli jopa keskimäärin NOPEAMPI.

Ainoa, missä quad channel oli joitain prosentteja nopeampi oli pakkaustestit.


Että kaksikanavaiset AM4 ja LGA11*-alustat on oikein päteviä keskitason alustoja.
 
Viimeksi muokattu:
Voisitko pelkän megaquottaamisen sijasta yrittää LUKEA sen viestini. (ja ymmärtää sen) ?


Tässä muuten vielä vähän benchmarkkia siitä, paljonko CPU hyötyy lisäkaistasta. Tässä 6-ydin-prossu.

Quad-channel RAM vs. dual-channel RAM: The shocking truth about their performance

Pelikäytössä tai työpöytäsoftissa ei siis MITÄÄN väliä, noissa pelitesteissä dual-channel oli jopa keskimäärin NOPEAMPI.

Ainoa, missä quad channel oli joitain prosentteja nopeampi oli pakkaustestit.


Että kaksikanavaiset AM4 ja LGA11*-alustat on oikein päteviä keskitason alustoja.

Entäs esim 8 ydin prossulla, kun on joku tilaanne, jossa ajetaan vähintään kahta eri softaa yhtäaikaa. Esim säikeistyvän pelin pelaaminen ja prossulla striimaaminen siinä samalla.

Itse en jaa noita kuluttaja-alustoja, muutakuin kahteen luokkaan ja itsellä nuo 115X:t ja AM4 on menneet aina siihen alimpaan luokkaan.
 
Entäs esim 8 ydin prossulla, kun on joku tilaanne, jossa ajetaan vähintään kahta eri softaa yhtäaikaa. Esim säikeistyvän pelin pelaaminen ja prossulla striimaaminen siinä samalla.

Live-stremin pakkaamisen kaistantarve CPUn ja muistin välillä on käytännössä
* Lopputulos kerran ulos (kaistantarve nykyisillä bitrateilla luokkaa kymmenestuhannesosa koko kaksikanavaisen muistin kaistasta, ei siis tunnu yhtään missään) sekä
* Pakkaamaton data n. kolmeen kertaan. (tallennus GPUlta normaaliin RAM-muistiin, ja lataus sekä itse framen pakkaamiseen että seuraavalle framelle motion compensationia varten). L3-kakun kapasiteetti ei ihan riitä että voisi pitää kahta framea koko ajan siellä joten pitää käydä muistin kautta. Sen sijaan L2-kakun kapasiteetti riittää helposti siihen, että kerrallaan pakattava blokki voi pysyä siellä, joten ei yleensä pitäisi tarvia enempää kuin nuo 3 accesssia.

Kaistantarve yhteensä kaikista fullHD-resolla 60 FPSllä luokkaa 1.5 GB/s. Eli n. kolmaskymmenesosa kaksikanavaisen muistin kaistasta.

Jotkut pakkausformaatit voi ehkä tehdä monimutkaisempaa motion compensationia(kahden framen välillä) ja tarvia neljännen accessin, n. 2GB/S, eli silti alle kahdeskymmenesosa kaksikanavaisen muistin kaistasta

Että ei, mikään pelin streamaus ei tarvi mitään nelikanavamuistia.

Itse en jaa noita kuluttaja-alustoja, muutakuin kahteen luokkaan ja itsellä nuo 115X:t ja AM4 on menneet aina siihen alimpaan luokkaan.

Tuo luokittelusi kertoo lähinnä siitä, kuinka pihalla niistä olet, ei mitään niistä itse alustoista.

Järkevä ihminen myöntäisi tässä vaiheessa, että on luokitellut asioita tyhmästi, ja korjaisi luokitteluaan. Mielipiteet kannattaa muodostaa faktojen perusteella, eikä yrittää keksiä omia mutujuttuja jotka tukee ensin perusteetta/rikkinäisin perustein muodostettuja mielipiteitä.
 
Viimeksi muokattu:
Live-stremin pakkaamisen kaistantarve CPUn ja muistin välillä on käytännössä
* Lopputulos kerran ulos (kaistantarve nykyisillä bitrateilla luokkaa kymmenestuhannesosa koko kaksikanavaisen muistin kaistasta, ei siis tunnu yhtään missään) sekä
* Pakkaamaton data n. kolmeen kertaan. (tallennus GPUlta normaaliin RAM-muistiin, ja lataus sekä itse framen pakkaamiseen että seuraavalle framelle motion compensationia varten). L3-kakun kapasiteetti ei ihan riitä että voisi pitää kahta framea koko ajan siellä joten pitää käydä muistin kautta. Sen sijaan L2-kakun kapasiteetti riittää helposti siihen, että kerrallaan pakattava blokki voi pysyä siellä, joten ei yleensä ptäisi tarvia enempää kuin nuo 3 accesssia.

Kaistantarve yhteensä kaikista fullHD-resolla 60 FPSllä luokkaa 1.5 GB/s. Eli n. kolmaskymmenesosa kaksikanavaisen muistin kaistasta.

Jotkut pakkausformaatit voi ehkä tehdä monimutkaisempaa motion compensationia(kahden framen välillä) ja tarvia neljännen accessin, n. 2GB/S, eli silti alle kahdeskymmenesosa kaksikanavaisen muistin kaistasta

Että ei, mikään pelin streamaus ei tarvi mitään nelikanavamuistia.



Tuo luokittelusi kertoo lähinnä siitä, kuinka pihalla niistä olet, ei mitään niistä itse alustoista.

Järkevä ihminen myöntäisi tässä vaiheessa, että on luokitellut asioita tyhmästi, ja korjaisi luokitteluaan. Mielipiteet kannattaa muodostaa faktojen perusteella, eikä yrittää keksiä omia mutujuttuja jotka tukee ensin perusteetta/rikkinäisin perustein muodostettuja mielipiteitä.

Harvoin päästään tuollaisiin laskettuihin teoreettisiin arvoihin käytännössä. Pelin aikana kun siellä on itse pelin threadit, nuo pakkausthreadit ja Nvidialle käsittääkseni edelleen näyttiksen ajuri käyttää myös prossua ihan jonkinverran. ja lisäksi kaikenlainen paske, joka tulee käyttisten ja muiden n kpl ajanmyötä taustasoftien mukana.

Tai sitten järkevä pitää asiat yksikertaisina ja ei käy luokittelemaan tuollaisia turhaan ties miten moneen lopkeroon. Noita kun on tarjolla esim Intelillä yleisesti nuo 2 vaihtoehtoa, josta sitten valitaan sen mukaan, tarvitseeko esim enemmän I/O:ta, kuin yhdelle näyttikselle ja jollekkin ei kovinkaan vaateliaalle pikkukortille tai tarvitseeko enemmän muistia , enemmän coreja prossuun jne jne..
 
Selkeästikin jo melkoisen tehoton GPU (joka esim Intelin Iriksessä on) hyötyy todella reippaasti siitä lisäkaistasta, kuten kaikki testit noilla prossuilla osoittivat.
GPU on vähän eri asia kuin CPU.
Grafiikan laskenta hyötyy suuresta muistin siirtokaistasta johtuen sen äärimmäisestä rinnakkaistuvuudesta.
Eli yhtä aikaa täytyy "toimittaa mahdollisimman paljon tavaraa."
Se äärimmäinen rinnaikkaisuus myös vähentää kokonaissuorituskyvyn riippuvuutta yksittäisten hakujen viiveistä.

Monessa asiassa hyvin sarjamuotoista laskentaa suorittava CPU taas vaatii alhaiseen latenssiin panostamista:
Vaikkei tarvittava datamäärä iso olisikaan, niin kaikki seisoo niin kauan kuin "paketti viipyy postin kyydissä".
Eikä siinä auta se "postin toimitus isommalla kuorma-autollakaan", jos toimitusaika ei parane.
Sen L4:n auttaminen myös CPU-suorituskyvyssä tuli juuri siitä, että tavallista suurempaan osaan muistin sisällöstä pääsi useammin käsiksi lyhyemmällä toimitusajalla kuin keskusmuistista/RAMista hakiessa.
Eli vähän kuin että kaupan omassa hyllyssä/varastossa tai tukkurin alueellisessa varastossa on enemmän tavaraa.
(toimitusaika lyhyempi kuin kaukaisemmasta/valmistajan varastosta)


Harvoin päästään tuollaisiin laskettuihin teoreettisiin arvoihin käytännössä. Pelin aikana kun siellä on itse pelin threadit, nuo pakkausthreadit ja Nvidialle käsittääkseni edelleen näyttiksen ajuri käyttää myös prossua ihan jonkinverran. ja lisäksi kaikenlainen paske, joka tulee käyttisten ja muiden n kpl ajanmyötä taustasoftien mukana.
Ja kovin harvoin siellä useampi niistä vaatii suurten datamäärien siirtämistä yhtä aikaa.
Pääosin ne ovat "pikkuasioita" joissa tarvitaan pientä datamäärää, mutta mieluiten mahdollisimman lyhyellä viiveellä että saa sen asian pois muiden samanlaisten pikkuasioiden tieltä.
 
Olisi hienoa, jos tulevassa testissä, tai erillisessä artikkelissa käytäisiin läpi myös Raven Ridgen ja yhteensopivien emolevyjen osalta videotoisto-ominaisuuksia ja mahdollisesti testejä. Aika moni näistä prosessoreista tulee päätymään kuitenkin htpc käyttöön, jolloin hyvillä ja ajan tasalla olevilla videotoisto-ominaisuuksilla on merkitystä.
 
Olisi hienoa, jos tulevassa testissä, tai erillisessä artikkelissa käytäisiin läpi myös Raven Ridgen ja yhteensopivien emolevyjen osalta videotoisto-ominaisuuksia ja mahdollisesti testejä. Aika moni näistä prosessoreista tulee päätymään kuitenkin htpc käyttöön, jolloin hyvillä ja ajan tasalla olevilla videotoisto-ominaisuuksilla on merkitystä.

Noissa testeissä olisi hyvä verrata Intel NUC kokoonpanoihin.
 
Olisi hienoa, jos tulevassa testissä, tai erillisessä artikkelissa käytäisiin läpi myös Raven Ridgen ja yhteensopivien emolevyjen osalta videotoisto-ominaisuuksia ja mahdollisesti testejä. Aika moni näistä prosessoreista tulee päätymään kuitenkin htpc käyttöön, jolloin hyvillä ja ajan tasalla olevilla videotoisto-ominaisuuksilla on merkitystä.

Tämä itseäkin etupäässä kiinnostaa. TV-tasossa huhkii wanha sotaratsu Llano joka kaipaa jo liimatehtaalle, pitäisi saada tilalle kaikki näköpiirissä olevat tarpeet kattava.

Guru3D:n revikassa oli lyhyt katsaus ominaisuuksiin ja suorituskykyyn, mutta testit kuitattiin toistamalla pari videota ja ottamalla screenshottiin CPU/GPU käyttöasteet. Lupaavalta vaikuttaa silti.
 
L2 kammoisa vai sirussa kysymys kertoo suoraa että et ensikään tiedä/ymmäärrä mitä L2 tarkoittaa.

Aina kun puhutaa L1 tai L2 välimuistista (oli se sitten CPU:ssa tai GPU:ssa) se on siinä sirussa koska L1 ja L2 viittaa aina sisäiseen välimuistiin.

L3 on pikkaisen eritilanteessa kun menneisyydessä sillä viitattiin prosessorin koteloinnissa tai prosessorin piirilevyllä olevaan L3 muistipiiriin mutta nykyisissä CPU:ssa ja GPU:ssa myös L3 on aina sillä sirulla.

Senpä takia kyselenkin , että ehkä joku selvittää asioita
Tuo Raven GPUn L2 on muutos Bristol Radeoniin nähden
Miksi Raven Bidgessä on vain 4MB L3 cachea kun täydessä CCX moduulissa on 8MB
Eli miksei tuota puolikasta käytetty GPUn eDRAM muistiksi jolloin kone olisi nopeutunut
 
Miksi Raven Bidgessä on vain 4MB L3 cachea kun täydessä CCX moduulissa on 8MB

Ei siellä ole kahdeksaa megaa. Se on pienempi, erilainen CCX. Siellä on vain 4 megaa. Katso nuo kuvat, mitkä postasin tänne toissapäivänä.

Video: AMD Ryzen with Radeon Vega -prosessoreiden ensituntumat

Eli miksei tuota puolikasta käytetty GPUn eDRAM muistiksi jolloin kone olisi nopeutunut

Se on (tai siis olisi, koska sitä ei ole) SRAMia, ei mitään eDRAMia.

SRAM tarkoittaa muistia, jonka solu on tehty kahdesta logiikkaportista, jotka loopissa toistavat toisilleen, mikä se tila on. DRAM tarkoittaa muistia, jonka solu on tehty kondensattorista, jonne joko varataan varaus tai ei varata varausta sen mukaan, säilötäänkö sinne 1 vai 0. eDRAM tarkoittaa DRAMia, joka valmistetaan samalla valmistusprosessilla kuin logiikkapiirit.

Ei voi käyttää kun ei ole, ja vaikka se olisi, se on kytketty sinne CCXään CPUiden luokse. Sen laajamittainen käyttäminen GPUn toimesta rasittaisi kaistaa CPU- ja GPU-puolen väliltä, paljon järkevämpää on tehdä vaan niistä GPUlle omista välimuisteista suurempia(kuten nyt on tehty)
 
Viimeksi muokattu:
Ei siellä ole kahdeksaa megaa. Se on pienempi, erilainen CCX. Siellä on vain 4 megaa. Katso nuo kuvat, mitkä postasin tänne toissapäivänä.

Video: AMD Ryzen with Radeon Vega -prosessoreiden ensituntumat



Se on (tai siis olisi, koska sitä ei ole) SRAMia, ei mitään eDRAMia.

SRAM tarkoittaa muistia, jonka solu on tehty kahdesta logiikkaportista, jotka loopissa toistavat toisilleen, mikä se tila on. DRAM tarkoittaa muistia, jonka solu on tehty kondensattorista, jonne joko varataan varaus tai ei varata varausta sen mukaan, säilötäänkö sinne 1 vai 0. eDRAM tarkoittaa DRAMia, joka valmistetaan samalla valmistusprosessilla kuin logiikkapiirit.

Ei voi käyttää kun ei ole, ja vaikka se olisi, se on kytketty sinne CCXään CPUiden luokse. Sen laajamittainen käyttäminen GPUn toimesta rasittaisi kaistaa CPU- ja GPU-puolen väliltä, paljon järkevämpää on tehdä vaan niistä GPUlle omista välimuisteista suurempia(kuten nyt on tehty)

Oukey tässä on tai eiole eDRAM muistia riippuen tulkinnasata Intel Core i7-5775C review: The unwanted desktop Broadwell has one neat trick

Tässä kilpailijassa taas on kalliita condensaattoreita , miten lienee Review: Much-improved Iris GPU makes the Skylake NUC a major upgrade

Mutta koska tyhmyydelle ei ole rajaa , niin onko Bristol / Summit / Raven Ridge prossujen kontaktipinnit kytketty piirilevyyn ja lähes samoihin paikkoihin

Koska esim viestisi # 109 ei näy muistiohjaimia jotka kuitenkin ovat yhteiset väylät sekä CPU että GPU ja RAM kampojen välillä , vai onko epäiltävä ettei Raven iGPU käytäkkään kampoja muisteina
 
Oukey tässä on tai eiole eDRAM muistia riippuen tulkinnasata Intel Core i7-5775C review: The unwanted desktop Broadwell has one neat trick

Tässä kilpailijassa taas on kalliita condensaattoreita , miten lienee Review: Much-improved Iris GPU makes the Skylake NUC a major upgrade
Ei, kyllä noissa molemmissa on ihan sitä eDRAM-muistia erillisessä ulkoisessa mutta samaan paketointiin sisällytetyssä piirissä. SRAM-muistia käytetään itse prosessorin (tai grafiikkapiirin tai -ohjaimen) sisäänrakennetuissa välimuisteissa, eli nykypäivänä L1, L2 ja L3.

Mutta koska tyhmyydelle ei ole rajaa , niin onko Bristol / Summit / Raven Ridge prossujen kontaktipinnit kytketty piirilevyyn ja lähes samoihin paikkoihin
Samaa tehtävää tekevät pinnit ovat tietääkseni samoilla paikoilla, mutta kaikki kolme eivät käytä välttämättä täysin samaa konfiguraatiota vaan osassa on käytössä pinnejä mitä toiset eivät käytä. @hkultala tai @The Stilt voinee korjata jos meni vikaan.

Koska esim viestisi # 109 ei näy muistiohjaimia jotka kuitenkin ovat yhteiset väylät sekä CPU että GPU ja RAM kampojen välillä , vai onko epäiltävä ettei Raven iGPU käytäkkään kampoja muisteina
Ei ole mitään epäiltävää, epäselvää tai muuta. Raven Ridgen iGPU käyttää ihan samaa keskumuistia eli "RAM-kampoja" kuin se prosessoripuolikin ja niillä on yhteinen muistiohjain. Noissa viestin #109 kuvissa on vain CCX:t eli Zen-prosessorikompleksit, ei koko sirua. Muistiohjain kuuluu "uncoreen" eli "siihen kaikkeen muuhun"

Tässä Raven Ridgen koko siru korostetuin osin:
950px-raven_ridge_die_%28annotated%29.png


Alaosan ja vasemman laidan "merkkaamattomat alueet" sisältävät PCIe-väylät, erilaisia ohjaimia (SATA, USB) jne. Ylhäällä olevasta merkkaamattomasta alueesta yläkulman kolmen nelikulmion osuus kuuluu vielä GPU:hun ja loppuosa tod.näk. infinity fabriciin. Keskellä olevasta merkkaamattomasta osasta en vanno juuta tai jaata mutta jossain senkin on mainittu olevan infinity fabriccia.
 

Statistiikka

Viestiketjuista
258 788
Viestejä
4 499 083
Jäsenet
74 283
Uusin jäsen
Maunula

Hinta.fi

Back
Ylös Bottom