Virallinen: AMD vs Intel keskustelu- ja väittelyketju

Liittynyt
23.10.2016
Viestejä
309
Aiemmin näin joo, mutta nyt noissa 10xxx -sarjalaisissa näyttäis olevan aika kovat kellot jo valmiiksi Turbo Frequencyllä. 10600k:ssa 4,8ghz ja 10700k:ssa 5ghz Turbo Frequency. Vai eikös tuo Turbo Frequency ole ns. boosti eli se johon prossu menee jos tarvetta ja jäähdytys kunnossa? Mulla ei Inteliä ole sitten i5-2500k ollut, ja siinä oli joku boosti joka piti aktivoida BIOS:ista. Miten nykyään?

Aiemminhan Intelin prossuista ei oltu otettu ns. tyhjiä pois tehtaalla, toisin kuin AMD:lla on Ryzeneissä. Makuasia että kummasta kuluttajana tykkää enemmän.
Mitä tuossa oon ite arvosteluja kattonu ni eipä näistä uusista prossuista juurikaan oo lisää kelloja irronnu ja marginaalisetkin ylikellot vetää virtaa aivan tajuttomia määriä samalla kun jäähyvaatimukset on minimissään tasoo 360mm AIO. Toisaalta ymmärrettävä ratkasu, Intelin 14nm vetelee aika pitkälti viimesiään ja käytännössä ainoo tapa saada enää minkäänlaisia eroja aikaseks aikasempiin prossuihin on yrittää puristaa viimesetkin mehut irti, vaikka purkin pohja on näkyny jo viimeset kaks vuotta.

Kaukana on ne ajat kun Intelin kiviltä sopi odottaa järjestäen sen 30% ylikelloja, vanha C0/C1 steppingin i7 920 otti sen 35% kelloja yli vakion ennenkun iski volttiseinä vastaan, kakkoskoneen X5660 pyöriny kohta neljä vuotta ~45% ylikelloilla.
 
Liittynyt
18.11.2016
Viestejä
480
Aiemmin näin joo, mutta nyt noissa 10xxx -sarjalaisissa näyttäis olevan aika kovat kellot jo valmiiksi Turbo Frequencyllä. 10600k:ssa 4,8ghz ja 10700k:ssa 5ghz Turbo Frequency. Vai eikös tuo Turbo Frequency ole ns. boosti eli se johon prossu menee jos tarvetta ja jäähdytys kunnossa? Mulla ei Inteliä ole sitten i5-2500k ollut, ja siinä oli joku boosti joka piti aktivoida BIOS:ista. Miten nykyään?

Aiemminhan Intelin prossuista ei oltu otettu ns. tyhjiä pois tehtaalla, toisin kuin AMD:lla on Ryzeneissä. Makuasia että kummasta kuluttajana tykkää enemmän.
Joo noi on vakiona automaattisesti lähempänä maksimeja kuin 9600k, mutta vain vähän. All core turbo on silti vain 4.5 GHz (9600k 4.3 GHz ), ja manuaalisesti kellotettuna menee enemmän. Nuo paremmat ja uudemmat automaattikellotukset ovat käytössä vain paremmissa malleissa, ei i5, eikä nekään näiden uusien mallien varsinaisia oikeita uudistuksia ollut.

Mutta jos tuosta katsoo pelivertailuja niin näkee että samoilla kelloilla kellotettu 10600k on monesti lähes samaa tasoa kuin 9600k, eli se HT ei tuo kauheasti apua. Jossain peleissä tuo. Toi HT on siis oikea merkittävä ero vanhempaan verrattuna mutta sen hyöty näkyy enemmän muualla kuin peleissä.
 
Liittynyt
08.08.2019
Viestejä
227
Joo noi on vakiona automaattisesti lähempänä maksimeja kuin 9600k, mutta vain vähän. All core turbo on silti vain 4.5 GHz (9600k 4.3 GHz ), ja manuaalisesti kellotettuna menee enemmän.
Joo all core turbo jättää varmasti löysiä, pelikäytössä jossa ytimiä ei hyödynnetä kuin 1-4 ja niissäkin yhdessä pääpaino, niin Turbo Frequency varmaan pusertaa vähän ylemmäs. Ja toki tästäkin varmasti manuaalisesti saa vielä lisää kelloja.

Mutta jos tuosta katsoo pelivertailuja niin näkee että samoilla kelloilla kellotettu 10600k on monesti lähes samaa tasoa kuin 9600k, eli se HT ei tuo kauheasti apua. Jossain peleissä tuo. Toi HT on siis oikea merkittävä ero vanhempaan verrattuna mutta sen hyöty näkyy enemmän muualla kuin peleissä.
Eipä niissä hirveitä eroja ole joo, HT:ta kun harva peli osaa hyödyntää toistaiseksi. Sinänsä tämä Intelin 10xxx -sarja oli vanhan keiton uudelleen lämmittämistä, mutta vähän paremmilla mausteilla. Hyviä peliprossuja edelleen, perf./price -osalta AMD tahtoo edelleen viedä voiton. Poislukien ehkä se 10900k vs 3900x.

Intel luottaa ''pelaajien prossut'' -brändiinsä, ja onhan Intelillä aiemmat näytöt kunnossa. AMD vaan taitaa laittaa Zen3:sella heti Intelin takamatkalle, eikä vaadi AMD:lta hirmuisia teholisiä edes. Inteliltä löytyy kuitenkin osaamista sekä resursseja, ja varmasti kilpailu tulee pysymään tulevaisuudessa tiukkana.
 
Liittynyt
21.06.2017
Viestejä
3 506
Intel luottaa ''pelaajien prossut'' -brändiinsä, ja onhan Intelillä aiemmat näytöt kunnossa. AMD vaan taitaa laittaa Zen3:sella heti Intelin takamatkalle, eikä vaadi AMD:lta hirmuisia teholisiä edes. Inteliltä löytyy kuitenkin osaamista sekä resursseja, ja varmasti kilpailu tulee pysymään tulevaisuudessa tiukkana.
Intelin entinen insinööri, nykyinen fanboi alkaa olla huolestunut Intelin tilanteesta


 
Liittynyt
21.06.2017
Viestejä
3 506
Intelin 10nm ongelmien myötä on ittellä pyöriny mielessä jo pidempään että miten pitkään Intel jaksaa valmistusprosessien kanssa painia vai olisiko kohta järkevämpää luopua omasta valmistamisesta ja siirtyä valmiiksi katettuun pöytään?
Juuri lueskelin artikkelin TSMC:stä, Taiwan’s Dominant Corporate Force: TSMC’s Five Keys to Success|Industry|2019-11-24|CommonWealth Magazine ja siellä on mielenkiintoinen huhu että Intel kun alkoi tuottaa jotain piirejä TSMC:llä niin CEO kun sai tarjouspyyntöön vastauksen TSMC:ltä niin ei ollut uskoa että hinta voi olla niin halpa.
Jos tuo pitää paikkaansa niin eiköhän siellä CEO:n päässä ole laskin alkanu raksuttaa että kannattaako oma valmistus enää jatkossa jos kilpailijat saavat tuotteensa markkinoille halvemmalla.

Sitten Zen 3:sta huhuja.

Jos tuo käännöksen sisältö pitää paikkaansa niin sieltähän olisi tulossa melkoinen rytky. Tuo IPC parannus yhdistettynä vuotoihin ES:n kelloista olisi tuomassa Zen 3:n potku aika reippaasti lisää. Lähteekö Inteliltä pelikuninkaan kruunukin päästä loppuvuodesta? Aika monta kruunua on jo viety, montaa ei ole jäljellä.
 
Liittynyt
18.11.2016
Viestejä
480
Intelin 10nm ongelmien myötä on ittellä pyöriny mielessä jo pidempään että miten pitkään Intel jaksaa valmistusprosessien kanssa painia vai olisiko kohta järkevämpää luopua omasta valmistamisesta ja siirtyä valmiiksi katettuun pöytään?
Juuri lueskelin artikkelin TSMC:stä, Taiwan’s Dominant Corporate Force: TSMC’s Five Keys to Success|Industry|2019-11-24|CommonWealth Magazine ja siellä on mielenkiintoinen huhu että Intel kun alkoi tuottaa jotain piirejä TSMC:llä niin CEO kun sai tarjouspyyntöön vastauksen TSMC:ltä niin ei ollut uskoa että hinta voi olla niin halpa.
Jos tuo pitää paikkaansa niin eiköhän siellä CEO:n päässä ole laskin alkanu raksuttaa että kannattaako oma valmistus enää jatkossa jos kilpailijat saavat tuotteensa markkinoille halvemmalla.
Vaikea kuvitella että Intel luopuisi piirinvalmistuksesta. Tekeekö TSMC kaikenlaisia piirejä mitä Intel tekee ja käyttää. Silti, miten Intel tuosta luopuisi?

Ehkä AMD saa parannettua IPC noilla CCX järjestelyillä, kun markkinoille on lykätty tarpeeksi ytimiä palvelimiin että noista voidaan ottaa paremmin toimivia vajaita settejä, plus hiuman enemmän viilattua. Mutta miksi ne tekisi suurempia parannuksia ennen DDR5:sta ja sen vaatimia muutoksia.
 
Liittynyt
21.06.2017
Viestejä
3 506
Vaikea kuvitella että Intel luopuisi piirinvalmistuksesta. Tekeekö TSMC kaikenlaisia piirejä mitä Intel tekee ja käyttää. Silti, miten Intel tuosta luopuisi?
Eiköhän se TSMC tee mitä asiakas suunnittelee ja pyytää tekemään. Silleenhän siitä omasta tuotannosta pääsee eroon kun huomaa että kilpailukyky ei riitä. Jos omavalmistus on huomattavasti kalliimpaa ja teknisesti ollaan myös jäljessä, silloin varmaan monella johtajalla alkaa päässä pyöriä ajatus että kannattaako touhua enää jatkaa. Eikö?
Eli mikäli se tosiaan pitää paikkaansa että CEO ei ollut uskoa kuinka halvalla TSMC pystyy piirit valmistamaan niin kyllä se varmaankin kertoo jotain myös siitä miksi ne Intelin rojut on maksanut ja maksaa edelleen niin paljon.
Voihan sitä edelleen pitää tuotannon pyörimässä niillä mitä on tai sitten irrottaa se tuotanto omaksi putkaksi ja myydä pois kuten AMD teki aikoinaan.
Eiköhän 14nm++++ prosessille löydy vielä käyttöä seuraavaksi 10v jossain piireissä. Edelleen on toiminnassa paljon isompiakin prosesseja kun kaikkeen ei tartte sitä viimeisintä hottia.

Mutta miksi ne tekisi suurempia parannuksia ennen DDR5:sta ja sen vaatimia muutoksia.
No miksei tekisi? Aivan käsittämätön ajatus että nyt alettaisiin chillaamaan ja odottelemaan että milloin DDR5 tulee markkinoille. Voi käytä myös niin että DDR5 kun tulee niin se otetaan ensin serveri puolella suuremmin käyttöön ja hima puolella mennään DDR4:lla. Tämähän onnistuu AMD:ltä varsin helposti kun serveri ja hima puolelle on omat IO-die:t.
Tosin kyllähän tuo Intel piti DDR3 tuen varsin pitkään mukana, tiedä vaikka noissa juuri julkaistuissa kivissäkin olisi vielä DDR3 tuki mukana.

Siinä 8700K pörrää iloisesti DDR3 muistoilla. Ja syynä ilmeisesti läppärit miksi Intelin prossuissa on DDR3 ja DDR4 tuki. Läppäreissä on menty LPDDR3 muisteilla pitkään.
 
Liittynyt
05.02.2017
Viestejä
4 273
Ehkä AMD saa parannettua IPC noilla CCX järjestelyillä, kun markkinoille on lykätty tarpeeksi ytimiä palvelimiin että noista voidaan ottaa paremmin toimivia vajaita settejä, plus hiuman enemmän viilattua. Mutta miksi ne tekisi suurempia parannuksia ennen DDR5:sta ja sen vaatimia muutoksia.
Kyllähän yhden ytimen suorituskyky on kaikkein mukavin paikka saada lisää suorituskykyä, koska se nopeuttaa kaikenlaisia sovelluksia, joten kyllä sitä kannattaa parantaa aina kun se on mahdollista. DDR5 tuo lisää kaistanleveyttä muistiin, mutta ymmärtääkseni se ei juurikaan paranna latensseja. Täten DDR5:stä on kunnolla hyötyä vasta kun systeemissä on riittävästi ytimiä hyödyntämään sitä lisääntynyttä muistikaistaa, eli tyypillisesti serverikäytössä. Ei AMD huvikseen ole lätkinyt AM4-kannalle jopa 16 ydintä. Se on tehnyt niin siksi, että ne tuovat suorituskykyä lisää, vaikka muistikaistaa ei tule lisää. Kaikkien AMD-fanien lempparitesti Cinebench on hyvä esimerkki ohjelmasta, joka käyttää kaikkia ytimiä, mutta jolle muistin suorituskyvyllä on hyvin vähäinen merkitys.

Itse uskon, että jos ytimiä on ne nykyiset 6-8 kappaletta vielä Zen 4:n myötä tyypillisissä kotikoneissa, niin DDR5:stä on vain marginaalisesti hyötyä. Eri asia, jos ytimiä lätkitään enemmän, mutta sitten tuleekin ongelmaksi, että mistä löydetään kotikäyttöön sovelluksia, jotka sekä osaavat hyödyntää runsaita määriä ytimiä, että tarvitsevat runsaasti muistikaistaa.
 
Liittynyt
23.01.2018
Viestejä
115
Itse uskon, että jos ytimiä on ne nykyiset 6-8 kappaletta vielä Zen 4:n myötä tyypillisissä kotikoneissa, niin DDR5:stä on vain marginaalisesti hyötyä. Eri asia, jos ytimiä lätkitään enemmän, mutta sitten tuleekin ongelmaksi, että mistä löydetään kotikäyttöön sovelluksia, jotka sekä osaavat hyödyntää runsaita määriä ytimiä, että tarvitsevat runsaasti muistikaistaa.
Käsittääkseni DDR5:ssa haetaan muistista kerralla kaksinkertainen määrä tietoa verrattuna DDR4:een. Tämä tieto on sitten välimuistissa saatavilla kronologisesti etenevälle ohjelmakoodille / datan haulle ilman ylimääräisiä latensseja. Tämä yhdistettynä entistä älykkäämpään prefetchiin nopeuttaa kaikenlaista ohjelmakoodia.
 
Viimeksi muokattu:
Liittynyt
05.02.2017
Viestejä
4 273
Käsittääkseni DDR5:ssa haetaan muistista kerralla kaksinkertainen määrä tietoa verrattuna DDR4:een. Tämä tieto on sitten välimuistissa saatavilla kronologisesti etenevälle ohjelmakoodille / datan haulle ilman ylimääräisiä latensseja. Tämä yhdistettynä entistä älykkäämpään prefetchiin nopeuttaa kaikenlaista ohjelmakoodia.
Ekat DDR5-muistit ovat DDR5-4800 (ainakin Intelin Alder Lakesta on huhuttu tällaista), ja nyt DDR4:ssä standardi on DDR4-3200 ilman ylikellotteluja, eli tulee 50% siirtonopeutta. Kuitenkin yleensä kriittisin juttu on se eka haku, joka on hidasta kaikella DRAM-teknologialla. Toki DDR5 nopeuttaa kaikkea toimintaa, mutta eri asia, että miten paljon.
 

Alensia

Custom-titteli
Liittynyt
17.10.2016
Viestejä
1 919
Ekat DDR5-muistit ovat DDR5-4800 (ainakin Intelin Alder Lakesta on huhuttu tällaista), ja nyt DDR4:ssä standardi on DDR4-3200 ilman ylikellotteluja, eli tulee 50% siirtonopeutta. Kuitenkin yleensä kriittisin juttu on se eka haku, joka on hidasta kaikella DRAM-teknologialla. Toki DDR5 nopeuttaa kaikkea toimintaa, mutta eri asia, että miten paljon.
JEDEC-standardi DDR4:lle on kyllä 2133 MHz, että siihen nähden on huima hyppy tulossa. Nuo markettien paskettikoneet ja läppärit käyttäneet lähinnä noita nopeuksia, fiksuimmissa pöytäkoneissa "de facto"-standardi toki on ollut jo kauan aikaa 3200 MHz. Eri DDR:ien pohjanopeuksia kun vertaa niin toki hypyt ovat olleet huimia, mutta käytännön erot "järkihertsejä" verratessaovat jääneet pieniksi, ja esim. Devil's Canyonilla käyttämäni DDR3-2400-kitti vs. joku markettiräpellyksen (pahimmillaan vielä Single Channel) DDR4-2133 ei paljoa jätä arvailujen varaan.. :think:
 
Liittynyt
11.02.2018
Viestejä
1 274
JEDEC-standardi DDR4:lle on kyllä 2133 MHz, että siihen nähden on huima hyppy tulossa. Nuo markettien paskettikoneet ja läppärit käyttäneet lähinnä noita nopeuksia, fiksuimmissa pöytäkoneissa "de facto"-standardi toki on ollut jo kauan aikaa 3200 MHz. Eri DDR:ien pohjanopeuksia kun vertaa niin toki hypyt ovat olleet huimia, mutta käytännön erot "järkihertsejä" verratessaovat jääneet pieniksi, ja esim. Devil's Canyonilla käyttämäni DDR3-2400-kitti vs. joku markettiräpellyksen (pahimmillaan vielä Single Channel) DDR4-2133 ei paljoa jätä arvailujen varaan.. :think:
Jep. Ja tämä vielä ennen kuin edes ollut mitään puhetta latenseista. Mitäköhän siellä jedecillä oikein ajateltiin tuon DDR4 julkaisun yhteydessä...

Tähän asti standardin nopeus on aina ollut 2x edelliseen nähden DDR-400 -> DDR2-800 -> DDR3-1600 sitten tuli DDR4-2133 cl15 kun markkinoilla on ollut DDR3-2400 cl12 helposti saatavilla
 
Liittynyt
17.10.2016
Viestejä
6 317
DDR5:sen tarjoama kaistalisäys on myös erittäin hyödyllistä integroiduille näyttiksille. Muistikaistarajoitus on gpu-puolella tiukka, joten +50% kaistaa on ihan merkittävä lisäys.

Esim. Geforce GTX 1050 Ti:n muistikaista on 112GiB/s.

Dual-channel DDR5-4800:sen muistikaista on 75GiB/s ja DDR5-6000:nen yltäisi jo n. 94GiB/s muistikaistaan.
 

demu

Conducător & Geniul din Carpați
Liittynyt
20.10.2016
Viestejä
1 107
Yhtään asiaa tuntematta, onko se sitten jonkinkin erityisen huono juuri nyt?
Linus Thorvalds ei aikaisemmin (tai pitkään aikaan ainakaan) ole AMD:tä käyttänyt.
 
Liittynyt
22.10.2016
Viestejä
6 183
Käsittääkseni DDR5:ssa haetaan muistista kerralla kaksinkertainen määrä tietoa verrattuna DDR4:een. Tämä tieto on sitten välimuistissa saatavilla kronologisesti etenevälle ohjelmakoodille / datan haulle ilman ylimääräisiä latensseja. Tämä yhdistettynä entistä älykkäämpään prefetchiin nopeuttaa kaikenlaista ohjelmakoodia.
Ei.

Muistista haetaan kerralla aina välimuistilinjan verran dataa.

Se, mikä muistityyppi on käytössä ei vaikuta yhtään sen välimuistilinjan kokoon; Välimuisti on jo >10 vuotta ollut kaikissa x86-prosessoreissa 64 tavua.

Uudemmat muistityypit vaan mahdollistavat sille muistiväylälle suuremman kellotaajuuden, että se välimuistilinja siirtyy hiukan nopeammin.

Muistin hakuaika on kuitenkin jo todella moninkertainen siihen siirtoaikaan nähden, joten sillä siirtoajalla on mitään väliä vain silloin, kun muistiväylä alkaa käydä ahtaaksi, kun siellä on monta ydintä puskemassa suurta määrää muistiaccesseja että jotkut accessit joutuvat odottamaan hetkeä jolloin väylä on vapaa.

(Ja nyt ollaan taidettu jo saavuttaa muististandardeissa se piste, että se muistiväylän tehokas hyödyntäminen vaatii sen, että sitä yhtä välimuistilinjaa ei edes jaeta kahdelle kanavalle, eli tosiaan nopeutta sen yksittäisen välimuistilinjan hakemiseen ei uusista standardeista ole tullut yhtään lisää. Ne ovat ainoastaa mahdollistaneet sen, että voidaan hakea kahta täysin rinnakkain, mikäli ne osuu eri kanaviin.)
(mutta joka tapauksessa pitää olla kymmenien välimuistilinjojen hakeminen kesken yhtä aikaa, että ollaan millään tavalla kaistarajoittuneita, ja että sellainen määrä yhtä aikaa kesken olevia accesseja saadaan aikaiseksi tarvitaan jo aika monta ydintä)

Ja uudemmat muistityypit eivät myöskään tuo mitään parempaa prefetchiä. Siihen, millaisia prefetchejä ydin tekee vaikuttaa vain se ydin.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
558
Linus Thorvalds ei aikaisemmin (tai pitkään aikaan ainakaan) ole AMD:tä käyttänyt.
Koska vastasit tällä tuohon kysymykseen, todistaako tämä sitten mielestäsi jotenkin AMD-alustan tuen huonoutta?
 
Liittynyt
05.02.2017
Viestejä
4 273
Linus Thorvalds ei aikaisemmin (tai pitkään aikaan ainakaan) ole AMD:tä käyttänyt.
Kyllä sitä Linuxia aika moni muukin koodaa kuin Linus Torvalds. :)
 

Taneli-

☤ Virallinen ⚔ testaaja ☣
Liittynyt
17.10.2016
Viestejä
3 234
Koska vastasit tällä tuohon kysymykseen, todistaako tämä sitten mielestäsi jotenkin AMD-alustan tuen huonoutta?
Eikös se mene toisinpäin? Eli nykyisin Intel on niin paska että jopa wanhat jäärät kuten Torvalds siirtyvät AMD:n leiriin vaikka olisivat sinnikkäästi jopa 15 vuoden ajan käyttäneet Inteliä.
Eli nykyisin käytännössä "kaikki" jotka eivät pelaa ostavat mieluummin paitsi halvemman myös paremman vaihtoehdon...
 
Liittynyt
17.10.2016
Viestejä
558
Eikös se mene toisinpäin? Eli nykyisin Intel on niin paska että jopa wanhat jäärät kuten Torvalds siirtyvät AMD:n leiriin vaikka olisivat sinnikkäästi jopa 15 vuoden ajan käyttäneet Inteliä.
Eli nykyisin käytännössä "kaikki" jotka eivät pelaa ostavat mieluummin paitsi halvemman myös paremman vaihtoehdon...
Mutta eihän tuossa Intel vs AMD paremmuudesta kysytty, vaan Linuxin AMD-tuen huonoudesta. Siksi ihmettelinkin kun eihän tuo tarjottu vastaus linkkeineen varsinaisesti vastaa kysymykseen.
 

Taneli-

☤ Virallinen ⚔ testaaja ☣
Liittynyt
17.10.2016
Viestejä
3 234
Mutta eihän tuossa Intel vs AMD paremmuudesta kysytty, vaan Linuxin AMD-tuen huonoudesta. Siksi ihmettelinkin kun eihän tuo tarjottu vastaus linkkeineen varsinaisesti vastaa kysymykseen.
Ilmeisesti hän yrittää sanoa että nykyisin AMD:n tuotetuki on niin paljon parempi ja ehkä Intelin tipahtanut että jopa yksi maailman kuuluisimmista Linuxin "isistä" sekä kehittäjistä on kääntynyt sitä käyttämään.

Itse en kyllä ole tiennyt että prosessoreissa ja niiden tuissakin olisi suuri ero Windows ja Linux puolella. Tosin varmaan emolevyissä ainakin on, koska muistaakseni mukana tulevissa ajureissa ei ainakaan ennen ollut Linux asennus CD:tä ja kaikki modeemin ajureista lähtien piti etsiä netistä viime vuosituhannen puolella.

Sen muistan ja kaverit ovat aikoinaan paljonkin mananneet miten kuulema ATI:n ajurit eivät ole samalla tasolla kuin Nvidian. Tosin nyt eletään tämän vuosituhannen puolta ja tuo on parantunut / tasoittunut kun AMD osti ATI:n näytönohjaimet. Tiedä sitten onko noissa edelleen eroja vai ei?
 
Liittynyt
05.02.2017
Viestejä
4 273
Ilmeisesti hän yrittää sanoa että nykyisin AMD:n tuotetuki on niin paljon parempi ja ehkä Intelin tipahtanut että jopa yksi maailman kuuluisimmista Linuxin "isistä" sekä kehittäjistä on kääntynyt sitä käyttämään.

Itse en kyllä ole tiennyt että prosessoreissa ja niiden tuissakin olisi suuri ero Windows ja Linux puolella. Tosin varmaan emolevyissä ainakin on, koska muistaakseni mukana tulevissa ajureissa ei ainakaan ennen ollut Linux asennus CD:tä ja kaikki modeemin ajureista lähtien piti etsiä netistä viime vuosituhannen puolella.
Sikäli kun olen ymmärtänyt, niin Linux-käytössä noista AMD:n Threadripper-hirmuista saa jopa suhteessa enemmän irti kuin Windows-puolella.
 
Liittynyt
21.06.2017
Viestejä
3 506
Mutta eihän tuossa Intel vs AMD paremmuudesta kysytty, vaan Linuxin AMD-tuen huonoudesta. Siksi ihmettelinkin kun eihän tuo tarjottu vastaus linkkeineen varsinaisesti vastaa kysymykseen.
Ehkä siinä oli vähän jotain sellaista toivetta että Linus tekee jotain ihmeitä kun nyt on AMD:n raudalla jotta suorituskyky tulee entistäkin paremmaksi.

Sen muistan ja kaverit ovat aikoinaan paljonkin mananneet miten kuulema ATI:n ajurit eivät ole samalla tasolla kuin Nvidian. Tosin nyt eletään tämän vuosituhannen puolta ja tuo on parantunut / tasoittunut kun AMD osti ATI:n näytönohjaimet. Tiedä sitten onko noissa edelleen eroja vai ei?
No Linuxissa on nykyisin AMD:n näytönohjaimille suoraan tuki kernelissä. Ei tartte asennella mitään ajureita. Eli jos tuohon mitä kirjoitit asiaa peilaa niin erohan on kuin yö ja päivä.
 
Liittynyt
17.10.2016
Viestejä
558
Sikäli kun olen ymmärtänyt, niin Linux-käytössä noista AMD:n Threadripper-hirmuista saa jopa suhteessa enemmän irti kuin Windows-puolella.
Taitaa päteä varsinkin 3990x:ään. Windows ei taida hanskata enempää kuin 64 threadia per CPU, ilmeisesti tämän vuoksi 3990x näkyy kahtena CPU:na eri socketissa. Mahtaa olla hieno schedulointi...
 
Liittynyt
22.10.2016
Viestejä
6 183
Eikös se mene toisinpäin? Eli nykyisin Intel on niin paska että jopa wanhat jäärät kuten Torvalds siirtyvät AMD:n leiriin vaikka olisivat sinnikkäästi jopa 15 vuoden ajan käyttäneet Inteliä.
Eli nykyisin käytännössä "kaikki" jotka eivät pelaa ostavat mieluummin paitsi halvemman myös paremman vaihtoehdon...
Ei Linus ole tuon suhteen ollut mikään "jäärä".

Linus on aina ollut hyvin pragmaatikko, ja on käyttänyt core2sta lähtien Intelin prosessoreita, koska silloin kun hän on koneita hankkinut (tai hänelle on koneita hankittu), koneet joissa on ollut intelin prosessori ovat tarjonneet parempaa suorituskykyä (ja/tai myös muita ominaisuuksia, jotka eivät riipu itse prosessorista).

Nyt tilanne on vihdoin muuttunut; Tällä hetkellä tuollaiseen järeän luokan softien kääntelyyn threadripper tarjoaa ylivoimaista suorituskykyä mihinkään intelin prosessoreihin verrattuna.

Kun tehdään tuotekehitystä jossa ihmisen työaika maksaa >kymppitonnin kuussa, ja sillä nopeudella millä se kone kääntää koodia on huomattava vaikutus sen ihmisen työtehoon, silloin ei aleta säästelemään pariasataa euroa muutaman vuoden välein tehtävissä konehankinnoissa ja optimoimaan "hinta-teho-suhdetta" ja ostelemaan "melkein yhtä hyvää mutta selvästi halvempaa".

Eli, esim. kymmenisen vuotta sitten se 6-ytiminen Nehalem joka maksoi ehkä tuplat siitä 6-ytimisestä Phenom II:sta, mutta oli ehkä ~15% nopeampi oli hyvinkin järkevä hankinta jos prossuteholla oli suora vaikutus >kymppitonnin kuussa maksavan ihmisen tuottavuuteen.


Lähinnä vaan ihmetyttää, että miksi valittu 32- eikä 64-ytiminen malli. Mutta ehkä maksimikellojen takia; Ehkä Linuxin kääntelyssä on edelleen paljon tilanteita joissa >32 säiettä ei joidenkin riippuvuuksien takia päästä tehokkaasti hyödyntämään, ja tuo 32-ytiminen malli tarjoaa suuremman maksimikellon eli paremman yhden säikeen suorituskyvyn. Tai sitten 3990X-pohjaisia koneita ei vaan ollut samalla tavalla hyllyssä kuin 3970X-pohjaisia koneita ja olisi pitänyt tilailla jostain ja odotella sitä yms.
 
Liittynyt
02.06.2017
Viestejä
186
Taitaa päteä varsinkin 3990x:ään. Windows ei taida hanskata enempää kuin 64 threadia per CPU, ilmeisesti tämän vuoksi 3990x näkyy kahtena CPU:na eri socketissa. Mahtaa olla hieno schedulointi...
Windows tukee max 64 säiettä per prosessi ilman numaextensioita ohjelmakoodiin. Säikeitä itsessään saa olla paljon enemmän (2^16-1).
 
Liittynyt
17.10.2016
Viestejä
558
Liittynyt
20.10.2016
Viestejä
1 761
No Linuxissa on nykyisin AMD:n näytönohjaimille suoraan tuki kernelissä. Ei tartte asennella mitään ajureita. Eli jos tuohon mitä kirjoitit asiaa peilaa niin erohan on kuin yö ja päivä.
Onhan ne kernelin mukana tulevat ajurit aika hyvät. Esim vähän aikaa sitten Half Life Alyxista linuxilla vastauksena siihen miksi 2080TI tökkii.

 

hik

Liittynyt
06.04.2017
Viestejä
863
Kun tehdään tuotekehitystä jossa ihmisen työaika maksaa >kymppitonnin kuussa, ja sillä nopeudella millä se kone kääntää koodia on huomattava vaikutus sen ihmisen työtehoon, silloin ei aleta säästelemään pariasataa euroa muutaman vuoden välein tehtävissä konehankinnoissa ja optimoimaan "hinta-teho-suhdetta" ja ostelemaan "melkein yhtä hyvää mutta selvästi halvempaa".

Eli, esim. kymmenisen vuotta sitten se 6-ytiminen Nehalem joka maksoi ehkä tuplat siitä 6-ytimisestä Phenom II:sta, mutta oli ehkä ~15% nopeampi oli hyvinkin järkevä hankinta jos prossuteholla oli suora vaikutus >kymppitonnin kuussa maksavan ihmisen tuottavuuteen.


Lähinnä vaan ihmetyttää, että miksi valittu 32- eikä 64-ytiminen malli. Mutta ehkä maksimikellojen takia; Ehkä Linuxin kääntelyssä on edelleen paljon tilanteita joissa >32 säiettä ei joidenkin riippuvuuksien takia päästä tehokkaasti hyödyntämään, ja tuo 32-ytiminen malli tarjoaa suuremman maksimikellon eli paremman yhden säikeen suorituskyvyn. Tai sitten 3990X-pohjaisia koneita ei vaan ollut samalla tavalla hyllyssä kuin 3970X-pohjaisia koneita ja olisi pitänyt tilailla jostain ja odotella sitä yms.
Linusin väitetään/juorutaan olevan todella hyvätuloinen, jopa luokkaa miljoonan kuussa. Kolmenumeroinen miljonääri, Red Hatin osakkeilla, kukaties.
Ei olisi mikään ihme, jos asuu jenkeissä ja vastaa kerneleistä ulottuen kännyköistä joka ainoaan top 500 supertietokoneeseen, osa jälkimmäisistä valtiollisia.

Voisi kuvitella että Linusilla tietoturva, mutta myös muu turvallisuus, henkilökohtainenkin, olisi kaiken a ja o ja nämä asettaisi rajoitteita arkeen ja
edellyttäisi avustajien armeijaa. Koska kerneleitä käytetään monissa eri maissa, tietoturvallisen työnteon kulttuurista voi olla todistustaakkaa, vaikka sitä
ei ole koskaan erityisemmin julkisesti epäilty. On erikoista ja hienoa, että Linusiin henkilönä näin vahvasti luotetaan ympäri maailman.

Voi olla täysin samantekevää, mitä Linusin ajankohtainen lempipöytäkone maksaa ostaa.
 
Liittynyt
21.06.2017
Viestejä
3 506
Lähinnä vaan ihmetyttää, että miksi valittu 32- eikä 64-ytiminen malli. Mutta ehkä maksimikellojen takia; Ehkä Linuxin kääntelyssä on edelleen paljon tilanteita joissa >32 säiettä ei joidenkin riippuvuuksien takia päästä tehokkaasti hyödyntämään, ja tuo 32-ytiminen malli tarjoaa suuremman maksimikellon eli paremman yhden säikeen suorituskyvyn. Tai sitten 3990X-pohjaisia koneita ei vaan ollut samalla tavalla hyllyssä kuin 3970X-pohjaisia koneita ja olisi pitänyt tilailla jostain ja odotella sitä yms.
Olisko ihan muistin takia. Jos Linus vaikka ajelee ramdiskillä käännöksiä niin alkaa käydä muistimäärä vähiin kun 256G on TR alustalla vissiin maksimi.
En tiijä miten toi kernelin kääntö rankasee muistia mutta chromium esim. rankasee pahasti. Tällä 8-coren rysällä 16G loppuu aika nopeesti jos ei rajota säikeitä reippaasti.
 
Liittynyt
17.10.2016
Viestejä
558
Olisko ihan muistin takia. Jos Linus vaikka ajelee ramdiskillä käännöksiä niin alkaa käydä muistimäärä vähiin kun 256G on TR alustalla vissiin maksimi.
En tiijä miten toi kernelin kääntö rankasee muistia mutta chromium esim. rankasee pahasti. Tällä 8-coren rysällä 16G loppuu aika nopeesti jos ei rajota säikeitä reippaasti.
Muistia itsekin arvelen. Itsekin piti muistin määrä päivittää 16GB -> 32GB kun Ryzen 2700x:n kanssa jo alkoi Gentoolla muisti käydä vähiin tiettyjen pakettien kohdalla.

Toisaalta voi olla että TR:llä tiedostojärjestelmänkin I/O muodostaa jo pullonkaulaa +100 threadilla käännellessä?
 
Liittynyt
22.10.2016
Viestejä
6 183
Olisko ihan muistin takia. Jos Linus vaikka ajelee ramdiskillä käännöksiä niin alkaa käydä muistimäärä vähiin kun 256G on TR alustalla vissiin maksimi.
En tiijä miten toi kernelin kääntö rankasee muistia mutta chromium esim. rankasee pahasti. Tällä 8-coren rysällä 16G loppuu aika nopeesti jos ei rajota säikeitä reippaasti.
C-kielen käännösprosessit ei tyypillisesti vie montaa kymmentä megatavua, ja Linuxin kernelissä eikä gitissä ei ole mitään C++-kielisiä templatehärveleitä jossa voitaisiin mennä moneen sataan megatavuun.

Ainoastaan linkkauksessa voi muistinkulutus mennä selvästi isommaksi, mutta kovin montaa linkkausta ei koskaan ajella rinnakkain.

Mutta linkkaus on muutenkin IO-intensiivistä, itse kääntämisen ollessa enemmän CPU-intensiivistä.
 
Liittynyt
17.10.2016
Viestejä
558
Mitenköhän kauan tuo kernelin kääntäminen mahtaa viedä tuolla allmodconfig-asetuksella. Peruskäännös vie Threadripperillä alle puoli minuuttia, ja ero 32 ja 64 ytimen välillä on pieni (reilun sekunnin).
Tein huvikseni erittäin tieteellisen ja tarkan kokeen. Oma käytössä oleva kerneli (5.6.10), omalla melko minimalistisella configilla mistä on jätetty pois se roska mitä en tarvitse:
Bash:
$ time make -j16 bzImage modules
...
real    2m24.397s
user    32m26.377s
sys     1m46.164s
Luonnollisesti mrproperilla siivottu ennen make oldconfigia.
Buildihakemiston koko mrproperin jäljiltä 1.1G, ylläolevan jälkeen 1.7G

Sama allmodconfigilla:
Bash:
$ make mrproper && make allmodconfig && time make -j16 bzImage modules
...
real    20m55.584s
user    313m19.023s
sys     17m3.507s
Hakemiston koko 6.3G
 
Liittynyt
01.09.2018
Viestejä
24
Ehkä Linuxin AMD-tuki alkaa pikku hiljaa lähenemään Intel-tasoa: LKML: Linus Torvalds: Linux 5.7-rc7

Oman kokemukseni mukaan Linukassa, Intelin näyttisajurit on parhaat, AMD:n lähentelee pikajunan vessa tasoa ja NVIDIAN ajurit vaatii suht pitkää tikkua että niihin viitsii koskea. Intelin verkkopiirit: LAN, WIFI ovat parhaita. Ja vastineita ei taida AMD / NVIDIA sektorilta löytyä. Pidän siis Intel osti Rivet Networksin (Killer-verkkotuotteet) erittäin huonona uutisena Linukka sopivuuden kannalta.

Olisko ihan muistin takia. Jos Linus vaikka ajelee ramdiskillä käännöksiä niin alkaa käydä muistimäärä vähiin kun 256G on TR alustalla vissiin maksimi.
En tiijä miten toi kernelin kääntö rankasee muistia mutta chromium esim. rankasee pahasti. Tällä 8-coren rysällä 16G loppuu aika nopeesti jos ei rajota säikeitä reippaasti.
Jokunen vuosi takaperin NINJA:an ei vaikuttanut MAKEOPTS="-jn" käsky (n=loogiset ytimet ja ehkä + jotain), ja lisäsin make.conf:iin rivin NINJAOPTS="-jn", johan alkoi Chromiumin kääntaminen sujumaan ilman swappaystä ja ihme kaatumisia. Tilanne saattaa nyt olla muuttunut, mutta en jaksa säätää ja NINJAOPTS="-jn" pysyy make.conf:ssa.
 
Liittynyt
17.10.2016
Viestejä
558
Oman kokemukseni mukaan Linukassa, Intelin näyttisajurit on parhaat, AMD:n lähentelee pikajunan vessa tasoa ja NVIDIAN ajurit vaatii suht pitkää tikkua että niihin viitsii koskea. Intelin verkkopiirit: LAN, WIFI ovat parhaita. Ja vastineita ei taida AMD / NVIDIA sektorilta löytyä. Pidän siis Intel osti Rivet Networksin (Killer-verkkotuotteet) erittäin huonona uutisena Linukka sopivuuden kannalta.
Minulla läppäreissä ollut toistaiseksi yksinomaan Intsukan näytönohjaimet, eikä tuo mitenkään harvinaista ole nykyisessäkään että ajuri heittää voltin ja kuva katoaa vaatien uudelleenkäynnistyksen. Kaikki muu toimii kyllä, näyttö vaan pimeä ja dmesgista löytyy tuo ajurista tullut GPF.
 
Liittynyt
22.10.2016
Viestejä
6 183
Siiretty vaikka tänne, koska ei kuulu ainakaan tuonne mistä peräisin.

Toi kireillä asetuksilla ajeleminen oli esimerkki. XMP ajelua vaan.

Mielestäni kyllä kuka ostaa jonkun päälle 500€ prossun (+emon) ei sinne laita jtn. 80€ muistikittiä kun ~180€ saa jo 4400Mhz tikut (2x8Gb) kun puhe on pelikoneesta.
Ylivoimaisesti suurin osa ihmisistä ostaa kerralla kokonaisen tietokoneen eikä erillistä prosessoria. Ja sen kokonaisen tietokoneen mukana tulee yleensä sitä bulkkimuistia.

Avattiin töissä pari vuotta sitten työkaverin työkone, joka tilattu "tehotyöasema"na, standardivalikoimasta mitä oli tarjolla.
Koneen valmistaja oli muistaakseni Lenovo.

Koneessa oli prosessorina Intelin 2066-kantainen. joka tuki neljää muistikanavaa, en muista prossun tarkkaa mallia.

No, kone oli varustettu yhdellä 32 gigan muistikammalla eli prossun muistikaista rajoitettu neljäsosaan koska kolme neljästä muistikanavasta käyttämättä.

Ja tämä on varmaan yleisin konfiguraatio millä tuota konetta valmistettiin ja myytiin.

Lisäksi sen virtalähteessä ei riittänyt puhti esim. Fury-näyttikselle.

(Ja tästä koneesta työpaikka oli maksanut varmaan monta tonnia.)

Tietokoneharrastajat on todella pieni murto-osa kaikista tietokoneiden markkinoista, ja tämä pätee myös niihin yläpään mallien ostajiin.

Ja ne koneet mitä nuo "isot valmistajat" tekee ja suurelle massalle myy on kaikkea muuta kuin "optimoituja kokoonpanoja", VAIKKA niihin olisi sepeksattu jotain kalliita osia, muista osista vaan säästetään senkin edestä kun niistä ei saada bullet pointteja eikä asiakasta tajua niiden tasosta mitään. Asiakas osaa tilata koneen josssa on "nopein prossu" muttei sen enempää.
 
Liittynyt
21.06.2017
Viestejä
3 506
C-kielen käännösprosessit ei tyypillisesti vie montaa kymmentä megatavua, ja Linuxin kernelissä eikä gitissä ei ole mitään C++-kielisiä templatehärveleitä jossa voitaisiin mennä moneen sataan megatavuun.

Ainoastaan linkkauksessa voi muistinkulutus mennä selvästi isommaksi, mutta kovin montaa linkkausta ei koskaan ajella rinnakkain.

Mutta linkkaus on muutenkin IO-intensiivistä, itse kääntämisen ollessa enemmän CPU-intensiivistä.
Joo ei toi kernelin kääntö kurita muistia pahasti. 4GB riitti hyvin kääntämiseen 8 "ytimellä", rpmbuild ajeli 12 jobia.
Ja ilmeisesti tossa cromiumissa on ollu joku ongelma kääntövaiheessa sillon kun sitä testasin. Nyt näyttäisi 8GB riittävän kun ajelee 12 jobia samaan aikaan.

Tein huvikseni erittäin tieteellisen ja tarkan kokeen.
Testaas huvikses 24 jobilla että vaikuttaako aikaan. Iänaikainen neuvo on ollut että 1,5 kertanen määrä jobeja mitä cpu tarjoaa ytimiä smt mukaanlukien. Syynä tähän on se että monet noista jobeista kestää lyhyen aikaa niin tuolla saadaan pidettyä cpu kiireisempänä.
 
Liittynyt
23.01.2018
Viestejä
115
Ei.

Muistista haetaan kerralla aina välimuistilinjan verran dataa.

Se, mikä muistityyppi on käytössä ei vaikuta yhtään sen välimuistilinjan kokoon; Välimuisti on jo >10 vuotta ollut kaikissa x86-prosessoreissa 64 tavua.
Ei.

Muistista haetaan kerralla sellaisen burstin pituinen määrä dataa, mitä kyseinen muististandardi tukee. Prosessorin muistiohjaimet ja välimuistit suunnitellaan tuon kanssa yhteensopivaksi. Tuo burstin pituus merkittäviltä osin määrittää sen muistin nopeuden, sillä peruskelloa ei voi määrättömästi nostaa.

Burstin pituus oli DDR2:ssa 4 siirtoa ja DDR3:n sekä DDR4:n kanssa 8 siirtoa. DDR5 käyttää oletusarvoisesti 16. pituista burstia ja on oletettavaa, että prosessoriarkkitehtuuri / muistiohjaimet suunnitellaan myös sitä tukemaan. Olisi varsin typerää, jos näin ei tehtäisi. Nythän yhtään DDR5-muistillista x86-prosessoria ei ole julkistettu ja kaikki mitä sinä (tai minä) sanot on spekulaatiota.

Todennäköisin käytännön toteutustapa lienee on, että koska DDR5 tukee kahta muistikanavaa per DIMM, tehdään siirto (ja bursti) kerrallaan vain yhdellä kanavalla, joka vastaa nykyistä prosessorin välimuistilinjaa. Näin molemmat kanavat voivat hakea yhtäaikaa tietoa toisiaan haittaamatta vaikkapa eri ytimien tarpeisiin, eikä välimuistiarkkitehtuuriin tarvitse tällä tasolla koskea. DDR5 käytännössä tuplaa muistikanavien määrän DDR4:een.

Jotta kaksi muistiväylää per DIMM todella toisi lisää kaistaa muistioperaatioihin on oletettavaa, että DDR5-tuellisissa (teho)prosessoreissa on (vähintään) neljä muistikanavaa: Kaksi per DIMM x 2 DIMMiä.

Micronin blogista:

"Increased data burst length to 16
A data burst length of 16 (BL16) is required on DDR5 to take full advantage of the increased data rates as core timing of the DRAM has not improved. BL16 improves data and command bus efficiency due to larger array accesses limiting the exposure to I/O-array timing constraints within the same bank. The burst length increase to 16 also enables the new DIMM architecture, which results in two completely independent 40-bit channels. This outcome improves concurrency and essentially doubles available memory channels in the system."

Uudemmat muistityypit vaan mahdollistavat sille muistiväylälle suuremman kellotaajuuden, että se välimuistilinja siirtyy hiukan nopeammin.
Kyllä, mutta tuplasyvyisellä burstilla ja kahdella kanavalla saa DDR5-muisti siirrettyä potentiaalisesti yhden muistinhakulantenssin aikana kaksinkertaisen määrän tietoa (DDR5-6400 vs DDR4-3200). Kuten yllä on mainittu, jaetaan DIMM kahtia ja tehdään kaksi hakua yhtäaikaa eri paikkoihin muistia, mikä on yhä kasvavan ydinmäärän kanssa toimiva tapa lisätä suorituskykyä.

Ja uudemmat muistityypit eivät myöskään tuo mitään parempaa prefetchiä. Siihen, millaisia prefetchejä ydin tekee vaikuttaa vain se ydin.
En väittänytkään prosessorin prefetchin siitä muistityypistä parantuvan, vaan sanoin nopeamman muistityypin yhdessä paremman prefetchin kanssa lisäävän tehoa. Mitä paremmin prosessori osaa ennakoida tulevat haut ja hakee tiedon valmiiksi, sitä vähemmän suorat muistihaut haittavat liukuhihnan etenemistä.
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
558
Testaas huvikses 24 jobilla että vaikuttaako aikaan. Iänaikainen neuvo on ollut että 1,5 kertanen määrä jobeja mitä cpu tarjoaa ytimiä smt mukaanlukien. Syynä tähän on se että monet noista jobeista kestää lyhyen aikaa niin tuolla saadaan pidettyä cpu kiireisempänä.
En itse muista tuollaista neuvoa aikaisemmin kuulleeni, tulee lähinnä mieleen Gentoon epävirallisen virallinen nyrkkisääntö MAKEOPTS="-jX", X=1.5x fyysisten ytimien määrä. Mutta tämä ei ehkä aivan samaan asiaan liity. Vaan suotta sitä arvelemaan, ajelin samaan rahaan eilisen 16 jobia myös uusiksi, tällä kertaa lisäksi tyhjentelin levycachet alkuun ettei ainakaan vääristä tuloksia suuntaan taikka toiseen. Bonuksena helpommin toistettava defconfig eilisen käsin säädetyn sijaan:
Bash:
# echo 3 > /proc/sys/vm/drop_caches && make mrproper && make allmodconfig && time make -j24 bzImage modules
...
real    20m25.600s
user    320m21.137s
sys     18m0.096s

# echo 3 > /proc/sys/vm/drop_caches && make mrproper && make allmodconfig && time make -j16 bzImage modules
...
real    20m52.145s
user    313m29.951s
sys     18m5.698s

# echo 3 > /proc/sys/vm/drop_caches && make mrproper && make allmodconfig && time make -j12 bzImage modules
...
real    24m3.031s
user    277m22.668s
sys     16m22.365s

# echo 3 > /proc/sys/vm/drop_caches && make mrproper && make defconfig && time make -j16 bzImage modules
...
real    1m49.582s
user    26m40.168s
sys     1m32.720s
 
Liittynyt
21.06.2017
Viestejä
3 506
Gentoon epävirallisen virallinen nyrkkisääntö MAKEOPTS="-jX", X=1.5x fyysisten ytimien määrä.
Jep. Redhat pohjaiset näyttää nykyisin vetävän vakiona tuolla. Ei tartte enää taistella että saa rpmbuild komennon ajamaan enemmän kuin 1 jobia kerrallaan.
Eipä tuo isosti vaikuttanut, mutta onhan se pienikin parannus jotakin ;)
 
Liittynyt
22.10.2016
Viestejä
6 183
Kyllä.
Muistista haetaan kerralla sellaisen burstin pituinen määrä dataa, mitä kyseinen muististandardi tukee.
Muististandardit tukevat monen eri kokoisia accesseja. Ja muisteja voidaan laittaa eri määrä rinnakkain.

Sen sijaan pienin datamäärä mitä välimuistit pystyvät käsittelemään ja josta pitämään kirjaa on tasan sen välimuistilihkon koko.

Välimuisti ei koskaan pyydä mitään muuta määrää dataa ulommalta muistilta, kuin välimuistilinjansa verran.

Prosessorin muistiohjaimet ja välimuistit suunnitellaan tuon kanssa yhteensopivaksi.
64 tavun välimuistilinja, jota on käytetty kaikissa x86-prosessoreissa >10 vuotta ja tullaan (hyvin todennäköisesti) käyttämään vielä monta vuotta tulevaisuudessakin, on yhteensopiva kaikkien tunnettujen , nykyisten ja tulevien JEDECin standardoimien keskusmuistiksi tarkoitetujen muistityyppien kanssa.

DDR5n tapauksessa itse asiassa homma menee nimenomaan sitenpäin, että muististandardia on nimenomaan "tuunattu" JOTTA se toimisi järkevästi myös 64 tavun välimuistilinjojen kanssa.

Ja prosessorin välimuistilinjan koko ei ole asia jota vaihdetaan kuten muistityyppiä tai sukkia. Se vaikuttaa kaikkeen siinä välimuistin kirjanpidossa, se vaikuttaa välimuistin koherenttiusprotokollaan. Ja koska data- ja käskyvälimuistien pitää pysyä koherentteina keskenään, se vaikuttaa selvästi myös käskynhakuun ja mm. siihen, miten hypyt ja niiden kohteet kannattaa olla alignoituna muistissa että ne on nopeita. Välimuistin lohkokokoa voidaan helposti vaihtaa vain kun koko ydin menee aivan uusiksi.

Ja Zenissä jopa lisättiin käsky (clzero) joka kirjoittaa yhden välimuistilinjan verran nollia, eli välimuistilinjan koko käytännössä paljastettiin softalle; Jos välimuistilinjan koko muuttuu, tämän käskyn toiminta muuttuu.

Samsung meni omaan Mongoose M1-ARM-ytimeensä 128 tavun lohkokoon, kun sen kanssa "little"nä käytettävässä Cortex A53ssa on vain 64 tavun lohkokoko. Tästä seurasi aika ilkeitä bugeja Exynos 8890-piirillä.


Tuo burstin pituus merkittäviltä osin määrittää sen muistin nopeuden, sillä peruskelloa ei voi määrättömästi nostaa.
Tässä ollaan hyvin oikeilla jäljillä, tosin en ole varma, onko asian kaikkia yksityiskohtia kuitenkaan aivan täysin ymmärretty.

Tässä on siis kyse siitä, kuinka monta kertaa leväempi sisäinen dataväylä (ja pienempi datansiirtotaajuus) muistilla sisäisesti on vs sen väylän datansiirtotaajuus ja leveys. Tälle käyetään termiä prefetch mikä on harhaanjohtava koska tällä on myös toinen täysin erilainen merkitys välimuisteista puhuttaessa.

Tämä ei kuitenkaan suoraan lukitse burstin pituutta. Se ainoastaan asettaa minimin sille, kuinka lyhyellä burstilla saadaan tehtyä kaistan kannalta optimaalisia siirtoja ilman että kikkaillaan useamman bankin kanssa

Eli, DDR2-400 toimii ulkoisesti 200 MHz kellotaajuudella, siirtäen dataa nousevalla ja laskevalla reunalle (400 MHz datansiirtotaajuus) mutta sisäisesti 100 MHz taajuudella. Kun muistista haetaan yhtään mitään, yhtä ulkoisen väylän bittiä kohden haetaan ja sisäisesti siiretään yhden sisäisen kellojakson aikana neljästä rinnakkaisesta paikasta 4 bittiä(prefetch=4n). Nämä voidaan sitten siirtää piiriltä ulos kahden ulkoisen kellojakson (neljän ulkoisen kellonreunan) aikana eli samassa ajassa.

DDR3-800 toimii sitten ulkosesti 400 MHz kellotaajuudella, siirtäen dataa nousevalla ja laskevalla reunalle (800 MHz datansiirtotaajuus) mutta sisäisesti 100 MHz taajuudella. Kun muistista haetaan yhtään mitään, yhtä ulkoisen väylän bittiä kohden haetaan ja sisäisesti siiretään yhden sisäisen kellojakson aikana kahdeksasta rinnakkaisesta paikasta 8 bittiä(prefetch=8n). Nämä voidaan sitten siirtää piiriltä ulos neljän ulkoisen kellojakson (kahdeksan ulkoisen kellonreunan) aikana eli samassa ajassa.

Mutta tämä pätee vain DDR3een asti.

DDR4ssa edelleen itse muistisoluista haetaan yhdellä accessilla yhtä muistiväylän bittiä kohden vain 8 bittiä kerrallaan(prefetch=8n), mutta ulkoinen väylä käy silti selvästi suuremmalla nopeudella kuin 8x datansiirtotaajuudella. Ja se, miten se muistiväylä saadaan työllistettyä sen loppuajan siitä yhdestä pitkästä sisäisestä kellojaksosta on, siellä suoritetaan seuraava burst-siirto jonka data tulee toisesta bank groupista; DDR4 tukee neljää bank grouppia; Kun kaksi erillistä accessia osuu eri bank grouppeihin, niiden datat voidaan hakea saman sisäisen kellojakson aikana muistisoluista ja tunkea saman sisäisen kellojakson aikana peräkkäin ulos ulkoiselle väylälle.

Burstin pituus oli DDR2:ssa 4 siirtoa
Väärin. DDR2n bursin pituus on vähintään 4 siirtoa. Se voi olla myös enemmän, ainakin 8.


Prefetch on DDR2ssa 4n.

ja DDR3:n sekä DDR4:n kanssa 8 siirtoa.
Väärin, se voi olla myös 4 (burst chop mode), mutta tämä tarkoittaa vaan sitä, että muistisoluista jo haetusta datasta heitetään puolet mäkeen ja ilmeisesti kaista puolittuu.

Verrattuna siihen, että data, jota ei tarvita, heitettäisiin mäkeen vasta siirron jälkeen toisessa päässä tällä kuitenkin säästetään virtaa tapauksissa, joissa muistiväylän ja välimuistin välinen konfiguraatio on epäoptimaalinen.


En ole varma, onnistuuko DDR4lla myös 4-mittaiset burstit neljään eri bank grouppiin, jolloin kaista ei tässä tilanteessa kärsi, mikäli accessit oikeasti sattuu osumaan neljään eri bank grouppiin.

Prefetch on DDR3ssa ja DDR4ssa 8n.

DDR5 käyttää oletusarvoisesti 16. pituista burstia
Nyt tajusit vihdoin lisätä "oletusarvoisesti"-sanan joka tekee väitteestäsi toden.

Tosin siinä on myös 32-pitkä moodi.

ja on oletettavaa, että prosessoriarkkitehtuuri / muistiohjaimet suunnitellaan myös sitä tukemaan.
Se 64 tavun välimuistilohko, jota on käytetty jo >10 vuotta, tukee sitä. 32-bittisillä muistikanavilla, joihin DDR5n myötä siirrytään.

Olisi varsin typerää, jos näin ei tehtäisi.
Välimuistin lohkokoko ja musitiohjaimen suunnittelu on toisistaan jossai määrin erillisiä asiota, ja se, kumpi vaikuttaa kumpaan, menee täysin toisinpäin: Muistiohjain suunnitellaan siten, että se palvelee sitä välimuistia mahdollisimman hyvin, kun välimuistin lohkokoko on ensin lyöty lukkoon.

Ja DRAM-muistiohjain suunnitellaan aina nimenomaan jollekin muistityypille että se toimii, ja on aivan itsestäänselvyys, että se optimoidaan toimimaan nopeasti sillä muistyypillä, jota se tukee.

Sen sijaan siinä, kumpi vaikuttaa kumpaan myös välillä välimuistilinjan koko vs muististandardii homma välimuistilinjojen koon kanssa menee käytännössä nykyään siten, että muististandardi (DDR5-DIMMin kanavan leveys) tuunattiin siten että se toimii optimaalisesti 64 tavun välimuistilinjojen kanssa.

Nythän yhtään DDR5-muistillista x86-prosessoria ei ole julkistettu ja kaikki mitä sinä (tai minä) sanot on spekulaatiota.
Erottelen kyllä kommenteissani hyvin selvästi spekulaation ja faktat toisistaan, ja kaikki mitä sanoin tuossa edellisessä viestissäni on faktaa, ei spekulaatiota.

Sinä sen sijaan sekoitat minimiburstin pituuden ja burstin pituuden, ja sinä täällä spekuloit siitä mitä mielestäsi pitää muuttaa tai jopa on pitänyt muttaa, vaikka tosiasia on, että ei ole muutettu.

Väännetään vielä rautalankaa:

Kun dataa haetaan yhdellä 64-bittisellä kanavalla, 64-tavuisen välimuistilinjan siirtämiseen tarvitaan 8 peräkkäistä siirtoa.
Tämän voi tehdä DDR2lla, DDR3lla ja DDR4lla yhdellä 8-mittaisella burstilla.

Kun data on interleavattu kadelle kahdelle 64-bittiselle kanavalle, 64-tavuisen välimuistilinjan siirtämiseen tarvitaan 4 peräkkäistä siirtoa

Tämän voi tehdä DDR2lla yhdellä 4-mittaisella burstilla.

Tämän voisi tehdä DDR3lla ja DDR4lla chop-modessa 4-mittaisella burstilla, mutta (nyt alkaa spekulaatio)
käsittääkseni näin ei yleensä tehdä, vaan DDR3n ja DD4n kanssa tällaisten kahden kanavan välillä interleavausta ei prosessoreilla tehdä, vaan data interleavataan siten, että kokonainen välimuistilinja on aina yhdessä kanavassa ja seuraava seuraavassa, ja tällöin voidaan käyttää optimaalista 8-mittaista burstia.


Kun dataa haetaan yhdellä 32-bittisellä kanavalla, 64-tavuisen välimuistilinjan siirtämiseen tarvitaan 16 siirtoa.

Tämän voi tehdä DDR5lla yhdellä 16-mittaisella burstilla.

Standardeissa DDR5-simmeissä yhden kanavan leveys on kavennettu 32 bittiin, juuri sen takia, että maailma on täynnä prosessoreita joiden välimuistilinja on 64 tavua.

Todennäköisin käytännön toteutustapa lienee on, että koska DDR5 tukee kahta muistikanavaa per DIMM, tehdään siirto (ja bursti) kerrallaan vain yhdellä kanavalla, joka vastaa nykyistä prosessorin välimuistilinjaa. Näin molemmat kanavat voivat hakea yhtäaikaa tietoa toisiaan haittaamatta vaikkapa eri ytimien tarpeisiin, eikä välimuistiarkkitehtuuriin tarvitse tällä tasolla koskea. DDR5 käytännössä tuplaa muistikanavien määrän DDR4:een.
Kyllä, oikeastaan sama mitä kirjoitin yllä.


Kyllä, mutta tuplasyvyisellä burstilla ja kahdella kanavalla saa DDR5-muisti siirrettyä potentiaalisesti yhden muistinhakulantenssin aikana kaksinkertaisen määrän tietoa (DDR5-6400 vs DDR4-3200). Kuten yllä on mainittu, jaetaan DIMM kahtia ja tehdään kaksi hakua yhtäaikaa eri paikkoihin muistia, mikä on yhä kasvavan ydinmäärän kanssa toimiva tapa lisätä suorituskykyä.
Se yksittäinen datamöykky mikä sieltä DDR5-DIMMiltä haetaan on edelleentasan saman kokoinen, 64 tavua.

Siirtyminen DDR5een ei siis yhdessäkään PCssä muuta kerralla siirretyn datan määrää yhtään, kuten ei myöskään vaikuttanut siirtyminen mihinkään muuhunkaan aiempaan muistityyppiin.

Sen siirtämiseen vaan DDR5lla tarvitaan vain puolet sen yhden DIMMin pinneistä, ja sinne saman DIMMiin toiseen kanavaan voi olla samaan aikaan täysin rinnakkainen access menossa.

Aiemmat muistityyppivaihdokset taas vaikutti vain siihen, että se sama datamäärä siirrettiin lyhemmässä ajassa.

En väittänytkään prosessorin prefetchin siitä muistityypistä parantuvan, vaan sanoin nopeamman muistityypin yhdessä paremman prefetchin kanssa lisäävän tehoa. Mitä paremmin prosessori osaa ennakoida tulevat haut ja hakee tiedon valmiiksi, sitä vähemmän suorat muistihaut haittavat liukuhihnan etenemistä.
Liian aggressiivisella välimuisti-prefetcherillä on aina huomattava riski heittää välimuistista mäkeen myös sellaista dataa, jota oikeasti tarvittaisiinkin aiemmin kuin sitä prefechattua dataa.

Prefetch ei ole mikään magic bullet joka vaihtaa kaistaa viiveeseen ilman haittavaikutuksia.
 
Viimeksi muokattu:
Toggle Sidebar

Uusimmat viestit

Statistiikka

Viestiketjut
89 799
Viestejä
1 837 330
Jäsenet
39 061
Uusin jäsen
Leo Laukkanen

Hinta.fi

Ylös Bottom