Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Jos tuo oikeasti tulee, niin sisällöntuottajat kiittävät. Jonkun videon koodaukseen tms. tuollaisen kuvittelisi olevan todella hyvä. Mehua varmaan kuluu ja jäähdytys lienee suht järeää luokkaa, mutta toisaalta kuvittelisi tuloksiakin tulevan. Ja ei taida Inteliltä olla tulossa vastaavaa. Intelin massiivipiireillä tuollaisen teko tulisi järkyttävän kalliiksi.

Kellot vain tarpeeksi alas (Ja jännitteet), esim 2 GHz, niin ei se liikaa virtaa vie, vaikka staattinen vuotovirtakin on varmasti jo jonkinmoinen..
 
Mitenhän toi quadchannel riittää moiselle monsterille. Siitähän oli jo epäilyjä että edellisillä threadrippereillä quad channel olisi ahistanut 32-core versioita, tosin tämähän osoitettiin vääräksi kun Linuxilla vastaavat sovellukset toimivat ongelmitta. Muistia varmaan pitää olla varmaan vähintään 64GB jos aikoo kaikkia ytimiä käyttää johonkin oikeaan työhön.

Tuossa on hyvää luettavaa miten esim Unreal enginen editori toimii aikaisemmalla threadripperillä, ja miten muistia tarvii:

enemmän tais ahdistaa muistien yhteys kahteen lastuun neljästä, mikä ei ehkä näissä päde kun on muistinohjain omalla lastulla ja muistitaajuutta on saatu kivasti nostettua
 
enemmän tais ahdistaa muistien yhteys kahteen lastuun neljästä, mikä ei ehkä näissä päde kun on muistinohjain omalla lastulla ja muistitaajuutta on saatu kivasti nostettua

Ehkä-sanan voi jättää pois. Ei päde näissä, kaikkiin muistikanaviin on kaikilta ytimiltä ihan yhtä nopea pääsy.

Mutta: liukuluku-throughput-nopeutta on tullut >4x lisää, muistikaistaa vaan n. 1.5-kertaisesti lisää.
Onneksi sentään L3-välimuistit ovat myös kasvaneet.



Ja jos palataan enemmän säikeen aiheeseen, niin:

Intelin vastine noille seuraavan sukupolven threadrippereille lienee 48-ytiminen cascade lake kellotettuna suurille kelloille. Siinä on 12 muistikanavaa, ja todennäköisesti matalammat monen ytimen kellot, mutta potentiaalisesti suuremmat turbokellot. ja se voi kärsiä NUMA-ongelmista mistä tuo seuraavan sukupolven threadripper ei voi kärsiä.
 
Viimeksi muokattu:
Jos tuo oikeasti tulee, niin sisällöntuottajat kiittävät. Jonkun videon koodaukseen tms. tuollaisen kuvittelisi olevan todella hyvä. Mehua varmaan kuluu ja jäähdytys lienee suht järeää luokkaa, mutta toisaalta kuvittelisi tuloksiakin tulevan. Ja ei taida Inteliltä olla tulossa vastaavaa. Intelin massiivipiireillä tuollaisen teko tulisi järkyttävän kalliiksi.

Jostain lueskelin jotta h264 pakkauksessa pystyreson kun jakaa 40 niin saadaan luku jonka verran h264 pystyy käyttämään coreja. Jos tämä pitää paikkaansa niin esim 4k resolla luku on 56, eli edes 2 yhtäaikaista 4K videon encoodausta ei näinollen vielä kuormittaisi tuota CPU:ta kokonaan.
 
61939b76d3b9346b8da02dfce3e13177808cae78c6e56eb35c4db3b6e0fdd832.jpg
 
Onks tollasille joku sopiva mesta täällä. Olen vielä aika noob tän foorumin syvemmästä sielun elämästä.
 
Onks tollasille joku sopiva mesta täällä. Olen vielä aika noob tän foorumin syvemmästä sielun elämästä.
Yleisesti pelkillä kuvilla/videoilla keskustelu on kielletty, mutta tuo menköön. Jatkossa referointi mukaan.
 
Intel reportedly delaying massive new chip plant in Israel

Intel Turns to Samsung in Order to Resolve CPU Shortage on the 14 nm Process


Nyt on taas erittäin mielenkiintoisia uutisia. Että 10 nm tilanne sekä 14 nm tilanne on niin paha että intelin täytyy ostaa 14 nm valmistuskapasiteettia samsungilta? Ei aivan kevyin perustein lähdetä. Intelin 14nm ei ole Samsungin 14 nm, paljonkohan rakenteita tarvii optimoida uudelleen ja mikä on lopputulos.

Intelin oma 14 nm on kuitenkin aivan perkeleen hyvä prosessi sellaiseksi mikä se on.
 
Intel reportedly delaying massive new chip plant in Israel

Intel Turns to Samsung in Order to Resolve CPU Shortage on the 14 nm Process


Nyt on taas erittäin mielenkiintoisia uutisia. Että 10 nm tilanne sekä 14 nm tilanne on niin paha että intelin täytyy ostaa 14 nm valmistuskapasiteettia samsungilta? Ei aivan kevyin perustein lähdetä. Intelin 14nm ei ole Samsungin 14 nm, paljonkohan rakenteita tarvii optimoida uudelleen ja mikä on lopputulos.

Intelin oma 14 nm on kuitenkin aivan perkeleen hyvä prosessi sellaiseksi mikä se on.

Vähän veikkaan, että joku tässä tarinassa mättää. On mm. kuulunut huhuja, että Rocket Lakessa olisi erillinen GPU omalla piilastullaan, samassa paketissa CPUn kanssa. Pitäisin uskottavana, että esim. tämä GPU tehtäisiin tuolla Samsungin prosessilla, mutta CPU tehtäisiin Intelin omalla prosessilla.
 


AMD Fine Wine ja Intelin tietoturvakorjauksetkin huomioiden 7700k on vielä tänäkin päivänä parempi peliprossu kuin 1800x.
 


AMD Fine Wine ja Intelin tietoturvakorjauksetkin huomioiden 7700k on vielä tänäkin päivänä parempi peliprossu kuin 1800x.


Erikoinen tulkinta kyllä videosta. Siniset lasit ilmeisesti vääristää maailmankuvan todella pahasti.
 
Erikoinen tulkinta kyllä videosta. Siniset lasit ilmeisesti vääristää maailmankuvan todella pahasti.

7700k voitti sekä min että avg FPS:ssä seitsemässä pelissä yhdeksästä. Yhdessä Intel voitti selvästi AVG ja hävisi hienoisesti MIN fps:ssä. Yhdessä pelissä 1800x voitti molemmissa.

Eli vähintään 7-2 voitto 7700k:lle, ehkä jopa 8-1. Mikä tässä nyt vääristyy?

EDIT: Molemmat kellotettuina siis.
 
Tuon testin kun ois vielä ajanu muistit viritettynä molemmille. Tosin taitaa toi muistien kellottelu olla enemmän harvojen puuhaa, meinaa suurin osa ostajista varmaa ajaa perusasetuksilla.
 
Tuon testin kun ois vielä ajanu muistit viritettynä molemmille. Tosin taitaa toi muistien kellottelu olla enemmän harvojen puuhaa, meinaa suurin osa ostajista varmaa ajaa perusasetuksilla.

Niin no testas 3200MHz 14cl B-die muisteilla tuossa eli edes nuo stock tulokset eivät nyt varsinaisesti ole stock tuloksia vaan muistien ylikellotuksella saatuja tuloksia.
 
Intelin mukaan PCIe 4.0 ei ole tarpeellinen peleille nyt eikä lähitulevaisuudessa.
Intel Shows PCI Express 4.0 Means Nothing For Gamers - Legit Reviews
8k-näyttöjen ja korkean virkistystaajuuden kanssa asia alkaa tulla ajankohtaiseksi.

Itse en tuota kyllä ihan purematta niele, koska Tech powerupin testissäkin joissakin peleissä jopa 1920x1080-tarkkuudella tuli selvää hyötyä PCIe 3.0 16x-väylästä verrattuna 8x-väylään, vaikka kaistanleveyslaskutoimituksen perusteella hyötyä ei pitäisi olla. Edellytyksenä oli tietysti se, että näytönohjaimena oli RTX 2080 Ti.
 
Itse en tuota kyllä ihan purematta niele, koska Tech powerupin testissäkin joissakin peleissä jopa 1920x1080-tarkkuudella tuli selvää hyötyä PCIe 3.0 16x-väylästä verrattuna 8x-väylään, vaikka kaistanleveyslaskutoimituksen perusteella hyötyä ei pitäisi olla. Edellytyksenä oli tietysti se, että näytönohjaimena oli RTX 2080 Ti.

Techpowerupin testissä oli vain fps-keskiarvot. Niissä oli 3 prosenttiyksikön ero pcie 3 8x vs 16.
99. persentiilin fps-erot voi olla mitä vaan. Fps minimit on se mitä silmä näkee.

hellblade_1920-1080.png
assassins-creed-origins_1920-1080.png
 
Viimeksi muokattu:
7700k voitti sekä min että avg FPS:ssä seitsemässä pelissä yhdeksästä. Yhdessä Intel voitti selvästi AVG ja hävisi hienoisesti MIN fps:ssä. Yhdessä pelissä 1800x voitti molemmissa.

Eli vähintään 7-2 voitto 7700k:lle, ehkä jopa 8-1. Mikä tässä nyt vääristyy?

EDIT: Molemmat kellotettuina siis.
FPS:n lukujen ulkopuolella mainitsi että 7700K myös tökki vähän väliä, mitä 1800X:llä ei tapahtunut. Itse olen juuri 4790K:n kanssa huomannut Win 10 1809 buildin jälkeen tuon vähän väliä tapahtuvan jökkimisen peleissä. Vahvistaa tuon että nuo Intelin tietoturvakorjaukset nyt vaan pilaa sen sulavan keskeytyksettömän G-sync kokemuksen.
 
Korkeilla resoluutioilla PCIe kaistan merkitys pienenee TPU:n testien mukaan.

Pullonkaula lakkaa olemasta pullonkaula jos lisää toisen vielä isomman pullonkaulan. Hitaampi prosu, hitaampi monitori (60 Hz), hitaampi näyttis (=sama näyttis tuplasti pikseleitä).

Silloinkaan keskimääräinen fps ei riitä kertomaan koko tarinaa koska latenssipiikit voi olla mahdollisia.
 
FPS:n lukujen ulkopuolella mainitsi että 7700K myös tökki vähän väliä, mitä 1800X:llä ei tapahtunut. Itse olen juuri 4790K:n kanssa huomannut Win 10 1809 buildin jälkeen tuon vähän väliä tapahtuvan jökkimisen peleissä. Vahvistaa tuon että nuo Intelin tietoturvakorjaukset nyt vaan pilaa sen sulavan keskeytyksettömän G-sync kokemuksen.

Tuollainen tökkiminen voisi olla ikävää, itse kärsin siitä Ryzen 1700-setilläni, mutta tässä mielestäni hyppäät aika nopeasti johtopäätökseen kun sattumanvaraisen tökkimisen voi selittää muutkin asiat. Esim. DPC-latenssiongelmat.
 
Ainakin oman i5-6600k:n kanssa jos Windowsista on balanced virranhallinta käytössä aiheuttaa tökkimistä. Kun laittaa high performance niin kellot pysyy tasaisena ja nykimiset häviää.
 
Ei mulla oo kyllä mitään vertailukelpoista käsitystä 4-core prossujen "sulavuus" eroista 6 tai 8 ytimisiin verrattuna. Todella pitkä aika kun omistanut 4-ytimen prossun, nyt on 9900k ja TR1950x "kotikoneissa".

Se toki jos käyttää jotain virranhallintaa tai offsetteja mitkä hyppyyttää kellotaajuutta niin voi näkyä mikrolagina tai tökkimisenä, siinä menee rytsölälläkin useampi kymmenen millisekuntia kun hyppyytellään p-statesta toiseen. Ja intelillä sama myös, ja lisäherkkuna mahdolliset avx-offsetit.

8700k oli mulle paljon parempi peliprossu kuin 1700x tai vaikka TR1950, 9900k on pitäny hyvillä muisteilla ja enemmän kuin kohtuullisella 5.2Ghz kellotuksella kaikki muut mun testaamat prossut takanaan.

Jotenkin toi koko sulavuus argumentti tuntunut lähinnä placebo-enkelipöly-trollailulta jota jotkut viljelee puolustellessaan jomman kumman leirin tuotteita :vihellys: sen "sulavuuden" näkee kyl mittareilla; frametime, min-fps ja mediumi-fps sekä huonoin prossa ja promille. Jos joku prossut/näyttis on näissä stateissa parempi niin se "sulavuus" on silloin parempi eikä siinä sen kummempaa.
 
Miten paljon tuota tökkimistä näkyy GPU rajoitteisissa peleissä? Eli jos 1440p tai yli ja kaikki tapissa uusimpia pelejä.
 
Kapasiteettiongelmat ratkeaa jos Ryzen 3 alkaa myydä kunnolla :D

Ryzen3:sesta pitää vielä ensin nähdä kolmansien osapuolten kattavat testit ja lisäksi AMD:n pitää pystyä valmistamaan sitä paljon, jos hinta pidetään edullisena, muuten se menee "ei ooksi" kun alkuvarastot tyhjenevät.
 
Ryzen3:sesta pitää vielä ensin nähdä kolmansien osapuolten kattavat testit ja lisäksi AMD:n pitää pystyä valmistamaan sitä paljon, jos hinta pidetään edullisena, muuten se menee "ei ooksi" kun alkuvarastot tyhjenevät.
Ottaen huomioon, miten emovalmistajat ovat panostaneet 3000 sarjan julkaisuun voidaan olettaa, että kova prosessori on tulossa ja varastoa tulee riittämään. Ei siellä puolella pistetä tuollaisia paukkuja keskinkertaiseen prosessoriin.
 
Ottaen huomioon, miten emovalmistajat ovat panostaneet 3000 sarjan julkaisuun voidaan olettaa, että kova prosessori on tulossa ja varastoa tulee riittämään. Ei siellä puolella pistetä tuollaisia paukkuja keskinkertaiseen prosessoriin.
EI olisi ensimmäinen kerta, jos valmistajalta tulee hyvä tuote, niin se lopahtaa kesken. Mutta tuotteen hyvyys on vielä näkemättä.
 
EI olisi ensimmäinen kerta, jos valmistajalta tulee hyvä tuote, niin se lopahtaa kesken. Mutta tuotteen hyvyys on vielä näkemättä.
Se että Intel viimein lähti laskemaan hintoja antaa kyllä odottaa että jonkunlianen suorituskykyboosti on tulossa. Se on aika lailla viimeisiä asioita mitä tekevät elleivät oikeasti ole jäämässä jalkoihin nykyhinnoilla per suorituskyky. Samoin noiden tulevien high-end-lankkujen määrä kertoo että alkaa uskoa olla komponenttitoimittajillakin. Kun nyt saisivat nuo tulevat APUt pärjäämään, niin AMD pääsisi paremmin isompien massojen läppäri-OEM-puolelle.
 
Se että Intel viimein lähti laskemaan hintoja antaa kyllä odottaa että jonkunlianen suorituskykyboosti on tulossa. Se on aika lailla viimeisiä asioita mitä tekevät elleivät oikeasti ole jäämässä jalkoihin nykyhinnoilla per suorituskyky. Samoin noiden tulevien high-end-lankkujen määrä kertoo että alkaa uskoa olla komponenttitoimittajillakin. Kun nyt saisivat nuo tulevat APUt pärjäämään, niin AMD pääsisi paremmin isompien massojen läppäri-OEM-puolelle.

Se on vielä näkemättä onko uusissa Ryzeneissä frame time piikkejä pelikäytössä. En ole kovin hyvin kärryillä aiheesta, mutta chiplet-rakenne ja iso DDR4-latenssi voisi olla altis sen tapaiselle. Huonossa skenaariossa iso L3-välimuisti, joka ei kait ole yhteinen kaikille ytimille, nostaisi keskimääräiset fps:t ylös, mutta jättäisi 99. persentiilit Zen 1 tasolle. Toivottavasti semmoista ei ole.
 
Viimeksi muokattu:
Tuohan pitäisi korjautua uusimman windowsin päivityksen kanssa.
 
Viimeksi muokattu:
(siirretty muualta)

Clarkdale oli kyllä niin surkea tapaus Inteliltä. Tai se olis ollut todella hyvä jos eivät olisi sille erilliselle igpu sirulle siirtänyt muistiohjainta mikä tuhosi tuon suorituskyvyn täysin.
Itse prossu ydin oli 32nm Westmere ja se kyllä otti/ottaa kelloja huolella (viimevuonna kellottelin i3 mallin 4.7GHz:n).
Ja kuten LGA1366 puolella nähty niin Westmere paukuttaa vieläkin nättejä lukuja tauluun ja ero Sandyyn on todella minimaalinen.

Että nuo Clarkdalet olisivat olleet mahtavia jos muistiohjain olisi ollut itse CPU sirulla.

Anteeksi offtopic.

.. ja sitten täällä ollaan innoissaan, kun AMD vuonna 2019 tekee juuri saman, mikä sen clarkdalen pilasi ;)

Ja odotetaan, että intelin pitäisi tehdä sama uudestaan, että pysyy kilpailukykyisenä ;)
 
4c 8t isosti parempi kuin 4c 4t: Assassins creedit, Kingdom come deliverance, kait muitakin.

Jatkon kannalta HT uskottavuus on kärsinyt kolauksen, eikä niitä voi enää ihan yhtä ennakkoluulottomasti kuin ennen ostaa kummaltakaan valmistajalta. Ei tiedä milloin löytyy joku uusi vika joka paikataan laastarilla.

Voi halutessaan ostaa ylimitoitetun määrän ytimiä, sopii tähän hetkeen ja ei ole kovin kallista, ja tarvittaessa tulevina vuosina kytkeä biosista HT:n pois - ja menettää silloin ehkä neljänneksen suorituskyvystä.

Kysymys kuuluu miten HT pois kytkeminen sopii AMD:n tulevaan chiplet-malliin ja nykyisiin 2600/2700 malleihin. Kiinnostaa tietää tekeekö prosun säikeiden väheneminen enemmän viiveitä tiedon liikutteluun suoritettavan ohjelman säikeiden välillä, koska pitää useammin liikuttaa tietoa fyysisten ytimien, CCX:ien, chiplettien välillä peleissä. Koska Ryzenin muistiohjaimen viiveet ei ole muutenkaan parhaat mahdolliset juuri peleissä.

Ei AMD:n tarvitse HT:tä kytkeä pois. Se on Intelin ongelma.
 
Joidenkin tutkijoiden mukaan koko HT/SMT on tietoturvan suhteen toivoton konsepti.

Saa nyt nähdä kun 3950X julkaistaan, voihan olla että jopa ilman HT/SMT viritystäkin 16-ydintä olisi ns tarpeeksi suuressa osassa ohjelmia / pelejä ilman että "ylimääräisiä" säikeitä tarvitaan. Mutta ainakin suuressa osassa vanhemmista AMD/Intelin prosessoreista pelkkä 2 tai 4 ydintä ei riitä ilman säikeistystä. Tämä tietysti vain oma mielipiteeni, osa kun tältäkin foorumilta on ollut vakaasti sitä mieltä että edes netin selaaminen ei onnistu 1 tai 2-ydin prosessorilla ja osa taas sitä mieltä että 2-ydin prosessorilla pystyy vielä pelaamaankin 4Gb muistin kanssa (tietysti vanhempia pelejä mutta kuitenkin).
 
Muutaman viikon juuri käytin Celeron G3930 prosessoria. (2core 2thread).
Kyllähän sillä pystyi nettiä selaamaan ja Netflixiä katsomaan, kunhan mitään muuta ei yhtä aikaa yrittänyt tehdä.
 
Saa nyt nähdä kun 3950X julkaistaan, voihan olla että jopa ilman HT/SMT viritystäkin 16-ydintä olisi ns tarpeeksi suuressa osassa ohjelmia / pelejä ilman että "ylimääräisiä" säikeitä tarvitaan. Mutta ainakin suuressa osassa vanhemmista AMD/Intelin prosessoreista pelkkä 2 tai 4 ydintä ei riitä ilman säikeistystä. Tämä tietysti vain oma mielipiteeni, osa kun tältäkin foorumilta on ollut vakaasti sitä mieltä että edes netin selaaminen ei onnistu 1 tai 2-ydin prosessorilla ja osa taas sitä mieltä että 2-ydin prosessorilla pystyy vielä pelaamaankin 4Gb muistin kanssa (tietysti vanhempia pelejä mutta kuitenkin).

SMT pois päältä kääntäminen ei kait peleissä perinteisesti ole pudottanut suorituskykyä vaan nostanut sitä (kunhan ytimet ei lopu kesken). Konsoleihin tulee 8c 16t , joten12c 12t riittää varmuudella pöytäkoneissa konsoliporttauksiin.

Se vaan, kun keskenään juttelevat threadit/prosessit koitetaan kait kerätä saman CCX:n ja L3 cachen sisälle, ja SMT pois päältä CCX:n sisälle mahtuu vain puolet tavarasta. Voi olla että siinä ei ole käytännössä ongelmaa.
 
SMT pois päältä kääntäminen ei kait peleissä perinteisesti ole pudottanut suorituskykyä vaan nostanut sitä (kunhan ytimet ei lopu kesken).

Juu. Ongelmana on tosiaan kuormanjako, eli tyypillisesti pelissä on yksi raskaampi säie, joka on selvä pullonkaula.
Kun sen kanssa samalle fyysiselle ytimelle joksikin aikaa sattuu osumaan joku toinen (ei-niin kriittinen säie), tämä kriittinen säie hidastuu.

SMT pois päältä se vähemmän kriittinen säie ajautuisi jollain toisella ytimellä sen jälkeen/sitä ennen/sen välissä kun sillä toisella ytimellä on ajettu jotain muuta kevyttä säiettä.

Konsoleihin tulee 8c 16t , joten12c 12t riittää varmuudella pöytäkoneissa konsoliporttauksiin.

Se vaan, kun keskenään juttelevat threadit/prosessit koitetaan kait kerätä saman CCX:n ja L3 cachen sisälle, ja SMT pois päältä CCX:n sisälle mahtuu vain puolet tavarasta. Voi olla että siinä ei ole käytännössä ongelmaa.

... ja sitten kun kaikki ajossa olevat säikeet ei mahdu yksinään yhden CCXn ytimille (eli säikeitä on ajossa yli 4) meillä on dilemma.

Voidaan joko laittaa pelin viides säie toiselle CCXlle, jolloin sille tulee ylimääräistä kommunikaatioviivettä, tai voidaan laittaa sen samaan CCXään samlle ytimelle jonkun muun säikeen kanssa (käyttää sen kanssa melkein kaikki samoja resursseja, hidastaa selvästi sitä).

Molemmissa on huonot puolensa.

Osaakohan mikään peli asettaa säikeilleen mitään prioriteetteja, että käyttiksen skedulerilla olisi edes teoreettinen mahdollisuus yrittää optimoida skedulointia siten, että se tärkein säie saisi aina yksin oman ytimensä, vaikka muita säikeitä laitetaan yhtä aikaa jonkun muun ytimen molempiin virtuaaliytimiin?
 
Viimeksi muokattu:
  • Tykkää
Reactions: hik
Se, mikä kelpaa näyttikselle joka toimii 1190 MHz kellotaajuudella on aika eri asia kuin mikä kelpaa CPUlle, jonka pitäisi toimia n. 5 GHz kellotaajuudella.
Aivan :D Siksi esitinkin esimerkkinä tuotteen, jossa CPU on tehty eri prosessilla kuin GPU lastu.
 
Juu. Ongelmana on tosiaan kuormanjako, eli tyypillisesti pelissä on yksi raskaampi säie, joka on selvä pullonkaula.
Kun sen kanssa samalle fyysiselle ytimelle joksikin aikaa sattuu osumaan joku toinen (ei-niin kriittinen säie), tämä kriittinen säie hidastuu.

Eikö käyttöjärjestelmät tosiaan osaa ohjata näitä säikeitä sellaisille ytimille, joilla on vähiten kuormaa? Mikä pakko se on tunkea kaikkein kuormitetuimmalle ytimelle jos muut ytimet ns. pyörittelevät peukaloitaan?
 
Eikö käyttöjärjestelmät tosiaan osaa ohjata näitä säikeitä sellaisille ytimille, joilla on vähiten kuormaa? Mikä pakko se on tunkea kaikkein kuormitetuimmalle ytimelle jos muut ytimet ns. pyörittelevät peukaloitaan?

Olet nyt ilmeisesti tajunnut jotain väärin. Ei siellä ole mitään "peukaloita pyöritteleviä" ytimiä silloin kun ne säikeet on valmiina suoritukseen. ja silloin kun siellä pyöritellään peukaloita, ne kaikki pyörittelee peukaloita pääosin yhtä aikaa. Säie haluaa suoriutua maksiminopeudella tai ollenkaan, ei "kevyt" säie millään ajanhetkellä kuluta suoritinydintä "osittain" vaan se käyttää sitä CPUta täysillä hetken ja sitten idlaa.

Väännetään rautalangasta esimerkki:

Pelissä aloitetaan 16.66 ms (60 fps) välein uuden framen laskenta. Ajoon tule yhtä aikaa 5 säiettä.

4 säikeistä laskee vähemmän ja valmistuu n. 8 ms jälkeen. Tämän jälkeen näitä säikeitä ajaneet ytimet pyörittelevät peukaloitaan.

Viimeinen säie laskee enemmän ja valmistuu n. 16ms jälkeen. viimeiset 0.66ms odotellaan vsyncciä.

Mikäli meillä on käytössä vain 4 fyysistä ydintä ja SMT, näistä viidestä säikeestä 2 menee samalle fyysiselle ytimelle, ja molemmat näistä säikeistä hidastuvat, esim. siten että hommaan menee molemmilta 13ms.

Mikäli sattuu käymään niin, että kaksi näistä 8ms CPU aikaa tarvitsevista "kevyemmistä" säikeista sattuu samalle ytimelle, ei mitään ongelmaa, niillä molemmilla kestää n. 13ms hommaansa, ja niille jää edelleen 3 ms aikaa idalta

Mutta mikäli sattuu käymään niin, että sen 16ms CPU-aikaa tarvitsevan säikeen kanssa sattuu päällekkäin samalle ytimelle yksi näistä toisista säikeistä, menee sen ensimmäisen puolikkaan suorittamiseen n. 13ms ja toiseen sama 8ms kuin normaalistikin, eli kokonaisuudessaan 21ms.

Ja muut säikeet odottelee sen 13ms ennen kuin frame on valmis ja ne pääsevät laskemaan seuraavaa framea.

Ja useat skedulerit vieläpä pyrkivät nimenomaan "reiluuteen" eli antamaan eri säikeille yhtä paljon CPU-aikaa. Jos monta säiettä tappelee siitä, kuka pääsee ajoon, valitaan se, joka on tähän mennessä kuluttanut vähiten cpu-aikaa.


Ja tosiaan, osa peleistä laukoo niin monta säiettä, kuin mitä koneesta löytyy virtuaaliytimiä. Jos virtuaaliytimiä on vähän (SMT pois päältä) noita kevyempiä aputaskeja suoritetaan peräkkäin samassa säikeessä (vähemmän yhtäaikaisia säikeitä), mutta jos virtuaaliytimiä on paljon, on enemmän taskeja yhtä aikaa ajossa omissa säikeissään.
 
Olet nyt ilmeisesti tajunnut jotain väärin. Ei siellä ole mitään "peukaloita pyöritteleviä" ytimiä silloin kun ne säikeet on valmiina suoritukseen. ja silloin kun siellä pyöritellään peukaloita, ne kaikki pyörittelee peukaloita pääosin yhtä aikaa. Säie haluaa suoriutua maksiminopeudella tai ollenkaan, ei "kevyt" säie millään ajanhetkellä kuluta suoritinydintä "osittain" vaan se käyttää sitä CPUta täysillä hetken ja sitten idlaa.

Väännetään rautalangasta esimerkki:

Pelissä aloitetaan 16.66 ms (60 fps) välein uuden framen laskenta. Ajoon tule yhtä aikaa 5 säiettä.

4 säikeistä laskee vähemmän ja valmistuu n. 8 ms jälkeen. Tämän jälkeen näitä säikeitä ajaneet ytimet pyörittelevät peukaloitaan.

Viimeinen säie laskee enemmän ja valmistuu n. 16ms jälkeen. viimeiset 0.66ms odotellaan vsyncciä.

Mikäli meillä on käytössä vain 4 fyysistä ydintä ja SMT, näistä viidestä säikeestä 2 menee samalle fyysiselle ytimelle, ja molemmat näistä säikeistä hidastuvat, esim. siten että hommaan menee molemmilta 13ms.

Mikäli sattuu käymään niin, että kaksi näistä 8ms CPU aikaa tarvitsevista "kevyemmistä" säikeista sattuu samalle ytimelle, ei mitään ongelmaa, niillä molemmilla kestää n. 13ms hommaansa, ja niille jää edelleen 3 ms aikaa idalta

Mutta mikäli sattuu käymään niin, että sen 16ms CPU-aikaa tarvitsevan säikeen kanssa sattuu päällekkäin samalle ytimelle yksi näistä toisista säikeistä, menee sen ensimmäisen puolikkaan suorittamiseen n. 13ms ja toiseen sama 8ms kuin normaalistikin, eli kokonaisuudessaan 21ms.

Ja muut säikeet odottelee sen 13ms ennen kuin frame on valmis ja ne pääsevät laskemaan seuraavaa framea.

Ja useat skedulerit vieläpä pyrkivät nimenomaan "reiluuteen" eli antamaan eri säikeille yhtä paljon CPU-aikaa. Jos monta säiettä tappelee siitä, kuka pääsee ajoon, valitaan se, joka on tähän mennessä kuluttanut vähiten cpu-aikaa.


Ja tosiaan, osa peleistä laukoo niin monta säiettä, kuin mitä koneesta löytyy virtuaaliytimiä. Jos virtuaaliytimiä on vähän (SMT pois päältä) noita kevyempiä aputaskeja suoritetaan peräkkäin samassa säikeessä (vähemmän yhtäaikaisia säikeitä), mutta jos virtuaaliytimiä on paljon, on enemmän taskeja yhtä aikaa ajossa omissa säikeissään.
IBM muistaakseni sanoi suoraan että heidän prossunsa (Power tai ehkä oli Z) suorittaa yksittäisiä säikeitä hitaammin SMT-päällä kuin ilman. Eli meni jotenkin niin, että jos prossua ajaa ilman SMT:tä, niin nopeus tai throughput on 1 ja jos SMT päällä, niin throughput olisi 0,8 huonosti säikeistyvällä kuormalla, mutta hyvin säikeistyvällä kuormalla 1,3. Säikeistyvällä tarkoitan nyt jotain muuta kuin pitkiä eräajotyyppisiä CPU-syöppöjä. Pellin alla toiminee juuri niin kuin kirjoitit eli SMT päällä iso riski on että skedulointi ei mene ihan optimaalisesti, mutta jos säikeitä on paljon niin lopputuloksena kuitenkin nopeampi läpimenoaika.

Joidenkin tutkijoiden mukaan koko HT/SMT on tietoturvan suhteen toivoton konsepti.
Sinänsä en kyllä usko että SMT mihinkään poistuisi. Se tarjoaa niin pienellä lisäkululla sen verran suorituskykyetua että kyllä siitä varmasti pidetään loppuun asti kiinni. Ytimen suorituksessa kun on lähes aina jotain yksiköitä käyttämättä, niin olisihan se hölmöä olla niitä käyttämättä. Globaalissa mittakaavassa SMT säästää myös melkoisen määrän sähköä.
 

Statistiikka

Viestiketjuista
257 150
Viestejä
4 470 721
Jäsenet
73 896
Uusin jäsen
halfbrite

Hinta.fi

Back
Ylös Bottom