Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Ihan mielenkiinnosta, oletko kokeillut mitä se toinen antaisi 0.1% kun sen fps rajoittaa matalemmalle?

Tekee pelistä paljon jouhevamman kyllä (auttaa myös ihan hitaallakin prossulla linkki alla videooni aiheesta), mutta en ole mitään benchmarkkeja ajanut. Kun olen oikeastaan jättänyt taakseni nuo benchmarkkaus hommat. Tuo ylikellotus videoni oli poikkeus, kun niin minulle vakuuteeltiin että se aihe kiinnostaa katsojia... mutta kahden päivän jäljeen video jo käytännössä "kuoli". Että eipä näemmä kuitenkaan porukkaa kiinnostanut ( tai sitten youtube ei siitä tykännyt syystä X ).

Normaalisti en tee benchmarkkeja kuin pienessä muodossa Youtube kanavani kanava jäsenille kiitokseksi tuesta. Mutta normaalisti kaikki prossu testini teen silleen että ensin prossusta ja muisteista otan kaiken irti mitä saan ja sitten kokeillaan sitä kasalla uusia pelejä. Siten että jokaista peliä pelataan se 2 - 4 min per peli että nähdään kuinka ne toimivat.
Ja jos oikein tökkii ja on ongelmia niin kokeillaan pienemmillä grafiikka asetuksilla että saako pelin kyseisellä prossulla pelattavaksi.

Seuraavaksi testiin olisikin tulossa semmoinen tapaus minkä kanssa pitää kokeilla kaikki mahdolliset kikat :)
Eli kuuluisa juhla pena = Pentium G3258 jossa vain 2-ydintä ja 2-säiettä.

Mutta tuolle ylikellotus videolle aijon siis tehdä jatkoa vaikka tuo ensimmäinen osa floppasi oikein huolella.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.
 
Viimeksi muokattu:
@Zetteri G3258 AE-versio kellottui suhteellisen hyvin. @Sampsa taisi saada melkein 5GHz tulokset jos oikein muistan kyseiselle prossulle ja muutenkin pärjäsi hyvin kellotettuna
 
Minäkin laitan mielellään asetuksia ylöspäin ja DLSS päälle sitten kun tehot ei riitä.

Väittelyketjussa kun kaikenlainen yksimielisyys on bannauksen uhalla kielletty, niin elokuvateatterin osalta pitää olla eri mieltä. Kun teattereita alkaa olla erilaisia ja niissä on niin eri lipun hinnat ja osassa tarjoilukin pelaa.
Käytännössä menen lähellä olevaan karvalakkimalliseen leffateatteriin selvästi paremman elokuvateatterin sijasta.

Eli haluat enemmän yksityiskohtia nostamalla detailit maksimiin ja sitten kumminkin hävität ne DLSS:llä :facepalm:
Eikös olisi järkevämpää tiputtaa detaileja pykälä tai parikin ja ajaa peliä natiivisti ?
Oletko edes kokeillut kuinka paljon / vähän peli muuttuu asetuksia tiputtamalla ?

@Zetteri G3258 AE-versio kellottui suhteellisen hyvin. @Sampsa taisi saada melkein 5GHz tulokset jos oikein muistan kyseiselle prossulle ja muutenkin pärjäsi hyvin kellotettuna

Ainakin tuohon aikaan Intel lähetti golden samplet medialle, kun sitä vartenhan valmistajat lähettävät rautaansa esim juuri iotechille että se edistäisi myyntiä.
Normaalisti Haswellit ovat aikasta surkeita mitä tulee niiden ylikellotettavuuteen.

Aikasemmat yksilöni G3258:sta meni 4.4GHz, 4670K 4.3GHz ja 4770K 4.4GHz. No päätin nyt toisilla yksilöillä kokeilla että oliko tuurini vaan noin huonoa mitä tulee noiden ylikellotettavuuteen.
Uusi G3258 yksilöni meni järkevillä volteilla 4.8GHz ja liian kovilla 4.9GHz eli todella hyvästä yksilöstä oli kyse. Mutta sitten toinen 4670K yksilö oli vielä surkeampi kuin tuo edellinen. Mutta meni kyllä samat 4.3GHz, mutta tarvitsi enemmän voltteja ja kävi sitä kautta reilusti kuumenpana.
Uutena nyt sitten 4690K eli paranneltu Haswell = Devils Canyon meni sitten 4.6GHz ( 4.7GHz meni jos cachen jätti 4100MHz ).

Tässä nimittäin jo valmiiksi ylikellottelin nuo prossut, että kun aloitan taas videoitten teot (pidän juuri kesälomaa videon teosta) niin ei tarvitse kuin prossu vaihtaa emolle ja lukea ylikellotus profiili jonka kyseiselle prossulle tallensin.

Mutta mainostetaan vähän että tämmöisiä prossu testejä olisi luvassa syyskuusta eteenpäin:
Pentium G3258
i5 4670K
i5 4690K
i7 4770K
i5 3570K
i7 3770K
i5 2500K
i7 2600K
i7 7700K
R3 3100
R5 5600G
FX-6350
1100T
1055T
1045T

Testi peleinä on: ARMA Reforger, Crysis 3 Remastered, Forza Horizon 5, God of War, Halo Infinite, Ready or Not, Redout 2, Serious Sam: Siberian Mayhem ja Shadow Warrior 3 .

EDIT: Ja syyskuussa lähetään liikkeelle videosta jossa testataan peliläppärillä paljon tahnojen vaihtaminen lisää suorituskykyä. Sekä parantaako nestemetalli suorituskykyä vieläkin enemmän.
Ja kyllä tämä on ihan benchmarkkien tuijotus video.
 
Viimeksi muokattu:
Eli haluat enemmän yksityiskohtia nostamalla detailit maksimiin ja sitten kumminkin hävität ne DLSS:llä :facepalm:
Eikös olisi järkevämpää tiputtaa detaileja pykälä tai parikin ja ajaa peliä natiivisti ?
Oletko edes kokeillut kuinka paljon / vähän peli muuttuu asetuksia tiputtamalla ?

Oma käsitys näistä DLSS/FSR-kuvanhuonontimista on että ne alkaa olla nykyään jo hyviä.
144 Hz freesync on parasta mitä oma kotikone pystyy parhaimmillaan tuottamaan ja olisi kiva jos hertsit pysyisi koko ajan tapissa etenkin kun pelaan isolta ruudulta.
Jos ja ajoittain kun ei, niin freesyncci pitää huolta lopusta.

Olen toki jonkun verran asetuksia säätänyt mutta lopetan säätämiset kun peli pyörii tökkimättä ja näyttää hyvältä eli tuntuu etten missaa mitään olennaista.

Kesälomilla pelasin yhtä peliä 1050ti läppärillä ulkoiselta 1440p ruudulta. Pelissä oli FSR jonka kanssa sain 90-100 fps aikaiseksi melko huonoilla detaljeilla vsync off.
Huonoihin detaljeihin tottui nopeasti eikä se oikeasti tuhonnut "pelikokemusta" mitenkään. Oli kiva että tuommoinen FSR-ominaisuus pelissä oli.
 
Oma käsitys näistä DLSS/FSR-kuvanhuonontimista on että ne alkaa olla nykyään jo hyviä.
144 Hz freesync on parasta mitä oma kotikone pystyy parhaimmillaan tuottamaan ja olisi kiva jos hertsit pysyisi koko ajan tapissa etenkin kun pelaan isolta ruudulta.
Jos ja ajoittain kun ei, niin freesyncci pitää huolta lopusta.

Olen toki jonkun verran asetuksia säätänyt mutta lopetan säätämiset kun peli pyörii tökkimättä ja näyttää hyvältä eli tuntuu etten missaa mitään olennaista.

Kesälomilla pelasin yhtä peliä 1050ti läppärillä ulkoiselta 1440p ruudulta. Pelissä oli FSR jonka kanssa sain 90-100 fps aikaiseksi melko huonoilla detaljeilla vsync off.
Huonoihin detaljeihin tottui nopeasti eikä se oikeasti tuhonnut "pelikokemusta" mitenkään. Oli kiva että tuommoinen FSR-ominaisuus pelissä oli.

Juu, DLSS sekä FSR ovat todellakin silloin hyviä kun ei ole enää muuta tehtävissä eli se viimeinen oljenkorsi saada peli pyörimään pelattavasti.
Mutta kun suurin osa porukasta tuntuu sitä käyttävän että vaikka väkisin on mentävä ULTRA asetuksilla kun jostain syystä matalemmille asetuksille meneminen on NO NO.
 
Juu, DLSS sekä FSR ovat todellakin silloin hyviä kun ei ole enää muuta tehtävissä eli se viimeinen oljenkorsi saada peli pyörimään pelattavasti.
Mutta kun suurin osa porukasta tuntuu sitä käyttävän että vaikka väkisin on mentävä ULTRA asetuksilla kun jostain syystä matalemmille asetuksille meneminen on NO NO.

En ole ihan varma onko niitä väkisin ultraajia lopultakaan kovin montaa.

Siitä olisin kumminkin aika luottavainen että DLSS quality ei tuhoa kuvaa, eli jos sen laittaa päälle niin tuskin missaa pahemmin mitään, ainakaan suhteutettuna mun läppäripelaamiseen.

Huomasin vasta nyt että ollaan AMD/Intel-ketjussa eli pitää vissiin keskittyä näiden kahden kuvanhuonontimiin ja unohtaa tuo DLSS.
 
On myös pelejä, missä ei ole natiivia resoluutiota tarjolla tai natiivi shimmeröi hulluna. Esimerkiksi cp2077:ssa joutuu valitsemaan TAA:n tai DLSSS:n väliltä. cp2077:ssa saa kyllä natiivin resoluution käsin konffitiedostoa modaamalla, mutta se tuottaa hirmuisen shimmeröinnin kuvaan. Molemmissa TAA ja DLSS on omat huonot ja hyvät puolensa. Jos käyttää uusinta dlss versiota niitä huonoja puolia on vähemmän kuin vuodentakaisista vertailuista voisi kuvitella.

Mielenkiinnolla odotan tuleeko ada-julkaisun yhteydessä dlss3.0. Jos tulee mitä dlss3 parantaa?
 
  • Tykkää
Reactions: hik
Mielenkiinnolla odotan tuleeko ada-julkaisun yhteydessä dlss3.0. Jos tulee mitä dlss3 parantaa?
Vaatisi kokonaan uuden API:n ja vielä vaikeammat pelimoottori-integraatiot jos sillä jotain isoa uutta tehtäis. Sitä liikevektorien huomioimista pikselin väri arbitraatiossa voi aina kehittää, mut lienee aika vaikeaa jo.
 
Vaatisi kokonaan uuden API:n ja vielä vaikeammat pelimoottori-integraatiot jos sillä jotain isoa uutta tehtäis. Sitä liikevektorien huomioimista pikselin väri arbitraatiossa voi aina kehittää, mut lienee aika vaikeaa jo.

Mietin, että voisko siellä olla jotain ihan vaan peruskauraa parannettu esimerkiksi sen suhteen miten neuroverkko osaa yhdistellä datat useammista frameista kuin ennen/paremmin tai vaikkapa täydenreson DLAA perffi sellaiseksi, että se olisi enemmän käyttökelpoinen? Tuskin mitään mullistavaa ja vois hyvin olla edelleen 2.x sarjaa, mutta pr:n takia nimetään 3.0:ksi.
 
Juu, DLSS sekä FSR ovat todellakin silloin hyviä kun ei ole enää muuta tehtävissä eli se viimeinen oljenkorsi saada peli pyörimään pelattavasti.
Mutta kun suurin osa porukasta tuntuu sitä käyttävän että vaikka väkisin on mentävä ULTRA asetuksilla kun jostain syystä matalemmille asetuksille meneminen on NO NO.

Aikamoista. DLSS ja FSR (2.0) on monesti nykyään kuvanlaadultaan huomattavasti parempia (ihan testatusti/tutkitusti), kun pelien tarjoamat "natiivit" TAA vaihtoehdot. Kannattaisi varmaan vähän ehkä testailla ja tutkia aihetta sinunkin ja jättää tämmöiset todella jyrkät mileipiteet vähemmälle.

Itse ainakin toivon tuollaisen testisisällön tuottajalta mahdollisimman objektiivista ja avarakatseista otetta ja näistä sinun testeistä ei aina sellainen oikein välity.
 
Aikamoista. DLSS ja FSR (2.0) on monesti nykyään kuvanlaadultaan huomattavasti parempia (ihan testatusti/tutkitusti), kun pelien tarjoamat "natiivit" TAA vaihtoehdot. Kannattaisi varmaan vähän ehkä testailla ja tutkia aihetta sinunkin ja jättää tämmöiset todella jyrkät mileipiteet vähemmälle.

Itse ainakin toivon tuollaisen testisisällön tuottajalta mahdollisimman objektiivista ja avarakatseista otetta ja näistä sinun testeistä ei aina sellainen oikein välity.
RDR2 DLSS shimmeröinti tekee siitä käyttökelvottoman, Bannerlordissa muuttaa pelimekaniikkaa kun iconit näkyvät maan läpi, myös käyttökelvoton. Tuossa omat kokemukset tähän mennessä.
 
Viimeksi muokattu:
Aikamoista. DLSS ja FSR (2.0) on monesti nykyään kuvanlaadultaan huomattavasti parempia (ihan testatusti/tutkitusti), kun pelien tarjoamat "natiivit" TAA vaihtoehdot. Kannattaisi varmaan vähän ehkä testailla ja tutkia aihetta sinunkin ja jättää tämmöiset todella jyrkät mileipiteet vähemmälle.

Itse ainakin toivon tuollaisen testisisällön tuottajalta mahdollisimman objektiivista ja avarakatseista otetta ja näistä sinun testeistä ei aina sellainen oikein välity.

Oli muuten FSR 2.0 video työn kun edellinen helle aalto iski ja en ole vielä kerennyt sitä jatkamaan.
Eli kyllä olen noita testannut ja edelleen olen sitä mieltä että sopivat parhaiten siksi viimeiseksi oljenkorreksi.

Ja mitä tulee testeihini niin en voi hehkuttaa jotain jos mielestäni se ei ole hyvä.
Vai pitäiskö jotain kehua tai haukkua kun niin muutkin tekevät ?

Enkä kyllä ole testeissäni ole haukkunut kuin Athlon X4 950 prossun sekä Asuksen peliläppärin jossa oli sika hidas A10 APU prossuna.
Sekä sanonut että Crossfirellä ja SLI ei tee nykyään mitään ja FSR 1.0 on ainoastaan hyvä viimeiseksi oljenkorreksi.

Mitä FSR 2.0 testailin niin KYLLÄ laatu on parempi kuin FSR1.0:llä, mutta edelleen en voi sitä suositella muuhun kuin siksi viimeiseksi oljenkorreksi.

EDIT: Minulla kun ei ole sponsoreita tai laitevalmistajia suututettavana, niin voin aika vapaasti kertoa eri jutuista oman kantani.
Tullut kuitenkin leikittyä PC raudan kanssa vuodesta 95 lähtien (sitä ennen Amiga 500).
Eli jonkun verran omaan näistä kokemusta kuitenkin ;)
 
Viimeksi muokattu:
Jos spekuloidaan olemassa olevilla huhuilla ja vuototiedoilla tulevia Intelin Raptor Lake ja AMD:n Zen4 prosessoreita, niin kumpaan päin olette kallellaan ja miksi ?

Itse olen ymmärtävinäni, että esim. 7950X ja 13900K tulevat olemaan laskentatehoissa hyvin pitkälti samoilla huudeilla. Riippuen sitten aina vähän siitä tehtävän laadusta, on toinen edellä toista ja päinvastoin. Eli nopeuserot tulee olemaan sen verran pienet, että sieltä ei ainakaan yleiskäytössä eroa paljon synny. Näin voisi olettaa jatkossakin asioiden kehittyvän...

No sitten kun ajatellaan sitä, että Zen4:ssa on se uusi AM5-kanta, jolle on lupailtu samanlaista elinkaarta kuin AM4:lle (5-7 vuotta), ja Raptoreillahan taas käytetty LGA-1700 kannan tuki loppuu tähän, ja tilalle tulee seuraavassa sukupolvessa kokonaan uusi LGA-1851, niin tällä onkin sitten jo joku merkitys.

Viimeisen kymmenen vuoden aikana prosessorien tehot on kasvaneet karkeasti laskettuna luokkaa 20% per vuosi. Sanotaan, että sillä alkaa olla jo monelle oikeasti merkitystä, kun uuden prossan laskentatehot nousee vähintään luokkaa +50-100%, niin tämähän tarkoittaa n. 3-4 vuoden päivitysväliä. Eli AMD:lla porskuttelee todennäköisesti ainakin seuraavat 2 päivityskertaa. Jos oikein innostuu niin useammankin.

Eli näistä vinkkeleistä katsottuna olen itse kallistumassa AMD:n puoleen omaa uutta Daily Driveria valitessani varsinkin, kun omat tekemiseni painottuvat hyötypuolelle. Mutta on varmasti muitakin juttuja mitä on hyvä ottaa huomioon niin kerroppa niistä.
 
Itse olen ymmärtävinäni, että esim. 7950X ja 13900K tulevat olemaan laskentatehoissa hyvin pitkälti samoilla huudeilla.
Mutta toinen polttanee sähköä merkittävästi enemmän. Tulee kyllä vaihteeksi ihan mielenkiintoiset julkaisut molemmilta.
 
13th gen tulee sitten kuolleelle alustalle kun taas AM5 voi olla aika monen seuraavankin sukupolven alusta.
 
No spekulaatioista ja vuototiedoistahan kun puhutaan, niin asianhan voi tehdä niin päin, että valitsee ensin haluamansa lopputuloksen ja sitten uskoo sitä näkemystä vahvistavia huhuja.

Oletettavasti Intel on parempi peleissä, AMD raskaassa multicoressa. Paitsi jos AMD saa muutaman coren boostit todella rajuksi (5,7 - 5,8 Ghz), jolloin saattaa olla hyvin lähellä Inteliä (jos se ei saa tosi kovia kelloja)
 
Oletettavasti Intel on parempi peleissä, AMD raskaassa multicoressa. Paitsi jos AMD saa muutaman coren boostit todella rajuksi (5,7 - 5,8 Ghz), jolloin saattaa olla hyvin lähellä Inteliä (jos se ei saa tosi kovia kelloja)

Veikkaan, että toisinpäin. AMD:llä on ollut paremmat välimuistiratkaisut pelityylisiin kuormiin kuin Intelillä. Lisäksi 13900K tulee isoilla säiemäärillä nostamaan perf per wattia merkittivästi, koska E-ytimien määrä on 2x. 12900K:n E-ytimet vievät maksimissaan vain ~25 wattia, joten ovat Zen 4:ää edellä todennäköisesti merkittävästi perf per watissa. Tähän viittaa myös alustavat 13900K-vuodot. Intelillähän on "helppo" saada lisää nopeutta hyvin rinnakkaistuviin kuormiin lisäämällä E-ytimien määrää, AMD:llä taas käytössä on 16 ydintä, joten vaihtoehto on nostaa kellotaajuuksia, joka nostaa TDP:tä. Vuotojen mukaan R9 Ryzeneiden TDP on 170 wattia ja PPT 230 wattia, joten hyvin ovat linjassa Raptor Laken kanssa. Omalle kohdalle mielenkiintoisimmat ovat v-cache-versiot. Näitä vastaan ei Intelillä ole mitään.
 
Mutta toinen polttanee sähköä merkittävästi enemmän.

Kumpi ja missä tilanteessa?

AMDllä on selvä etu valmistustekniikan energiatehokuudessa, mutta Intelin pikkuytimet ovat arkkitehtuuriltaan selvästi energiatehokkaampia kuin zen4.

Ja AMD on nostamassa uuden kantansa teholimittejä selvästi edellisestä.

Itse oletan, että riippuu hyvin paljon siitä, paljonko ytimiä on kuormitettuna ja mitkä ytimistä on kuormitettuna, että paljonko Raptor Lake vie sähköä.

Jos halutaan maksimaalista säeikohtaista suorituskykyä (pienellä säiemäärällä), käytetään isoja ytimiä 1 säie/ydin, ja Raptor lake omaa selvästi huonomman energiatehokkuuden.

Mutta jos ajossa on vaikka 16 säiettä ja nämä kaikki laitetaan pikkuytimille, Raptor Lake voi hyvinkin olla energiatehokkaampi kuin zen4.

Toisaalta, sitten kun mennään 32 säikeeseen ja isot ytimet on täydellä kuormituksella, ze4n lienee taas energiatehokkaampi.

Tulee kyllä vaihteeksi ihan mielenkiintoiset julkaisut molemmilta.

Itse pitäisin kyllä zen4sta selvästi mielenkiintoisempana; Kaikki mitä Raptor Lakesta on kuulunut sanoo että se on lähnnä Alder Lake jossa tuplattu pikkuydinten määrä (mikä toisaalta kyllä parantaa sen kilpailukykyä suurella säiemäärällä merkittävästi), zen4ssa taas tulee selvästi uutta sekä ytimen mikroarkkitehtuuriin, järjestelmäarkkitehtuuriin että vielä uusi valmistustekniikkakin.

Zen4ssa ehkä itselleni mielenkiintoisinta on että millainen sen AVX-512-toteutus on ja millainen suorituskyky siinä on AVX-512lla; Onko ihan täysi 512-bittinen datapolku vai pilkotaanko kahteen osaan. ja onko siellä esim. jotain tiettyjä (harvoin käytettyjä) AVX-512-käskyjä jotka on selvästi hitaampia.
 
Viimeksi muokattu:
Oletettavasti Intel on parempi peleissä, AMD raskaassa multicoressa. Paitsi jos AMD saa muutaman coren boostit todella rajuksi (5,7 - 5,8 Ghz), jolloin saattaa olla hyvin lähellä Inteliä (jos se ei saa tosi kovia kelloja)

Näyttäshän tuo 13900K:n Cinebench R23 Single Core nopeus olevan yli +10% että auttaa peliosastoon, jollei alustalla ole sitten jotain muita uusia virityksiä keksitty, jotka auttaa kompensoimaan tuota eroa.
 
Jos halutaan maksimaalista säeikohtaista suorituskykyä (pienellä säiemäärällä), käytetään isoja ytimiä 1 säie/ydin, ja Raptor lake omaa selvästi huonomman energiatehokkuuden.

Mutta jos ajossa on vaikka 16 säiettä ja nämä kaikki laitetaan pikkuytimille, Raptor Lake voi hyvinkin olla energiatehokkaampi kuin zen4.

Toisaalta, sitten kun mennään 32 säikeeseen ja isot ytimet on täydellä kuormituksella, ze4n lienee taas energiatehokkaampi.
Ainakaan windowsia käyttävät eivät tuohon pääse pahemmin vaikuttamaan (ellei aloita uutta harrastusta process lasson parissa). Mitä alder lake arvosteluja on lukenut, niin ei se juuri missään testikäytössä ihmetytä energiatehokkuudellaan, vaikka siihen toki joskus tekniset mahdollisuudet olisivatkin.

En siis usko että raptorikaan on missään tyypillisessä työpöytäkäytössä energiatehokkaampi kuin tulevat ryzenit.
 
On noissa uusissa Gen 13 ja Zen4 sukupolvissa varmasti samalalla lailla karseitakin eroja tehokkuudessa, kuin mitä nykyisissäkin sukupolvissa on. Esim. nyt vaikka ihan yhtenä esimerkkinä nuo Ethernet-latenssit 12900K vs. 5950X. Ero pahimmillaan 3x 12900K:n eduksi. Tahi sitten jotain rinnakkaista koneoppimislaskentaa ero 4x 5950X:n eduksi (openbenchmarking.org). Eli kyllä niillä sovelluksillakin on paljon merkitystä valinnassa.
 
Viimeksi muokattu:
Kiinnostava kyllä tuo ethernet-latenssin mittaus. Vaikuttaakohan tuohon suuresti emolevyn merkki ja malli ja miten verkkoyhteys on kyseisellä lankulla toteutettu ja onko käytetty erillistä verkkokorttia ja mikä on verkko-ohjaimen valmistaja. Aika paljon muuttujia.
 
Kiinnostava kyllä tuo ethernet-latenssin mittaus. Vaikuttaakohan tuohon suuresti emolevyn merkki ja malli ja miten verkkoyhteys on kyseisellä lankulla toteutettu ja onko käytetty erillistä verkkokorttia ja mikä on verkko-ohjaimen valmistaja. Aika paljon muuttujia.
Intelillä on perinteisesti ollu vähän paremmat io-latenssit. Ei tolla ole käytännössä kenellekkään mitään merkitystä.
 
Zen4ssa ehkä itselleni mielenkiintoisinta on että millainen sen AVX-512-toteutus on ja millainen suorituskyky siinä on AVX-512lla; Onko ihan täysi 512-bittinen datapolku vai pilkotaanko kahteen osaan. ja onko siellä esim. jotain tiettyjä (harvoin käytettyjä) AVX-512-käskyjä jotka on selvästi hitaampia.
Lisäksi kiva nähdä minkä käskyvalikoiman AMD on valinnut tuosta AVX-512 sillisalaatista vai tekeekö peräti uuden kokoelman.
 
Intelillä on perinteisesti ollu vähän paremmat io-latenssit. Ei tolla ole käytännössä kenellekkään mitään merkitystä.

Joo ilman muuta hyvin sovelluskohtinen juttu. Ei tuolla ole varmasti mitään merkitystä esim. jossain nettipelaamisessa.

Lähtökohtaisestihan I/O käsitellään yleensä keskeytyksien kautta, ja aina yhdellä säikeellä kerrallaan (kenelle se interrupt aina ohjatuu). Näinpä Intelin kovempi säienopeus (esim. Cinebench tuloksista pääteltynä) pääsee oikeuksiinsa. Toistoja vaan paljon, niin se 10% ero alkaa tuntua. Sama jatkunee myös sukupolvivaihdoksen jälkeenkin.

Noita testejä kun käy läpi, niin ne ei kyllä mene aina ihan loogisesti. Voi olla tiettyjä I/O juttuja, missä eroa taas ei synny, tai se on jopa päinvastoin. Kiini on paljon softien implementoinneistakin, että mikä millekin prossulle on eduksi ja mikä ei. Mutta kyllä sieltä varmasti yhteisiä nimittäjiä löytyy, kun vaan tarpeeksi analysoisi.
 
Joo ilman muuta hyvin sovelluskohtinen juttu. Ei tuolla ole varmasti mitään merkitystä esim. jossain nettipelaamisessa.

Lähtökohtaisestihan I/O käsitellään yleensä keskeytyksien kautta, ja aina yhdellä säikeellä kerrallaan (kenelle se interrupt aina ohjatuu). Näinpä Intelin kovempi säienopeus (esim. Cinebench tuloksista pääteltynä) pääsee oikeuksiinsa. Toistoja vaan paljon, niin se 10% ero alkaa tuntua. Sama jatkunee myös sukupolvivaihdoksen jälkeenkin.

Noita testejä kun käy läpi, niin ne ei kyllä mene aina ihan loogisesti. Voi olla tiettyjä I/O juttuja, missä eroa taas ei synny, tai se on jopa päinvastoin. Kiini on paljon softien implementoinneistakin, että mikä millekin prossulle on eduksi ja mikä ei. Mutta kyllä sieltä varmasti yhteisiä nimittäjiä löytyy, kun vaan tarpeeksi analysoisi.
Ero voinee johtua jossain määrin kans tosta AMD:n chiplettirakenteesta. Joku mikrosekunnin viive TCP paketin käsittelyssä ei kiinnosta ketään, ellei käyttö ole äärimmäisen spesifiä. En usko että yhden säikeen suorituskyvyllä on tässä kyseisessä käytössä juuri mitään vaikutusta.

Ja mielenkiintoisena sivuhuomiona, jos katsoo keskiarvotuloksia 12th gen vs ryzen 5000, niin AMD on hieman edellä, ja intelin 11th gen on itseasiassa nopeampi. Ethr Benchmark - OpenBenchmarking.org
 
IO-viiveistä:

Intelillä on Xeoneissaan DDIO jolla oheislaite (esim verkkokortti) voi tehdä DMA-siirtonsa suoraan CPUn L3-kakkuun josta CPUn on selvästi nopeampi hakea se kuin DRAM-keskusmuistista.

AMDllä tätä ei ole missään piireissään, ja tämä olisi AMDllä hiukan ongelmallinen AMDn CCX-rakenteen takia; Minkä CCX:n L3-kakkuun se data tungettaisiin, kun L3-kakkuja on useita?

Intelillä sen sijaan kaikki L3-kakku on jaettua kaikkien saman piirin ytimien välillä, joten ei ole tällaista ongelmaa.

Mutta tätä DDIO:ta ei kuitenkaan ilmeisesti työpöytäprossuissa ole Intelilläkään.
 
Joku mikrosekunnin viive TCP paketin käsittelyssä ei kiinnosta ketään, ellei käyttö ole äärimmäisen spesifiä. En usko että yhden säikeen suorituskyvyllä on tässä kyseisessä käytössä juuri mitään vaikutusta.

Kyllä niillä pienillä eroilla on merkitystä. Ne kun kertaantuu nopeasti. Pakettiliikenne juurikin hyvä esimerkki esim. Ethr 1.0 UDP bandwidth testi 2 säikeellä, mistä näkee hyvin, että packets/sec ero on aikamoinen (~2.4x) -> suora vaikutus tiedonsiirtonopeuksiin verkossa esim. isot videotiedostot jms.

Mutta kuten tässä jo mainittiinkin, niin siellä on paljon paljon muutakin rautaa mukana. Erityisesti käytetyt tiedonsiirtoon liittyvät piirit ja muut tarvittavat komponentit. Mutta lienee sanomattakin selvää, että kun se säienopeus on suurempi, niin kyllä siitä aina etua on tietyn tyyppisissä sovellutuksissa. Selittääkö juuri tässä nimenomaisessa tapauksessa asian niin tuskimpa.
 
Kyllä niillä pienillä eroilla on merkitystä. Ne kun kertaantuu nopeasti. Pakettiliikenne juurikin hyvä esimerkki esim. Ethr 1.0 UDP bandwidth testi 2 säikeellä, mistä näkee hyvin, että packets/sec ero on aikamoinen (~2.4x) -> suora vaikutus tiedonsiirtonopeuksiin verkossa esim. isot videotiedostot jms.
Videoita siirretään aika isoissa paketeissa. Ei merkitystä kenellekkään, edes netflixille.
Levyltä siirrettäessä pullonkaula taas on tiedostojärjestelmässä.
 
Ei kyllä ne pieninä paketteina yleensä menee. Se on sitten asia erikseen, jos on lähtenyt virittelemään esim. MTU-kokoja, mutta ei normaalit käyttäjät yleensä näihin koske. Eikä sovelluksetkaan.

Kuten sanottua, niin jokainen sovellus on aina vähän eri. Ei voi yleistää.

Pitääpäs kahlata tuon ao. testin koodeja vähän, että mitä siellä oikein loppujen lopuksi tehdään ja miten:
GitHub - microsoft/ethr: Ethr is a Comprehensive Network Measurement Tool for TCP, UDP & ICMP.
 
Juu. Sellaista sovellusta odotellessa, jolle noi I/O nopeudet on ongelma, ja jota ei ole järkevä säikeistää.

No se ei paljon vaadi :rofl:
scp 100Gfilee.mov kone:/polku/hakemisto

Tuossa liikkuu pakettia pikkusen paljon perkeleesti, ja vastaa pitkälti noita Ethr:n TCP-kaistatestejä missä sitä eroa näyttää siis tulevan. Pikatsekkasin tuota koodia ja se näyttäs olevan perinteinen client-server pakettilähetin, missä voidaan säätää säikeiden määrää. Testeistä näkee, että ei se tuo säiemäärän kasvatus asiaa kuittaa. Molemmilla alustoillahan niitä säikeitä kyllä riittää. Intelillä vaan on se huono, että osa säikeistä tulee sieltä E-coreista, mitkä taitaa olla niitä vähän kökömpiä versioita. Linukkaanhan tuli Kernelin version 5.18 myötä vasta joku governaattorikikkare, jonka pitäs nyt hoitaa hommia vähän fiksummin.

Kaistatestit esim. 8 säikeellä komppaa tätä, kun pittiä liikkuu 1.9 (+90%) kertaa enemmän 19200K vs 5950X
 
No se ei paljon vaadi :rofl:
scp 100Gfilee.mov kone:/polku/hakemisto

Tuossa liikkuu pakettia pikkusen paljon perkeleesti, ja vastaa pitkälti noita Ethr:n TCP-kaistatestejä missä sitä eroa näyttää siis tulevan. Pikatsekkasin tuota koodia ja se näyttäs olevan perinteinen client-server pakettilähetin, missä voidaan säätää säikeiden määrää. Testeistä näkee, että ei se tuo säiemäärän kasvatus asiaa kuittaa. Molemmilla alustoillahan niitä säikeitä kyllä riittää. Intelillä vaan on se huono, että osa säikeistä tulee sieltä E-coreista, mitkä taitaa olla niitä vähän kökömpiä versioita. Linukkaanhan tuli Kernelin version 5.18 myötä vasta joku governaattorikikkare, jonka pitäs nyt hoitaa hommia vähän fiksummin.

Kaistatestit esim. 8 säikeellä komppaa tätä, kun pittiä liikkuu 1.9 (+90%) kertaa enemmän 19200K vs 5950X

Hyvin on bitti liikkunu tähänasti jo 1800X lähtien, eli kikan verkon täydeltä. Eli missä tilanteessa tuo nyt tulee ongelmaksi?

Jos ne rysenit ja EPYC:t olis niin huonoja verkkoliikenteen kanssa kuin nyt ilmeisesti yritetään todistella, niin eihän datacenter puolelle noita menis ollenkaan.
 
Hyvin on bitti liikkunu tähänasti jo 1800X lähtien, eli kikan verkon täydeltä. Eli missä tilanteessa tuo nyt tulee ongelmaksi?

Jos ne rysenit ja EPYC:t olis niin huonoja verkkoliikenteen kanssa kuin nyt ilmeisesti yritetään todistella, niin eihän datacenter puolelle noita menis ollenkaan.
No toisten mielestä kun Intel on nanosekunnin nopeempi se on iso asia ja toisten pieni. Ja sitten taas päin vastoin kun AMD on sen nanosekunnin nopeampi muuttuu mieli heti
 
No mielenkiintoisia eroja joka tapauksessa löytyy sieltä sun täältä, kun vähän tarkemmin kaivelee. Jääköön lukjian harkintaan sitten merkitykset omalla kohdalla.
 
Sitten on tietysti se bugiosasto. Raptori on jo 2. generaatiossa PCIe 5.0 ja DDR5:n osalta, kun AMD vasta aloittelee. Vois olla ihan viksua odotella joku aika, eikä ihan suin päin heti ensimmäisenä koekaniiniksi. Erot kun ei ole vielä tässä vaiheessa kun muutama 10% ed. sukupolviin.

Vaan voi olla, että kun kiima iskee päälle, niin ei siinä paljon näitä mieti :(
 
No se ei paljon vaadi :rofl:
scp 100Gfilee.mov kone:/polku/hakemisto
Aika harvalla on sen työpöytäprossun kaverina useampaa 40Gbps verkkokorttia. Tuota hitaammilla en usko että näkyy. Säikeistämisellä sit saadaan helposti tukittua ihan kaikki verkkoratkaisut mitä sä tommoseen voit virittää.
 
Joo no eihän tuo nyt mikään paras esimerkki normijannun kannalta ole.

Mutta jottei pointti unohdu, niin noita testejä lienee hyvä tarkastella yksityiskohtaisemminkin, kuin vain pelkästään "geometric mean" 400 testistä -tasolla. Merkityksellisiä eroja löytyy varmasti.

---

Mitä säikeisiin tulee, niin se on niin sovelluksesta ja soveltajasta kiinni, että lähteekö niillä tuomaan context switch ja synkronointi overheadia soppaan mukaan. Joskus heti selkeä hyöty, ja taas joskus tappaa tehot.
 
Viimeksi muokattu:
Noissa testeissä muuten saattaa harhauttaa tuloksia vielä myös se, että AMD testit ajetaan PCIe 4.0, kun Intel on jo 5.0. AMD kuronee kauloja kiinni nyt myös sillä, että Zen4 on myös 5.0.
 
Noissa testeissä muuten saattaa harhauttaa tuloksia vielä myös se, että AMD testit ajetaan PCIe 4.0, kun Intel on jo 5.0. AMD kuronee kauloja kiinni nyt myös sillä, että Zen4 on myös 5.0.
Pci 5.0 ei hyödytä mitään ellei ole sitä tukevaa laitetta ja se kaista mene oikeasti käyttöön.

Kummastakaan en ole paljoa juttua kuullut. En toki kiistä sellaisen olemassaoloa, mutta kuluttajan näkökulmasta molempien täyttyminen on kaukana.
 
Mutta jottei pointti unohdu, niin noita testejä lienee hyvä tarkastella yksityiskohtaisemminkin, kuin vain pelkästään "geometric mean" 400 testistä -tasolla. Merkityksellisiä eroja löytyy varmasti.
Juu toki. Ensin katotaan sovellusbenchmarkkeja liittyen siihen mitä koneella tekee, ja sit jos tulokset on hassuja niin avataan linkattujen kaltaisia microbenchmarkkeja auki ja ihmetellään että mistäköhän ne oudot tulokset vois johtua.

Yhtäkään ostopäätöstä en kuluttajana tekis microbenchmarkkien perusteella.
 
Yhtäkään ostopäätöstä en kuluttajana tekis microbenchmarkkien perusteella.

Okei. Minä en taas koskaan katso mitään yhtä kokonaisarvoa. Prossu voi olla ihan paska jossain osa-alueella, mikä on juuri itselle tärkeää, ja taas loistaa sitten toisella, mikä ei välttämättä taas ollenkaan tärkeää. Ihan nyt vain yhtenä esimerkkinä joku Zippaus. Sitä tulee tehtyä paljon ja isoille tietomäärille. 5950X luokkaa 50% nopeampi. Perin omituistahan se olisi olla ottamatta huomioon tuollaista asiaa. Ja samalla kun tutkii ja yrittää ymmärtää syitä, niin oppii yhtä jos sun toista laitteen sielunelämästä.

Mutta toki kukin tavallaan ja tarpeidensa mukaan.
 
Viimeksi muokattu:
Noissa testeissä muuten saattaa harhauttaa tuloksia vielä myös se, että AMD testit ajetaan PCIe 4.0, kun Intel on jo 5.0. AMD kuronee kauloja kiinni nyt myös sillä, että Zen4 on myös 5.0.

Sitten kannattaa muistaa että oikeassa elämässdä noilla eroilla ei välttämättä ole mitään merkitystä kun ne jotka tuollaisilla nopeuksilla netwörkin kanssa pelaa, todennäköisesti ajelee netwörk rautaa joka taipuu RDMA siirtoon, jolloin CPU ei osallistu siihen siirtoon juuri ollenkaan.
 
Sitten kannattaa muistaa että oikeassa elämässdä noilla eroilla ei välttämättä ole mitään merkitystä kun ne jotka tuollaisilla nopeuksilla netwörkin kanssa pelaa, todennäköisesti ajelee netwörk rautaa joka taipuu RDMA siirtoon, jolloin CPU ei osallistu siihen siirtoon juuri ollenkaan.

Okei. RDMA olikin ihan uusi teknologia. DMA-juttujen kanssa on tullut aikoinaan pelattua sulautettujen koodien kanssa enempikin. Mitä vähän nyt opiskelin lisää, niin RDMA:ssa ei ole enää paikallista controlleria CPU:lla, että tieto liikkuu vieläkin vapaammin verkkokortilta sisään. Tällöin kytkintenkin pitää osata vähän enempi juttuja.

Tosiaankin iso merkitys asialla.

Ne nuo ethernet jutut on helposti muutenkin huonompi esimerkki vertailuista, kun se tuo network itsessään on jo helposti se pullonkaula, kuten @pomk jo asian esille toi.
 
Viimeksi muokattu:
Okei. RDMA olikin ihan uusi teknologia. DMA-juttujen kanssa on tullut aikoinaan pelattua sulautettujen koodien kanssa enempikin. Mitä vähän nyt opiskelin lisää, niin RDMA:ssa ei ole enää paikallista controlleria CPU:lla, että tieto liikkuu vieläkin vapaammin verkkokortilta sisään. Tällöin kytkintenkin pitää osata vähän enempi juttuja.

Tosiaankin iso merkitys asialla.

Ne nuo ethernet jutut on helposti muutenkin huonompi esimerkki vertailuista, kun se tuo network itsessään on jo helposti se pullonkaula, kuten @pomk jo asian esille toi.

Joo ja sitten on toki DPU:t myös, nvidian mellanox korteissa on DPU ja Xilinx kaupan myötä AMD:llä on myös omansa tai on tulossa ihan kohta. Kait intelilläkin on joku. Toihan offloadaa nettiliikenteen aikalailla kokonaan pois CPU:lta.
 
Raptor lakessa on myös ring busia muokattu jotta P- ja E-ytimien välisiä latensseja on saatu pienemmiksi. Selittänee (välimuistien kasvun lisäksi) miksi noi Raptor lake -samplet ovat osassa testejä merkittävästi nopeampia kuin Alder laket.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.
 

Statistiikka

Viestiketjuista
295 627
Viestejä
5 046 690
Jäsenet
80 967
Uusin jäsen
Samppa__

Hinta.fi

Back
Ylös Bottom