Follow along with the video below to see how to install our site as a web app on your home screen.
Huomio: This feature may not be available in some browsers.
Live: io-techin pikkujoulu- ja hyväntekeväisyysstriimi tänään alkaen klo 19. Pelataan io-techin toimituksen kesken PUBGia ja tavoitteena saada 10000 euroa täyteen Pelastakaa Lapset ry:n joulukeräykseen! Tule mukaan katselemaan ja keskustelemaan! Linkki lähetykseen >>
Aiemmin kyselin mitä esim. Zetterin testikokoonpanot ottavat seinästä. Kaivelin sitten hieman esimerkkejä tuolta internetsin ihmeellisestä maailmasta. Ja kuinka vertailukelpoisia ovat, mutta on siinä ainakin jotain suuntaa antavaa näihin.
Xeon X5650 @ 4,37 GHz ja tehonkulutus oli 285 wattia. Linkki: Intel X5650 Overclocking – resulting a 4.37 GHz hexacore – tomrei.com
Ryzen 3 2200G @ vakio ja tehonkulutus 86 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
Ryzen 5 2400G @ vakio ja tehonkulutus 100 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
i7 860 @ vakio ja tehonkulutus 180 wattia. Linkki: The Intel Core i7 860 Review
Siinä saa SERriin laitella vähän järeämpää virtalähdettä jos lähtee kelloja hakemaan ja ei taideta ihan parin kympin coolereillakaan pärjätä noiden tehojen suhteen. Mutta jokainen joutuu itse päätöksensä tekemään, itse lähtisin mieluummin 2200G linjalle ja saa uuden alustan, takuunalaisen. Sekä saa niitä nykyajan ominaisuuksia (esim. M.2, USB3, Sata 3) ihan out of box. Vielä kun saisivat noita DDR4 hintoja alaspäin..
Tuo X5650 tulos ei voi pitää paikkaansa mitenkään. Noctua NH-D15 oli mulla tuossa jääynä (yhdellä tuulettimella) niin Prime95 kuormalla lämmöt 86C. Peleissä 57-68C eli viileämpi kuin nykyiset Coffee Lake i7:t. Joten tuo watti määrä ei voi olla mahdollista. Tämä siis 4.50GHz kelloilla.
Olikos ton ajan intelit juotettuja vielä?
Laitetaas tähän noitten testejeni Cinebench scoret,video renderöinti ja 3dmark firestrike tulokset. Että ei tarvi valittaa että tulokset eivät ole "oikeita" tai jotain sinne päin.
3dmark tuloksista uupuu se i7 3820:n koska sitä mulla ei enää ollut kun aloin suorittaa näitä 3dmark testejä yleisöpalautteen takia.
Ja video renderöinnistä että näyttäis että tuo ei osaa hyödyntää oikein yli 8 säettä.
E5-2670 jossa 16 säettä niin CPU kuormat vain noin 60% ja 12 säikeisellä X5650:lla n.80%.
Firestriken testeissä on kyllä jotain hämärää.. Pelkkä ikivanha Xeon ei tuota eroa tee.
Aiemmalla kokoonpanolla sain i7 3820 ja SLI 980:llä 15847 pistettä... 2 x 980GTX:ää on nopeampi Firestrikessä kuin yksi 980Ti.
I scored 15 847 in Fire Strike
Toki olivat. Mutta ei Noctua NH-D15 jaksa 285W lämpökuormaa jaksa hoitaa mitenkään. Joten siksi kerroinkin että tulos ei voi vaan pitää paikkaansa.
Ja ei ollut edes kovin lämmin sitä koskettaessa.
Eikös sinulla ole kulutusmittaria jolla mitata? Ainakin olit laittanut serveri videoon tehonkulutuksesta juttua. Joten oletan että olit itse mittaillut?Tuo X5650 tulos ei voi pitää paikkaansa mitenkään. Noctua NH-D15 oli mulla tuossa jääynä (yhdellä tuulettimella) niin Prime95 kuormalla lämmöt 86C. Peleissä 57-68C eli viileämpi kuin nykyiset Coffee Lake i7:t. Joten tuo watti määrä ei voi olla mahdollista. Tämä siis 4.50GHz kelloilla.
EDIT: Nuo DDR4 muistihinnat tekevät SER-vehkeistä paljon houkuttelevammat. Sitten jos päästään takas sinne n.40€ 8GB hintoihin niin sitten asia on aivan toinen.
TDP guidelines & cooler height Saattaa jaksaa, saattaa että ei. Mitä tuo 165W & OC sitten meinaakaan taulukossa.
The overclocking headroom (OC) is specified as follows:
*** = best overclocking potential
** = medium overclocking potential
* = low overclocking potential
Eikös sinulla ole kulutusmittaria jolla mitata? Ainakin olit laittanut serveri videoon tehonkulutuksesta juttua. Joten oletan että olit itse mittaillut?
EDIT: Nuo DDR4 muistihinnat tekevät SER-vehkeistä paljon houkuttelevammat. Sitten jos päästään takas sinne n.40€ 8GB hintoihin niin sitten asia on aivan toinen.
Kerrotko nyt jotain konkreettisia esimerkkejä (pl. täysin epärelevantti AoTS) ensin ohjelmista, jotka on nimenomaan optimoitu jollekkin tietylle mikroarkkitehtuurille?
Arkkitehtuuri joka vaatii koodin kirjoittamisen käsin suoriutuakseen kunnolla, ei ole hyvä / pitkäikäinen arkkitehtuuri. Tuo on täysin kohtuuton vaatimus.
Koodaan töikseni kääntäjän optimointeja joten väitän tietäväni koodin optimoinnista aika paljon.
Miten se AoTS optimointi nyt yht äkkiää muuttuu epärelevantiksi? Ei sovi agendaasi? Kyllähän niitä tuli muitakin suorituskykyä parantavia pätsejä muihin ohjelmiin Ryzenin julkaisun jälkeen, jotkut jopa hyödytti myös Inteliä ei tosin niin paljoa. Eli kyllä sillä softaoptimoinnilla on merkitystä.
Eli sama kysymys: Prosessorikohtaisilla optimoinneilla ei ole merkitystä?
Miten se AoTS optimointi nyt yht äkkiää muuttuu epärelevantiksi? Ei sovi agendaasi?
#include <math.h>
#include <stdio.h>
#include <stdlib.h>
#include "timer.h"
#define CACHELINE 64 // size of cache line [bytes]
#define SOFTENING 1e-9f
typedef struct { float *x, *y, *z, *vx, *vy, *vz; } BodySystem;
void randomizeBodies(float *data, int n) {
for (int i = 0; i < n; i++) {
data[i] = 2.0f * (rand() / (float)RAND_MAX) - 1.0f;
}
}
void bodyForce(BodySystem p, float dt, int n, int tileSize) {
for (int tile = 0; tile < n; tile += tileSize) {
int to = tile + tileSize;
if (to > n) to = n;
for (int i = 0; i < n; i++) {
float Fx = 0.0f; float Fy = 0.0f; float Fz = 0.0f;
#pragma vector aligned
#pragma simd
for (int j = tile; j < to; j++) {
float dy = p.y[j] - p.y[i];
float dz = p.z[j] - p.z[i];
float dx = p.x[j] - p.x[i];
float distSqr = dx*dx + dy*dy + dz*dz + SOFTENING;
float invDist = 1.0f / sqrtf(distSqr);
float invDist3 = invDist * invDist * invDist;
Fx += dx * invDist3; Fy += dy * invDist3; Fz += dz * invDist3;
}
p.vx[i] += dt*Fx; p.vy[i] += dt*Fy; p.vz[i] += dt*Fz;
}
}
}
int main(const int argc, const char** argv) {
int nBodies = 30000;
if (argc > 1) nBodies = atoi(argv[1]);
int tileSize = 24400;
if (tileSize > nBodies) tileSize = nBodies;
const float dt = 0.01f; // time step
const int nIters = 10; // simulation iterations
if ( tileSize % (CACHELINE/sizeof(float)) ) {
printf("ERROR: blockSize not multiple of %d vector elements\n", CACHELINE/(int)sizeof(float));
exit(1);
}
int bytes = 6*nBodies*sizeof(float);
float *buf = (float*)_mm_malloc(bytes, CACHELINE);
BodySystem p;
p.x = buf+0*nBodies; p.y = buf+1*nBodies; p.z = buf+2*nBodies;
p.vx = buf+3*nBodies; p.vy = buf+4*nBodies; p.vz = buf+5*nBodies;
randomizeBodies(buf, 6*nBodies); // Init pos / vel data
double totalTime = 0.0;
for (int iter = 1; iter <= nIters; iter++) {
StartTimer();
bodyForce(p, dt, nBodies, tileSize); // compute interbody forces
for (int i = 0 ; i < nBodies; i++) { // integrate position
p.x[i] += p.vx[i]*dt;
p.y[i] += p.vy[i]*dt;
p.z[i] += p.vz[i]*dt;
}
const double tElapsed = GetTimer() / 1000.0;
if (iter > 1) { // First iter is warm up
totalTime += tElapsed;
}
}
double avgTime = totalTime / (double)(nIters-1);
printf("\nBodies: %d", nBodies);
printf("\nTotal time elapsed: %0.3f seconds", totalTime);
printf("\nAverage time per iteration: %0.4f seconds", avgTime);
printf("\nAverage %0.4f BIPS\n", 1e-9 * nBodies * nBodies / avgTime);
_mm_free(buf);
}
Ja sitten sinä aloit epäilemään että kuitenkin olivat "intel-optimoituja softia". Eivät olleet.
Ja The Stilt ei käsittääkseni ollut testannut AoTSää , mikään niistä 290 softasta ei ollut AoTS, joten sillä ei tämän kanssa ole mitään tekemistä.
Minä sanoin että itse luotan cinebench lukuihin koska se näyttäisi olevan suhteellisen hyvin optimoitu molemmille, jonka sinä halusit ampua alas väittäen että ei ole hyvin optimoitu jolloin keskustelu ohjautui softaoptimointiin ja sen merkitykseen IPC:n.
Optimointi ei ole epärelevantti, vaan tuo "peli" itsessään on täysi vitsi.
Kun kerran tiedät tarkkaan miten suorituskykyerot johtuu Intelin suosimisesta, niin voisitko näyttää esimerkkiä tämän koodin optimoimisesta Ryzenille?
EDIT. Ja AotS on hyvä esimerkki tässä yhteydessä, ainoastaan sillä huomiolla, että näytönohjaimen ajurilla on oma roolinsa välissä. Kannattaa sekin muistaa että jotkin pelit performoivat huomattavasti paremmin kun paritetaan esimerkiksi Ryzen ja Vega verrattuna Ryzen ja Pascal.
Aiemmin kyselin mitä esim. Zetterin testikokoonpanot ottavat seinästä. Kaivelin sitten hieman esimerkkejä tuolta internetsin ihmeellisestä maailmasta. Ja kuinka vertailukelpoisia ovat, mutta on siinä ainakin jotain suuntaa antavaa näihin.
Xeon X5650 @ 4,37 GHz ja tehonkulutus oli 285 wattia. Linkki: Intel X5650 Overclocking – resulting a 4.37 GHz hexacore – tomrei.com
Ryzen 3 2200G @ vakio ja tehonkulutus 86 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
Ryzen 5 2400G @ vakio ja tehonkulutus 100 wattia. Linkki: Testissä AMD Ryzen 5 2400G & Ryzen 3 2200G (Raven Ridge) - io-tech.fi
i7 860 @ vakio ja tehonkulutus 180 wattia. Linkki: The Intel Core i7 860 Review
Siinä saa SERriin laitella vähän järeämpää virtalähdettä jos lähtee kelloja hakemaan ja ei taideta ihan parin kympin coolereillakaan pärjätä noiden tehojen suhteen. Mutta jokainen joutuu itse päätöksensä tekemään, itse lähtisin mieluummin 2200G linjalle ja saa uuden alustan, takuunalaisen. Sekä saa niitä nykyajan ominaisuuksia (esim. M.2, USB3, Sata 3) ihan out of box. Vielä kun saisivat noita DDR4 hintoja alaspäin..
En minä ole missään epäillyt että olisi intel-optimoinnit päällä käännetty ne softat, vaan olen koko ajan tarkoittanut sitä että Softan tekijät on menneet Intelin ehdoilla jo vuosia.
jokumuu myös asiaan otti kantaa ja on hyvin linjassa siihen mitä kaveri on jutellut ja hän työkseen päivittäin koodaa. AMD:lle ei ole järkevää optimoida, kun ei rautaa ole juurikaan missään käytössä, mutta toki tilanne voi muuttua.
Virallinen: AMD vs Intel keskustelu- ja väittelyketju
AoTS on varsin oiva esimerkki juuri siitä että optimoinneilla on merkitystä. Minä sanoin että itse luotan cinebench lukuihin koska se näyttäisi olevan suhteellisen hyvin optimoitu molemmille, jonka sinä halusit ampua alas väittäen että ei ole hyvin optimoitu jolloin keskustelu ohjautui softaoptimointiin ja sen merkitykseen IPC:n.
Mistä se parannus sinun mielestäsi sitten tuohon kyseiseen "peliin" tuli jos ei optimoinnista?
Että nyt kaivat nuo The Stiltin koodit käyttämien softien lähdekoodit esille ja näytät sieltä ne Intel-spesifiset optimoinnit tai lopetat tuon höpöttämisen siitä kuinka ne muka on "intelille optimoituja".
Kyllä. Mm. mainitsemani cache coherency liittyy moniprosessorijärjestelmiin ja fence-käskyjen käyttöön, joissa AMD ei kyllä tuo itsestään parhaimpia puolia esiin. Fencet on AMD:llä monessa paikassa korvattu ihan vain syncillä, kun suorituskykyetu on ollut negatiivinen tai sitä ei ole ollut.Heillä koodataan ilmeisesti jotain suorituskykykriittistä palvelinkoodia.
Ja hänen mainitsemansa TSX ei toimi myöskään Intelin i5-prosessoreilla, ja AMDn vastine TSX:lle, ASF, ei ole tuettu yhdessäkään prosessorissa.
TSXn tukeminen ei kuitenkaan millään tavalla ole AMDltä pois.
Valitettavasti se, että hkultala ja the stilt näyttäisivät tietävän asiat paljon paremmin kuin moni muu tällä foorumilla ja vielä perustellusti, ei tee heistä räksyttäjiä. Jos sitä räksyttäjää pitää etsiä, niin kannattaisikohan ehkä katsoa peiliin, varsinkin kun argumenttien loppuessa mentiin henkilökohtaisuuksiin. The Stilt esitti testituloksia, joita sinä rupesit kyseenalaistamaan vaikka minkälaisilla mutuiluilla.Okei. Koska sinä käsket minun lopettaa ja sinä yhdessä stiltin kanssa olette todennäköisesti planeetan ellei jopa koko universumin parhaita koodaaji joilla on aikaa räksyttää eri forumeilla kuinka hommat tulisi tehdä, niin onhan se uskottava!
Uskottava on myös se fakta että Intelin ja AMD:n prosessorit on täysin samanlaisia ja ihan sama miten niille koodia kirjoittaa niin ne toimii täysin opti maalisesti kunhan koodi on mennyt kääntäjästä läpi.
Okei. Koska sinä käsket minun lopettaa ja sinä yhdessä stiltin kanssa olette todennäköisesti planeetan ellei jopa koko universumin parhaita koodaaji joilla on aikaa räksyttää eri forumeilla kuinka hommat tulisi tehdä, niin onhan se uskottava!
Uskottava on myös se fakta että Intelin ja AMD:n prosessorit on täysin samanlaisia ja ihan sama miten niille koodia kirjoittaa niin ne toimii täysin opti maalisesti kunhan koodi on mennyt kääntäjästä läpi.
Ihan turha oli varmaan myös se AMD:n julkaisema KPTI pätsi linux kerneliin tuossa taannoin.
Eli lopulta pitää myös tunnustaa se fakta että Intel on vain yksinkertaisesti paljon parempi prosessori koska sillä kaikki pyörii niin paljon paremmin. Eiköhän tuo IPC ero ens kuussa ole jo 50% luokkaa Intelin hyväksi.
Jatkakaa.
The Stilt esitti testituloksia, joita sinä rupesit kyseenalaistamaan vaikka minkälaisilla mutuiluilla.
Jos sitä räksyttäjää pitää etsiä, niin kannattaisikohan ehkä katsoa peiliin, varsinkin kun argumenttien loppuessa mentiin henkilökohtaisuuksiin.
Noniin, sen sijaan, että olisit kaivanut ne mainittujen softien lähdekoodit esille ja alkanut näyttää niistä niitä intel-optimoituja paikkoja esille, aloit uhriutua ja vetää aivan naurettavia olkiukkoja esille.
Noniin, sen sijaan, että olisit kaivanut ne mainittujen softien lähdekoodit esille ja alkanut näyttää niistä niitä intel-optimoituja paikkoja esille, aloit uhriutua ja vetää aivan naurettavia olkiukkoja esille.
Hauskahan näitä oli lukea. Pidetään vauhti päällä niin saadaan pian sadan sivun raja rikki!Okei. Koska sinä käsket minun lopettaa ja sinä yhdessä stiltin kanssa olette todennäköisesti planeetan ellei jopa koko universumin parhaita koodaaji joilla on aikaa räksyttää eri forumeilla kuinka hommat tulisi tehdä, niin onhan se uskottava!
Uskottava on myös se fakta että Intelin ja AMD:n prosessorit on täysin samanlaisia ja ihan sama miten niille koodia kirjoittaa niin ne toimii täysin opti maalisesti kunhan koodi on mennyt kääntäjästä läpi.
Ihan turha oli varmaan myös se AMD:n julkaisema KPTI pätsi linux kerneliin tuossa taannoin.
Eli lopulta pitää myös tunnustaa se fakta että Intel on vain yksinkertaisesti paljon parempi prosessori koska sillä kaikki pyörii niin paljon paremmin. Eiköhän tuo IPC ero ens kuussa ole jo 50% luokkaa Intelin hyväksi.
Jatkakaa.
Jaa samalla powerilla ajeltu myös tämä: rapukala`s CPU Frequency score: 5199.72 mhz with a Xeon X5675 ? Sinä voisit sen mittailla ja kertoa meille.Paljonkohan tämä imutteli sitten virtaa jos tuo linkkaamasi veti jo 285W edestä
Totuus: 450W rutku poweri ja 780ti
Itsekään en koodaa. Mutta hyvin lähellä nuo arkkitehtuurit ovat toisiaan säikeen suorituksen kannalta katsottuna, eikä AMD saa mistään mitään mystistä boostia.Niin oli 29 ja voi hyvinkin olla että kaikki 29 on pelkästään intelille optimoituja. En ymmärrä miksi tämä on niin vaikeaa monen hyväksyä taikka käsittää että optimoinneilla on väliä eikä se ole mitään takertumista johonkin.
Enkä kritisoi sitä etteikö kaveri osaisi, kritisoin sitä että jätetään oleellisia asioita mainitsematta.
Onhan toi SERrin virrankulutus aivan absurdi, jos vertaa nykypäivän laitteisiin. Oma prossun keskikulutus on päivän aikana siinä 60W ja 80W paikkeilla, käyntilämpöjen liikkuessa 40 ja 60 välillä.
Onko tuo se Eng sample vai lopullinen versio?Niin no tuossa katselin io-techin i7-8700K testejä ja siitähän löyty tuo mielenkiintoinen taulukko:
Niin tämä 4.5GHz kellotettu 6C/12T Xeon X5650 nuo luvut ovat Prime95:lla 140W.
IDLE:ssä 15W.
EDIT: Niin ja IDLE lämmöt 30-36C riippuen ytimestä
Prime käyttää kaikkia mitä haluat sen käyttävän. Säätökysymys.Onko tuo se Eng sample vai lopullinen versio?
Ja mikä on noiden prossujen prime suorituskyky? Periaatteessahan joku prossu voisi viedä esim 5 kertaa enemmän tehoa, kun jotain tapahtuu, mutta jos asia tuleekin tehtyä 10x nopeammin, niin se on silti puolet parempi. (Energiaa kuluu vain puolet).
Mitä käskykantoja tuo prime muuten käyttikään?
Onko tuo se Eng sample vai lopullinen versio?
Ja mikä on noiden prossujen prime suorituskyky? Periaatteessahan joku prossu voisi viedä esim 5 kertaa enemmän tehoa, kun jotain tapahtuu, mutta jos asia tuleekin tehtyä 10x nopeammin, niin se on silti puolet parempi. (Energiaa kuluu vain puolet).
Mitä käskykantoja tuo prime muuten käyttikään?
Edelleen vastaus on että kaikkia.Tukeeko Prime 95 siis mitä kaikkia käskylaajennuksia?
Kirjoitinko epäselvästi? En ole koodaaja. Ihan harrastepohjalta on hiukan tullut tcl ja php:tä joskus "koodattua", perl jonkin verran osaan tulkita mutten ole koskaan sillä mitään "koodannut". Joku C on hyvin pitkälti hepreaa.
Eihän siellä tartte olla mitään ns. "Intel optimoituja paikkoja" kun kokoa alalla on menty 10v Intelin ehdoilla.
Stilt toi esiin tuossa AoTS:ssä esiin tuon CCX <-> CCX asian joka on yksi esimerkki siitä että se "geneerinen" koodi ei välttämättä ole Ryzenille optimaalista. Jos kyse tuossa tapauksessa oli tuosta CCX <-> CCX kommunikoinnista.
Joko kääntäjät esim. osaa tuon CCX:n ottaa huomioon?
Ja mitä täältä on aiemmin tullut lueskeltua niin tuntuisi silläkin olevan merkitystä kuinka cacheja käytetään. Se mikä sattuu yhdelle, ei välttämättä olekaan optimaalinen toiselle. Tätähän on nähty ihan Intelin sisälläkin.
Onko tuo se Eng sample vai lopullinen versio?
Tuossa testissä on juurikin ES käytössä, io-techillähän oli sitten hieman myöhemmin retail vs ES testi myös, jonka retail cpu oli jonkin verran "virtapihimpi" kuin tuo ES.Muistelen, jotta IO-techillä olisi ollut jokun eng sample versio prossusta ensin testissä.?
Tuossa testissä on juurikin ES käytössä, io-techillähän oli sitten hieman myöhemmin retail vs ES testi myös, jonka retail cpu oli jonkin verran "virtapihimpi" kuin tuo ES.
Nytkö tästä on tullut jo ikäkysymys? Paljonpa luulet näillä herroilla olevan ikää?Mikä on mutuilua? Onko se todellakin niin vaikeaa ymmärtää että optimoinneilla on väliä? Se että Intel on hallinnut viimeiset lähes 10v cpu markkinoita on opettanut lähes KAIKKI (Varsinkin nuoremmat, ne jotka imi vielä tissiä silloin kun AMD:n ja Intelin välinen sota oli kuumimmillaan) jo koulusta lähtien koodaamaan täysin Intelin ehdoilla. Tää tuntuu olevan hyvin vaikeaa ymmärtää monelle.
Edelleen, tässä ei sinäänsä ole mitään väärää. Tottakai kannattaa tehdä asiat niin mille on kysyntää.
Argumentit ei lopu, en vaan yksinkertaisesti JAKSA vängätä asiasta kun se on ihan sama vaikka menisi tuonne ulos puupölkyille juttelemaan. En yksinkertaisesti osaa ilmaista asioita niin että näille neropateille se menisi jakeluun.
Ilmeisesti herroilla on vain liikaa vielä tuota nuoruuden intoa ja kun ovat mielestään niin hyvin perillä kaikesta niin on käynyt samalla vähän sellainen efekti että kusi noussu päähän ja ollaan hyvin herkästi heti kyykyttämässä niitä jotka eivät asioita niin tarkkaan tiedä.
Ne "intelin ehdot" on >90%sti ihan yhtä lailla "AMDn ehdot". Olen tätä jo moneen kertaan yrittänyt selittää.
Miten kääntäjä VOISI ottaa CCXn jotenkin huomioon?
Vai onko tosiaan niin että kaikki viimeisen 10 vuoden aikana kirjoitettu koodi suosii automaattisesti Intelin arkkitehtuureja
Taitaa olla! Millos tuli viimoset 3D Now! koodit ulos ...