Virallinen: AMD vs Intel keskustelu- ja väittelyketju

  • Keskustelun aloittaja Keskustelun aloittaja Sampsa
  • Aloitettu Aloitettu
Zen 3:n osalta jury on vieläkin pihalla, mutta ainakin aiemmissa AMD:n prosessoreissa on ollut mm. herkemmin latenssiongelmia tietyissä audiosovelluksissa, jonka takia Inteliä on suosittu. Niitä varten täällä on oma ketjunsakin Prosessorit audiokäytössä , samoin AVX-512 koodia varten joutuu hankkimaan Inteleitä. Ja varmasti muitakin vastaavia erikoistapauksia on, jotka puoltavat Intelin hankkimista.

Nämä epätyypillisemmät esimerkit eivät kuitenkaan muuta sitä tosiasiaa, että Zen 3:n myötä Intelin paletti ei vaikuta olevan ykkösvalinta tällä hetkellä oikein missään asiassa ainakaan työpöytäkäyttäjän osalta suorituskykynäkökulmasta. Sen verran vähän on enää mitään pullonkauloja, että tällä hetkellä en laittaisi Inteliä kuin midrange pelikoneisiin joiden hintataso menee reilusti alle 5600X+B550-setin.

Ja tuonkin AVX-512 koodin voit unohtaa koska Comet Lake prosessorit ei sitä tue...

Pitää mennä HEDT puolelle Cascade Lake X prosessoreihin että saa tuon tuen. Ja niiden saatavuushan on ollut todella heikkoa. (ainakin i9-10980XE).
Ja 5950X taitaa olla lähes kaikessa muussa nopeampi kuin tuo Intelin 18-ydin prosessori ja huomattavasti edullisempi tehonkulutuksesta puhumattakaan...
 
Jotenkin on koomiseksi muuttunut tämä väittelyketju kun Intel vei niin ei ollut fps:llä eikä suorituskyvyllä mitään väliä AMD:n puolestapuhujille, mutta kun AMD tuo nopeamman prosessorin niin yhtäkkiä ne onkin super tärkeää ja merkityksellistä ja pastetaan kuvia miten 360p resolla saa enemmän fps:ää AMD:llä kuin Intelillä :rofl2:

Koomista on lähinnä se kuinka intel fanipojat koittaa kilpaa nyt selitellä sanomisiaan kauniiksi, vedoten milloin mihinkin selityksiin. Ehkä huvittavin mihin nyt olen törmännyt on vetoaminen sarkasmiin.
Se että AMD on nyt jonkun freimin inteliä edellä peleissä, niin sillä ei ole juurikaan merkitystä.


Onko jotain AVX-512 optimoituja tuotantosoftia joissa intel on vielä merkittävästi edellä ja joille ei löydy GPU kiihdytettyä koodipolkua?

Tai ylipäätään kuluttajille tarkoitettua prossua josta AVX-512 löytyisi.. Sellainenhan on ilmeisesti vuoden päästä vasta tulossa joten hirveästi ei kannata tuota AVX-512 vielä rummuttaa. Se että AVX-512 saadaan myös kuluttajaluokkaan niin siitä menee vielä vuosia että se alkaisi olla jotenkin merkityksellinen jos edes koskaan sellaiseen asemaan tulee pääsemään kun ottaa huomioon sen aiheuttamat ongelmat josta syystä jopa datacenter puolella kehoitetaan kytkemään koko käskykanta pois päältä koska haitta on suurempi kuin hyöty monesti.

Eihän sinun ole ollut pakko tätä foorumin osaa lukea jos niin on haitannut se, että Intelin lukemattomia vuosia kestänyttä ylivoimaa on täällä käsitelty.

Intelillä oli toki ylivoima vuosia mutta se ylivoima lakkasi olemasta myöskin jo vuosia sitten. Tarkalleen ottaen silloin kun Zen julkaistiin.

Suosittelisin että nyt kun olet takkisi kääntänyt niin käyt samalla hiukan läpitte niitä omia sepustuksiasi tuolta parin kuukauden takaa. Se on meinaan sellainen juttu että sitä niität mitä kylvät.
 
Ei kaikki kommentit ja pitäähän se kone joskus päivittää niin miksei nyt
Jokaisella on oikeus muutta mieltään, ostaa tai olla ostamatta tuotetta ilman että sitä täytyisi alkaa random jampoille jollain foorumilla selitteleen.

Joten ei muutakuin uutta rautaa koneeseen, on se sitten Amd,Nvidiaa tai Inteliä eli RGB.tä :smile:
 
Rocket Lake ei ole relevantti jos pitää saada uusi prosessori nyt tai ihan lähikuukausina. Sen sijaan jos päivityksellä ei ole kiire, niin ei sitä kovin kauaa tarvitse odotella.

2021Q1een on alle 2kk aikaa. Siitä, tuleeko tammikuussa vai maaliskuussa ei kai ole vielä mitään varmistunutta tietoa, mutta kyllä se voi tulla "lähikuukausina".

Tuosta toista kappalettasi en kyllä ymmärrä. Sekä Ryzen 5000 että Rocket Lake tulevat olemaan viimeisiä omalla kannallaan, koska seuraavaksi tulee DDR5-emolevyt ja prosessorit. Tai no vähän on huhuja liikkunut, että Zen 3:sta tulisi vielä jokin refresh, mutta itse olettaisin että on vähän samaa tasoa refreshinä kuin viime kesän XT-julkaisut.

Mikäli Zen4n työpöytä- ja serverimallit tulee vielä samanlaisella chiplet-ratkaisulla samalla piilastujen välisellä väylällä, AMDllä on aika paljon optioita "välimalleihin", joko
1) AMD pystyisi hyvin pienilllä kustannuksilla tuomaan Zen4sta markkinoille myös "päivitysmallin" AM4-kannoille, käyttäen samaa vanhaa zen2-aikaista IO-piilastua, TAI
2) AMD voisi jo ennen Zen4sta tehdä uuden DDR5sta tukevan IO-piilastun ja tuoda markkinoilla uuden pakkauksen jossa nykyinen Zen3-CCD + uusi DDR5-IO-piiri.

Näistä ensimmäinen tarkoittaisi vanhaa kantaa, jälkimmäinen uutta kantaa.
 
Tai ylipäätään kuluttajille tarkoitettua prossua josta AVX-512 löytyisi..

Ensimmäinen on julkaistu melkein kaksi ja puoli vuotta sitten mutta sen valmistus- ja myyntimäärät jäivät hyvin pieniksi


Sen sijaan ihan laajamittaiseen myyntiin tulleita mallejakin on julkaistu iso kasa jo yli vuosi sitten ja ollut jo yli vuoden myynnissä ja myyty huomattavia määriä

 
2021Q1een on alle 2kk aikaa. Siitä, tuleeko tammikuussa vai maaliskuussa ei kai ole vielä mitään varmistunutta tietoa, mutta kyllä se voi tulla "lähikuukausina".
Yleensä kyllä hyvä nyrkkisääntö on ollut, että jos joku prosessori luvataan myyntiin tietyllä vuosineljänneksellä, niin sitä saa kaupasta ehkä neljänneksen viimeisenä kuukautena. Katsotaan, miten käy tällä kertaa.
 
Ensimmäinen on julkaistu melkein kaksi ja puoli vuotta sitten mutta sen valmistus- ja myyntimäärät jäivät hyvin pieniksi


Sen sijaan ihan laajamittaiseen myyntiin tulleita mallejakin on julkaistu iso kasa jo yli vuosi sitten ja ollut jo yli vuoden myynnissä ja myyty huomattavia määriä

Tarkoitatko oikeasti, että nuo 2-4 -ytimiset mobiiliprosessorit olisi tarkoitettu AVX-512 -laskentaan?
Noista tehokkaimmassakin oli 28W TDP, ja base-kellot 2,3 GHz. AVX512:lla varmaan kellot tippuvat alle gigahertsiin. Todellinen laskentahirmu.

Noissa mobiili-Ice lakeissa on varmaan AVX512 sen vuoksi, kun se oli muihinkin Ice Lake -prosessoreihin suunniteltu (ja noita muita ei sitten koskaan ainakaan toistaiseksi ole saatu valmistettua).
 
Näistä ensimmäinen tarkoittaisi vanhaa kantaa, jälkimmäinen uutta kantaa.

Itseasissa kolmas vaihtoehto on se että IO:ssa on DDR4 ja DDR5 ohjain, jolloin se sama IO-piiri käy sekä vanhalle että uudelle.

Esim. Intel on pitänyt DDR3 tuen ainakin 8th geniin asti. Mikään tunnettu emovalmistaja ei toki emoa ole julkaissut, mutta kiinalaiset on. LTT tuota joku vuosi sitten testasi.


Sen sijaan ihan laajamittaiseen myyntiin tulleita mallejakin on julkaistu iso kasa jo yli vuosi sitten ja ollut jo yli vuoden myynnissä ja myyty huomattavia määriä

Se että jossain tuhnussa läppäri piirissä on AVX-512 ei paljoa lohduta vaikka se ne läppärimarkkinat toki isot onkin. Desktop puolen kuluttaja tuotteista se AVX-512 edelleen uupuu.
 
Viimeksi muokattu:
Tarkoitatko oikeasti, että nuo 2-4 -ytimiset mobiiliprosessorit olisi tarkoitettu AVX-512 -laskentaan?

Ei ole mitään erillistä "AVX-512-laskentaa". AVX512-käskyjä voi käyttää vaikka mihin mistä löytyy datariippuvaisia kohtia.

Tarkoitin, että ne tukevat AVX-512-käskykantaa, ja niillä voi ajaa mitä tahansa tekevää koodia, joka käyttää AVX512-käskyjä. Siitä tässä oli kyse.

Noista tehokkaimmassakin oli 28W TDP, ja base-kellot 2,3 GHz. AVX512:lla varmaan kellot tippuvat alle gigahertsiin. Todellinen laskentahirmu.

Hienosti vedit hihasta luvun joka menee pieleen yli kolminkertaisesti.

Todellisuudessa Ice Laken läppärimalli (i5-1035G4 ) ajaa AVX512-koodia yhdellä ytimellä 3.6 GHz:lla ja neljällä ytimellä 3.3 GHZ:lla.

AVX512n takia siis Ice Lakessa lasketaan maksimikelloja vajaat 3% ja neljän ytimen kelloja ei yhtään.



Että mutuilet nyt todella pahasti sen perusteella, miten muinaiset Skylaken serverimallit (joissa aivan eri mikroarkkitehtuuri, ja paljon energiatehottomampi valmistustekniikka) käyttäytyy, sotkien mukaan vielä todella reippaasti omaa liioitteluasi.

Ja tuossa vähän linkkiä siihen miten tuosta seuraavalla mallilla, Tiger Lakella, joka sekin on julkaistu jo melkein 2kk sitten, AVX512 mahdollistaa monella softalla neljällä ytimellä saman luokan tai paremman suorituskyvyn kuin kilpailijan 8-ytimisellä prossulla on.


Noissa mobiili-Ice lakeissa on varmaan AVX512 sen vuoksi, kun se oli muihinkin Ice Lake -prosessoreihin suunniteltu (ja noita muita ei sitten koskaan ainakaan toistaiseksi ole saatu valmistettua).

Keksitkö vielä yhtään enempää virheellisiä väitteitä?

Ice Laken serverimalli on julkaistu jo pari kuukautta sitten ja ollut jo jonkin aikaa tuotannossa, hyvin niitä on saatu valmistettua.

Ja Ice Laken läppärimalleissa on AVX512 sen takia että sillä saadaan mukavasti nopeutta lisää datarinnakkaisiin koodeihin samalla kun energiatehokkuus niissä paranee. Kun saadaan laskettua tuplamäärä laskutoimituksia per haettu ja dekoodattu käsky. Sekä voidaan vektoroida sellaisia looppeja, jotka tarvii vektoroituakseen scatter-storea (AVX2ssa tuli vain gather-load, muttei scatter-storea, AVX512ssa on molemmat), sen sijaan että suoritettaisiin ne todella hitaasti ja energiatehottomasti skalaarikoodina.
 
Viimeksi muokattu:
Se että jossain tuhnussa läppäri piirissä on AVX-512 ei paljoa lohduta vaikka se ne läppärimarkkinat toki isot onkin.

Ice Lake ja Tiger Lake eivät todellakaan ole mitään "tuhnuja". Ainoastaan Cannon Lake oli "tuhnu".

Ja mikään ei todellakaan lohduta jos se suru tulee täysin tunteisiin ja mutuun eikä faktoisiin pohjaavista asioista.

Fakta on se, että pöytäkoneiden prossut on hyvin pieni osa koko Intelin tuotepaletista ja melko pieni osa Intelin tuloista.
Mutta tällaisilla foorumeilla jossa ihmiset kokoavat itse koneensa ne on ainoa, mitä tuijotetaan.

Desktop puolen kuluttaja tuotteista se AVX-512 edelleen uupuu.

Niin uupuu, parin kuukauden ajan. Sitten tule Rocket Lake.

Ja kuluttajaa ei nytkään kuitenkaan kielletä ostamasta pöytä-PChensä LGA2066-kantaista prossua josta se löytyy.
 
Ei ole mitään erillistä "AVX-512-laskentaa". AVX512-käskyjä voi käyttää vaikka mihin mistä löytyy datariippuvaisia kohtia.

Tarkoitin, että ne tukevat AVX-512-käskykantaa, ja niillä voi ajaa mitä tahansa tekevää koodia, joka käyttää AVX512-käskyjä. Siitä tässä oli kyse.



Hienosti vedit hihasta luvun joka menee pieleen yli kolminkertaisesti.

Todellisuudessa Ice Laken läppärimalli (i5-1035G4 ) ajaa AVX512-koodia yhdellä ytimellä 3.6 GHz:lla ja neljällä ytimellä 3.3 GHZ:lla.

AVX512n takia siis Ice Lakessa lasketaan maksimikelloja vajaat 3% ja neljän ytimen kelloja ei yhtään.



Että mutuilet nyt todella pahasti sen perusteella, miten muinaiset Skylaken serverimallit (joissa aivan eri mikroarkkitehtuuri, ja paljon energiatehottomampi valmistustekniikka) käyttäytyy, sotkien mukaan vielä todella reippaasti omaa liioitteluasi.

Ja tuossa vähän linkkiä siihen miten tuosta seuraavalla mallilla, Tiger Lakella, joka sekin on julkaistu jo melkein 2kk sitten, AVX512 mahdollistaa monella softalla neljällä ytimellä saman luokan tai paremman suorituskyvyn kuin kilpailijan 8-ytimisellä prossulla on.




Keksitkö vielä yhtään enempää virheellisiä väitteitä?

Ice Laken serverimalli on julkaistu jo pari kuukautta sitten ja ollut jo jonkin aikaa tuotannossa, hyvin niitä on saatu valmistettua.

Ja Ice Laken läppärimalleissa on AVX512 sen takia että sillä saadaan mukavasti nopeutta lisää datarinnakkaisiin koodeihin samalla kun energiatehokkuus niissä paranee. Kun saadaan laskettua tuplamäärä laskutoimituksia per haettu ja dekoodattu käsky. Sekä voidaan vektoroida sellaisia looppeja, jotka tarvii vektoroituakseen scatter-storea (AVX2ssa tuli vain gather-load, muttei scatter-storea, AVX512ssa on molemmat), sen sijaan että suoritettaisiin ne todella hitaasti ja energiatehottomasti skalaarikoodina.
Onhan tuota Ice laken AVG-512 -suorituskykyä testattukin. Ei kovin kummoisia kelloja saavuteta, kun käytetään AVX-512 -laskentaa.
Second to note is the AVX-512 frequency. Not listed here, but under the 15W mode we saw the AVX-512 frequency around 1.0-1.1 GHz, while at 25W it was around 1.4-1.5 GHz. That’s quite a drop from non AVX-512 code, for sure.
 
Ja Ice Laken läppärimalleissa on AVX512 sen takia että sillä saadaan mukavasti nopeutta lisää datarinnakkaisiin koodeihin samalla kun energiatehokkuus niissä paranee. Kun saadaan laskettua tuplamäärä laskutoimituksia per haettu ja dekoodattu käsky. Sekä voidaan vektoroida sellaisia looppeja, jotka tarvii vektoroituakseen scatter-storea (AVX2ssa tuli vain gather-load, muttei scatter-storea, AVX512ssa on molemmat), sen sijaan että suoritettaisiin ne todella hitaasti ja energiatehottomasti skalaarikoodina.

No mikäs on gather-scatter suorituskyky? Data kun luetaan L1-cachesta ja se ei taivu käsittelemään Intelin prossuissa kuin kahta eri cachelinjaa kerrallaan eli jos luetaan ja tallennetaan 16 elementtiä per vektori niin taitaa sulaa koko vektoroinnista mahdollisesti saatava hyöty, eikä taida energiatehokkuuskaan kummoisesti parantua.
 
Ja tuossa vähän linkkiä siihen miten tuosta seuraavalla mallilla, Tiger Lakella, joka sekin on julkaistu jo melkein 2kk sitten, AVX512 mahdollistaa monella softalla neljällä ytimellä saman luokan tai paremman suorituskyvyn kuin kilpailijan 8-ytimisellä prossulla on.
Siis jollain ihan tuotantosoftillako? Joku piin desimaalien laskeminen ei ole kovin oleellinen juttu IMO.

Vieläkään ei ole näkynyt yhtäkään käytännön esimerkkiä jossa joku tuottavaan työhön tarkoitettu softa pyörisi AVX-512:n avulla niin nopeasti että mentäisiin ohi renoirista, ja jolle ei olisi dramaattisesti nopeampaa GPU laskentapolkua.

edit: oman käsitykseni mukaan jotkut ML opetusrakenteet voi vaatia niin isoa muistiavaruutta, että mikään GPU pakka ei ole tarpeeksi, jolloinka AVX-512 kiihdytetty serveri on ainoa järkevä vaihtoehto. Kyseessä on kuitenkin harvinaisen ahdas nissi ja jolla ei ole minkään valtakunnan merkitystä juuri kenellekkään.
Ice Laken serverimalli on julkaistu jo pari kuukautta sitten ja ollut jo jonkin aikaa tuotannossa, hyvin niitä on saatu valmistettua.
Missä viipyy testit, jos niitä kerran on saatu valmistettua jo tovi?
 
Viimeksi muokattu:
No mikäs on gather-scatter suorituskyky? Data kun luetaan L1-cachesta ja se ei taivu käsittelemään Intelin prossuissa kuin kahta eri cachelinjaa kerrallaan eli jos luetaan ja tallennetaan 16 elementtiä per vektori niin taitaa sulaa koko vektoroinnista mahdollisesti saatava hyöty, eikä taida energiatehokkuuskaan kummoisesti parantua.

"kerrallaan" == kellojaksossa.

Lasketaanpa vähän kumpi on nopeampaa:

Että meillä looppi jota pyöritään vaikka 64 kierrosta, jossa suoritetaan ensin lataus (vaikka 5 kellojaksoa), sitten jotain laskentaa (vaikka 8 kellojaksoa) ja lopuksi tallennus (1 kellojakso) ja vaihtoehdot on joko

1) suorittaa tämä looppi skalaarikoodina 64 kertaa, jotka peräkkäisinä veisivät 1024 kellojaksoa, mutta jotka spekulatiivisen suorituksen ansiosta liukuhihnoittuvat alkamaan esim. n. neljän kellojakson välein eli suoriutuvat n. 268 kellojaksossa.

2) vektoroida suorittaa vektoroitu koodi neljä kertaa siten että suoritetaan suoritetaan yksi ~13 kellojaksoa kestävä gather-load, sen jälkeen 8 kellojaksoa laskentaa ja sen jälkeen scatter-store jonka suorittamisessa kestää 8 kellojaksoa mennä perille, eli peräkkäisenä yksinään nämä veisivät 29 kellojaksoa/iteraatio eli yhteensä 116 kellojaksoa, mutta joka spekulaatiivisen suorituksen ansiosta liukuhihnoittuu kahdeksan kellojakson välein, eli neljä iteraatiota suoritetaan yhteensä n. 53 kellojaksossa. (scatterin ja gatherin kaista siis rajoittaa tämän uuden iteraation aloittamisen kahdeksan kellojakson väleihin)


Vektoroitu scatter-gather-versio on tässä siis suuruusluokkaa 5x nopeampi kuin se skalaariversio, vaikka gather on mielestäsi "hidas". Mikäli dataa olisi vielä enemmän että "liukuhihnan alun ja hännän" vaikutus vähenisi, suorituskykyero lähestyisi tällaisella loopilla kahdeksankertaista.

Energiatehokkuudessa on myös todella suuri ero kun suoritettujen käskyen kokonaismäärässä on 16-kertainen ero.


Seitsemisen vuotta sitten suunnittelin prossuytimen ajamaan yhtä virheenkorjausalgoritmiä, jossa yksinkertaisesti vektoroitu koodi olisi vaatinut sekä scatterin että gatherin, mutta keksin optimoinnin, jonka kanssa koodi vaati vektoroituakseen ainostaan JOKO scatterin TAI gatherin (toki koodi oli sitten monimutkaisempi). Päädyin toteuttamaan scatterin ja jättämään gatherin pois, koska se oli käskyjen skeduloinnin kannalta helpompaa.


Joku meistä on oikeasti tehnyt töitä ja tutkimusta näiden juttujen kanssa, ja julkaissut vertaisarvioituja tieteellisiä papereita näihin liittyvistä asioista. Se joku et taida olla sinä.
 
Viimeksi muokattu:
Missä viipyy testit, jos niitä kerran on saatu valmistettua jo tovi?

Ensimmäiset vuodetut tulokset tuli jo maaliskuussa:


Lisää tuli heinäkuussa:


Intelin omia vertailuja Cascede Lakeen tuli ulos elokuussa:


"Isojen arvostelusitejen" testitulokset sen sijaan lienee vielä NDAn alla.
 
Ice Lake ja Tiger Lake eivät todellakaan ole mitään "tuhnuja". Ainoastaan Cannon Lake oli "tuhnu".

Ja mikään ei todellakaan lohduta jos se suru tulee täysin tunteisiin ja mutuun eikä faktoisiin pohjaavista asioista.

Fakta on se, että pöytäkoneiden prossut on hyvin pieni osa koko Intelin tuotepaletista ja melko pieni osa Intelin tuloista.
Mutta tällaisilla foorumeilla jossa ihmiset kokoavat itse koneensa ne on ainoa, mitä tuijotetaan.



Niin uupuu, parin kuukauden ajan. Sitten tule Rocket Lake.

Ja kuluttajaa ei nytkään kuitenkaan kielletä ostamasta pöytä-PChensä LGA2066-kantaista prossua josta se löytyy.

Me tarkastellaan tätä koko AVX-512 keissiä niin eri näkökulmista. Minä katselen sitä siitä näkökulmasta että milloin siitä on MINULLE oikeasti jotain hyötyä ihan arkipäiväisessä koneen käytössä ja se päivä ei ole kyllä ihan huomenna taikka ylihuomenna tapahtumassa.
Eli se käytännön hyöty siitä AVX-512 ei vaan tunnu toteutuvan, kukaan ei ole mitään käytännön esimerkkejä esittänyt että siitä olisi normi kuluttajalle hyötyä.
On vain teorioita esitetty miten siitä voisi teoriassa saada niin ja niin paljon parempaa suorituskykyä.

Päinvastoin on esitetty käytännön esimerkkejä joissa se AVX-512 tankkaa suorituskykyä.

Se että jokin paperilla ja teorissa näyttää/kuulostaa kivalta ei sitten aina reaalimaailmassa toteudu niin ruusuisena. Ja ainakin nyt näyttää siltä että koko AVX-512 on sellainen että sen käyttökohteet on hyvin raajalliset eikä se välttämättä koskaan tule olemaan mikään "must have".

LGA2066 alustalla toki pääsee kyseiseen turhuuteen kiinni, mutta kyseinen alusta on ainakin aikaisemmin luokiteltu HEDT alustaksi ja hintakin on sitten ollut sen mukainen. Toki hinnan on tullu roimasti alas koska TR juoksee ympyrää kyseisen alustan ympärillä.

Jopa maailman suurin Intel fanboi on sitä mieltä että Intelin pitäisi säkittää koko AVX-512.
 
Me tarkastellaan tätä koko AVX-512 keissiä niin eri näkökulmista. Minä katselen sitä siitä näkökulmasta että milloin siitä on MINULLE oikeasti jotain hyötyä ihan arkipäiväisessä koneen käytössä ja se päivä ei ole kyllä ihan huomenna taikka ylihuomenna tapahtumassa.

... koska AMD-fanipoikana/Intel-vihaajana kieltäydyt ostamasta prosessoreita, jotka sitä tukevat, ennen kuin fanittamasi prossuvalmistaja niitä (todennäköisesti vuonna 2022) julkaisee. Joten luonnollisesti et voi saada AVX512sta hyötyä ennen sitä, koska et omista sitä tukevaa prossua.

Siitä voisi olla sinulle esim. läppärissä hyötyä jo tänä vuonna, jos et kieltäytyisi ostamasta sitä tukevia prosessoreita.

Tosin, monet sinun arkipäiväisessä koneenkäytössä käyttämäsi verkkopalvelut pyörivät palvelinprosessoreilla, joissa AVX512sta käytetään sinun käyttämiäsi palveluja nopeuttamaan. Tämäkin on ihan arkipäiväistä koneenkäyttöä.
 
Jopa maailman suurin Intel fanboi on sitä mieltä että Intelin pitäisi säkittää koko AVX-512.

Viitannet piednoeliin.

Se, että joku on maailman suurin fanboi tarkoittaa sitä, että hän on idiootti, jonka arvostelukykyyn ei kannata MISSÄÄN asiassa luottaa.
 
Päinvastoin on esitetty käytännön esimerkkejä joissa se AVX-512 tankkaa suorituskykyä.

Pätee ainostaan Skylake-johdannaisiin.

Siihen markkinasegmenttiin mistä sinä niin hirveästi piittaat eli kuluttajatyöpöytiin ei ole koskaan tullut eikä ole koskaan Inteliltä tulemassa YHTÄÄN sellaista prosessoria joissa näitä Skylaken merkittäviä AVX512n throttling-ongelmia on.

Ensi vuonna työpöydälle tuleva Rocket Lake on aivan eri mikroarkkitehtuuri, se perustuu Ice Lakeen eikä se throttlaa samalla tavalla kuten Skylake-johdannaiset.
 
Koomista on lähinnä se kuinka intel fanipojat koittaa kilpaa nyt selitellä sanomisiaan kauniiksi, vedoten milloin mihinkin selityksiin. Ehkä huvittavin mihin nyt olen törmännyt on vetoaminen sarkasmiin.

Se että AMD on nyt jonkun freimin inteliä edellä peleissä, niin sillä ei ole juurikaan merkitystä.







Intelillä oli toki ylivoima vuosia mutta se ylivoima lakkasi olemasta myöskin jo vuosia sitten. Tarkalleen ottaen silloin kun Zen julkaistiin.



Suosittelisin että nyt kun olet takkisi kääntänyt niin käyt samalla hiukan läpitte niitä omia sepustuksiasi tuolta parin kuukauden takaa. Se on meinaan sellainen juttu että sitä niität mitä kylvät.


Sinä et ole ikinä tajunnut että minä en ole ollut "Intelin fanipoika" koskaan vaan olen vahvimman kannattaja ollut aina ja nyt se on AMD.

Tästä tuli jotenkin mieleeen kun osa kavereistani kuittailee minulle jalkapallosta että olisin glory hunter kun fanitan jalkapallossa (jalkapallossa fanitan kyllä) aina sitä seuraa joka johtaa maansa isointa liigaa (la liga, premier league, bundesliga, seria a) tai on voittanut viimeksi mestarien liigan. Mielestäni se ei ole mitään glory huntaamista vaan se on menestyjän mukana menestymistä ja mielestäni se on yksi menestyjän merkki (jalkapallosta puhe). Vaikka en sitä ääneen heille sanokkaan niin uskon että he ovat vaan kateellisia kun minun kannattavat jalkapallo joukkueet pärjäävät paremmin.

Intel oli vuosikausia täysin ylivoimainen peleissä, nyt on AMD.

Pahoittelen että joudut pettymään kun luulit minua Intel fanipojaksi, minä olen menestyksen mukana kulkija, olipa väri mikä vain. Harmi että et tajunnut monia kirjoituksiani sarkasmiksi vaikka ne itsestään selvästi sitä olivat (eivät toki kaikki kirjoittamani).

Jos jotain jäi hampaankoloon niin turha sitä on minuun yrittää purkaa. Joudut nyt valitettavasti muualta etsimään niitä intel faneja joista jatkuvasti puhut, mutta tähän mennessä et ole tainnut löytää yhtään oikeaa intel fania foorumilta. AMD-faneja sen sijaan täältä löytyisi valtavasti, mutta niitä et ilmeisesti etsi jostain syystä.

Ja takkiani en ole kääntänyt kun en koskaan ole intel tai amd fanipoika ollutkaan. Minä olen seurannut menestyjää, se on paljon hienompaa. Tällöin on aina voittajan kelkassa ja voi ylpeänä sanoa kannattavansa parasta.

Ennen olin foorumin Intel kannattajien kärkeä ja eliittiä, nyt olen AMD kannattajien. Jonkun pitää esimerkillään johtaa.
 
Tästä tuli jotenkin mieleeen kun osa kavereistani kuittailee minulle jalkapallosta että olisin glory hunter kun fanitan jalkapallossa (jalkapallossa fanitan kyllä) aina sitä seuraa joka johtaa maansa isointa liigaa (la liga, premier league, bundesliga, seria a) tai on voittanut viimeksi mestarien liigan. Mielestäni se ei ole mitään glory huntaamista vaan se on menestyjän mukana menestymistä ja mielestäni se on yksi menestyjän merkki (jalkapallosta puhe). Vaikka en sitä ääneen heille sanokkaan niin uskon että he ovat vaan kateellisia kun minun kannattavat jalkapallo joukkueet pärjäävät paremmin.

Rankka off topic, mutta siis tuo on sanakirjamääritelmä glory huntista, että vaihtaa kannatamaansa seuraa sen mukaan mikä kulloinkin menestyy.

Urheilussa kannattajatoiminta on ainakin alun perin orgaanista ja osa lajia, tietokonebrändien kohdalla puhtaasti markkinamiesten lastien nielemistä.
 
Siitä voisi olla sinulle esim. läppärissä hyötyä jo tänä vuonna, jos et kieltäytyisi ostamasta sitä tukevia prosessoreita.
Millaisessa käytössä? Ja siis edelleen vaatimuksena että se on sekä nopeampi kuin renoir, että ohjelmalle ei ole huomattavasti nopeampaa GPU-kiihdytettyä koodipolkua.
 
Onhan tuota Ice laken AVG-512 -suorituskykyä testattukin. Ei kovin kummoisia kelloja saavuteta, kun käytetään AVX-512 -laskentaa.
Second to note is the AVX-512 frequency. Not listed here, but under the 15W mode we saw the AVX-512 frequency around 1.0-1.1 GHz, while at 25W it was around 1.4-1.5 GHz. That’s quite a drop from non AVX-512 code, for sure.

Tuossa tapauksessa siis kelloja laskettiin lämpörajan takia, ei suoraan sen takia että käytössä olisi AVX512-käskyt. AVX-koodi joka oli todella monta kertaa nopeampi kulutti myös enemmän virtaa samalla kellolla, joten kelloa piti laskea. Ja tuossa testissä joka oli energiankulutus-/lämmöntuottorajoitteinen, suorituskyky tuolla AVX512-optimoidulla versiolla 9 kertaa nopeampi kuin skalaariversiolla, selvästi matalammasta kellosta huolimatta.

Eli siis, AVX512-koodipolku oli tuossa testissä sekä n. 9 kertaa nopeampi kuin skalaarikoodipolku että n. 9 kertaa energiatehokkaampi kuin skaalaarikoodipolku.
 
Viimeksi muokattu:
Millaisessa käytössä? Ja siis edelleen vaatimuksena että se on sekä nopeampi kuin renoir, että ohjelmalle ei ole huomattavasti nopeampaa GPU-kiihdytettyä koodipolkua.

Vaikka mikä tahansa AVX512lle optimoitu kuvan- tai videonkäsittelyfiltteri, jossa laskettava laskutoimitusmäärä on luokkaa alle 100 laskuoperaatiota/pikseli. Eli esim. mikä tahansa melko normaali /yksinkertainen terävöitys- tai blurrifiltteri

GPU nimittäin on sen hitaan 32 GB/s pcie-väylän päässä, siinä ajassa kun 32-bittinen floatti siirtyy CPUlta GPUlle ja takaisin sillä ehdittäisiin CPUlla tehdä n. 100 laskutoimitusta. Ja mikäli kerralla laskettavaa dataakin on vähän (ja erillisiä kutsuja rutiiniin paljon), tähän vielä päälle overheadit näyttiksen ajurista yms.
 
Tuossa tapauksessa siis kelloja laskettiin lämpörajan takia, ei suoraan sen takia että käytössä olisi AVX512-käskyt. AVX-koodi joka oli todella monta kertaa nopeampi kulutti myös enemmän virtaa samalla kellolla, joten kelloa piti laskea. Ja tuossa testissä joka oli energiankulutus-/lämmöntuottorajoitteinen, suorituskyky tuolla AVX512-optimoidulla versiolla 9 kertaa nopeampi kuin skalaariversiolla, selvästi matalammasta kellosta huolimatta.

Eli siis, AVX512-koodipolku oli tuossa testissä sekä n. 9 kertaa energiatehokkaampi kuin skalaarikoodipolku että n. 9 kertaa energiatehokkaampi kuin skaalaarikoodipolku.

Jos nyt sitten vielä osottasit edes sen yhden ohjelman millä olis minkäänlaista relevanssia tavalliselle tietokoneenkäyttäjällä. Se että AVX-512:sta saa lisää tehoja johonkin niche-sovelluksiin ei tee siitä edelleenkään ominaisuutta mikä oikeuttas ne kaikki trade-offit mitä tässä kohtaa AMD:n skippaamisesta aiheutuis. Edelleen, tuolla ei ole tuon taivaallisenkaan merkitystä peruskäyttäjälle.
 
Vaikka mikä tahansa AVX512lle optimoitu kuvan- tai videonkäsittelyfiltteri, jossa laskettava laskutoimitusmäärä on luokkaa alle 100 laskuoperaatiota/pikseli. Eli esim. mikä tahansa melko normaali /yksinkertainen terävöitys- tai blurrifiltteri
Selvä. Olisko sulla heittää joku esimerkki tälläisestä ohjelmasta, niin saan etsittyä jotain testituloksia?
 
Jos nyt sitten vielä osottasit edes sen yhden ohjelman millä olis minkäänlaista relevanssia tavalliselle tietokoneenkäyttäjällä. Se että AVX-512:sta saa lisää tehoja johonkin niche-sovelluksiin ei tee siitä edelleenkään ominaisuutta mikä oikeuttas ne kaikki trade-offit mitä tässä kohtaa AMD:n skippaamisesta aiheutuis. Edelleen, tuolla ei ole tuon taivaallisenkaan merkitystä peruskäyttäjälle.

Photoshoppiin ja muutamaan muuhun Adoben softaan on tulossa AVX-512 tuki hyvin pian, sitä on jo demottu mutta oli ilmeisesti vielä ei-julkinen beta-versio.

Ja siinä vaiheessa kun nVidia lisää ajureihinsa AVX512-tuen ja kytkee sen oletuksena päälle AVX-512sta tukevilla prossuilla, käytännössä melkein kaikilla peleillä nähdään jonkinlainen pieni nopeutus Rocket Lakella, Ice Lakella ja Tiger Lakella tämän johdosta nVidian näyttiksillä. Näyttiksen ajureissa nimittäin aika varmasti tehdään sellaista laskentaa, jossa AVX-512sta on hyötyä.

Tosin Skylake-johdannaisten sukkaava AVX-512-toteutus jossain määrin demotivoi tämän tekemistä.
 
Viimeksi muokattu:
Selvä. Olisko sulla heittää joku esimerkki tälläisestä ohjelmasta, niin saan etsittyä jotain testituloksia?

Ei ole vielä.

AVX-512-tuki on tullut työpöytäsoftiin hitaasti, koska työpöydälle sitä tukevia prossuja ei ole ollut saatavilla, ja suurin osa softankehittäjistä käyttää työpöytäkonetta, softan kehittäminen on vaan paljon helpompaa kun sitä voi kehittää ja ajaa samalla koneella. Vapaa-ajan Open source-kehitykseen ihmisillä ei ole mitään motivaatiota alustoilla, joita he eivät itse käytä, ja firmoille taas softien optimointiin käytetty työ maksaa ja joka tehdään vasta siinä vaiheessa kun se alkaa tuottaa.

Kun Rocket lake julkaistaan alkuvuodesta ja työpöydälle on vihdoin saataville AVX-512sta tukevia prossuja, softafirmojen motivaatio ja softankehittäjien käytännön mahdollisuudet AVX512-tuen lisäämiseen softiin lisääntyy aika reippaasti.

Sen, mihin AVX-512 kykenee hyvin rinnakkaistuvilla workloadeilla näkee hyvin noista Anandtechin testeistä jotka olen tänne linkannut jo ainakin kolme kertaa, eikä tällaiset kuvan- tai videokäsittelyjutut eroa rinnakkaistumisessaan niistä merkittävästi.



ps. 80386 julkaistiin vuonna 1985. Pelit alkoivat käyttää sen 32-bittistä tilaa vasta n. vuonna 1993 (Doom oli yksi ensimmäisiä). Sitä ennen 386n 32-bittisestä datapolusta oli pelatessa oikeastaan lähinnä haittaa, 16-bittisestä datapolusta olisi saanut tehtyä nopeamman. Oliko 386n 32-bittinen datapolku ja mahdollisuus osoittaa lineaarisesti enemmän kuin 64 kiB muistia pöytä-/pelikoneessa turhuutta, koska sitä eivät pelit käyttäneet kahdeksaan vuoteen?

Kannattaa peilata tätä omaan AVX-512-vastustukseensa.
 
Viimeksi muokattu:
Ei ole vielä.

AVX-512-tuki on tullut työpöytäsoftiin hitaasti, koska työpöydälle sitä tukevia prossuja ei ole ollut saatavilla, ja suurin osa softankehittäjistä käyttää työpöytäkonetta, softan kehittäminen on vaan paljon helpompaa kun sitä voi kehittää ja ajaa samalla koneella. Vapaa-ajan Open source-kehitykseen ihmisillä ei ole mitään motivaatiota alustoilla, joita he eivät itse käytä, ja firmoille taas softien optimointiin käytetty työ maksaa ja joka tehdään vasta siinä vaiheessa kun se alkaa tuottaa.

Kun Rocket lake julkaistaan alkuvuodesta ja työpöydälle on vihdoin saataville AVX-512sta tukevia prossuja, softafirmojen motivaatio ja softankehittäjien käytännön mahdollisuudet AVX512-tuen lisäämiseen softiin lisääntyy aika reippaasti.

Sen, mihin AVX-512 kykenee hyvin rinnakkaistuvilla workloadeilla näkee hyvin noista Anandtechin testeistä jotka olen tänne linkannut jo ainakin kolme kertaa, eikä tällaiset kuvan- tai videokäsittelyjutut eroa rinnakkaistumisessaan niistä merkittävästi.
Okei, eli ei ole yhtäkään esimerkkiä tuotantosoftasta jolla tuosta olisi hyötyä. Tällä hetkellä AMD:n kuusi ydintä on keskimäärin nopeammat kuin intelin 18 noissa mainitsemissasi photoshopin blur ja sharpen filttereissä, myös tehobudjettia on vähintään kaksinkertaisesti:

Anandtechin testit on spesifisti synteettisiä testejä ja ovat toki akateemisesti mielenkiintoisia. En kuitenkaan tekisi ostopäätöstä minkään ominaisuuden perusteella josta ei ole mitään hyötyä ostohetkellä. Palataan ton avx-512:n kanssa asiaan kunhan saavat sen edes yhteen softaan jota normaalit ihmiset ajavat kotikoneillaan.

Oliko 386n 32-bittinen datapolku ja mahdollisuus osoittaa 4 gigan muistia pöytä/pelikoneessa turhuutta, koska sitä eivät pelit käyttäneet kahdeksaan vuoteen?
Jeps, eli keväällä tulee ekat työpöytäprosessorit AVX-512 tuella ja siten voidaan historiaan vedoten ajatella että siitä on hyötyä jo vuonna 2029? Henkilökohtaisesti uskon päivittäväni koneen ennen sitä.
 
Okei, eli ei ole yhtäkään esimerkkiä tuotantosoftasta jolla tuosta olisi hyötyä.

Moni firma on kertonut että heillä on parhaillaan tekeillä AVX-512-optimoinnit softiinsa.

Näistä vaan ei vielä ole juuri benchmarkkeja ulkona.

Tällä hetkellä AMD:n kuusi ydintä on keskimäärin nopeammat kuin intelin 18 noissa mainitsemissasi photoshopin blur ja sharpen filttereissä, myös tehobudjettia on vähintään kaksinkertaisesti:

Olisit nyt analysoinut niitä tuloksiasi vähän enemmän, siellä olisi paljastunut mm. että se sinun 6-ydin-ryzenisi pieksee myös saman sukupolven 16-ydin-ryzenin tuossa blur-filtterissä, ja sharpen-filtterissä ero 6-ytimisen ja 16-ytimisen ryzenin välillä on vain n 1.5-kertainen.

Eli tuon testin blur-filtteri ilmeisesti ajautuu täysin yhdellä säikeellä TAI jos ajautuu monella säikeellä, on optimoitu täysin päin persettä(paljon false sharingia tms), ja sharpen-filtterissäkin pullonkaula lienee tuossa testissä aivan muualla kuin laskentanopeudessa (muilla prossuilla muistikaista, mutta käytetty kuva mahtuu (melkein kokonaan?) zen3n 32 megan L3-kakkuun?)

Mutta, tarkoituksella valitsit saatetekstiisi ryzen-mallin jossa vähän ytimiä ja Inteliltä mallin jossa paljon ytimiä, jotta saisit agendaasi jyrättyä läpi.
 
Eli tuon testin blur-filtteri ilmeisesti ajautuu täysin yhdellä säikeellä TAI jos ajautuu monella säikeellä, on optimoitu täysin päin persettä(paljon false sharingia tms), ja sharpen-filtterissäkin pullonkaula lienee tuossa testissä aivan muualla kuin laskentanopeudessa (muilla prossuilla muistikaista, mutta käytetty kuva mahtuu (melkein kokonaan?) zen3n 32 megan L3-kakkuun?)

Mutta, tarkoituksella valitsit saatetekstiisi ryzen-mallin jossa vähän ytimiä ja Inteliltä mallin jossa paljon ytimiä, jotta saisit agendaasi jyrättyä läpi.
Valitsin esimerkkini osoittaakseni että kyseinen softa on paskasti optimoitu ja joku avx-512 toteutus tuolla ammattitaidolla kannattaa jättää tekemättä.

Minulla ei ole mitään agendaa avx-512:n suhteen. Ihan mieluusti ottaisin vastaan nopeamman buildin photoshopista. Toivottavasti toteuttavat täyden uudelleenkirjoituksen yhteydessä samalla AVX2 tuen.
 
... koska AMD-fanipoikana/Intel-vihaajana kieltäydyt ostamasta prosessoreita, jotka sitä tukevat, ennen kuin fanittamasi prossuvalmistaja niitä (todennäköisesti vuonna 2022) julkaisee. Joten luonnollisesti et voi saada AVX512sta hyötyä ennen sitä, koska et omista sitä tukevaa prossua.

En ole mikään Intel vihaaja, en tiedä että mistä moisen olet saanut päähäsi. Edelliset 2 alustaa olivat Inteliä koska AMD:n suorittaminen oli sitä tasoa että ei ollut mitään järkeä hankkia AMD:tä. Nyt ovat desktop puolella hyvin tasaväkisiä lähes kaikessa, joten ei oikeastaan ole väliä että kumpaa hankkii. Silloin kun tämän rysenin hommasin, se vaan oli huomattavasti edullisempi kuin vastaava Intel.
Ja toki osa syynä AMD:n hankinnalle oli altavastaajan tukeminen, koska minä en ole "glory hunter" kuten eräs tuossa ylempänä tunnusti olevansa.

Sinulla alkaa hirmuinen sykkiminen kun jotain negatiivista mainitaan AVX-512. Ihan kuin olisit oikein suuri AVX-512 fani, aika erikoista fanittaa jotain käskylaajennusta. Huomaa hyvin miten kiihkona olet asian tiimoilta kun suu vaahdossa tehtailet peräjälkeen vastauksia samaan aiheeseen liittyen jotka olis voinu niputtaa yhteen. Rauhoitu nyt hyvänen aika!

Mä voin kyllä hankkia AVX-512 tukevan prossun heti kun siitä on jotain merkittävää hyötyä siinä käytössä jossa konetta käytän. Sen aika ei kuitenkaan ole vielä vähään aikaan.
Voihan toki olla että parin vuoden kuluttua AVX-512 on niin kova juttu että ilman sitä ei tule mistään mitään mutta epäilen kyllä suuresti.

Siitä voisi olla sinulle esim. läppärissä hyötyä jo tänä vuonna, jos et kieltäytyisi ostamasta sitä tukevia prosessoreita.

En omista läppäriä koska en sellaista tarvitse. Silloin harvoin kun on tarvetta mukana raahattavalle isommalle ruudulle kuin puhelin, niin sen asian hoitaa riittävän hyvin tabletti.

Ja tuo piikittely siitä että ne minun käyttämät webbipalvelut hyötyy AVX-512 oli aika typerää kun nimenomaan on osoitettu että siellä webbiserveri käytössä siitä AVX-512 on nimenomaan haittaa eikä hyötyä.
 
Sinulla alkaa hirmuinen sykkiminen kun jotain negatiivista mainitaan AVX-512.

Minua alkaa ärsyttää ihan MIKÄ TAHANSA paskan puhuminen. Oli aihe mikä tahansa.

Ja n. 80% kritiikistä AVX512-sta kohtaan on joko paskapuhetta tai sitten sitä ettei ymmärretä sitä että softatuen saapuminen uudelle käskykantalaajennokselle kestää jonkin aikaa (erityisesti tilanteessa jossa sen valmistaja sählää kuten Intel nyt sählää)

Se, että Skylake-johdannaisissa on huono AVX-512-toteutus ei ole itse AVX-512n vika. Se on Skylake-johdannaisten ytimien ongelma.

Ihan kuin olisit oikein suuri AVX-512 fani, aika erikoista fanittaa jotain käskylaajennusta. Huomaa hyvin miten kiihkona olet asian tiimoilta kun suu vaahdossa tehtailet peräjälkeen vastauksia samaan aiheeseen liittyen jotka olis voinu niputtaa yhteen. Rauhoitu nyt hyvänen aika!

En ole mikään AVX512-fani. Vaan olen täällä niitä harvoja ihmisiä jotka oikeasti ymmärtää näitä asioita siinä missä muut mutuilee eikä ymmärrä itse käskykannan ja sen implementaation eroja eikä sitä, miten SIMD vaikuttaa esim. energiatehokkuuteen ja postaa mutupaskaa.

Esim. ARMn SVE on paljon parempi SIMD-käskykanta kuin AVX-512. Todellisuudessa olen SVE-fani. Ja syy siihen SVE-faniuteen on ihan se, kuinka hyvä SVE on teknisesti.

Mutta AVX-512 nyt sattuu olemaan esim. ainoa keino x86lla vektoroida looppeja jotka tekevät talletuksia ei-peräkkäisiin muistiosoitteisiin.

Näiden looppien osalta vaihtoehdot x86lla on joko todella hidas ja energiatehoton skalaarisuoritus, tai AVX-512. Muita vaihtoehtoja ei ole, jos halutaan pysyä x86ssa ja saada hyvä suorituskyky näissä loopeissa. Kohta toki on vaihtoehtona vaihtaa Appleen ja käyttää SVEtä.

Jos itse speksaisin x86lle uutta SIMD-käskykantaa, se olisi monelta osin erilainen kuin AVX-512, muistuttaisi paljon enemmän SVEtä, mutta valitettavasti AVX2 on ominaisuuksiltaan vajaa monille koodeille ja AVX-512 tarjoaa tarvittavan toiminnallisuuden, vaikkei olekaan kaikilta yksityiskohdiltaan täydellinen ratkaisu. AVX-512 nyt sattuu olemaan se ainoa kehittynyt (*) SIMD-käskykanta joka meillä x86lle on.

Ja silloinkin kun niitä AVX-512n kehittyneitä ominaisuuksia ei tarvita, se mahdollistaa tuplasti enemmän laskutoimituksia/käsky kuin AVX2, mikä mahdollistaa sekä hiukan paremman energiatehokkuuden että suuremman suorituskyvyn kuin AVX2 mikäli implementaatio on tehty tätä silmälläpitäen.

Olen itse ollut suunnittelemassa useampaa SIMD-datapolun omaavaa prossuydintä sekä yhtä VLIW-prossua jossa käytännössä emuloitiin SIMDiä VLIW-linjoilla, kun prossunsuunnittelutyökalun SIMD-tuki ei ollut vielä valmis. Olen joutunut miettimään, tarvitaanko kyseessä olevien algoritmien ajamiseen scatteria ja gatheria, että tarvitaanko ytimelle jompaa kumpaa tai molempia, ja että kuinka hidas scatter/gather on näissä algoritmeissa nopeuden kannalta kelvollinen toteutus, tarviiko tehdä joku massiivinen multibank-ratkaisu joka lataa kaikki linjat kellojaksossa (kunhan ei tule bank-konflikteja) vai riittääkö sisäisesti sarjallinen "kevyttoteutus" kuten Intelin ja AMDn x86-prossuissa.

Olen tuskaillut sen kanssa, että (scatterin ja gatherin lisäksi) linjakohtainen predikointi tarvittaisiin siihen että SIMD-prossulle voisi rinnakkaistaa OpenCL-work itemeita geneerisesti, mutta oma TTYn prossunkehitystyökalumme ei tätä tukenut eikä tuen lisääminen olisi ollut helppoa. (AVX-512 tukee)

Olen opettanut rinnakkaisohjelmointia TTYn "parallel computing" kurssilla monena vuonna (en enää tänä vuonna, vaihdoin teollisuuden puolelle suunnittelemaan prossuytimiä jotka menee ihan oikeisiin tuotteisiin).

Parallel computing-kurssilla käsiteltiin nimenomaan mm. koodin optimointia SIMDille (sekä näyttiksille, ja moniytimelle)

Ja tuo piikittely siitä että ne minun käyttämät webbipalvelut hyötyy AVX-512 oli aika typerää kun nimenomaan on osoitettu että siellä webbiserveri käytössä siitä AVX-512 on nimenomaan haittaa eikä hyötyä.

Ei todellakaan ole osoitettu mitään sellaista yleisesti. Sotket jälleen itse AVX-512sta ja sen toteutusta Skylake-johdannaisissa.
On osoitettu että Skylake-johdannaisilla siitä on välillä haittaa kun skylake-johdannaiset sählää kellotaajuutensa ja jännitteensä kanssa kun osa säikeistä käyttää sitä ja osa ei.

Mutta jos lasketaan esim. sellaista tekoälykoodia jossa sitä raskasta AVX-512sta kaipaavaa laskentaan tehdään "jatkuvasti", suurimmalla osalla sen palvelimen ytimistä, siitä on suurta hyötyä. Mutta tekoälykoodi oli toki siitä huono esimerkki, että se kannattaa yleensä lähettää joko näyttikselle tai erilliselle neuroverkkopiirille laskettavaksi, mutta käsittääkseni esim. Facebook kyllä ajaa tekoälykoodia ihan Intelin prossuillakin.

(*) Kehittyneellä tarkoitan (gatherin, joka löytyy jo AVX2sta lisäksi) mm. tukea scatterille sekä kunnolista linjakohtaista predikointia kaikelle; Kun käskykannassa on gather, scatter sekä linjakohtainen predikointi, käytännössä mikä tahansa looppi joka ei sisällä datariippuvuuksia ja sisältää vain hyvin käyttäytyviä kontrollirakenteita (for-loopit, if-elset, mutta ei villejä gotoja) on mahdollista rinnakkaistaa sille.
 
Viimeksi muokattu:
Ei todellakaan ole osoitettu mitään sellaista yleisesti. Sotket jälleen itse AVX-512sta ja sen toteutusta Skylake-johdannaisissa.
On osoitettu että Skylake-johdannaisilla siitä on välillä haittaa kun skylake-johdannaiset sählää kellotaajuutensa ja jännitteensä kanssa kun osa säikeistä käyttää sitä ja osa ei.
Ei yleisesti, mutta pitää kyllä paikkansa kaikkien saatavissa olevien palvelinprosessorien kohdalla. Ice lake palvelinprossujen arvosteluja ja hinnoittelua odotellessa.
 
Moni firma on kertonut että heillä on parhaillaan tekeillä AVX-512-optimoinnit softiinsa.

Näistä vaan ei vielä ole juuri benchmarkkeja ulkona.
Montako prosenttia kannettavien käyttäjistä arvelet käyttävän esimerkiksi Photoshoppia kannettavassaan?

Suurin osa sekä työ- että kotikäyttäjistä tekee koneellaan seuraavaa:
- Käyttää Officea
- Käyttää ryhmätyöohjelmia, kuten Teamsia
- Käyttää selainta
- Pelaa pelejä

Miten AVX-512 hyödyntää edellä mainittujen ohjelmistojen käyttäjiä?

Mitä tulee ideaan, että Nvidian näyttöajurit hyödyntäisivät AVX-512:sta, niin mikä mielestäsi olisi sellainen ajurista löytyvä toiminne, joka kannattaisi tehdä AVX-512:lla ajurissa eikä viedä sen Nvidian näytönohjaimen suoritettavaksi?
 
Viimeksi muokattu:
ps. 80386 julkaistiin vuonna 1985. Pelit alkoivat käyttää sen 32-bittistä tilaa vasta n. vuonna 1993 (Doom oli yksi ensimmäisiä). Sitä ennen 386n 32-bittisestä datapolusta oli pelatessa oikeastaan lähinnä haittaa, 16-bittisestä datapolusta olisi saanut tehtyä nopeamman. Oliko 386n 32-bittinen datapolku ja mahdollisuus osoittaa lineaarisesti enemmän kuin 64 kiB muistia pöytä-/pelikoneessa turhuutta, koska sitä eivät pelit käyttäneet kahdeksaan vuoteen?
Tämä on oikeastaan aika heikko vertaus. 32-bittistä tilaa ei hyödynnetty, sillä ei ollut olemassa käyttöjärjestelmää, joka olisi tätä hyödyntänyt. Ei se yksittäinen peli voi ottaa koko käyttöjärjestelmän roolia ja vaihtaa prosessoria noin vain 32-bittiseen tilaan.

OS/2 1.x hyödynsi vain 286:n 16-bittistä tilaa (historiankirjoituksen mukaan pitkälti IBM:stä johtuen, joka halusi myymiensä 286:n olevan vielä kuranttia tavaraa). Ensimmäiset 32-bittistä moodia hyödyntävät käyttikset olivat Windows NT 3.1 (1993; on tuolla tullut tiedostopalvelimia joskus asenneltuakin) sekä IBM OS/2 2.0 (1992; ja tällä on tullut pyöriteltyä suurehkoja BBS-järjestelmiä).
 
Viimeksi muokattu:
Offtopiccia mutta astellaan nyt tuonne muistojen teille:

Olikohan Phar-Lapin 386|Dos-extender vuodelta 1986 joka mahdollisti Dossista tuon 32bit tilan hyödyntämisen. Erillistä 32bit tilaa tukevaa käyttöjärjestelmää ei siis välttämättä tarvittu.
 
Offtopiccia mutta astellaan nyt tuonne muistojen teille:

Olikohan Phar-Lapin 386|Dos-extender vuodelta 1986 joka mahdollisti Dossista tuon 32bit tilan hyödyntämisen. Erillistä 32bit tilaa tukevaa käyttöjärjestelmää ei siis välttämättä tarvittu.
Kyllä, mutta käytännössä useimmat DOS-Extenderit käyttivät 386:n ominaisuuksia vain muistiavaruuden laajentamiseen ja koodi oli edelleen 16-bittistä. Käsittääkseni näin oli myös aiemmin mainitun Doominkin tapauksessa.
 
Viimeksi muokattu:
Kyllä, mutta käytännössä useimmat DOS-Extenderit käyttivät 386:n ominaisuuksia vain muistiavaruuden laajentamiseen ja koodi oli edelleen 16-bittistä. Käsittääkseni näin oli myös aiemmin mainitun Doominkin tapauksessa.

Olen hieman erimieltä tästä (sattuneesta syystä), voitko mainita muutamia esimerkkejä extendereistä jotka tekevät noin ?
 
Olen hieman erimieltä tästä (sattuneesta syystä), voitko mainita muutamia esimerkkejä extendereistä jotka tekevät noin ?
Extenderit tulivat ensimmäistä kertaa kuvioihin 286:n aikaan. Ne luonnollisestikaan eivät edes mahdollistaneet 32-bittistä koodia.

Myöhemmät extenderit kyllä usein mahdollistivat 32-bittisen koodin, mutta useimmissa tapauksissa niillä käytännössä ajettiin 16-bittistä koodia ja extenderin käytön tarkoitus oli pääsy suurempaan muistikapasiteettiin.

Toki DOSin päällä pyörivät Windows-versiotkin olivat tavallaan DOS Extendereitä ja näissä kyllä ajettiin Win32-koodia.
 
Viimeksi muokattu:
Suurempaan muistikapasiteettiin pääsemiseksi ei tarvita extenderiä varsinaisesti vaan XMS manageri riittää, suoraan sitä muistia ei kyllä voi osoittaa. mutta sitä varten olikin oma palvelunsa jota käyttämättä datan sai lukittua ja vapautettua.

Mutta edelleen niitä pyytämiäni esimerkkejä odottaen.
 
Kyllä, mutta käytännössä useimmat DOS-Extenderit käyttivät 386:n ominaisuuksia vain muistiavaruuden laajentamiseen ja koodi oli edelleen 16-bittistä. Käsittääkseni näin oli myös aiemmin mainitun Doominkin tapauksessa.

Ei. Nyt olet aivan totaalisen pihalla mitä nuo dos-extenderit teki. Sekoitat sen siihen, mitä joku EMM386 teki/miten EMS-muisti toimi.

Dos extender ei laajenna muistia vaan laajentaa DOSin palvelut toimimaan 32-bittisessä moodissa jossa on luonnollisesti kaikki muisti käytössä.

Doom (ja kaikki muutkin dos-extenderiä käyttävät softat) oli käännetty ihan puhdasta 32-bittistä koodia tekevällä kääntäjällä(Watcom) 32-bittisessä moodissa ja se oli ihan puhdasta 32-bittistä koodia.

Intin pituus oli 32 bittiä, pointterien pituus oli 32 bittiä, ja 4 gigaa muistia pystyi näkymään peräkkäisissä osoitteissa ilman mitään segmentointia (toki siellä edelleen on segmenttirekisterit mutta ne toimii aivan eri tavalla eikä niitä ole pakko käyttää).

Watcomin paketti löytyy minulta vieläkin hyllystä.


Sen sijaan DOSin mukana tuli EMM386 joka mahdollisti EMS-muistin, seli sen, että jonnekin 640k ja 1M väliin luotiin 64kiB ikkuna, joka pystyi osoittamaan mihin tahansa päin koneen koko suurta muistia, ja tätä pystyi käyttämään 16-bittisestä koodista. Sitä, mihin ikkuna osoitti, pystyi vaihtamaan hitailla komennoilla, kerralla oli kuitenkin näkyvissä maksimissaan 1 mega. EMS-muistia pystyi kuitenkin käyttämään myös ilman 386-prosessoria, esim erillisellä EMS-muistikortilla.

Tällä ei ole mitään tekemistä dos-extenderin kanssa eikä DOOMin kanssa. EMS-muistia käytettiin monissa ennen vuotta 1994 tulleista peleistä.
 
Viimeksi muokattu:
Tämä on oikeastaan aika heikko vertaus. 32-bittistä tilaa ei hyödynnetty, sillä ei ollut olemassa käyttöjärjestelmää, joka olisi tätä hyödyntänyt. Ei se yksittäinen peli voi ottaa koko käyttöjärjestelmän roolia ja vaihtaa prosessoria noin vain 32-bittiseen tilaan.

Peli nimenomaan VOI vaihtaa prosessorin 32-bittiseen tilaan ja käytännössä hyvin suuri osa viimeisistä DOS-pelit teki juuri niin.

DOS ei rajoita millään tavalla sitä mitä softat tekee. Jotkut demot vaihtoivat jo aiemmin prossun 32-bittiseen tilaan ja toimivat siinä, mutta eivät pystyneet esim. lukemaan tiedostoja ilman DOSin palveluja.

DOS extender (esim. DOS4GW) sitten tarjosi DOSin palvelut myös 32-bittisessä tilassa. Suurin osa n. 1994-1997 julkaistuista DOS-peleistä käytti DOS4GWtä ja toimi 32-bittisessä tilassa. Doomin (julkaistu joulukuussa 1993) ollessa ensimmäisiä.
 
Viimeksi muokattu:
Vaikea kyllä ymmärtää miten voi olla niin kova fanipoika, että vieläkin jaksaa nähdä siinä puhkiruoskitussa hevosessa nimeltä Skylake* jotain jonka vuoksi sellainen olisi millään tavalla järkevämpi kuin uudet Ryzenit. Joo, voi parissa pelissä olla muutaman freimin edellä, mitä sitten? Lällätellä kaverille ja foorumeilla? Tuo on kuin vertaisi kahden identtisen koneen tuloksia ja marginaaliheittojen takia toinen on "parempi" kuin toinen.

* Samaa Skylakea ne edelleen on, MOAR CORES, kellot tehtaalla tappiin ja tarpeeksi plussia valmistusprosessiin per uusi sukupolvi.

Erot kuitenkin sitä luokkaa että ilman fps-mittaria sitä eroa ei ole.

Fakta nyt vaan on, että Zen 3:set pieksää Skylaket niin pelisuorituskyvyssä, sovellusohjelmissa, raskaassa monen ytimenlaskennassa ja tekee sen kaiken pienemmällä sähkönkulutuksella kuin skylaket. Erilaisia testejä on tullut jo ulos niin monelta eri taholta myös AMD riippumattomilta testaajilta, että tämän voi sanoa olevan faktaa tällähetkellä.

Inteli on lupaillut vastaiskua keväälle on mielenkiintoista nähdä mitä ne tekee pieksääkseen Zen 3:set kun se vastaisku on edelleen tehty 14nm viivanleveydellä. On mielenkiintoista nähdä viheltääkö Intel pelin poikki tiputtaa hintoja ja rupeaa budjetti prosessorivalmistajaksi, jonka tuotteet ovat hitaampia. Laittaako Intel ydinvoimalat töihin sähkönkulutusvaatimuksillaan ja kellotaajuudet tappiin, jotta edes sillä saa nopeutta vai mitä inte tekee. Intel on aika kusessa, koska valmistusprosessit ovat vanhentuneita. Käsittääkseni Intel on jo aika pitäkälle ottanut kaiken irti mitä 14nm viivanleveydellä valmistetuista prossuista järkevästi enää saa irti kun niitä on väännetty niin monta sukupolvea jo.
 
Mihis ne nyt päästiin näiden dossien kans, kumpi kisaa vie, intel vai amd.
ps: dos 6.22 paras
 
Mihis ne nyt päästiin näiden dossien kans, kumpi kisaa vie, intel vai amd.
ps: dos 6.22 paras
Intel pelailuun AMD hyötyohjelmille silleen tässä nyt on menty monta sukupolvea ja ei muutosta näköpiirissä. Välillä vähän tasottuu mutta sitten taas ottaa kaulaa kumpikin suuntaansa.
 
Intel pelailuun AMD hyötyohjelmille silleen tässä nyt on menty monta sukupolvea ja ei muutosta näköpiirissä. Välillä vähän tasottuu mutta sitten taas ottaa kaulaa kumpikin suuntaansa.
Eikös ne uusimmat käppyrät sano että Amd pelailuun Amd hyötyohjelmille :)
 
Intel pelailuun AMD hyötyohjelmille silleen tässä nyt on menty monta sukupolvea ja ei muutosta näköpiirissä. Välillä vähän tasottuu mutta sitten taas ottaa kaulaa kumpikin suuntaansa.

Näyttäis kyllä siltä että nyt ne KILPAPELAAJAT on jättämässä Intelin, eli taitaa homma mennä nyt ainakin tuonne ens vuoden alkupuoliskolle asti niin että AMD on parempi kaikkeen ellei Intel kiiruhda leikkaamaan hintoja.
 
Näyttäis kyllä siltä että nyt ne KILPAPELAAJAT on jättämässä Intelin, eli taitaa homma mennä nyt ainakin tuonne ens vuoden alkupuoliskolle asti niin että AMD on parempi kaikkeen ellei Intel kiiruhda leikkaamaan hintoja.
Joo kyllä. Zen2 oli vielä jäljessä peleissä kilpapelaajien käytössä, mutta kyllä nyt AMD menee siinäkin ohi.

Itsekin kilpapelien pelaajana pistin samantien Ryzeniä tilaukseen, kun nyt se on melko yksiselitteisesti kaikessa Inteliä parempi.
 

Statistiikka

Viestiketjuista
259 272
Viestejä
4 507 490
Jäsenet
74 347
Uusin jäsen
Si-Pe

Hinta.fi

Back
Ylös Bottom