IBM Power9 Linux:ille?

xana

ICT Pro
Tukijäsen
Liittynyt
25.10.2016
Viestejä
887
Monia kiinnostaisi varmaankin IBM Power9 prosessorin työasematietokone. Huomasin netistä, että nyt tammikuussa 2018 tullee ensimmäiset markkinoille.
Ihan halpoja nämä eivät ole.:D Hintaluokka ~6000€. Prosessorituki on ilmeisesti vasta Linuxille.

Raptor Engineering::Talos™ II Secure Workstation Raptor Computing Systems::TL2DS1 Intro

IBM-Power9-Workstation mit offener Firmware und Linux

Talos II POWER9 Workstation With OpenBMC, PCI-E 4.0 Up For Pre-Ordering - Phoronix

Talos II: First workstation with IBM’s POWER9 processor

Raptor Computing looks to end x86 domination with POWER9-based Talos II Secure Workstation
 
Liittynyt
18.10.2016
Viestejä
274
Kyllähän sitä open source rauta kiinnostaisi. Harmi kun on vaan köyhä.
 
Liittynyt
17.10.2016
Viestejä
2 305
Löytyyköhän jostain luotettavia, vertailukelpoisia testituloksia Power9:n ja parhaiden x86-64 -prosessorien väliltä?

Tai osaako joku arvioida, mitä x86-64 -prosessoria Power9 suunnilleen vastaisi?

Jos olisin rikas niin tällainen menisi ostoon saman tien, mutta tällä hetkellä ei näillä hinnoilla. Halpa tämäkin tosin lienee tyypillisiin Power-palvelimiin verrattuna.


@Sampsa io-Techin testiin tällainen? :smoke:
 
Liittynyt
04.11.2016
Viestejä
1 589
Löytyyköhän jostain luotettavia, vertailukelpoisia testituloksia Power9:n ja parhaiden x86-64 -prosessorien väliltä?

Tai osaako joku arvioida, mitä x86-64 -prosessoria Power9 suunnilleen vastaisi?

Jos olisin rikas niin tällainen menisi ostoon saman tien, mutta tällä hetkellä ei näillä hinnoilla. Halpa tämäkin tosin lienee tyypillisiin Power-palvelimiin verrattuna.


@Sampsa io-Techin testiin tällainen? :smoke:
Phoronix oli Raptorin Talos II:een saanut etäyhteydellä tehdä pari testiä. Sinällään jänniä vehkeitä, kun noissa on 4 threadiä per ydin :D. Noi phoronixin suorittamat testit oli duali power9 8c/32t eli yhteensä 16c/64t.
 
Liittynyt
02.06.2017
Viestejä
374
Minulla on etäyhteys Power9-koneeseen (virtuaalipartitio ja se on AIX, ei Linux). Ensituntumat on, että suorituskyvyn osalta on menty metsään tällä versiolla. Aiemmat P7 ja P8 ovat julkaisuhetkellään olleet jopa optimoimattomalla koodilla hetken kukkulan kuninkaita ainakin joissakin suhteissa, tämä ei ole.
Ainoa, missä tämä laittaa hanttiin edullisemman pään Inteleille on muistikaista. Sitä tuntuu piisaavan ihan käytännössä. Suhteessa Intelin huippumalleihin en osaa sanoa, kun ei ole pääsyä sellaisiin.

Mutta tässä nyt on näitä liikkuvia osia, jotka eivät anna oikein luotettavaa vertailukohtaa. Etenkin AIX on aika eeppisen pska käyttis, joten jos Linuxin saisi, niin voisi antaa luotettavampaa arviota. Katellaan, josko sellaista heruisi.
 
Liittynyt
02.06.2017
Viestejä
374
Oma epäilyni on, että IBM dumppaa Power-liiketoiminnan jo tämän vuoden aikana jonnekin. Joko se menee jonain outona hybridimyyntinä, jossa IBM pitää osittain IP:t ja laittaa henkilöstön ostajalle, tai sitten laittavat "yhteisyrityksen" kasaan jonkun kanssa.
Aiemmin uskoin, että NVidia saattaisi olla kiinnostunut (niillähän on kaikkea Power-liitännäistä HPC-viritelmää), mutta en usko enää, ei ne käsiään tuollaiseen kasaan työntäisi, etenkin kun IBM pitää varmastikin ison osan IP:stä joko kokonaan tai osittain itsellään.
Joka tapauksessa, tulee ostaja olemaan kuka tahansa, hinta tulee jäämään pariin miljardiin maksimissaan.
 

CalEpitan

BANNATTU
BANNED
Liittynyt
24.11.2016
Viestejä
1 702
Saisi joskus mieluusti koko iotech sivusto perehtyä enemmän myös näihin juttuihin
eikä pelkästään johonkin helvetin jonne 3D peleihin
mutta resurssit jne on rajalliset toki, ketjun aloittaja tai joku muu voisi tehdä syvempää luotausta näihin ja verrata normi prossuihin
 
Liittynyt
02.06.2017
Viestejä
374
Huhut kertovat, että joku olisi juuri nyt tekemässä due diligenceä IBM:n power liiketoiminnasta.
Mielenkiintoista nähdä, mikä teknologiafirma on kätensä tähän lykännyt, mutta kyseessä on pakosti joku amerikkalainen yritys (tai Japanista), koska tällaista teknologiaa ei Kiinaan myydä.

Due diligence ei tosin tarkoita, että tämä päätyisi kauppoihin, mutta jos huhu pitää paikkaansa se varmistaa, että IBM ainakin yrittää myydä.
 
Liittynyt
21.06.2017
Viestejä
6 984
Liittynyt
16.10.2016
Viestejä
12 044
Liittynyt
21.06.2017
Viestejä
6 984
Tuo näyttäisi ainankin olevan melko hidas ja kallis?
Mikä siitä muuten tekee noin törkykalliin?
En nyt ymmärrä tätä sinun vänkäämistä. Miten tuo nyt on muka hidas kun on 16-core systeemiä verrattu 32-core ja 40-core systeemeihin?
Pääsee sillä 16-corella jo monessa testissä noitten 32-core epycien rinnalle joten jos tuossa olisi 32-core syssteemillä päästy testit ajamaan niin olis toi 40-core intel systeemikin ollut monessa testissä uhattuna.

Hinta on mikä on. Ketkä noita ostaa, niin nillee se hinta on toisarvoinen seikka, onhan se täälläkin todettu jo monen suusta että ainoastaan suorituskyky ratkaisee silloin kun tehdään töitä.
 
Liittynyt
16.10.2016
Viestejä
12 044
En nyt ymmärrä tätä sinun vänkäämistä. Miten tuo nyt on muka hidas kun on 16-core systeemiä verrattu 32-core ja 40-core systeemeihin?
Pääsee sillä 16-corella jo monessa testissä noitten 32-core epycien rinnalle joten jos tuossa olisi 32-core syssteemillä päästy testit ajamaan niin olis toi 40-core intel systeemikin ollut monessa testissä uhattuna.

Hinta on mikä on. Ketkä noita ostaa, niin nillee se hinta on toisarvoinen seikka, onhan se täälläkin todettu jo monen suusta että ainoastaan suorituskyky ratkaisee silloin kun tehdään töitä.
Ei tuossa mitään "vänkäämistä" ole Testit oli tuolla linkattu. Tuolla oli testattu 2:n CPU:n järjestelmää ja nopeus tahtoi olla yleensä puolet tai alle tuon xeonit koneen nopeudesta. TS siis mielestäni melko hidas. Kyllä tuohon hintaan odottaisi jotain paremmin kilpailukykyistä.
 
Liittynyt
21.06.2017
Viestejä
6 984
Ei tuossa mitään "vänkäämistä" ole Testit oli tuolla linkattu. Tuolla oli testattu 2:n CPU:n järjestelmää ja nopeus tahtoi olla yleensä puolet tai alle tuon xeonit koneen nopeudesta. TS siis mielestäni melko hidas. Kyllä tuohon hintaan odottaisi jotain paremmin kilpailukykyistä.
Niin ja jos nyt satuit yhtään aivoilla sitä testiä katsomaan niin olisit varmaankin huomannut että se Intel oli MYÖS 2:n CPU:n järjestelmä kun taas EPYC oli yhden.
Eli edelleen miten se 16-core vs. 40-core tekee tuosta hitaan? Kun Powerilla on laittaa peliin 28-corea lisää. Eli jo tuplattuna noi Powerin coret alkaisi olemaan lähellä tuota Intelin kokoonpanoa, joissain ehkä jo ohi.
Toki testi olisi ollut parempi jos se olisi tehty 16-coren Xeon ja EPYC systeemeitä vastaan, jolloin toi olisi pöllyhttäny molemmat.
 
Liittynyt
16.10.2016
Viestejä
12 044
Niin ja jos nyt satuit yhtään aivoilla sitä testiä katsomaan niin olisit varmaankin huomannut että se Intel oli MYÖS 2:n CPU:n järjestelmä kun taas EPYC oli yhden.
Eli edelleen miten se 16-core vs. 40-core tekee tuosta hitaan? Kun Powerilla on laittaa peliin 28-corea lisää. Eli jo tuplattuna noi Powerin coret alkaisi olemaan lähellä tuota Intelin kokoonpanoa, joissain ehkä jo ohi.
Toki testi olisi ollut parempi jos se olisi tehty 16-coren Xeon ja EPYC systeemeitä vastaan, jolloin toi olisi pöllyhttäny molemmat.
Niin, entäs sitten?
Vertasin Inteliä (2 cputa) power kokoonpanoon (2 CPUta) ja suorituskyky power kokoonpanolla oli hinnasta huolimatta yleensä n puolet. Eli voidaan luonnehtia: HIDAS.
En ole missään vaiheessa sotkenut asiaan jotain 1 prossu mitälie AMD kokoonpanoa.
 

xana

ICT Pro
Tukijäsen
Liittynyt
25.10.2016
Viestejä
887
Näitä IBM Power9 pohjaisia tietokoneita käytetään muun muassa supertietokoneiden osasina.
 
Liittynyt
22.10.2016
Viestejä
11 030
Niin, entäs sitten?
Vertasin Inteliä (2 cputa) power kokoonpanoon (2 CPUta) ja suorituskyky power kokoonpanolla oli hinnasta huolimatta yleensä n puolet. Eli voidaan luonnehtia: HIDAS.
En ole missään vaiheessa sotkenut asiaan jotain 1 prossu mitälie AMD kokoonpanoa.
Tuossa verrattiin power9n melko alapään mallia, $620 per paketti.

Raptor Computing Systems::TL2WK2 Purchase

Verrokkikoneena olevan intel-pohjaisen nopeamman koneen YHDEN prossun hinta on $2600, eli suomen hinnoissa 2600 euroa.

Että mitenkäspäin se hinta-suorituskyky-suhde meneekään näiden välillä, kun Intel on 4x kalliimpi?

Saataisiin "hiukan" eri suorituskykylukemia, jos Power9stä valittaisiin 22-ytiminen, tuon intelin prossun kanssa käytännössä samanhintainen($2650) piiri tuon 8-ytimisen sijasta.
 
Viimeksi muokattu:
Liittynyt
22.10.2016
Viestejä
11 030
Power on ihan ok arkkitehtuuri.

Perusperiaatteiltaan RISC, muttei ole sellainen "uskonnollinen 80-luvun RISC" kuten MIPS ja SPARC vaan siinä on tehty järkeviä kompromisseja ja otettu mukaan joitain monimutkaisempia käskyjä.

Powerissa on kuitenkin kaksi asiaa tehty vähän tyhmästi:

1) Se on oletuksena big-endian-arkkitehtuuri. Se kyllä tukee myös little-endian-moodia, mutta kaikki on oletuksena big-endiania, ja jos halutaan säilyttää yhteensopivuus vanhaan softaan yms. pitää toimia big endian-moodissa.

2) Siinä on "takaperin toimivat" hajautustauluihin perustuvat sivutaulut jotka tekevät käyttiksen virtualimuistinhallinnasta hankalaa ja TLB-huteista kalliita.

linus torvalds @ comp.arch sanoi:
The Power/PowerPC inverse page tables are horrible!

Se, että vain kaksi asiaa on tehty tyhmästi on kuitenkin melko pieni määrä tyhmästi tehtyjä asioita. Useimmissa muissa viime vuosituhannelta peräisin olevassa arkkitehtuurissa on paljon enemmän tyhmästi tehtyjä asioita.
 
Liittynyt
21.06.2017
Viestejä
6 984
Niin, entäs sitten?
Vertasin Inteliä (2 cputa) power kokoonpanoon (2 CPUta) ja suorituskyky power kokoonpanolla oli hinnasta huolimatta yleensä n puolet. Eli voidaan luonnehtia: HIDAS.
En ole missään vaiheessa sotkenut asiaan jotain 1 prossu mitälie AMD kokoonpanoa.
Niin ja edelleen jaksat vain ummistaa silmäsi siltä faktalta että tuossa oli powerin kaikista heikkotehoisimmat prosessorit tuossa kokoonpanossa. Mistähän tämä mahtaa johtua tämä silmien sulkeminen?

EDIT: Korjataan sen verran että 4-core mallejakin löytyy.

Onko se sinun Intel palvontasi noin vahvaa että yrität selitellä ihan millä tahansa tekosyyllä sen Intelisi paremmaksi? Vai mikä on kun ei voi mies myöntää että tuli tehtyä virhetulkinta.
Ja kuten hkultala tuossa ylempänä mainitsi niin tuo sinun hinta inttäminen ontuu myös ja pahasti.
 
Liittynyt
27.12.2016
Viestejä
1 837
Power on ihan ok arkkitehtuuri.

2) Siinä on "takaperin toimivat" hajautustauluihin perustuvat sivutaulut jotka tekevät käyttiksen virtualimuistinhallinnasta hankalaa ja TLB-huteista kalliita.
Käänteisellä sivutaululla on se hyvä puoli että pienellä fyysisellä osoitteen leveydellä saadaan suuri (lineaarinen?)muistiavaruus toki saantiajan kustannuksella, koska tasoja voi ainakin teoriassa kejuttaa miten pitkälle hyvänsä. Muistelen joskus TTKK:lla pitäneeni aiheeseen liittyneitä harkkoja, joiden oleellinen sisältö vastasi tätä verkosta löytynyttä:

Operating Systems Homework 4
 
Liittynyt
16.10.2016
Viestejä
12 044
Niin ja edelleen jaksat vain ummistaa silmäsi siltä faktalta että tuossa oli powerin kaikista heikkotehoisimmat prosessorit tuossa kokoonpanossa. Mistähän tämä mahtaa johtua tämä silmien sulkeminen?

EDIT: Korjataan sen verran että 4-core mallejakin löytyy.

Onko se sinun Intel palvontasi noin vahvaa että yrität selitellä ihan millä tahansa tekosyyllä sen Intelisi paremmaksi? Vai mikä on kun ei voi mies myöntää että tuli tehtyä virhetulkinta.
Ja kuten hkultala tuossa ylempänä mainitsi niin tuo sinun hinta inttäminen ontuu myös ja pahasti.
Totesin tuon, että on hitaampi, jolloin joku pisti tuon testin, jossa on vielä hitaampi.
Ei minua kiinnosta sinänsä, mitä jossain purkissa on, kunhan saan sillä OMAT hommat tehtyä mahdollisimman helposti. Ei mielestäni faktan toteaminen ole minkään merkin palvontaa tai silmien ummistamista. Testit esiin, jos on kerran nopeampiakin (nopein vs nopein).
 
Liittynyt
22.10.2016
Viestejä
11 030
Käänteisellä sivutaululla on se hyvä puoli että pienellä fyysisellä osoitteen leveydellä saadaan suuri (lineaarinen?)muistiavaruus toki saantiajan kustannuksella, koska tasoja voi ainakin teoriassa kejuttaa miten pitkälle hyvänsä. Muistelen joskus TTKK:lla pitäneeni aiheeseen liittyneitä harkkoja, joiden oleellinen sisältö vastasi tätä verkosta löytynyttä:

Operating Systems Homework 4
.. paitsi että tosimaailmassa ne "normaalinpäiset" sivutaulut on hierarkisia, eikä niitä matalamman tason sivutauluja tarvitse olla ollenkaan läheskään kaikille osoitteille, vaan vain niille, mitä oikeasti käytetään (sekä melko pienelle määrälle ylimääräisiä, mutta tämä ylimääräisyys ei tunnu yhtään missään) ja käänteisen sivutaulun tilantarve-etu katoaa.

.. Eikä se vain katoa, vaan se tilaetu käytännössä kääntyy toisenpäiseksi, hierarkinen "normaalinpäinen" sivutaulu viekin yleensä VÄHEMMÄN tilaa, koska käänteisessä on overheadia siitä hajautustaulusta (mutta niiden lisäksi tarvii olla se "lopullinen kirjanpito" törmäyksien varalta), ja sen overhead on yleensä selvästi suurempi kuin monitasoisen sivutaulun overhead niistä monesta tasosta sekä niiden välisestä granulariteetista.

Tuo ykköstehtävä on tuossa todella typerä, koska olettaa ei-hierarkiset sivutaulut, joita ei käytetä käytännössä missään.

Surullista, että yliopistoissa tulee vastaan tällaisia olkiukkoon perustuvia opetuksia.

Tuolla Linusin kommentit kokonaisuudessaan:

PowerPC page tables (Greg Pfister; Linus Torvalds)


Miten nuo hierarkiat käytännössä menee x86lla:

386ssa (normaali 32-bittinen moodi nykyprossuillakin) sekä virtuaalimuistisivun että sivutaulun koko on 4 kiB, eli 12 alinta bittiä määrittelee osoitteen sivun sisällä. Kokonaisuudessaan sivutauluhierarkia on 2-tasoinen, ja kukin yksittäinen sivutaulu on kooltaan 1024 entryä, eli bitit 31-22 määrittelee ylemmän tason sivutaulun, ja bitit 21-12 määrittelee alemman tason sivutaulun.

Yksi entry ylemmän tason sivutaulussa siis vastaa 4 megaa virtuaalimuistiavaruutta.

Jos ohjelma esimerkiksi käyttää vain 16 megaa (peräkkäisissä virtuaaliosoitteissa olevaa) virtuaalimuistia, riittää että sen ylemmän tason sivutaulussa 4 entryä johtaa oikeaan olemassaolevaan alemman tason sivutauluun, eli sivutauluja tarvitaan yhteensä 5 kpl (ylemmän tason sivutaulu + 4 alemman tason sivutaulua), ei 1024 tai 1025 kappaletta. Loput 1020 entryä ylemmän tason sivutaulussa voi olla vaikka null-pointereita, kun niiden kohdalla on päällä bitti että sitä ei ole mapattu mihinkään. Tai ne voivat kaikki osoittaa samaan yhteen alemman tason sivutauluun jossa kaikki sivut on merkattu ettei ole mapattu mihinkään (tällöin sivutauluja tarvitaan yhteensä 6 kpl, ei 5 kpl).

Pentium Pro:ssa tuotiin PAE-moodi, jossa entryn koko tuplattiin neljästä kahdeksaan tavuun, jolloin sivutauluun mahtuu entryjä vain 512 kappaletta eli yhdeksän bitin edestä. Samalla saatiin kirjanpitoon lisää "no execute-bitti" sekä tuki 36-bittisille fyysisille osoitteille.
Tällöin sivutaulu muuttui kolmitasoiseksi, kun kukin sivutaulutaso vastasi yhdeksää bittiä virtuaaliosoitteessa, ja osoitteenmuunnos kuitenkin tarvitsi tehdä 20 virtuaaliosoitteen bitille.

x86-64ssa sivutaulun rakenne on kuten PAE-moodissa, mutta tasoja on tuotu yläpäähän lisää, jotta voidaan tukea 48-bittisiä osoitteita (36 bittiä muunnettavaa osoitetta).

X86-64lla bitit 20-12 on siis alin sivutaulutaso, 29-21 toiseksi alin, 38-30 kolmanneksi alin, 47-39 neljänneksi alin (tällä hetkellä ylin, tällä hetkellä vain 48-bittiset osoitteet ovat tuettuja millään x86-64-prosessorilla).

Tulevaisuudessa voidaan lisätä hierarkiaan jopa kaksi tasoa lisää, ja saada tuki täysille 64-bittisille osoitteille.


Lisäksi Pentiumista lähtien on ollut olemassa myös "big page"-moodi, jossa sivut ovat kooltaan 2 tai 4 megaa(riippuen siitä, ollaanko PAE-/x86-moodissa vai vanhassa 386-sivutaulumuodossa), ja alin sivutaulutaso puuttuu. Big page-moodissa 32-bittisessä tilassa ilman PAEta tosin sivutauluissa on sitten vain 1 taso eikä hierarkiaa. Big Page-moodia kuitenkin käytetään todella harvoin, esimerkiksi kuluttaja-windosilla ei tietääkseni koskaan mihinkään(tuettu vain pro-/server-/enterprise-versioissa, ja niissäkin vaatii säätöä), ja linuxillakin se pitää erikseen käsin säätää käyttöön ja ohjelman pitää niitä erikseen pyytää.

X86-64 toi myös 1 GiB-hugepage-moodin, jossa kaksi alinta tasoa on poistettu ja sivut ovat gigan kokoisia. Tällöinkin jäljellä on kahden tason verran sivutauluhierarkiaa nykyprossuilla. En tiedä, onko tätä moodia tuettu missään käyttiksessä.

big/huge page-moodit ei varsinaisesti ole koko prosesorin toimintatiloja, vaan ylemmän tason sivutauluentryssä on bitti, onko siinä pointteri seuraavan tason sivutauluun vai onko kyseessä big-/huge page jolloin siinä on pointteri suoraan siihen isoon sivuun.
 
Viimeksi muokattu:
Liittynyt
27.12.2016
Viestejä
1 837
.. paitsi että tosimaailmassa ne "normaalinpäiset" sivutaulut on hierarkisia, eikä niitä matalamman tason sivutauluja tarvitse olla ollenkaan läheskään kaikille osoitteille, vaan vain niille, mitä oikeasti käytetään (sekä melko pienelle määrälle ylimääräisiä, mutta tämä ylimääräisyys ei tunnu yhtään missään) ja käänteisen sivutaulun tilantarve-etu katoaa.
toki ja tosimaailmassa sivutus tehdään pitkälle rauta-avusteisesti kun taas käänteinen sivutaulurakenne on, jos nyt ei mahdoton, niin hyvin hankala toteuttaa raudalla.

Teoria ei ole huono/turha, tällä hetkellä ohjelmistot on toteutettu siten että hierarkinen malli on optimaalisempi. Voi olla että joskus syntyy laskentamalli, johon käänteinen sivutaulu soveltuu jostakin syystä paremmin. Vaikea ennustaa, Alpha panosti rinnakkaisuuteen ja x86 sarjalliseen suoritukseen. Nyt ollaan menossa toiseen suuntaan.
 
Liittynyt
21.06.2017
Viestejä
6 984
Ei mielestäni faktan toteaminen ole minkään merkin palvontaa tai silmien ummistamista. Testit esiin, jos on kerran nopeampiakin (nopein vs nopein).
Kun ne sinun faktasi on täyttä paskaa. Etkö sinä oikeasti osaa suhteuttaa asioita? Moneen kertan jo kertonut että tuossa oli dual 8-core vs. dual 20-core.
Tuon sinä olet jotenkin sisäistänyt ja sitten mielestäsi power9 on täyttä paskaa kun on puolta hitaampi kuin toi Intel mylly.
Koitas nyt suhteuttaa asioita ja ajattele jos vastakkain olisi ollutkin dual 16-core vs dual 16-core. Eli power9 kokoonpanoon olisi tullut roimasti lisää vauhtia kun taas tuosta xeon kokoonpanosta olisi kadonnut jonkin verran nopeudesta.

Kyllä sinun se pitäisi ymmärtää että enemmän coreja = enemmän nopeutta kuormilla jotka skaalautuu ja tuossa testeinä oli suurin osa sellaisia jotka skaalautuu hyvin. Jos näin ei olisi, niin ei olisi mitään järkeä valmistaa mitään 22-core taikka 32-core prosessoreita.

Ja tottakai olisi ollut hienoa jos testi olisi voitu tehdä laitteella jossa on sama määrä coreja, mutta jos satuit edes hiukan lukemaan testiä, niin testin tekijä oli saanut ssh tunnukset koneelle, eli käytettiin sitä mikä saatiin.
 
Liittynyt
02.06.2017
Viestejä
374
Powerissa on noita sivukokoja TLB missien välttämiseksi aikalailla. Ihan antiikkisista ajoista lähtien tarjolla on ollut kaksi, 4KB ja 64KB. 64KB jo vähentää TLB missejä melkoisesti. Myöhemmissä P-inkarnaatioissa on sitten tuotu oikeasti Huge paget, suurimmillaan 16GB. Jos näillä saa vielä paljon TLB-missejä aikaiseksi pitää olla tosi paljon muistia. Toki pitää muistaa, että pienin allokointikoko 16GB sivulla on sitten se yksi sivu.

Koska TLB-miss on Powerilla kallis, tulisi näitä isompia sivukokoja oikeasti käyttää.

Isoja sivuja kannattaa harkita myös muilla alustoilla, muisti-intensiivinen sovellus saattaa pienilläkin muistimäärillä saada 10% boostin suorituskykyyn, kun vaihdetaan 4K -> 2M sivuihin. Linuxissa nämä eivät ole kovin läpinäkyviä, vaikka uusissa kerneleissä onkin jo jokseenkin toimiva tuki muistin siirtelyyn sivukokojen välillä (tosin fragmentointuminen on ongelma). Käytännössä Linuxissa kannattaa varata isot sivut jo bootissa haluamalleen softalle, jos tämä hugepageja käyttää. Ja 2M ja 1G sivut ovat toimineet Linuxissa yhtä hyvin (huonosti) jo vuosia.
Linuxissa on myös fiitsöri nimeltään transparent hugepages, jolla yritetään liimailla pieniä sivuja isoiksi sivuiksi TLB-missien välttämiseksi. Oman kokemuksen mukaan tämä on ominaisuus joka kannattaa ottaa aina pois päältä, hyötyä tulee lähinnä ramdiskeillä, esim. tietokannat ottavat kovaa hittiä ominaisuudesta.
 
Liittynyt
16.10.2016
Viestejä
12 044
Kun ne sinun faktasi on täyttä paskaa. Etkö sinä oikeasti osaa suhteuttaa asioita? Moneen kertan jo kertonut että tuossa oli dual 8-core vs. dual 20-core.
Tuon sinä olet jotenkin sisäistänyt ja sitten mielestäsi power9 on täyttä paskaa kun on puolta hitaampi kuin toi Intel mylly.
Koitas nyt suhteuttaa asioita ja ajattele jos vastakkain olisi ollutkin dual 16-core vs dual 16-core. Eli power9 kokoonpanoon olisi tullut roimasti lisää vauhtia kun taas tuosta xeon kokoonpanosta olisi kadonnut jonkin verran nopeudesta.

Kyllä sinun se pitäisi ymmärtää että enemmän coreja = enemmän nopeutta kuormilla jotka skaalautuu ja tuossa testeinä oli suurin osa sellaisia jotka skaalautuu hyvin. Jos näin ei olisi, niin ei olisi mitään järkeä valmistaa mitään 22-core taikka 32-core prosessoreita.

Ja tottakai olisi ollut hienoa jos testi olisi voitu tehdä laitteella jossa on sama määrä coreja, mutta jos satuit edes hiukan lukemaan testiä, niin testin tekijä oli saanut ssh tunnukset koneelle, eli käytettiin sitä mikä saatiin.
En näe mitään syytä olettaa, että tuolla ei olisi noissa eri testeissä olleet suorituskykyisimmät vaihtoehdot, mitä ko testin aikaan vain saatiin.

Paskaa tai ei, niin mutua heitit, mutta et niitä testejä.
---------------
Halpahan tuo on.

Mm. Open Source "BIOS" on harvinaista herkkua ja joissakin tehtävissä välttämätön.
Hmm.. En kyllä keksi, millä mittarilla..
Mihin open source bios on välttämätön muuhun, kuin jos on pakko olla opensource BIOS?
 
Liittynyt
21.06.2017
Viestejä
6 984
En näe mitään syytä olettaa, että tuolla ei olisi noissa eri testeissä olleet suorituskykyisimmät vaihtoehdot, mitä ko testin aikaan vain saatiin.

Paskaa tai ei, niin mutua heitit, mutta et niitä testejä.
Eli nyt sinä väität että powerin 8-core prosessori on suorituskykyisempi kuin powerin 22-core prosessori.
 
Liittynyt
22.10.2016
Viestejä
11 030
toki ja tosimaailmassa sivutus tehdään pitkälle rauta-avusteisesti kun taas käänteinen sivutaulurakenne on, jos nyt ei mahdoton, niin hyvin hankala toteuttaa raudalla.

Teoria ei ole huono/turha, tällä hetkellä ohjelmistot on toteutettu siten että hierarkinen malli on optimaalisempi. Voi olla että joskus syntyy laskentamalli, johon käänteinen sivutaulu soveltuu jostakin syystä paremmin. Vaikea ennustaa, Alpha panosti rinnakkaisuuteen ja x86 sarjalliseen suoritukseen. Nyt ollaan menossa toiseen suuntaan.
Ei kyse ole mistään ohjelmistojen toteutuksesta tai laskentamalleista, ihan niistä riippumatta käänteinen sivutaulu on hidas eikä säästä tilaa normaaliin järkevään hierarkiseen sivutauluun verrattuna millään järkevillä konfiguraatioilla (voi toki säästää tilaa jollain aivan järjettömillä konfiguraatiolla, kuten että meillä on 64-bittinen virtuaalimuistiavaruus ja 16-bittinen fyysinen osoiteavaruus).

Ja siinä hitaudessa kyse on mm. siitä, että hajautustaulu on välimuistin toiminnan kannalta kauhea(koska osoituksissa hajautustauluun ei ole mitään järkevää lokaalisuutta)

Normaalit sivutaulut taas sopivat välimuistiin oikein kivasti ja kun jonkun sivun osoitteenmuunnos on juuri tehty, kaikki seuraavien 7 tai 15 sivun osoitteenmuunnoksen tarvitsema data (yhteensä 32 tai 64 kiB alue) löytyy tämän jälkeen välimuistista valmiiksi, välimuistilinjalta, joka juuri ladattiin. Ja seuraavaksi ylemmän tason sivutauludata löytyy sieltä jo 16 tai 64 megan alueelle sen yhden tehdyn osoitteenmuunnoksen jälkeen.

Lisäksi käänteinen sivutaulu on heti ongelmallinen tilanteessa jossa sama fyysinen sivu halutaan mapätä moneen eri virtuaaliosoitteeseen.
Mikä taas on aivan arkipäivää(copy on write, zero page- optimoinnit sekä jaettu muisti prosessien välillä). Näiden toteuttamiseen tarvitaan käänteisillä sivutauluilla ylimääräistä (jälleen lisää hidastavaa, ja potentiaalisia bugeja sisältävää) purkkaa.
 
Liittynyt
18.10.2016
Viestejä
274
Hmm.. En kyllä keksi, millä mittarilla..
Mihin open source bios on välttämätön muuhun, kuin jos on pakko olla opensource BIOS?
Otetaan vaikka esimerkiksi järjestelmä mitä tulee ylläpitää omasta toimesta yli vuosikymmenen tai vuosikymmeniä.

Nykyäänki finassi, lento, energia, sotilas ym. aloilla on järjettömän vanhaa rautaa. Ei niitä ihan joka päivä vähän conffailla uusiksi tai vaikka ylipäätään foliohattutietoturva.
 
Liittynyt
22.10.2016
Viestejä
11 030
Otetaan vaikka esimerkiksi järjestelmä mitä tulee ylläpitää omasta toimesta yli vuosikymmenen tai vuosikymmeniä.

Nykyäänki finassi, lento, energia, sotilas ym. aloilla on järjettömän vanhaa rautaa. Ei niitä ihan joka päivä vähän conffailla uusiksi tai vaikka ylipäätään foliohattutietoturva.
Juu. Open source == korjattavissa itse.

Closed source == systeemin tekijä voi olla vaikka mennyt konkurssiin kauan sitten ja vanhoja bugeja ei voida korjata, tai sitten niitä ei vaan suostuta korjaamaan tai niiden korjaamisesta pyydetään älytöntä hintalappua (vaikka ne olisivat nimenomaan tuotteessa olevia vikoja).


ps.
Käytin juuri kaksinumeroisen määrän tunteja siihen, että sain tehtyä oikeanlaisen binääripaketin softan uudesta versiosta "asiakkaalle". Itse koodimuutokseen meni aikaa n. vartti...
 
Liittynyt
18.10.2016
Viestejä
274
Onko siitä mitään varmaa tietoa vieläkään mitä koneelle voi Intel ME:n kautta tehdä esim. globaalissa kriisissä?

Intel ME is a co-processor integrated in all post-2006 Intel boards, which is the base hardware for many Intel features like Intel AMT, Intel Boot Guard, Intel PAVP and many others. To provide such features, it requires full access to the system, including memory (through DMA) and network access (transparent to the user).

Unlike many other firmware components, the Intel ME firmware can't be neither disabled nor reimplemented, as it is tightly integrated in the boot process and it is signed.

This poses an issue both to the free firmware implementations like coreboot, which are forced to rely on a proprietary, obscure and always-on blob, and to the privacy-aware users, who are reasonably worried about such firmware, running on the lowest privilege ring on x86.
 
Viimeksi muokattu:
Liittynyt
27.12.2016
Viestejä
1 837
Nykyäänki finassi, lento, energia, sotilas ym. aloilla on järjettömän vanhaa rautaa. Ei niitä ihan joka päivä vähän conffailla uusiksi tai vaikka ylipäätään foliohattutietoturva.
Avoimet järjestelmät ovat vieläkin arvokkaampia käänteisessä tapauksessa, eli kun on sertifioitu ohjelmisto, joka pitää saada toimimaan uudella raudalla koska alkuperäisestä ei enää saa mistään.
 
Liittynyt
18.10.2016
Viestejä
274
Avoimet järjestelmät ovat vieläkin arvokkaampia käänteisessä tapauksessa, eli kun on sertifioitu ohjelmisto, joka pitää saada toimimaan uudella raudalla koska alkuperäisestä ei enää saa mistään.
Nyt oli kysymyksessä vain BIOS ja tämäkin järjestelmä ajalee linuxia niin kysymyksessä ei ole mikään custom case.

Mistäänhän en oikeasti mitään tiedä. :tdown:

Kelan mainframe palatsihan virtualisoitiin Jyväskylästä, olisi ollut mielenkiintoista päästä seuraamaa projektia.
 
Liittynyt
17.10.2016
Viestejä
1 020
Melko "synteettisen" tuntuisia testejä taitaa olla suurin osa..
Missä määrin synteettisiä? Ihan normaali Phoronixin testipaletti tuo on? Ja, noiden moniydinnumeronmurskaimien käyttöön sopiva rinnakkaistuva kuorma nyt sattuu pääosin olemaan melko ”synteettisen” oloista. Tuo on yksi parhaista testipattereista noiden testaamiseen, ainakin minun mielestäni:

Joukossa oli esim. tiedostojen pakkaamista (7-zip, jossa Power9 oli selvästi joukon nopein, kuten suurimman säiemäärän alustalta ehkä jopa sopi olettaa), perinteisen shakkitekoälyn ajamista (Stockfish 9, kuten myös Power9 loistaa tässä), ohjelmakoodin kääntämistä (tyypillinen kuorma tuollaiselle laitteistolle, ja Power9 vei muita taas), OpenSSL-suorituskykyä (hmm... serveri pystymässä hoitamaan hyvin isoa määrää yhteyksiä, ja Power9 ...), tietokantaa, raskasta tieteellistä laskentaa (jota tässä edusti Octavella ajettava pätkä). Mitä siinä muka olisi pitänyt testata, pelejäkö? :-?

Tuosta renderöintitestistä en osaa sanoa, että onko se relevantti, vai olisiko tuossa oikeasti järkevää käyttää vain GPU-pohjaisia alustoja. Käsitin, että monesti tuota edelleen tehdään CPU-puolella, jos esim. on tarvetta isolle määrälle muistia. Mutta tämä on parin vuoden takaa.

Toki nuo Power9 suurin häviö yhden säikeen Python- tai PHP-testeissä ei toki ole kovin relevantti... mutta Phoronix pitänee ihan periaatesyistä testipatterissaan muutamaa tuollaista testiä, koska jos joku vaikka tarvitsee myös siedettävää yhden säikeen suorituskykyä. (Esim. siinä muuten monisäikeisessä oikean maailman kuormassa on ikävä skriptikielipohjainen yhden säikeen osuus joka olisi liian kallista optimoida pois.)
 

xana

ICT Pro
Tukijäsen
Liittynyt
25.10.2016
Viestejä
887
Yhden prosessorin emolevy hinta $1,154.99 + halvin IBM POWER9 CPU (4-Core) prosessori $375.00. Paras kahden prosessorin emolevy maksaakin jo $2,524.00 + paras IBM POWER9 CPU (22-core) prosessori $2,625.00.
Näihin hintoihin pitää vielä lisätä muistit ym., jotta saadaan toimiva kokoonpano.
 
Liittynyt
22.10.2016
Viestejä
11 030
Hih smt8. OpenCapi näyttäis olevan mutta pudottivatko todella nvlinkin?
Sellainen huomio tuosta "SMT8sta" että se on käytännössä SMT4; Yksi "markkinoinnin laskema" Power10-ydin on käytännössä kaksi itsenäistä SMT4-ydintä. Kaksi "oikeaa ydintä" vaan lasketaan yhdeksi lähinnä jotta saadaan halvempia lisenssejä softista, joiden lisenssit menee ydinmäärän mukaan.

Nuo Power10n "saman ytimen kaksi eri puoliskoa" siis jakavat vähemmän logiikkaa keskenään kuin AMDn bulldozerissa/bulldozer-johdannaisissa sen modulin "kaksi eri ydintä" jakoivat.
 
Toggle Sidebar

Statistiikka

Viestiketjut
237 498
Viestejä
4 164 372
Jäsenet
70 416
Uusin jäsen
giantaxe

Hinta.fi

Ylös Bottom