Ampere julkisti uuden sukupolven Altra-prosessorin

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 612
ampere-altra-mt-jade-mt-snow-20200303.jpg


Kaotik kirjoitti uutisen/artikkelin:
Yhdysvaltalainen vuonna 2017 perustettu Ampere on julkaissut uuden sukupolven prosessorinsa. Ampere Altra -prosessorit perustuvat ARM-arkkitehtuuriin ja ne on suunniteltu palvelinkäyttöön.

Ampere Altra -prosessorit tarjoavat parhaimmillaan peräti 80 ydintä per prosessorikanta. Ytimet perustuvat Arm Neoverse N1 -ytimiin ja ne ovat yhteydessä toisiinsa mesh-tyyppisen välimuistikoherentin väylän avulla. Neoverse N1 -ytimet on suunniteltu pilvipalvelimien tarpeisiin ja niiden luvataan olevan erityisen energiatehokkaita. Altra-prosessorit valmistetaan TSMC:n 7 nanometrin valmistusprosessilla.

Prosessorin 80 ytimen tarpeita ruokitaan kahdeksalla DDR4-3200-muistikanavalla, jotka tukevat parhaimmillaan 4 teratavua muistia. Yhtiön diojen mukaan välimuistikoherentin mesh-väylän ansiosta kaikkien ydinten muistiviive on identtinen. Prosessori tukee yhteensä 128 PCI Express 4.0 -linjaa, mutta kahden prosessorin järjestelmissä varataan kummaltakin prosessorilta 32 linjaa prosessorikantojen väliselle liikenteelle, jolloin käytettäväksi jää 192 linjaa. Lisäksi tuettuna on CCIX- eli Cache Coherent Interconnect for Accelerators -väylä, johon voidaan kytkeä enimmillään neljä laitetta.

Suorituskyvyn osalta yhtiö arvioi sen Altra-prosessorin tarjoavan SPECint 2017 -testissä 4 % parempaa suorituskykyä kuin AMD:n 64-ytiminen Epyc 7742 ja peräti 123 % parempaa suorituskykyä kuin Intelin 28-ytiminen Xeon Platinum 8280. Lukemat perustuvat yhtiön arvioon kahden 3,3 GHz:n Altra-prosessorin suorituskyvystä. Lisää yhtiön suorituskykydioja löydät Serve the Homen artikkelista. Prosessoreiden TDP-arvo on mallista riippuen 45 - 210 wattia.

Ampere Altra tulee saataville yhden ja kahden prosessorikannan järjestelminä 2U-kokoluokassa. Yhden prosessorikannan Mt. Snow -palvelin on Gigabyten käsialaa, mutta kahden prosessorikannan Mt. Jade -palvelimen valmistajaa ei ole paljastettu vielä. Myös Lenovo tulee valmistamaan Altra-palvelimia, mutta se ei ole Mt. Jaden valmistaja.

Lähde: Ampere

Linkki alkuperäiseen juttuun
 
Viimeksi muokattu:
Yhtiön diojen mukaan välimuistikoherentin mesh-väylän ansiosta kaikkien ydinten muistiviive on identtinen.

Tuo on mielenkiintoinen ja kysymyksiä herättävä ratkaisu kun muilla valmistajilla yleensä viiveettä naapuriin on pyritty minimoimaan ja schedulerille jätetään vastuu ymmärtää käyttää mahdollisimman läheisiä coreja samalle softalle. Onnistui tai sitten ei.. :)

Mikähän lie takana.. toteutuksen yksinkertaistus vai pinta-alan säästö tjsp.

Sinänsä ei pitäisi palvelinpuolella toisaalta häiritä, kun softat pitäisi kuitenkin kirjoitella asyncronisesti, joten vaikka yksittäinen pyyntö stallaisi johonkin niin sinänsä kokonais suorituskykyyn sen ei pitäisi pahemmin vaikuttaa. Serveripuoella kun ei tarvitse silleen minimi viiveellistä vastetta kun deskarilla peleissä.
 
Noista Neoverse-ytimistä ilmeisesti löytyy ARMin uusi SVE-vektorikäskykanta, mutta se on tuossa toteutettu vain 128-bittisenä (SVEssä vektorinleveys on siis implementaation päätettävissä).

Vain 128-bittisten vektorien takia ei tästä löyty hirveästi raakaa liukulukuvääntöä, mutta toisaalta SVE mahdollistaa teoriassa joidenkin sellaisten looppien vektoroimisen, mitä aiemmille vektorikäskykannoille ei ole voinut ollenkaan vektoroida. Eri asia sitten tosin on, että kuinka hyvin kääntäjät onnistuvat tässä käytännösä.
 
What we will note is that Ampere de-rated both the AMD EPYC 7742 and Xeon Platinum 8280 results by 16.5% and 24% respectively. This was done to adjust for using GCC versus AOCC2.0 and ICC 19.0.1.144. Ampere disclosed this, and it is a big impact.

Eli kilpailevista prosessoreista vähennettiin suorituskykyä kompensoimaan oman tuloksen huonoa kääntäjää, jos oikein ymmärsin?
 
Prosessori tukee yhteensä 128 PCI Express 4.0 -linjaa, mutta kahden prosessorin järjestelmissä varataan yhteensä 32 linjaa prosessorikantojen väliselle liikenteelle, jolloin käytettäväksi jää 192 linjaa.

Jos niitä varataan yhteensä 32 linjaa, niin eikö niitä silloin jää 224 linjaa vapaaksi (2 x 128 - 32 = 224)?
 
Eli kilpailevista prosessoreista vähennettiin suorituskykyä kompensoimaan oman tuloksen huonoa kääntäjää, jos oikein ymmärsin?

Juu. IMHO melkoisen törkeää/harhaanjohtavaa markkinointia.

Erityisesti kun vielä väittää "leadership performance" kun keinotekoisesti vaan pienennetään kilpailijoiden lukuja.

Jos todelliset luvut ei miellytä, käyttäisivät vaan sitten muita benchmarkkeja, joiden luvut miellyttää, sen sijaan että esittävät valheellisia lukuja, joita on muokattu hihasta vedetyllä kertoimella.

Ja palkkaisivat ihmisiä tekemään sitä kunnollista kääntäjää, se parempi kääntäjä auttaa kyllä kaikkialla muuallakin.
 
Jos niitä varataan yhteensä 32 linjaa, niin eikö niitä silloin jää 224 linjaa vapaaksi (2 x 128 - 32 = 224)?
Todennäköisesti tarkoitetaan, että molemmista prosessorikannoista varataan se 32 linjaa (koska pitäähän ne toiselta tulevat linjat johonkin liittää), näin ainakin itse ymmärtäisin asian. Korjatkaa toki, jos ymmärsin väärin.
 
Todennäköisesti tarkoitetaan, että molemmista prosessorikannoista varataan se 32 linjaa (koska pitäähän ne toiselta tulevat linjat johonkin liittää), näin ainakin itse ymmärtäisin asian. Korjatkaa toki, jos ymmärsin väärin.

Toi sana "yhteensä" viittaa yleensä siihen että se on yhteenlaskettu summa, eli molemmat prossut käyttää 16 linjaa suuntaansa.

[edit] Katoin ton lähteen ja niitä linjoja käytetään tosiaan 32 per kanta, jolloin jää sen 192 linjaa käyttöön. Toi lause
Prosessori tukee yhteensä 128 PCI Express 4.0 -linjaa, mutta kahden prosessorin järjestelmissä varataan yhteensä 32 linjaa prosessorikantojen väliselle liikenteelle, jolloin käytettäväksi jää 192 linjaa.
on imho vähän huonosti muodostettu ja siitä saa väärän kuvan.

[edit] Alkuperäisessä sanotaan näin:
It has 128 PCIe lanes per CPU. It then utilizes 32 of those lanes for a 2P system using CCIX for the cache coherent interconnect.
 
Viimeksi muokattu:
Toi sana "yhteensä" viittaa yleensä siihen että se on yhteenlaskettu summa, eli molemmat prossut käyttää 16 linjaa suuntaansa.

[edit] Katoin ton lähteen ja niitä linjoja käytetään tosiaan 32 per kanta, jolloin jää sen 192 linjaa käyttöön. Toi lause on imho vähän huonosti muodostettu ja siitä saa väärän kuvan.

[edit] Alkuperäisessä sanotaan näin:
Joo siinä on käynyt joku ajatuskatkos, korjataan.
 
Jos tämä firma pysyy pystyssä tarpeeksi pitkään niin että ehti optimoida tuon kääntäjänsä niin ARM palvelimista tulee oikeasti kilpailukykyinen vaihtoehto muissakin kuin muutamassa niche käyttötarkoituksessa (eikös nuo ole jo nyt kilpailukykyisia jos on tarkoituksena ajaa hirveää määrää hyvin kevyitä virtuaalikoneita).
 

Uusimmat viestit

Statistiikka

Viestiketjuista
261 210
Viestejä
4 532 101
Jäsenet
74 774
Uusin jäsen
Swatmc

Hinta.fi

Back
Ylös Bottom