ARM esitteli uudet Cortex-X2-, A710- ja A510-prosessoriytimet sekä uudet Mali GPU:t

Juha Kokkonen

Ylläpidon jäsen
Liittynyt
17.10.2016
Viestejä
13 986
arm-cortex-cpus-270521-1024x573.jpg


Juha Kokkonen kirjoitti uutisen/artikkelin:
ARM on esitellyt uuteen ARMv9-arkkitehtuuriin perustuvat uusimman sukupolven versiot mobiililaitteisiin suunnatuista Cortex-sarjan prosessoriytimistään sekä uudet Mali-sarjan grafiikkasuorittimet, joita tullaan näkemään ensi vuoden järjestelmäpiireissä. Uutuudet on suunniteltu skaalautuvaksi niin suorituskykyisiin kannettaviin tietokoneisiin, älytelevisioihin, multimedialaitteisiin kuin mobiililaitteisiin ja älypuhelimiinkin. Erilaisista prosessoriytimistä koostuvan ryppään selkärankana toimii uusi DynamIQ Shared Unit-110 -yksikkö, joka tarjoaa moninkertaistuneen kaistan, kasvaneen yhteisen L3-välimuistin ja paremman skaalattavuuden eri käyttötarkoituksiin.

[gallery link="file" size="medium" ids="62355,62356,62357"]

Prosessorivalikoimansa huipulle ARM esitteli uuden toisen sukupolven Cortex-X2-ytimen, jonka luvataan tarjoavan 16 % suorituskykyparannus Cortex-X1-ytimeen nähden samalla kellotaajuudella ja tekniikalla valmistettuna. Modernimmalla valmistustekniikalla ja korkeammalla kellotaajuudella suorituskykyetu nousee jopa 30 %:iin. Koneoppimissuorituskyvyn luvataan tuplaantuneen edelliseen sukupolveen nähden. Cortex-X2-ytimiä voidaan hyödyntää korkeamman suorituskyvyn sovelluksissa (kuten kannettavissa tietokoneissa) jopa kahdeksan ytimen ryppäänä.

Cortex-X-ytimien alapuolelle sijoittuva A78-ytimen seuraaja on saanut nyt uuden nimeämistavan ja se tunnetaan Cortex-A710-mallina. Sen suunnittelussa on keskitytty suorituskyvyn ja energiatehokkuuden tasapainottamiseen sekä pitkäkestoiseen moniydinsuorituskykyyn. Sille luvataan 10 %:n suorituskykykasvu sekä peräti 30 % parannus energiatehokkuudessa. Pitkäkestoisessa rasituksessa suorituskyvyn luvataan kuitenkin kasvavan jopa yli 30 %.

Cortex-A510 on puolestaan aiemman A55-ytimen seuraaja ja se on suunniteltu puhtaasti kevyempiin tehtäviin ja alhaiseen virrankulutukseen. Sen kerrotaan tarjoavan mukavan 35 % suorituskykyparannuksen, jonka myötä tehtäviä voidaan ajaa pidempään "pienillä ytimillä" siirtämättä niitä A710-ytimille. Lisäksi energiatehokkuuden kerrotaan parantuneen 20 % ja koneoppimissuorituskyvyn kolminkertaiseksi.

[gallery link="file" columns="4" size="medium" ids="62351,62352,62353,62354"]

Myös Mali-grafiikkasuorittimien nimeämispolitiikkaa on uudistettu ja Mali-G78:n seuraaja on nimeltään Mali-G710. Sen kerrotaan olevan 20 % nopeampi sekä energiatehokkaampi kuin edeltäjänsä sekä 35 % etevämpi koneoppimistehtävissä. G710:ssä on uusi CSF (command stream frontend), jonka kerrotaan vähentävän prosessoriytimille kohdistuvaa kuormaa. Lisäksi shader-ytimiä on uudistettu merkittävästi ja niiden suorituskykytiheyttä on saatu kasvatettua. G710:ssä voi olla 7-16 shader-ydintä. Myös tekstuuriyksiköiden suorituskyky on tuplattu, vaikka pinta-ala on kasvanut vain 50 %:lla.

Mali-G68:n seuraajana Mali-G610 asemoituu G710:n alapuolelle ja perustuu samaan rakenteeseen karsitussa muodossa. Se on suunnattu hieman edullisempiin premium-puhelimiin ja shader-ytimien määrä on rajattu 1-6 kappaleeseen. Seuraava pykälä alaspäin on uusi Mali-G510, joka on puolestaan seuraaja Mali-G57-mallille. Se tarjoaa peräti 100 % suorituskykyparannuksen sekä 22 % energiasäästön. Ensimmäinen Valhall-arkkitehtuuriin perustuva edullisimman luokan laitteisiin suunnattu uutuus on Mali-G310 (seuraaja Mali-G31:lle) ja se kykenee kuusinkertaiseen suorituskykyyn teksturoinnissa, 4,5-kertaiseen suorituskykyyn Vulkan-sovelluksissa ja kaksinkertaiseen suorituskykyyn Android-käyttöliittymän pyörittämisessä.

Lähteet: ARM (1)(2)(3)

Linkki alkuperäiseen juttuun
 
Viimeksi muokattu:
Muutamia huomioita:

0) Yleistä CPU-ytimistä

SVE2 on vihdoin tuettu kaikilla ytimillä. Nyt voi kääntää yhden SIMD-koodin ja se tulee toimimaan optimaalisesti myös tulevaisuuden prossuilla joissa levämpi SIMD.

1) Little-ydin A510:

Kaksi A510ä jakaa L2-kakun ja SIMD/FPU-puolen Bulldozerin tyyliin.

Oleellisena erona kuitenkin, että kaksi A510aa ei jaa liukuhihnan etupäätä (käskynhaku- ja dekoodaus) kuten bulldozer jakoi.

A510 pystyy suorittamaan kolmea käskyä rinnakkain vaikka on in-order. Tämä on aika yllättävää, luulisi että joutuisi idlaamaan aika paljon kun tulee välimuistihuteja tms.

2) Luureihin tarkoitettu big-ydin A710, sweet-spot suorituskyvyn ja virrankulutuksen välillä:

Tietyt vaiheet kavennettu 6 käskystä 5 käskyyn jotta saadaan eneriatehokkuutta paremmaksi verrattuna Cortex A78iin. IPCn pitäisi silti parantua koska muualla on paljon parannuksia ja näiden leveys ei kai ollut kovin merkityksellinen.

Yksi liukuhihnanvaihe pudotettu pois A78iin verrattuna

3) Järeä ydin X2:

Yksi liukuhihnanvaihe pudotettu pois X1een verrattuna

ROBin koko 288 käskyä, etupään leveys 8 käskyä, ALUja 4 ja niiden lisäksi rinnakkain vielä 2 haarautumisenresolvausksikköä, ja 128-bittisiä FPUita 4 kpl.

Tässä puhutaan aika lailla samasta järeysluokasta kuin Zen3 ja Covet. Liukuhihna sen sijaan on lyhempi joten kellojen voi odottaa olevan hiukan pienemmät.
 
Viimeksi muokattu:
Muutamia huomioita:

0) Yleistä CPU-ytimistä

SVE2 on vihdoin tuettu kaikilla ytimillä. Nyt voi kääntää yhden SIMD-koodin ja se tulee toimimaan optimaalisesti myös tulevaisuuden prossuilla joissa levämpi SIMD.

1) Little-ydin A510:

Kaksi A510ä jakaa L2-kakun ja SIMD/FPU-puolen Bulldozerin tyyliin.

Oleellisena erona kuitenkin, että kaksi A510aa ei jaa liukuhihnan etupäätä (käskynhaku- ja dekoodaus) kuten bulldozer jakoi.

A510 pystyy suorittamaan kolmea käskyä rinnakkain vaikka on in-order. Tämä on aika yllättätää, luulisi että joutuisi idlaamaan aika paljon kun tulee välimuistihuteja tms.

2) Luureihin tarkoitettu big-ydin A710, sweet-spot suorituskyvyn ja virrankultuusken välillä:

Tietyt vaiheet kavennettu 6 käskystä 5 käskyyn jotta saadaan eneriatehokkuutta paremmaksi verrattuna Cortex A78iin. IPCn pitäisi silti parantua koska muualla on paljon parannuksia ja näiden leveys ei kai ollut kovin merkityksellinen.

Yksi liukuhihnanvaihe pudotettu pois A78iin verrattuna

3) Järeä ydin X2:

Yksi liukuhihnanvaihe pudotettu pois X1een verrattuna

ROBin koko 288 käskyä, etupään leveys 8 käskyä, ALUja 4 ja niiden lisäksi rinnakkain vielä 2 haarautumisenresolvausksikköä, ja 128-bittisiä FPUita 4 kpl.

Tässä puhutaan aika lailla samasta järeysluokasta kuin Zen3 ja Covet. Liukuhihna sen sijaan on lyhempi joten kellojen voi odottaa olevan hiukan pienemmät.
Kiitos taas asiantuntevista täydennyksistä/huomioista :thumbsup:
 

Statistiikka

Viestiketjuista
257 839
Viestejä
4 479 591
Jäsenet
74 017
Uusin jäsen
Nooa11

Hinta.fi

Back
Ylös Bottom