Intel esitteli 10 nanometrin prosessin palvelimiin tuovan Ice Lake-SP:n teknisiä ominaisuuksia

Kaotik

Banhammer
Ylläpidon jäsen
Liittynyt
14.10.2016
Viestejä
22 495
intel-ice-lake-sp-agenda-20200818.jpg


Kaotik kirjoitti uutisen/artikkelin:
Intel on ollut jumissa Skylake-johdannaisten ydinten kanssa jo vuosia pidempään, kuin oli tarkoitus. Uuden sukupolven Sunny Cove -ytimet saatiin viimein käyttöön noin vuosi sitten Ice Lake -prosessoreiden myötä, mutta vain kannettavissa. Nyt Intel valmistautuu pitkän odotuksen jälkeen tuomaan Sunny Cove -ytimet myös järeään luokkaan Ice Lake-SP -palvelinprosessoreiden myötä.

Ice Lake-SP eli 3. sukupolven Xeon Scalable -prosessorit valmistetaan parannetulla 10 nanometrin ”10nm+”-prosessilla. Prosessorit tulevat saataville kahden prosessorikannan Whitley-alustalla, mutta tarkka julkaisuaikataulu on edelleen avoin. Prosessorista on odotettavissa ilmeisesti useampia versioita, mutta Hot Chips 32 -verkkomessuilla pidetty esitys käsitteli 28-ytimistä varianttia ja vertasi sitä niin ikään 28-ytimiseen Cascade Lake-SP -arkkitehtuurin siruun.

[gallery link="file" ids="51066,51067,51068"]

Sunny Cove -prosessoriytimet kasvattavat Out-of-Order-suoritusikkunan kokoa Cascade Laken 224:stä 384:ään ja samanaikaisesti voi olla menossa aiemman 72 Load- ja 56 Store-operaation sijasta 128 Load- ja 72 Store-operaatiota. Ytimen vuorontajan kapasiteettia on kasvatettu puolestaan 97:stä 160:een. Myös rekisterien määrä on kasvanut ja siinä missä Cascade Lakessa oli 180 kokonaisluku- ja 168 liukulukurekisteriä, on Ice Lakessa niitä 280 ja 224. L1-välimuistia on kasvatettu 32:sta 48 kilotavuun ja L2-välimuistia on nyt 1,25 Mt per ydin. Sunny Coven palvelinversio on saanut lisäksi toisen FMA-yksikön. Kokonaisuudessaan Intel laskee Ice Lake-SP:n IPC:n (Instructions per Clock) kasvaneen noin 18 % SPECcpu2017:n kokonaislukutesteissä.

Sunny Coven kryptografiset ominaisuudet ovat parantuneet uusien käskyjen tuen myötä. Tuettuina ovat AVX-512 Integer IFMA:n alle osuva VPMADD52, uudet Vector AES- ja Vector Carry-less Multiply -käskyt, Galois Field New Instructions -käskyt sekä SHA-NI-käskyt. Lisäksi ytimissä on tuki Bit Algebran alla CPOCNT-käsky ja Bit Shuffle -toiminto, sekä uusi Vector Bit Manipulation Instruction -käsky. Löydät Intel tarkemmat kuvaukset käskyistä yllä olevasta kuvasta. Viereisestä kuvasta löydät puolestaan uusien käskyjen tuomat suorituskykyparannukset Cascade Lakeen verrattuna ydintasolla, kunhan sovellukset ja algoritmit on optimoitu uusille käskyille.

[gallery link="file" columns="2" size="medium" ids="51069,51070"]

Ice Lake-SP:ssä on uudistunut myös ns. uncore eli muu osuus, kuin varsinaiset prosessoriytimet. Prosessorissa on kaksi erillistä sivukaistaverkkoa, joista toinen on yleiseen käyttöön ja toinen omistettu yksin virranhallinnan käyttöön. Näiden tehtävänä on varmistaa varmatoiminen ja konsistentti kommunikaatio koko sirun eri yksiköiden kesken paremman hallinnan ja telemetriatietojen takaamiseksi.

Myös sirun sisäinen asettelu on uudistunut merkittävästi. Cascade Lakessa erilaiset ulospäin lähtevät väylät oli sijoitettu sirun ylälaitaan ja ytimet niiden alle 6 – 4 – 6 – 6 – 6 -konfiguraatioon siten, että muistiohjaimet täyttivät neliytimisen rivin kaksi reunimmaista paikkaa. Ice Lakessa löytyy nyt ulospäin meneviä väyliä sekä ylälaidasta että alalaidasta ja prosessoriytimet on sijoitettu nyt 6 – 6 – 4 – 6 – 4 – 2 konfiguraatioon siten, että viimeiset kaksi ovat aivan sirun alalaidassa väylien välissä. Yhteensä 8-kanavaiset ja täysin uudelleen suunnitellut muistiohjaimet on sijoitettu 4 ytimen rivien päätyihin. Samalla sirun kommunikaatioväylät on muutettu 6 x 3 -Mesh-verkosta 7 x 3 -Mesh-verkoksi.

[gallery link="file" columns="2" size="medium" ids="51071,51072"]

Ice Lake-SP tuo mukanaan tuen myös PCI Express 4.0 -väylille, mutta niiden tarkkaa määrää ei ole kerrottu. Sirulla on kuitenkin neljä erillistä PCIe4-yksikköä. Lisäksi prosessorista löytyy kolme UPI-linkkiä (Ultra Path Interconnect) sekä yksi DMI / CBDMA -yksikkö.

Intelin prosessoreiden kellotaajuudet ovat olleet jo pitkään normaalia matalammat, kun ajetaan AVX-kuormia. Nyt Ice Lake-SP:ssä AVX-256-käskyillä kellotaajuus pysyy vakiona ja AVX-512-käskyillä se tippuu vajaaseen 85 %:iin vakiosta, kun aiemmilla sukupolvilla se tippui noin 72 %:iin. Uutta on myös Speed Select Technology eli Intel SST, joka mahdollistaa prosessorin kellotaajuusprofiilin muuttamisen tarpeen mukaan. SST-tiloja on neljä: Performance Profile, Base Frequency, Core Power ja Turbo Frequency. Löydät Intelin niistä antamat kuvaukset yllä olevasta diasta.

Lähde: AnandTech

Linkki alkuperäiseen juttuun
 
Jokohan ensi vuonna tulee vihdoin ja viimein työpöydälle 10nm eli 10ESF (10nm++).
 
Jeps, kirjoitin 10nm+ koska niin luki dioissa eikä mikään viitannut erikseen että tämä olisi 10SF (minkä olemassaolosat toki olin tietoinen, Architecture Day -seteissä oli asiasta puhe)
Tuo "10nm+" lienee sama prosessi jolla mobiili-Ice Laket tehdään, sekin oli 10nm+
 
Eli käytännössä nuo Intelin "10nm" generaatiot lienee?

"10nm" (Cannon Lake), pahasti ongelmainen prosessi
"10nm+" (Ice lake mobile, Ice lake server) , melko toimiva mutta maksimikelloiltaan vielä selvästi hitaampi kuin "14nm+++"
"10nm superfin" (Tiger lake), alkaa olla jo kelloiltaan mukava muttei silti aivan yhtä nopea kuin "14nm+++++++"

Ja sitten Alder Lakeen tulee joku "10nm superfin+" tai hyperfin tms. ensi vuonna?
 
Eli käytännössä nuo Intelin "10nm" generaatiot lienee?

"10nm" (Cannon Lake), pahasti ongelmainen prosessi
"10nm+" (Ice lake mobile, Ice lake server) , melko toimiva mutta maksimikelloiltaan vielä selvästi hitaampi kuin "14nm+++"
"10nm superfin" (Tiger lake), alkaa olla jo kelloiltaan mukava muttei silti aivan yhtä nopea kuin "14nm+++++++"
Erona 10nm+ ja superfinin välillä voivat olla myös saannot - jos jälkimmäisen saannot ovat huonommat, niin isoja serveri-prossuja ei ehkä ole kiva tuottaa sillä, vaikka maksimisuorituskyky olisikin parempi.
 
Tuossa hot chips esitelmässä oli oikeastaan mielenkiintoisinta se että 28 core 10 nm lastun wateista tai kellotaajuuksista ei mainittu sanallakaan.

Luulisi että viime aikojen ongelmien vuoksi olisi enemmän kuin tärkeää näyttää että ollaan saavutettu etuja uudella prosessiteknologialla vs 14nm++ 28 core lastut.

Vaan jospa niitä ei ole..?
 
Tuossa hot chips esitelmässä oli oikeastaan mielenkiintoisinta se että 28 core 10 nm lastun wateista tai kellotaajuuksista ei mainittu sanallakaan.

Luulisi että viime aikojen ongelmien vuoksi olisi enemmän kuin tärkeää näyttää että ollaan saavutettu etuja uudella prosessiteknologialla.

Vaan jospa niitä ei ole..?
Kellotaajuuksista ja wateista kerrottaneen vasta kun tuotteet oikeasti julkistetaan. Eihän Tiger Lakenkaan kellotaajuuksista ole puhuttu vielä mitään. Toki jotain hehtaaria varmaan kerrottaisiin jos valmistustekniikassa olisi saavutettu jonkin sortin suuri mullistus, mutta sellaistahan ei ole luvassa.
 
Kellotaajuuksista ja wateista kerrottaneen vasta kun tuotteet oikeasti julkistetaan. Eihän Tiger Lakenkaan kellotaajuuksista ole puhuttu vielä mitään. Toki jotain hehtaaria varmaan kerrottaisiin jos valmistustekniikassa olisi saavutettu jonkin sortin suuri mullistus, mutta sellaistahan ei ole luvassa.
Joo toki, mutta vähän kummeksun ettei edes performance per watt ole mainittu.
 
Erona 10nm+ ja superfinin välillä voivat olla myös saannot - jos jälkimmäisen saannot ovat huonommat, niin isoja serveri-prossuja ei ehkä ole kiva tuottaa sillä, vaikka maksimisuorituskyky olisikin parempi.
Toisaalta Intelillä on näyttänyt olevan periaate, että serveriprosessorit tulevat samalla valmistusteknologialla ja arkkitehtuurilla kuin vastaava desktop-prosessori, mutta 1-2 vuotta jälkijunassa. Esim. Skylake syksyllä 2015 ja Skylake-X syksyllä 2017.
 
Kellotaajuuksista ja wateista kerrottaneen vasta kun tuotteet oikeasti julkistetaan. Eihän Tiger Lakenkaan kellotaajuuksista ole puhuttu vielä mitään. Toki jotain hehtaaria varmaan kerrottaisiin jos valmistustekniikassa olisi saavutettu jonkin sortin suuri mullistus, mutta sellaistahan ei ole luvassa.
4.7GHz näyttää olevan Geekbench-tuloksien perusteella, mutta lopulliset kellot nuo ei välttämättä ole.
 
Joo, mutta tarkoitin että Intel ei ole virallisesti tiedottanut aiheesta mitään.
Ei tietenkään ole kun ei ole niitä julkaissut? Monenko prosessorin kellotaajuuksia on mainostettu ennen niiden julkaisua ikinä?
 
Kyllä on etenkin performance/watt uplifteilla paukutellut henkseleitä mm. AMD
 
Tuossa hot chips esitelmässä oli oikeastaan mielenkiintoisinta se että 28 core 10 nm lastun wateista tai kellotaajuuksista ei mainittu sanallakaan.

Luulisi että viime aikojen ongelmien vuoksi olisi enemmän kuin tärkeää näyttää että ollaan saavutettu etuja uudella prosessiteknologialla vs 14nm++ 28 core lastut.

Vaan jospa niitä ei ole..?

kellotaajuuksista sanottiin sen verran, että avx-512:sta käyttäessä kelloja pudotetaan enää 85% skalaarikelloista, verrokkiluvuksi skylake-sp:lle taidettiin sanoa 72%

Hyvä kysymys on tietysti että kummasta tämä kertoo enemmän, siitä että ice lake-spn avx-512-implementaatio on selvästi parempi, vai että skalaarikellotkin on alhaalla. Ehkä yhdistelmä molempia.

(ja muualta kävi juuri ilmi, että Ice Laken mobiilimallilla jossa vain yksi 512-bittinen fma ero on vielä pienempi, pudotus vain 3.7 -> 3.6 travisin testeissä). Ja Travis on siis oikesti pätevä tyyppi.

 
Viimeksi muokattu:

Statistiikka

Viestiketjuista
258 718
Viestejä
4 496 641
Jäsenet
74 273
Uusin jäsen
Aloittelija6271

Hinta.fi

Back
Ylös Bottom