GPU ei ole CPU joten ei voida olettaa että kellottuvuus olisi verrattavissa.
Kyllä voidaan kuten hkultala tuossa myöhemmin kertoi.
Se on sekä että. Mikäli se 10nm olisi saatu toimimaan ajallaan, niin ei olisi niin suuria suorituskyky paineita mitä nyt on ja jokainen 14nm viilaus hilaa sitä rimaa ylös.
Tavallaan noinkin mutta nytkään ei ole niinkään suorituskykypaineita vaan paineita saada jotain ulos ettei tarvitse lisätä 14nm tuotantoa.
32-ytiminen EPYC/Threadripper 4*213mm = 852mm^2, intel Skylake-SP XCC ~700 mm^2.
Intelin 28 ydintä vie siis selvästi vähemmän pinta-alaa kuin AMDn 32 ydintä.
Kun laskee reunahävikin mukaan, 300mm^2 kiekolta saa n. 75 skylake-SP-XCCtä, ja n. 260 zeppeliniä eli n. 65 32-ytimistä EPYCiä/threadripperiä.
Eli AMDn tarvii zeppelinillensä n. 15% paremmat saannot että pääsee tasoihin intelin kanssa siinä, montako toimivaa piiriä samankokoiselta piikiekolta saadaan.
Käytännössähän AMD kyllä saa enemmän kuin 15% paremmat saannot, mutta kuinka paljon, on hyvä kysymys. Ei se ero kuitenkaan AMDn hyväksi mikään todella suuri ole, kun kuitenkin piireistä voidaan kuitenkin osa ytimistä kytkeä pois päältä, jos niiden kohdalle osuu valmistusvika, piiri on totaalisen pilalla vain jos valmsitusvika osuu vaikka johonkin muisti- tai IO-ohjaimeen tai väylälogiikkaan.
Kyllähän tuosta käytännössä tulee järkyttävä ero. Ensinnäkin Intelin 28-ytiminen prosessori ei ole enää 28-ytiminen jos siitä kytketään
yksikin ydin pois päältä. Suuremmassa mittakaavassa:
Intel:
- Intel valmistaa XCC:n josta pitää toimia noin 2/3 osaa ytimistä, muuten menee roskiin. Tiettävästi Intel ei myy XCC:ta kovin pienillä ydinmäärillä.
- Kaikkien toimivien ytimien pitää olla "sopivasti toimivia" palvelinkäyttöön.
- Edellisen takia 28-ytimisen speksien pitää olla aika laveat jotta kaikki toimivat piirit sopivat niihin.
AMD:
- Valmistetaan vain yhtä 8-ytimistä mallia, valmistuneet sirut voidaan speksata toimivuuden JA kellottuvuuden mukaan erikseen.
- Huonosti kellottuvat (tai toimivat pienillä kelloilla pienellä lämmöntuotolla) Epycceihin, parhaiten kellottuvat Threadrippereihin, siitä väliltä Ryzeneihin.
- Kaikki 8 ydintä toimivat suuren ydinmäärän prosessoreihin (32-ydin Epyc, 32-ydin Threadripper, 8-ydin Ryzen jne), 6 ytimellä toimivat vähän pienemmän määrän prosessoreihin, 4 ytimellä toimivat Epycceihin (aiemmin Ryzeneihin myös), 2 ytimellä toimivat Epycceihin.
- Koska valikointia voi harrastaa, sirujen speksaukset voivat olla paljon tiukemmat kuin Intelillä.
- Hukkaa tulee todella vähän ja siruja on helppo valmistaa varastoon. Kokonaisuutena ero on huikea.
Ja vaikka pysyttäisiin vain 28-ytimisissä, AMD:lle riittää kun saa valmistettua 4 kappaletta 213 mm2 siruja joissa kaikissa toimii 8 ydintä. Intel tarvitsee valmistaa 700 mm2 siru jossa pitää toimia kaikki 28 ydintä. Löytyy varmasti monta mielipidettä siitä kuinka paljon saannot huononevat sirukoon kasvaessa, mutta lonkaltakin heitettynä ero on todella suuri AMD:n hyväksi myös speksauksen takia.
Lähdettä näille?
Itselle tulee mieleen vain yksi ikivanha vertailu jossain verrattiin iphonejen piiriä(A9?) samsungin "14nm" LPE-prosessilla ja TSMCn kypsyneemmällä prosessilla, ja saatiin TSMClle pienempi virrankulutus tms. AMD ei kuitenkaan käytä tätä LPE-versiota prosessista prosessoreissaan.
GeForce GT1030 ja jotain muita vastaavan luokan piirejä tehdään Samsungilla ja tiettävästi juuri 14nm LPP käytössä. GP107 ja GP108 ilmeisesti.
Juuri tuon takia en ottanut Applea mukaan.
Prosessoreita käytetään aivan erilaisilla jännitteillä ja kellotaajuuksilla kun GPUilta. Eri prosessien kellottuvuus ja sähkönkulutus skaalautuu hyvin eri tavalla jännitteen mukaan. Mobiilioptimoidut prosessit ovat optimoitu toimimaan hyvin pienillä jännitteillä pienillä kellotaajuuksilla, mutta jos niistä yritetään ottaa enemmän kelloa irti, pitää alkaa lisätä jännitettä rankemmin ja pian sekään ei riitä, suurempaa kelloa ei vaan millään saavuteta. CPU-optimoitu prosessi taas toimii hyvin suurehkoilla jännitteillä suurilla kelloilla, mutta vaikka sen kellotaajuutta pudotettaisiin, piiriä ei siltikään voi ajaa kovin pienillä jännitteillä ja se joka tapauksessa vuotaa paljon.
GPUissa mennään käyrällä sellaisessa kohdassa, että ollaan käytännössä rajoittuneita siihen, paljonko sähkön piiri kuluttaa ja lämpöä koko piiri tuottaa. Mitä energiatehokkaammalla prosessilla piiri valmistetaan, sitä ylemmäs voidaan kelloa nostaa ilman että lämmöntuotto ja sähkönkulutus karkaa pilviin.
CPUissa taas maksimikelloa rajoittava tekijä on paljon enemmän kriittiset polut sekä hyvin paikalliset kuumat kohdat piriin sisällä, mutta ei niinkään koko piirin kuumiaminen ja sähkönkulutus.
Mikäli näyttikset kellottuvat TSMCn "16nm" prosessilla korkeammalle kuin GFn/Samsungin "14nm" prosessilla, niin todennäköistä toki on, että myös prosessorit kellottuisivat TSMCn "16nm" prosessilla hiukan ylemmäs kuin GFn/Samsungin "14nm" prosessilla, mutta mitenkään äärimmäisen varmaa tämä ei ole.
Esimerkiksi Intelin "14nm++" prosessi tarjoaa CPUille selvästi paremmat kellot kuin GFn "14nm" prosessi, mutta todennäköisesti sillä ei saisi aikaiseksi kovin hyviä GPUita, koska virrankulutus GPU-luokan jännitteillä tai kellotaajuuksilla ei varmaan olisi yhtään sen pienempi kuin GFn prosessilla, todennäköisesti hiukan huonompi, jolloin virransyöttö- ja lämpörajoitteet helposti pakottaisivat ajamaan sitä pienemmällä kellolla.
Aivan. Entä jos kysymys muotoillaan seuraavasti: Kellottuisiko Intelin 14nm++:lla tehty GPU korkeammalle kuin TSMC 16nm prosessilla tehty? Jos pysytään vain kellottuvuudessa ja unohdetaan lämpörajoitteet sun muut. Voisin vahvasti veikata kellottuvan. Tulihan AMD:lla ongelmaa RX- ja Vega-sarjojen lämmöntuoton kanssa kun piti saada piirit kellottumaan ja/tai saannot koviksi mutta prosessi ei tarjonnut hyviä mahdollisuuksia kellottaa korkealle. Toimii se noinkin päin.
Core i3-8121U on ollut jo jonkin aikaa myynnissä. Joten "mitään toimivaa ei saada ulos" on paskapuhetta.
"10nm"llä vaan saadaan ulos huonompia piirejä kuin "14nm++"lla. Tällöin se "14nm++"-prosessin hyvyys nimenomaan johtaa siihen, että "10nm" prosessia ei kopioida muihin tehtaisiin ennen kuin sillä saadaan tehtyä parempia piirejä ja/tai halvemmalla kuin "14nm++"lla.
Halvemmalla sillä todennäköisesti saisikin tehtyä, jos toimisi kunnolla.
Core i3-8121U toimii. Ja sitä valmistetaan kannettaviin.
Saatavuus oli Q2/2018, en löytänyt mistään myynnistä kannettavaa jossa kyseinen prosessori olisi. Ehkei kirjaimellisesti päde tuo lausahdus "mitään toimivaa", hyvin lähellä käytäntöä se kuitenkin on.
höpöhöpö. Se on jo myöhästynyt ne pari vuotta, mutta on jo pienessä mittakaavassa tuotannossa.
Todella pienessä kun on yksi tuote jota ei saa mistään. NUC:n myös tungettu samaa piiriä ja sama homma: ei saa juuri mistään.
Mittakaava on siis marginaalisen pieni puhuttaessa prosessorin saatavuuden tasolla. Puhuttaessa valmistusprosessin tasolla, voidaan sanoa ettei mitään saatavuutta ole.
Tämä i3-8121U:n tapaus on kyllä outo. Intel ei listaa sille edes hintaa omilla sivuillaan:
Intel® Core™ i3-8121U Processor (4M Cache, up to 3.20 GHz) Product Specifications
Samoin vaikka se on kategorisoitu luokkaan "8th Generation Intel® Core™ i3 Processors", sen luokan listauksessa sitä ei näy:
8th Generation Intel® Core™ i3 Processors Product Specifications
Oma veikkaus, että ainoa syy siihen, miksi se on markkinoilla, on se, että joku pomo on saanut bonuksia kun on saatu edes jonkinlainen 10 nm tekele markkinoille, vaikka myymisessä ei olekaan suuremmin järkeä.
Aivan, Q2'18 launch datella tuotteita luulisi olevan reilusti myynnissä jo mutta ei ole käytännössä ollenkaan. Mikä tietenkin viittaa siihen ettei valmistusprosessi toimi edes vähää alusta. Riskituotannon riskituotannon riskituotanto tasolla korkeintaan.