Tässä verrattiin edellinen huippumalli vs julkaisun paras.
Vertailusi on typerä, kun saman sarjan eri piirejä julkaistiin pari kuukautta eri tahtiin.
Järkevää on verrata
saman hinnan, pii-pinta-alan tai markkinasegmentin piirejä keskenään.
GM200 oli aivan eri markkinasegmentin piiri kuin GP104, ja näiden vertaileminen keskenään on typerää.
GTX1080 Ti julkaistiin melkein vuosi myöhemmin kuin GTX1080.
... mutta GP102-piiri johon se perustuu, titan X (pascal) julkaistiin pari kuukautta GTX 1080n jälkeen.
Mutta jätit nämä titanit pois vertailustasi - perusteetta.
Piiri oli valmis, sitä ei vaan tarvinnut tuoda markkinoille tuohon markkinasegmenttiin koska kilpailua ei olltui ja 1080 pieksi mennen tullen kaikkea mitä AMDllä oli tarjolla.
Valmistustekniikka paranee ajan kanssa ja samalla parempien piirien julkaisu muuttu järkevämmäksi. Alunperin vertailu oli GTX1080Ti vs tuleva GTX2xxx huippumalli julkaisussa, ei GTX1080Ti vs joku GTX2xxx joka julkaistaan vuosi sen jälkeen kun ensimmäinen GTX2xxx huippumalli on julkaistu. Samaten jos suorituskyky samalla kellotaajuudella on vastaavalla piirillä julkaisussa lähelle 1:1, arkkitehtuuria ei ole muutettu merkittävästi ellei se sitten näy esim. selkeästi pienempänä virrankulutuksena.
Mitähän tarkoitat nyt "vastaavalla piirillä" ? Tähän mennessä olet verrannut keskenään piirejä jotka eivät ole millään järkevällä mittarilla "vastaavia piirejä".
Vertasit järeintä maxwell-piiriä KOLMANNEKSI JÄREIMPÄÄN Pascal-piiriin.
Millaisilla piireillä? Kun verrataan Intelin puolelta 32nm vs 22 nm, performance per watt on pientä jännitettä käyttävissä piireissä parantunut huimasti. Kun katsotaan mitä tapahtuu kun jännitettä nostetaan desktop prosessorien jännitteiden tasolle, parannus on lähellä nollaa. Performance per watt mittaria on huono käyttää koska se riippuu lähes täysin siitä mitä valmistetaan ja mihin kategoriaan.
Uudet valmistustekniikan nimenomaan mahdollistavat niiden matalampien jännitteiden käytön (kellotaajuutta laskematta), ja se on juuri yksi (muttei ainoa) syy siihen, miksi ne ovat energiatehokkaampia.
Kun molempia piirejä ajetaan sellaisella jännitteellä, että se juuri saavuttaa jonkun "keskitasoa" olevan kellotaajuuden, uusi valmistustekniikka tekee sen n. kaksi kertaa energiatehokkaammin.
Jos taas uutta ajetaan hiukan suuremmalla kellotaajuudella siten että käytety jännite on "suhteessa samaa tasoa" prosessin maksimi- ja minimijännitteisiin verrattuna, uusi on vähän alle kaksi kertaa energiatehokkampi. Nämä on ne tilanteet, mitä näyttiksillä tulee vastaan.
Sen sijaan kun aletaan käyttämään hyvin suuria jännitteitä maksimikellotaajuuden saavuttamiseksi, alkaa se uusikin prosessi viemään paljon sähköä. Ei relevantti tilanne näyttiksissä, paitsi ehkä Vegan kohdalla, kun AMD halusi kellottaa Vegan liian korkeisiin kelloihin.
Niillä teknisillä luvuilla ei ole mitään väliä kun katsotaan mitä saadaan aikaan käytännön tapauksessa.
Eli siis ignoraat täysin ne suoraan prosessin ominaisuuksista kertovat tekniset luvut ja ominaisuudet vain sen takia että LUULET että ne muka "käytännössä toimii" jotenkin erilailla. Eikä edes toimi.
Niinkuin oikeasti. Alkaa olemaan kyllä taas sen tason "elämäm koululais"-tason touhua että hohhoijaa.
jos et ymmärrä asioita, sitten kannattaisi yrittää opetella ymmärtämään niitä asioita, sen sijaan että alkaa väittämään että kaikki sellaiset asiat ja luvut, joita ei itse ymmärrä, on merkityksettömiä.
Ja tuosta tuon prosessin käytännön toimivuudesta:
Jos nyt verrataan vaikka esille ottamiasi GTX 980 TI:tä ja 1080 GTXää, niin käytännössä saatiin aikaan se, että
1) transistoritiheys on 1.72-kertaistunut noiden koko piirien välillä. Toki tätä hiukan huonontaa piirin reunoilla oleva IO, käytännössä ne itse logiikkatransistorit ja välimuistit pääsee skaalautumiskertoimeltaan hiukan lähemmäs kakkosta. Ollaan siis
todella kaukana siitä nelosestä, mitä sen pitäisi pitäisi olla, jos oltaisin hypätty "yhden täyden prosessisukupolven ylI".
2) energiatehokkuus on alle kaksinkertaistunut kun sen pitäisi melkein nelinkertaistua jos oltaisiin hypätty "yhden prosessin" yli.
Että väitteesi että "käytännän vaikutus olisi paljon suurempi kuin yhden sukupolven vaikutus, käytännössä kahden luokkaa" on täyttä puppua.
Huomioiden arkkitehtuurin aiheuttamien parannusten olevan käytännössä nolla
Parempi framepuskuripakkaus vähentää selvästi muistiliikennettä. Muistin käyttö on suurimpia virrankulutuksen aiheuttajia näyttiksillä. Eli osa siitä hiukan alle kaksinkertaisesta energiatehokkuuden parantumisesta johtuu nimenomaan arkkitehtuurillisesta muutoksesta. Jäljelle jääväksi valmsitustekniikan osuudeksi jää siis selvästi alle 2x.
, GTX980Ti vs GTX1080 tapauksessa voidaan puhua yhden valmistustekniikan yli hyppäämisestä kun katsotaan mitä saatiin käytännössä aikaan edellinen huippumalli vs uuden tekniikan julkaisun huippumalli.
"julkaisun huippumalli" on täysin irrelevantti asia kun toisessa huippupiiri julkaistiin heti, toisessa
3kk myöhemmin. Se 3kk on ihan merkityksetön aika tuossa ja GP102n pudottaminen pois vertailusta sen 3kk takia on ihan puhdasta typeryyttä tai tarkoituksellista epärehellisyyttä.
Kuten yllä. Jos katsotaan Intelin 32nm-22nm teknisillä luvuilla, on tehty yhden sukupolven hyppäys. Kun katsotaan käytännössä desktop prosessoreissa, voidaan puhua 22nm:n kohdalla hädin tuskin 32nm+:sta.
Pinta-ala:
Yksi Ivy Bridge-ydin vie n. 19.5mm^2 pinta-alaa. (2c ja 4c GT2-versioiden pinta-alat 121 vs 160 mm^2)
Yksi Sandy Bridge-ydin vie n. 33.5 mm^2 pinta-alaa. (2c 4c GT2-versioiden pinta-alat 149 vs 215 mm^2)
Koko piirejä ei siis voi suoraan järkevästi verrata keskenään, koska ivy bridgessä on paljon järeämpi näyttis ja selvästi isommat välimuistit yms.
Ytimen pinta-ala on siis pudonnut 58%iin kun valmistustekniikka on vaihdettu "32nm" -> "22nm".
Tämä on hyvin lähellä sitä puoleen putoamista, mikä uudesta prosessista pitäisi tulla, vaikka Ivy Bridge-ytimessä on myös lisätty jonkin verran toiminnallisuutta, jonka takia siinä on enemmän logiikkaa (F16C- ja rdrand-käskyt, järeämpi jakolaskuyksikkö, mov-käskyjen suoritus renameamalla)
Suorituskyvystä taas:
Desktop-prosessorit pyörii täysin erilaisilla jännitteillä ja täysin eri kohdassa sitä jännite-kellotaajuus-virrankulutus-käyrää kuin näyttikset.
Siitä huolimatta:
The Intel Ivy Bridge (Core i7 3770K) Review
Anandin testeissä esim. x264:ssa 3770k oli 10% nopeampi kuin 2600k, mutta silti 3770k:lla koko systeemin virrankulutus oli vain 82% 2600k:n virrankulutuksesta.
Tästä virrankulutuksesta ivy bridellä n. puolet oli käytännössä muuta kuin CPUn kulutusta, ja näiden muiden osien kulutus lisääntyi ivy bridgellä kun tehtiin enemmän työtä.
Tästä saadaan laskettua että käytännössä itse ivy bridge-prosessorin virrankulutus oli alle kaksi kolmasosaa sandy bridgen virrankulutuksesta, VAIKKA se teki 10% enemmän työtä.
Päästään aika lähelle sitä energiatehokkuuden tuplaantumista.
Ja tässä vielä verrattiin prossuja joista toinen oli valmistetu "kypsällä" versiolla "32nm" tekniikasta ja toinen "22nm" prosessin varhaisella versiolla.
Jonkun devils canyonin aikaan prosessi oli kypsynyt tästä aika paljon lisää ja ero "32nm" prosessiin oli taas jo selvästi suurempi.
Että väitteesi siitä että intelin "22nm" ei tarjonnut juuri mitään parannusta "32nm" prosessiin on täyttä puppua.
Tietysti, myös GF mokasi 20nm prosessin kanssa. Tietenkin lähes kaksinkertainen aika kehittää valmistusprosessia myös auttaa saamaan suuremman parannuksen.
Mitään "suurempaa parannusta" ei vaan ollut.
Energiatehokkuus parani alle kaksinkertaisesti, kellotaajuuksia voitiin nostaa n. 1.5-kertaisesti ilman että energiankulutus ja lämpörajat alkoi paukkua.
Ja transistoritiheys parani alle 2-kertaisesti.
Totta kai saadaan jos halutaan ja ollaan valmiit karsinmaan tuloista. Mitään teknistä estettä ei ollut julkaista GTX1080Ti:ta samaan aikaa kuin GTX1080:a. Näytönohjaimien koko poikkeuksetta kasvaa kun valmistustekniikka kehittyy ja saannot paranevat. Mikään ei estä Nvidiaa julkaisemasta jättipiiriä heti kun 7nm tekniikka toimii joten kuten. Huonoilla saannoilla ei tule yhtä paljoa voittoa kuin tulee tekemällä ensin maltillisemman kokoista.
Tämä siis massamarkkinoille. Huonot sannot tarkoittavat ettei sieltä tule heti alussa jättipiiriä vaan sellainen joka järkevästi pystytään tekemään hyvillä saannoilla. Vahvasti veikkaan ettei sellainen piiri ole lähelläkään sitä parannusta vs GTX1080Ti mitä oli GTX1080 vs GTX980Ti.
GV100 josta tensoriyksiköt poistettu ja muistirajapinta vaihdettu ei olisi mikään "jättipiiri" "7nm"llä.
TSMC "7nm" prosessi on 2.74 kertaa tiheämpi (mitattuna SRAM-solun koolla) kuin TSMCn "16nm" prosessi. Se on siis
ihan oikeasti "puolentoista sukupolven hyppäys" siitä "16nm" prosessista tiheydeltään. (log2 (2.74) == 1.454)
Jos koko piiri skaalautuisi tuolla kertoimella, täysi GV100 valmistettuna "7nm"llä olisi vain 297mm^2.
Käytännössä piirin reunoilla oleva IO ei skaalaudu ihan täydellä kertoimella, mutta tensoriyksiköt poisjättämällä ja vähemmän pädejä käyttävään muistitekniikkaan vaihtamisella säästöä olisi varmaan hiukan enemmän kuin mitä näiden huonompaan skaalaamiseen menetetään. Lopputulokseni ehkä joku ~280mm^2 piiri, pienempi kuin GTX1080/GP104 ( 314mm^2), puolessa välissä polaris 10n(rx 480) ja gtx 1080n kokoa.
Kun edellisessä sukupolvessa AMD ja Nvidia julkaisivat keskisarjan piirit (RX480 ja GTX1060), ne olivat hämmästyttävän lähellä nopeudessa huomioiden ettei kumpikaan varsinaisesti tiennyt mitä kilpailija tarkalleen tekee ja valmistustekniikatkin olivat erilaiset. Molemmat tekivät keskisarjan kortin siihen sweet spotiin mikä hyvillä saannoilla onnistuu ja Nvidia skaalasi paremmat piirit sen mukaan (1070 ja 1080).
.. paitsi että AMDn piiri oli näistä 16% isompi, vaikka se valmistettiin n. 9-15% (*) tiheämmällä valmistustekniikalla. Eli AMDn piiri olikin logiikkamäärältään n. 25-30 % suurempi.
AMDltä tarvittiin siis n. 25-30% enemmän logiikkaa saman suorituskyvyn saavuttamiseen.
On melko helppo veikata seuraavan sukupolven GeForcen "mid end" piirin "GTX2060" (jos sellainen tulee) olevan valmistusteknisesti sweet spot ja parempien skaalautuvan sen mukaan. Voisivat tietenkin julkaista sikahintaisen jättiläisenkin massamarkkinoille, en usko siihen koska rahallisesti siinä ei ole järkeä.
~280mm^2 piiri ei olisi mikään "sikahintainen jättiläispiiri" vaan se olisi vain n. 20% sitä sinun sweet-spot-rx480stäsi suurempi.
(*) Applen piiri oli Samsungin prosessilla(sama kuin GFn prosessi) 9% pienempi kuin TSMCn prosessilla, mutta SRAM-solun koko on jopa 15% pienempi.