Applen CPU:t -keskustelu (M1, M1 Pro, M1 Max...)

Joku arvostelija oli törmännyt ongelmiin useiden x86-softien kanssa. Ihmetyttää kyllä, että miksi kukaan käyttäisi Macin kanssa jotain Edge-selainta. En edes tiennyt, että se on saatavilla Macille.
Toimii yhtä nopeasti kuin Chrome, mutta huomattavasti pienemmällä muistinkäytöllä ja paremmalla akunkestolla. Macbook Pro 16 ja edge käytössä.
 
Sama softa se on, käännetty vaan eri alustalle. Ja joo, huomaa hyvin että ollaan appleketjussa ku ihmiset massoittain esittää että kaikki nopeutuminen johtuu (epäreilusta) softaoptimoinnista, koska sehän on aivan mahdoton ajatus että apple osaisi suunnitella prosessorin.

Tuohan on todella hyvä prossu ja hyvä launch applen arm työpöytäprossulle. Kiinnostaa lähinnä tietää mikä on raudan tuomaa nopeutta ja mikä softan.

Toivottavasti io-tech ottaisi äkkiä testiin yhden M1 laitteen niin saataisiin tähän keskusteluun vähän näkökulmaa.
Sitten pari sanaa yleisesti. Mistä ihmeestä tämä Apple kielteisyys johtuu? Olen käsittänyt että yleinen mantra on, koska se on suljettu järjestelmä? Mitä haittaa siitä on? Sekö että piraattisoftia ei ole niin paljoa?

Suljetut järjestelmät ovat yleisesti ottaen melko persiistä, koska olet silloin lukossa niihin. Otetaan vaikka Mac Pro. Siihen ei tullut KUUTEEN vuoteen päivityksiä. Tehoissa PC meni menojaan ja olit jumissa alustaan. Alalla jossa työskentelen ammatilaiset joutuivat vaihtamaan pc-rautaan, kun omena oli keskittynyt iphoneihin.

Tälläkin hetkellä Apple on jumissa (toistaiseksi) Intelissä. Tehoissa AMD vie tehotyöasemissa Inteliä kuin pässiä narusta. Onneksi sentään AMD-sai nyt näyttispuolella jotain tehokkaita kortteja ulos, mutta jos käyttäisit applea, niin olet ollut jumissa amd:n näyttiksiin vuosia.

MacOS ei ole varsinaisesti suljettu järjestelmä - Kuka tahansa voi koodata sille ohjelmia, kääntää ne konekielelle ja ajaa miten lystää.
Prossut, muistit ja SSD:t ovat tietty Mac-tietokoneissa emolle juotettuna, mutta niinhän ne ovat monissa Windows-läppäreissäkin. Ei esim. MS Surfaceihin voi mitään vaihtaa ostamisen jälkeen. Silti jengi ei valita läheskään samalla tavalla noista, joten lievää kaksinaismoralismia on kyllä paikoin ilmassa.

Mitä kaksinaismoralismia? Jos joku tekee pc-puolella vaikka kertakäyttöisen läppärin, niin silti on varaa valikoida 1000 muusta vaihtoehdosta. Kun Apple tekee jotain, niin se on ota tai jätä. Harmi vaan jos softa on saativilla vain Applen laitteilla. Tuskin Apple enää kauaa sallii sovelluksia kaupan ulkopuolelta. 5 vuoden päästä lukossa koko alusta.
 
Nyt tuli huhuja M1X:stä (ei välttämättä lopullinen nimi), jossa olisi 8+4 ydintä ja joka tulisi ensin 16" Macbook Pro:hon. Tosin samantapaisia huhuja on pyörinyt aiemminkin.
Tuo vie sit aivan kaikkia mobiilipiirejä, ja suurinta osaa työpöytäprossujakin, kuin litran mittaa. Ainoastaan AMD:n useamman chipletin prossut on relevantteja tuon jälkeen, jos tekee jotain mitä voi applen ympäristössäkin tehdä ja ei karsasta kyseistä ympäristöä jostain syystä.
 
Viimeksi muokattu:
Tässä kun olen jonkun aikaa höpissyt mahdollisesta L1-cachen virtuaalisesta accessoinnnista niin tässä on itseasiassa todiste, ei satavarma kun en tiedä käytettyä TLB-trash algoritmiä. Mutta sekä L1 että TLB ovat erillisiä cacheja ja L1 TLB:n koko ei riitä kattamaan koko L1-cachea TLB-trashissä, eli jossa joka L1-linja varataan eri TLB-sivulta. TLB ei missaa L1:ssä -> L1 accessoidaan virtuaalisesti ja mahdollinen TLB-tarkistus tehdään vaiheessa jossa sen käännös ehtii tulla myös L2-tlb:stä. Tai koko TLB-käännöstä ei tehdä L1-accessissa.

Saman tuloksen saa aikaan ihan perus VIPT-cachellakin. Siinä siis linjan haku alkaa yhtä aikaa TLB-tarkistuksen kanssa, ja jos koko L1 kakun sisällön muistiosoitteet eivät ole TLB:ssä niin sitten träshää. Käsittääkseni 64-bittisellä ARM:illa Applella virtuaalimuistisivun koko on 16kB, eli 128kB cachessa olisi 8 "way"ta, ja 192:sessa olisi 12.
 
Tuo vie sit aivan kaikkia mobiilipiirejä, ja suurinta osaa työpöytäprossujakin, kuin litran mittaa. Ainoastaan AMD:n useamman chipletin prossut on relevantteja tuon jälkeen, jos tekee jotain mitä voi applen ympäristössäkin tehdä ja ei karsasta kyseistä ympäristöä jostain syystä.
No, katsotaan nyt - ei M1:nen ainakaan Macbook Pro 13:sessa niin totaalisen suvereeni ole verrattuna 4800u:hun, etteikö tuosta jotain kilpailua saataisi aikaan. Intelillähän ei ole mitään kilpailukykyistä 8-core-mallia tarjolla, kun nuo 14nm kiukaat hörppivät energiaa aivan tolkuttomasti.
 
MacOS ei ole varsinaisesti suljettu järjestelmä - Kuka tahansa voi koodata sille ohjelmia, kääntää ne konekielelle ja ajaa miten lystää.

Prossut, muistit ja SSD:t ovat tietty Mac-tietokoneissa emolle juotettuna, mutta niinhän ne ovat monissa Windows-läppäreissäkin. Ei esim. MS Surfaceihin voi mitään vaihtaa ostamisen jälkeen. Silti jengi ei valita läheskään samalla tavalla noista, joten lievää kaksinaismoralismia on kyllä paikoin ilmassa.

Taitaa olla yhden käden yhdellä sormella laskettavissa se prosentti käyttäjiä, joka kannettavalle koneelle mitään rautamuutosta tekee sen jälkeen kun se on kaupasta ulos kannettu.
 
No, katsotaan nyt - ei M1:nen ainakaan Macbook Pro 13:sessa niin totaalisen suvereeni ole verrattuna 4800u:hun, etteikö tuosta jotain kilpailua saataisi aikaan. Intelillähän ei ole mitään kilpailukykyistä 8-core-mallia tarjolla, kun nuo 14nm kiukaat hörppivät energiaa aivan tolkuttomasti.
Onhan sieltä tulossa 8-ytiminen Tiger Lake-H, mutta saa nähdä että milloin ja mihin hintaan. M1 lienee todennäköisesti joka tapauksessa energiatehokkaampi.
 
No, katsotaan nyt - ei M1:nen ainakaan Macbook Pro 13:sessa niin totaalisen suvereeni ole verrattuna 4800u:hun, etteikö tuosta jotain kilpailua saataisi aikaan. Intelillähän ei ole mitään kilpailukykyistä 8-core-mallia tarjolla, kun nuo 14nm kiukaat hörppivät energiaa aivan tolkuttomasti.
Ainoat asiat joissa 4800u tuottaa isommat lukemat on virrankulutus ja yli neljälle säikeelle jakautuvat kuormat.
 
edit: taitaa olla parempi siirtää viesti sille paremmin sopivaan ketjuun. Samin Zen-L1TLB-viestiin vastattu siis tuolla:

 
Viimeksi muokattu:
Kun kerran palstalta löytyy mikroprosessoriarkkitehtuurin ammattilaisia ja tietäjiä, mitä arvelette tämän M1-prossun skaalautuvuuden suhteen? High-perf ytimiä lienee melko yksinkertainen kasvattaa nykyisestä neljästä vaikka kuutentoista, kun nykyisissä x86:ssa löytyy 32 threadia SMT:n kanssa ja niille on kuormia jotka hyötyy tästä säiemäärästä. Samaten GPU:ta voi kaiketi leventää vielä reilusti tätä enemmänkin ennen kuin ongelmia skaalautuvuudessa tulee vastaan, vrt. vaikka AMD:n 80CU. Korjatkaa jos olen väärässä.

Entä kuinka helppoa tai vaikeaa Applen olisi kasvattaa single core perfiä nostamalla TDP:tä järeämmille macbookeille tai desktopille? Onnistuuko tämä missä määrin tai ollenkaan, ilman että ARM julkaisee tälläisen korkeamman TDP:n coren?
 
Kun kerran palstalta löytyy mikroprosessoriarkkitehtuurin ammattilaisia ja tietäjiä, mitä arvelette tämän M1-prossun skaalautuvuuden suhteen? High-perf ytimiä lienee melko yksinkertainen kasvattaa nykyisestä neljästä vaikka kuutentoista, kun nykyisissä x86:ssa löytyy 32 threadia SMT:n kanssa ja niille on kuormia jotka hyötyy tästä säiemäärästä. Samaten GPU:ta voi kaiketi leventää vielä reilusti tätä enemmänkin ennen kuin ongelmia skaalautuvuudessa tulee vastaan, vrt. vaikka AMD:n 80CU. Korjatkaa jos olen väärässä.

Entä kuinka helppoa tai vaikeaa Applen olisi kasvattaa single core perfiä nostamalla TDP:tä järeämmille macbookeille tai desktopille? Onnistuuko tämä missä määrin tai ollenkaan, ilman että ARM julkaisee tälläisen korkeamman TDP:n coren?

Ytimien määrä:

Se, kuinka helppoa ytimien määrän lisääminen riippuu lähinnä siitä, millainen on väylä- ja välimuistirakenne.

M1:ssä L2-välimuisti on jaettu kaikkien tehoytimien välillä, joten niiden määrän nostaminen ei ole kuitenkaan aivan triviaalia; jos jaetaan sen kahdeksan ytimen kesken, tarkoittaa se käytännössä lisäviiveitä siihen.

Todennäköisempi vaihtoehto on Zen1/Zen2-CCX-tyylinen clusterointi, eli tehdään kaksi (tai siis kolme) täysin erillistä L2-välimuistia, yksi palvelee joitain ytimiä, toinen toisia (ja kolmas palvelee pikkuytimiä, se siellä on jo). Tällöin sinne voisi vaan lätkäistä toisen samanlaisen neljän ytimen clusterin kuin mikä M1ssä on.

Piiriltä löytyy kuitenkin myös L3-välimuisti, joka on sitten kai jaettu aivan kaiken kanssa.

Kellotaajuus:

A13sta lähtien Applella on ollut ytimissään hiukan lyhyempi liukuhihna(pidemmät liukuhihnanvaiheet, lyhyemmät viiveet kellojaksoissa mitattuna) kuin Intelillä ja AMDllä, joten ihan saman luokan kellotaajuuksia ei ole odotettavissa mikäli mikroarkkitehtuuri on sama. Mutta kyllä siinä kellotaajudessa on silti selvästi varaa nostaa. Nyt nyt käy ilmeisesti lähempänä kolmea kuin neljää gigahertsiä, ainakin jonnekin neljään gigahertsiin pitäisi kyllä tuonkin taipua.

Tosin käynyt mielessä myös sellainen villi spekulaatio, että entäs jos Apple lyhensikin liukuhihnaansa A13ssa sen takia, että sitä tarkoituksella optimoitiin pois maksimisuorituskyvystä hiukan energiatehokkuuden suuntaan, ja eriytettiin sitten se kaikkein tehokkain microarkkitehtuuri vielä erikseen. Ja nämä pienet vähävirtaiset ekat koneet julkistettiin tuolla enemmän energiatehokkuuteen optimoidulla ytimellä, ja sitten Mac Pro:t ja Macbook Pro:n isommat mallit tulee sillä maksimisuorituskyky-mikroarkkitehtuurilla, jossa pidempi liukuhihna => AMD/Intel-luokan kellotaajuus, ja hiukan huonompi kellotaajuuskohtainen suorituskyky kuin tässä M1:ssä pidemmistä viiveistä johtuen.

Mutta ehkä Applellakaan ei kuitenkaan riitä resurssit kolmeen eri rinnakkaiseen ARMv8-mikroarkkitehtuuriversioon.
 
Yksi kysymysmerkki on myös tuo TSMC:n 5nm prosessi - kun ei ole oikein verrokkeja, niin on vaikea tietää miten se vaikuttaa kellotaajuuksiin?

Kuinka helppoa Applen olisi pultata SMT nykysiin high-perf ytimiinsä? Vai onko se turhaa, koska L1 on niin valtava, että huteja tulee vähän ja täten hyötyä tulee vähemmän?
 
Mua kiinnostaa jytkymmässä mallissa muistiratkaisu. Tehdäänkö esim. neljän tiukasti integroidun LPDDR4X-piirin ratkaisu, vai siirrytäänkö emolevyllä oleviin muisteihin (jotka kyllä nekin olisivat varmaan LPDDR4X:ää). Sitten taas toisaalta jos halutaan tehdä selvä ero edelliseen sukupolveen, jossa on vähintään Radeon Pro 5300M, niin ehkä muistikaistaakin olisi kiva olla lisää?
 
A13sta lähtien Applella on ollut ytimissään hiukan lyhyempi liukuhihna(pidemmät liukuhihnanvaiheet, lyhyemmät viiveet kellojaksoissa mitattuna) kuin Intelillä ja AMDllä, joten ihan saman luokan kellotaajuuksia ei ole odotettavissa mikäli mikroarkkitehtuuri on sama. Mutta kyllä siinä kellotaajudessa on silti selvästi varaa nostaa. Nyt nyt käy ilmeisesti lähempänä kolmea kuin neljää gigahertsiä, ainakin jonnekin neljään gigahertsiin pitäisi kyllä tuonkin taipua.

M1:sessä on 3 kellosyklin 128kB L1d. En oikeen usko että niitä taajuuksia voi siihen kovin paljon lisää repiä, ainakaan ilman että tuohon laitetaan sykli lisää viivettä.
 
M1:sessä on 3 kellosyklin 128kB L1d. En oikeen usko että niitä taajuuksia voi siihen kovin paljon lisää repiä, ainakaan ilman että tuohon laitetaan sykli lisää viivettä.

Juu, juuri tuon takia on selvää että vastaavalla valmistustekniikalla oltaisiin huomattavasti alhaisemmissa kelloissa kuin Intel ja AMD. Mutta kun valmistustekniikka on myös tällä hetkellä hiukan kehittyneempi, niin se pienentää eroa siinä millaiset kellot on saavuttavissa.
 
Viimeksi muokattu:
Laskeskelin M1-piirin olevan n. 120mm^2 pinta-alaltaan ja maksavan ~40 dollarilla huhutulla 5nm kiekon hinnalla ja TSMC:n ilmoittamalla virhetiheydellä. IBM:n ukon arvioimalla Intelin CPU:n 200 dollarin hinnalla Apple voisi teetättää 410mm^2 kokoisia järkäleitä nykyisillä saannoilla vaikka epäkelvot piirit nakattaisiin binnaamatta pihalle.

M1 on kahdella extra tehocorellaan ja neljällä GPU-yksiköllä 32mm^2 isompi kuin A14. A14-piiri sisältää 5G:n, jota M1:ssä ei ole, mutta M1:ssä on myös 4MB lisää L3-kakkua ja ymmärtääkseni myös L1-kakkua on kasvatettu. En löytänyt tietoa siitä kuinka paljon 5G edes arviolta veisi tilaa piiriltä, mutta joka tapauksessa M1-tekeleeseen voisi lisäillä suvereenisti CPU ja GPU-coreja, sekä kasvattaa muistikaistan leveyttä ennen kuin ainakaan TSMC:n toimesta hinta karkaa lapasesta.

Varmaan kuitenkin, sanotaan vaikka 40CU:n GPU, olisi järkevämpää toteuttaa erillisellä piirillä jolloin saannot paranee tuosta teoreettisesta 410mm^2 (~70% saanto) järkäleestä? Jos tehot kasvaa jotakuinkin lineaarisesti nykyisestä ja muistikaista perässä tuo olisi erittäin kilpailukykyinen GPU mobiilipuolella.
 
On toi M1 uskomaton kapistus.

Huvittavinta tuossa videossa oli kohta jossa saatiin Intel Mac mini renderöimään ulkoisen näytönohjaimen kanssa samalla nopeudella kuin M1. Tehoa Intel combo otti yli 200W kun M1 mini otti vain tuon 5.6W. Ei voi käsittää näitä eroja. On tainnut Apple on lähtenyt oikealle tielle. Vanhalla polulla saa vain maapallon lämpenemään. Herää ihmetys että miten Apple on suostunut hinnoittelemaan nämä prossut näinkin edullisiksi. Veikkaan että jollain olisi voinut olla kiusaus hinnoitella noi tehojen mukaan hintavammiksi.

1606419248358.png


1606418581447.png
 
Kaveri hommasin tuollaisen M1 Airin ja ajoi GPU-benchmarkkina Civ VI:sen graphics testiä korkeimmalla yhteisellä resolla mikä irtosi suoraan 16" MBP:n ja MBA:n valikoista.

1650x1050 (kyllä kumma reso) @ ultra / ultra + 4x MSAA

Macbook Air M1 + 16GB täyden GPU:n malli Big Surilla: 31.8fps average
Macbook Pro 16" Core i9 2.3/4.8GHz 8-core + 64GB + Radeon Pro 5500M 4 GB: 36fps average

Catalinalla MBP 16 sai 41fps, joten käyttispäivitys söi aika paljon tulosta isolta mäkiltä.

Huomioiden sen, että 5500M:ssä on 128bit GDDR6 erillismuisti ja luokkaa 50W tai vähän yli TDP siinä missä M1:nen pärjää about 10W:llä, on sekä AMD:tä, että Inteliä kyllä häpäisty tässä aika pahasti. Niin, ja Civ on tietty x86-versio, koska mac-versiota ei ole vielä päivitetty ARM-tuetuksi.
 
Kyllähän tässä isoa jytkyä viritellään. Monelta mennyt tuo potentiaali tajuamatta. Eiköhän ne pelijonnetkin herää kun naapurin Apple hipsteri vetää MacBookilla kovemmat framet tauluun kuin oma peliläppäri samalla kun polttaa sukukalleudet sylissä.
 
Tuli tilattua tällainen Macbook Air 16GB 8 coren GPU:lla.

Voin ajella testejä ja katsella jos jotakuta kiinnostaa miten tässä joku pyörii kyllä. Akku tässä kestää ihan naurettavan hyvin näin muutaman päivän kokemuksella.
 
Tuli tilattua tällainen Macbook Air 16GB 8 coren GPU:lla.

Voin ajella testejä ja katsella jos jotakuta kiinnostaa miten tässä joku pyörii kyllä. Akku tässä kestää ihan naurettavan hyvin näin muutaman päivän kokemuksella.

Hieman harmaalla alueella, mut minkälaista sun käyttö on? Miten siis eri softat toimii? Onko vertauspohjaa intel-mäkkeihin?
 
Hieman harmaalla alueella, mut minkälaista sun käyttö on? Miten siis eri softat toimii? Onko vertauspohjaa intel-mäkkeihin?
On mulla juu intelmäkkejä useampi tässä. Air on siis oma koneeni, töistä on tuollainen 16" 8-core MBP ja työpöydällä istuu iMac. Ja on vielä 13" 2-core MBP tuossa myös pyörimässä nurkissa.

Olen aika paljon benchmarkkaillut juttuja ja koittanut kääntää homebrewistä tavaraa armille. Siellä on vielä vähän haasteita kyllä, gcc:tä ei ole vielä saatu käännettyä, mikä tarkoittaa että fortran-kääntäjää ei oikeastaan ole, mikä taas tarkoittaa että numpy kääntyy, mutta ilman optimointeja mikä tekee siitä hitaan. Numpyä on huomattavan paljon nopeampi ajaa x86-emulaation läpi kuin natiivina toistaiseksi. Docker ei vielä toimi myöskään, mikä tekee ainakin minulle töiden tekemisen tällä vehkeellä melkoisen haastavaksi. Mutta sillä saralla työntävät kyllä kovaa vauhtia ja Apple on heitä auttamassa. Todennäköisimmin docker tulee ajamaan arm-linuxia applen hypervisor-frameworkin läpi ja linuxin puolella potentiaalisesti qemulla emuloivat x86:tta jos se on tarpeellista.

Olen siis jotain tuolla vehkeellä koodannut.. selaillut nettiä ja kuunnellut musiikkia, ja pelaillut factoriota, mtg arenaa ja civ 6:sta. Sensellaista. Ihan täysilläkään yrittämällä en ole illan aikana saanut akkua alle 40% tason, ihan käsittämätöntä kuinka hyvin akku kestää verrattuna esimerkiksi tuohon 16" MPB:hen. Ja yleinen käytön ripeys on ihan samalla tasolla ellei parempi. Pöytäimaccia (2015) Air vie mennen tullen palatessa, niin pelitehossa (emuloinnin jälkeenkin) kuin hyötykäytössä. 16GB muistia on riittänyt toistaiseksi, mutta heti kun virtualisaatio / docker saadaan käyntiin, se alkaa käydä kyllä ahtaaksi.
 
On toi M1 uskomaton kapistus.

Huvittavinta tuossa videossa oli kohta jossa saatiin Intel Mac mini renderöimään ulkoisen näytönohjaimen kanssa samalla nopeudella kuin M1. Tehoa Intel combo otti yli 200W kun M1 mini otti vain tuon 5.6W. Ei voi käsittää näitä eroja. On tainnut Apple on lähtenyt oikealle tielle. Vanhalla polulla saa vain maapallon lämpenemään. Herää ihmetys että miten Apple on suostunut hinnoittelemaan nämä prossut näinkin edullisiksi. Veikkaan että jollain olisi voinut olla kiusaus hinnoitella noi tehojen mukaan hintavammiksi.

1606419248358.png


1606418581447.png
Renderöintituloksia verrattaessa olisi hyvä verrata uusimpaan rautaan, missä molemmissa raudassa tuki käytetylle codecille. Eli Iris Xe, RX6000- tai RTX3000 -sarjaa sisältäviin kokoonpainoihin tässä tapauksessa. Tietysti validi vertailu vanhaan miniin verrattuna, mutta ei kerro ihan täyttä kuvaa suhteesta nykyisiin vaihtoehtoihin(tietty Applen tapauksessa ei ole muuta uutta vaihtoehtoa).

Kaikkiaan kyllä kovaa rautaa saaneet ulos ja jos tuo aiheuttaisi painetta Intelin ja AMD:n suuntaan.
 
Renderöintituloksia verrattaessa olisi hyvä verrata uusimpaan rautaan, missä molemmissa raudassa tuki käytetylle codecille. Eli Iris Xe, RX6000- tai RTX3000 -sarjaa sisältäviin kokoonpainoihin tässä tapauksessa. Tietysti validi vertailu vanhaan miniin verrattuna, mutta ei kerro ihan täyttä kuvaa suhteesta nykyisiin vaihtoehtoihin(tietty Applen tapauksessa ei ole muuta uutta vaihtoehtoa).

Kaikkiaan kyllä kovaa rautaa saaneet ulos ja jos tuo aiheuttaisi painetta Intelin ja AMD:n suuntaan.
Pitää muistaa se verrokkilaitteen sähköteho rajoittaa sinne 12 wattiin... :D
 
Pitää muistaa se verrokkilaitteen sähköteho rajoittaa sinne 12 wattiin... :D

Pointti oli että vertailu Tigerlakeen näyttäisi huomattavasti pienempää eroa, kun myös tigerlake voisi tehdä tuon omalla encoderilla ja sitä tukevalla softalla(davinci resolve studio). Tuo ei kerro sinällään mitään GPU/CPU nopeudesta tai energiatehokkuudesta, kun raskasta työtä ei tässä tapauksessa tehdä niillä.
 
Eipä tuota voi kuin ihmetellä mihin uusi M1 mac mini pystyy. Kesällä kasattu, ylikellotettu ja vesijäähdytetty iMad runnottiin videoeditoinnissa heti kumoon yli 10x pienemmällä virrankulutuksella.
Alla pari benchmarkkia:

Geekbench5:
iMad 10700k+5700xt+32GB@4000MHzCL18:
Single, multi
1415, 10290
Mac mini 512GB+16GB
Single, multi, OpenCL, Metal
1753, 7728, 19279, 21781

Timespy:
iMad 10700k+5700xt+32GB:
10822, graphics 10543

Bruce test:
iMad 10700k+5700xt+32GB: 6,6s
Mac mini 512GB+16GB: 11s

1min 51sec GH5 5K 4:2:0 HLG 10bit clip copy to library and transcode to Proress:
iMad 10700k+5700xt+32GB: 1 min 51sec
Mac Mini 512GB+16GB: 1min 36sec

7min 50sec värikorjattu projekti UHD Req. 2020 PQ timelinella, exporttaus UHD HDR 10bit H.265 videoksi Final cutista compressor exportin kautta:
iHack 10700k+5700xt+32GB: 7min 42sec
Mac mini 512GB+16GB: 3min 54sec

Muistia mac mini näytti käyttävän 10gigaa tuon 7min HDR videon exporttaukseen, intel pohjaisella 2018 13 tuuman neliydin MBProlla 16GB loppui kesken kun kone oli jauhanut exporttia melkein 2 tuntia.

Ulkoiset levyt näyttäisivät olevan M1 sirulla hiukan hitaampia kuin intelin prossuilla. Minin sisäinen levy on silti suht nopea.

Blackmagic disk speed test
Mac mini 512GB: Write 2919, READ 2875
MBP 13 2018 256GB: Write 1447, READ 2895
iMad PCIE3 970 Evo 1TB: Write 2484 Read 3066

1TB 970 Evo Tekq Rapide Thunderbolt3 kotelossa:
Mac Mini: Write 1708, Read 2530
MBP13 2018: Write 2002, Read 2612

2TB Samsung T7 USB 3.1 Gen2 levy:
Mac Mini: Write 760 Read 790
iMad: Write 860 Read 886
 
Omituisia nuo M1 scoret. Hirveä Cinebench singlecore tulos, multicore taas aivan onneton. Ja kun sitä vääntöä tarvittaisiin oikeasti videon muuntamiseen, niin sitä ei tuosta M1:stä juuri löydy. Noiden perusteella aika kehno prosessori. Tuolla ei Inteliä ja AMD:tä korvata vielä aikoihin.
 
Omituisia nuo M1 scoret. Hirveä Cinebench singlecore tulos, multicore taas aivan onneton. Ja kun sitä vääntöä tarvittaisiin oikeasti videon muuntamiseen, niin sitä ei tuosta M1:stä juuri löydy. Noiden perusteella aika kehno prosessori. Tuolla ei Inteliä ja AMD:tä korvata vielä aikoihin.
Riippuu mitä Inteliä tai AMD:tä sillä olisi tarve korvata. ei tuossa ultrabook kastissa ole tällä hetkellä Intelillä tai AMD:llä oikein tarjota mitään. Pöytäkoneet sitten ihan eriasia ja niihin Applella ei toistaiseksi olekaan mitään tarjolla, ne tulevat myöhemmin. Mutta jos katsoo että tuo M1 vie sen max 10W ja tarjoaa tuollaista.
 
Omituisia nuo M1 scoret. Hirveä Cinebench singlecore tulos, multicore taas aivan onneton. Ja kun sitä vääntöä tarvittaisiin oikeasti videon muuntamiseen, niin sitä ei tuosta M1:stä juuri löydy. Noiden perusteella aika kehno prosessori. Tuolla ei Inteliä ja AMD:tä korvata vielä aikoihin.

Toi on tuulettimeton Macbook Air. Multicorevääntöä ei ole pitkäkestoisissa jutuissa koska prossu throttlaa. Mac Minissä tai Macbook pro:ssa sama siru laittaa ihan eri tavalla vääntöä...
 
Itse asiassa M1 sirulla ei ole edes pakko välttämättä transkoodailla kun 4K H.264 ja 5K H.265:n editointi onnistuu myös suoraan transkoodaamatta Proressiksi. Mac Mini M1 näyttäisi jaksavan pyörittää kolmea 5K 4:2:0 10Bit HEVC klippiä päällekkäin ja kahta klippiä yhdellä LUT:illa ja värikorjauksilla vielä sulavasti Final cutin 3840x2160 Timelinella.

Ajelin pari transkoodaustestiäkin varulta ja niissä M1 ei 10700k+5700k komboa ihan kepitä. Mielenkiintoisesti ainoastaan H.265 10bit exporttaus on nopeampi kuin 10700k+5700xt compolla. Kyllä tällä M1 sirulla saa Applen kaupasta kerrankin sisäänheittohintaan huomattavasti enemmän tehoa kuin aiemmin isommallakkaan rahalla.
compare.png
 
Kellotaajuus:

A13sta lähtien Applella on ollut ytimissään hiukan lyhyempi liukuhihna(pidemmät liukuhihnanvaiheet, lyhyemmät viiveet kellojaksoissa mitattuna) kuin Intelillä ja AMDllä, joten ihan saman luokan kellotaajuuksia ei ole odotettavissa mikäli mikroarkkitehtuuri on sama. [...]

Tosin käynyt mielessä myös sellainen villi spekulaatio, että entäs jos Apple lyhensikin liukuhihnaansa A13ssa sen takia, että sitä tarkoituksella optimoitiin pois maksimisuorituskyvystä hiukan energiatehokkuuden suuntaan, ja eriytettiin sitten se kaikkein tehokkain mikroarkkitehtuuri vielä erikseen.

Vieläkö muistat mistä tietosi liukuhihnan lyhentämisestä A13-piireistä lähtien on peräisin? Wikipedian mukaan "pipeline depth" on säilynyt ennallaan kuudessatoissa ainakin A7-piiristä lähtien.

Viitteet wikin artikkelissa on todella kyseenalaisia, enimmäkseen näyttävät viittaavan Anandtechin vuosittaiseen analyysiin, jossa liukuhihnan pituudesta on esim. A7-piirin kohdalla sanottu vain: "Pipeline depth likely remains similar (maybe slightly longer) as frequencies haven’t gone up at all (1.3GHz)."
 
Viimeksi muokattu:
Analyysiä ja vertailua Intelin sekä AMD:n tuotoksiin:

Selittää kansantajuisesti, mutta sisältää selviä asiavirheitä. Yksinkertaistaa aisioita todella paljon ja jättää hyvin oleellisia asioita sanomatta.

Ja sotkee vielä sitä, mitkä asiat liittyvät ARMiin, mitkä appleen.

1) Heti kun alkaa puhua CPUn suorituskyvystä jättää sen KAIKKEIN OLEELLISIMMAN mainitsematta, eli:

ÄLÄ JUMITA.

Vaikka prossu pystyisi suorittamaan kuinka monta käskyä kellojaksossa, ja kävisi kuinka suurella kellotaajuudella, ei nämä lohduta, jos sen teoreettiseta leveydestä saadaan vaan murto-osa hyödynnettyä, käskyillä on monen kellojakson viive ja muististakin dataa odotellaan usein pitkään.

Tärkein syy, miksi M1 pystyy hurjaan suorituskykyyn kellojaksoa kohden on, että siinä on jättimäinen 128 kiB L1D-välimuisti, jolla vielä hyvin nopea 3 kellojakson viive, jonka ansiosta dataa ei tarvitse odotella niin paljoa. ja en taas mahdollistaa
A) Ne matalat kellotaajuudet
B) Se, että ei tarvi tukea 4 kiB virtuaalimuistisivuja.

2)
Tuossa puhutaan sitä kuinka tuo voi dekoodata 8 käskyä kellojaksossa, AMD ja Intel vain 4, mutta AMDllä ja intelillä on nykyään mikro-op-välimuisti josta pystytään kyllä hakemaan selvästi enemmän kuin 4 micro-operaatiota kellojaksossa; Zen8ssa hakemaan jopa 8, tosin rekisterien uudelleenimeäminen on silti rajoitettu kuuteen.

Se ero, mitä tuo väittää kaksinkertaiseksi, on todellisuudessa n.1.33-kertainen.

3) Tuo puhuu pelkästään etupään nopeudesta muttei verta ollenkaan prosssorien suorituspään nopeutta.

Ilmeisesti kirjoittaja on halunnut yksinkertaistaa prosessorin leveyden yhteen numeroon, missä vaan ei ole mitään järkeä.


4) Tuo ignoraa täysin liukuhinan pituuden ja sen vaikutuksen kellotaajuuksiin.

Väitttää että käy matalammilla kelloilla jotta peinempi virrankulutus, mutta todellisuduessatuo käy matalammilla kelloilla, koska siellä on lyhyempi liukuhihna joka mahdollistaa sen 3 kellojakson L3-viiveen ja muillekin asioille viiveitä, jotka ei pidemmällä, suurempiin kelloihin kykenevällä liukuhihnalla olisi mahdollisia.

Toki sitä kellotaajuutta voi hiukan tuosta lisätä, mutta ei läheskään samoihin lukemiiin kuin missä AMD ja Intel menee nyt.



5) Tuo tuntuu olevan pihalla siitä, mitä kaikkea AMDn ja Intelin nykypiireissä on sisällä sen CPUn lisäksi. Niissäkin on videokodekit, intelillä on tiger lakessa myös neuroverkkokiihdytin jne. Ei tuo eroa mitenkään oleellisesti niistä, paitsi että tuossa on vähän tehokkaampi integroitu GPU kuin Intelillä ja AMDllä, ja muistit on samassa paketissa.

Ja se mitä tuo höpöttää shared memorystä vs unified memorystä on vaan miten jaettu muisti 10 vuotta sitten eroaa jaetusta muistista nykyään. Ei sillä ole mitään tekemistä sne kanssa mitä eroa Applen vs Intelin ja AMDn muistiratkaisuista.
 
Viimeksi muokattu:
Vaikka prossu pystyisi suorittamaan kuinka monta käskyä kellojaksossa, ja kävisi kuinka suurella kellotaajuudella, ei nämä lohduta, jos sen teoreettiseta leveydestä saadaan vaan murto-osa hyödynnettyä, käskyillä on monen kellojakson viive ja muististakin dataa odotellaan usein pitkään.

Tärkein syy, miksi M1 pystyy hurjaan suorituskykyyn kellojaksoa kohden on, että siinä on jättimäinen 128 kiB L1D-välimuisti, jolla vielä hyvin nopea 3 kellojakson viive, jonka ansiosta dataa ei tarvitse odotella niin paljoa. ja en taas mahdollistaa
A) Ne matalat kellotaajuudet
B) Se, että ei tarvi tukea 4 kiB virtuaalimuistisivuja.

M1-tukee 4kb virtuaalimuistisivujakin.

Väitttää että käy matalammilla kelloilla jotta peinempi virrankulutus, mutta todellisuduessatuo käy matalammilla kelloilla, koska siellä on lyhyempi liukuhihna joka mahdollistaa sen 3 kellojakson L3-viiveen ja muillekin asioille viiveitä, jotka ei pidemmällä, suurempiin kelloihin kykenevällä liukuhihnalla olisi mahdollisia.

Edelleenkin odotan lähdettä tälle että liukuhihna olisi lyhyemp, muutakin kuin omat mutuilusi. AMD ei Zen3:een lisännyt rekisterifilen portteja koska se olisi rajoittanut kellotaajuutta. Applen coressa on tuplamäärä portteja tuplasti suuremmassa rekisterifilessä - samoilla liukuhihanpituuksilla toteutettuna AMD:n prosessorikin olisi tiputtunut kellotaajuuksiaan reilusti. Mitä suurien rekisterifileiden käsittelyn optimointeihin tulee niin useimmissa innovaatioissa on mukana ylimääräisiä liukuhihnavaiheita rekisterin käsittelyyn, Applen tuotteista ei tosin paljoa tiedetä mitän siellä tehdään mutta se on selvää että jotain tehdään hyvin eritavalla kuin AMD/Intel toteutuksissa.
 
M1 vertailua 4900HS ja RTX2060 näyttikseen. Sanomatta selvää, että RTX 2060 vie kuin litran mittaa tuota integroitua, mutta CPU-puoli ei ole paha ollenkaan, kun ottaa huomioon että M1:ssä on vain neljä teho -corea ja 13W kulutus, vrt. 8-corea jotka haukkaa 35-55W.

Alla pari poimintaa ja linkki videoon.

Chrome javascript -testi, M1:ssä (oikealla) ARM-natiivi versio:

1606935169978.png


1606935246097.png


Geekbench multicore Zephyrus 7934, M1 7523
Virtajohto irrotettuna: Zephyrus, single core 724 ja multi 5449. M1 ei muutosta.

GPU:
1606935464204.png


Ja letku irti:
1606935498558.png


Cinebench r23:
1606935594599.png


Linkki videoon, jossa myös kuvan- ja videonkäsittelytestejä yms:

 
Wccftechin jutussa valitetaan että yhden ytimen tulokset ovat väärin testattuja, kun Intelin ja AMD:n arkkitehtuurit on optimoitu SMT-koodia varten, kun taas M1 suorittaa vain yhtä säiettä per ydin. Siksi pitäisi testata kahdella säikeellä, mutta yhdellä ytimellä, jotta tulisi vertailukelpoinen tulos. Sitten on pläjäytetty Cinebench-testit päälle.

Minusta kyllä pöljä ajattelutapa. Ideahan on se, että kaikkea koodia ei pysty säikeistämään, jolloin yhden ytimen suorituskyky on tärkeä yksittäinen mittari. Sinänsä tuo kyllä osittain selittää sitä, että miksi monisäikeisissä testeissä M1 ei veny niin pitkälle kuin mitä yhden säikeen suorituskyvyn perusteella voisi odottaa.

 
Wccftechin jutussa valitetaan että yhden ytimen tulokset ovat väärin testattuja, kun Intelin ja AMD:n arkkitehtuurit on optimoitu SMT-koodia varten, kun taas M1 suorittaa vain yhtä säiettä per ydin. Siksi pitäisi testata kahdella säikeellä, mutta yhdellä ytimellä, jotta tulisi vertailukelpoinen tulos. Sitten on pläjäytetty Cinebench-testit päälle.

Minusta kyllä pöljä ajattelutapa. Ideahan on se, että kaikkea koodia ei pysty säikeistämään, jolloin yhden ytimen suorituskyky on tärkeä yksittäinen mittari. Sinänsä tuo kyllä osittain selittää sitä, että miksi monisäikeisissä testeissä M1 ei veny niin pitkälle kuin mitä yhden säikeen suorituskyvyn perusteella voisi odottaa.


Artikkelista:
1606991010412.png


Olen ymmärtänyt M1:n omaavan n. tuplasti leveämmän decoden kuin AMD:n ja Intelin prossut.

Mitä tulee M1:n huonompiin tuloksiin multicorella kuin mitä yhdellä coren tuloksista voisi olettaa, otitko huomioon että M1 on lähempänä 4-, kuin 8-ydin prosessoria, koska 4 ydintä on energiatehokkuutta varten?

Mielenkiintoinen testi, mutta kyllä ne SMT:n edut tulee multicore-testeissä ilmi, ilman että tarvii lähteä tälläin tasoittelemaan 1-thread tuloksia.
 
Mitä tulee M1:n huonompiin tuloksiin multicorella kuin mitä yhdellä coren tuloksista voisi olettaa, otitko huomioon että M1 on lähempänä 4-, kuin 8-ydin prosessoria, koska 4 ydintä on energiatehokkuutta varten?
Mun ymmärtääkseni ne 4 virransäästöydintä eivät kuitenkaan ole ihan mopoja. Itse olen olettanut, että tehobudjetti on merkittävä rajoittava tekijä.
 
Mun ymmärtääkseni ne 4 virransäästöydintä eivät kuitenkaan ole ihan mopoja. Itse olen olettanut, että tehobudjetti on merkittävä rajoittava tekijä.

Ei tästä tosiaan mitään kunnollista testiä ole vielä. Paras arvio lienee Anandtechin artikkelista:

1606996036996.png


Eli nuo neljä efficiency -corea vastaa keskimäärin n. yhtä tehocorea. Osuu myös kohdalleen kun Cinebench single-core tulosta (1500) vertaa multicore tulokseen (7500).
 
M1 Air 16gb tulee olemaan seuraava työkone toimistohommiin. 8gb varmaan riittäisi, mutta ei parille sadalle tossa väliä.
 

Statistiikka

Viestiketjuista
258 399
Viestejä
4 489 786
Jäsenet
74 154
Uusin jäsen
Almedin

Hinta.fi

Back
Ylös Bottom