AMD julkaisi 64-ytimisen Ryzen Threadripper 3990X -prosessorin

  • Keskustelun aloittaja Keskustelun aloittaja Kaotik
  • Aloitettu Aloitettu
Sitä hetken miettii, että onpas prossun hinta karannut korkeaksi, kun ei ole kilpailua. Sitten sitä miettii, että muutama vuosi takaperin olisi tarvittu useita palvelimia samaan räkkiin, jotta saadaan sama ydinmäärä mitä nyt tarjotaan asennettavaksi yhteen prossukantaan. Kokonaiskustannuksissa siis selvä voitto, eikä ne Intelin kivet yksittäinkään ole halpoja olleet.
Muutama vuosi sitten HP:n serveri setti vastaavalla teholla olis maksanut noin 300-400 tuhatta. Joten ei paha kehitys kyllä ja noita saa kuka vaan jos pörssissä on painetta tarpeeksi. Itsellä ensimmäisen setin TR:ä ja siitä on tultu kyllä aika paljon ylöspäin tehoissa ja ytimien määrässä. AMD kurmottaa Inteliä nyt niin isän kädestä kun olla ja voi. Toki tässähän kulminoituu vuosien paineet altavastaajana ja nyt on ihanaa heitellä suolaa sinisiin haavoihin.

Tää oli kahdella NUMAlla?
Eli välttämättä kaikki softat ei osaa hyödyntää kokonaisuutta?
Heh...just joo. Vielä joku jaksaa yrittää jotain selittelyä tämän tiimoilta. NUMA:n suhteen ollaan siinä tilanteessa että ei enää mikään ns. iso ongenlma. Täytyy muistaa että nyt ollaan tekemisissä myös softan suhteen vähän eri tilanteessa kun ns. normi jannun pelikoneen räpeltämisessä. 1 NUMA edelleen ja tehoa riittävästi vs. Intel. Toki jossain se ahdistaa niin vitetävästi kun on tajuttu että ei vaan nappaa enää nämä Intelin rahastus mallit yntään enää.

Pitää tosiaan muistaa se että TR on kuluttajaprossu ja EPYC konesaleihin tarkoitettu. Niissä on aika paljon eroja keskenään ja siksi vertailu on aika vaikeaa. TR:llä on varmasti tilausta kuvankäsittelyyn, autocad, videoeditointi jne. Mutta EPYC on ihan palvelinpuolen rautaa vaikka samat ytimet siellä on käytössä.
 
Viimeksi muokannut ylläpidon jäsen:
Vauhtisokeushan ihmisille on näiden suhteen iskenyt. Pari vuotta sitten nuita 16-ytimisiä Threadrippereitä kuolattiin ja mietittiin että olisiko sellaiselle käyttöä kotona. Intelin 10-ytiminen HEDT-prosessori maksoi tonnin ja emolevy 300-500. Intelin 18-ytiminen palvelinprosessori maksoi 5000e (maksaa vieläkin Intel Intel Xeon E5-2699 v4, LGA2011-3, 2.2GHz, 55MB, Tray - 4 878,00€). Nuihin kun vertaa niin varsin halpaahan tämä on.
Saattaa osa miettiä kotiin kalleinta TR:ää "työasemaksi" ja EPYC sitten kellariin pyörittämään pelipalvelinta ja "virtuaalikoneita". Peleihin sitten Inteliltä joku, millä saa yhden coren @ 6 GHz. Minusta tuo vauhtisokeus on pahentunut juuri sen takia, että tehokasta rautaa on suhteellisen halvalla eikä niinkään sen takia, että olisi tarvetta. Asia on heti eri jos tekee oikeasti palkkatyötä jollain kodin koneella, mutta jos ei, niin vaikea perustella välillä, miksi se video pitää renderöityä 10 minuutissa 15 minuutin sijaan ja miksi kerneli pitää kääntää 300 kertaa päivässä, jos ei edes devaa sinne ajureita.
 
offtopic:
En nyt puolustele Windowsia mitenkään Unix-miehenä, mutta WTF mikä vertailu! Otetaan Windowsilla joku määrittelemätön buildi ja verrataan sitä -march=native gcc-buildiin? (-march=native optimoi käytettävälle CPU:lle, ml. kaikki cachelinet, cachet, tlb:t, uudet fiitsörit ml avx:t, etc., tulokset voivat olla kapeissa testeissä todella paljon parempia kuin geneerisen building joka on optimoitu ehkä -march=core-i7 yhteensopivuuden takia).

Jos vertailu olisi tehty kunnolla, softat olisi käännetty vaikkapa Intelin kääntäjällä oletuksilla kummallekin alustalle. Tulokset voisivat olla varsin erilaisia. Todennäköisesti Linux olisi edelleen nopeampi, mutta ei noin paljoa.
Intelin kääntäjä aika absurdi veto tähän, kun valtaosa kääntäjäkehityksestä on GCC/LLVM-maailmassa eikä monenkaan ohjelman kääntyvyyttä edes testata Intelin kääntäjän kanssa.

Ainakin yksi mikä tulee mieleen vastahuomiona on, että march=native -optimointi on aika paljon vaikeampi tehdä Windows-maailmassa. Mieluummin kaivan silmäni haarukalla päästä kuin alan käännellä Windowsiin työohjelmia uusiksi eri käännösvivuilla. Jossain Archissa/Gentoossa paketin kääntö uusiksi on ihan triviaali. Laitat esim. makepkg-vipuihin halutut vivut ja käännät paketin makepkg. Jos ei käännykään vaikka -O3:lla, niin ei huolta, vanha paketti toimii yhä. Jos taas kääntyy, niin makepkg -i ja käynnistyy suoraan normaalisti valikosta. Niin helppoa, että tuota oikeasti tulee tehtyä, jos tehokkuus kiinnostaa.
 
Intelin kääntäjä aika absurdi veto tähän, kun valtaosa kääntäjäkehityksestä on GCC/LLVM-maailmassa eikä monenkaan ohjelman kääntyvyyttä edes testata Intelin kääntäjän kanssa.

Ainakin yksi mikä tulee mieleen vastahuomiona on, että march=native -optimointi on aika paljon vaikeampi tehdä Windows-maailmassa. Mieluummin kaivan silmäni haarukalla päästä kuin alan käännellä Windowsiin työohjelmia uusiksi eri käännösvivuilla. Jossain Archissa/Gentoossa paketin kääntö uusiksi on ihan triviaali. Laitat esim. makepkg-vipuihin halutut vivut ja käännät paketin makepkg. Jos ei käännykään vaikka -O3:lla, niin ei huolta, vanha paketti toimii yhä. Jos taas kääntyy, niin makepkg -i ja käynnistyy suoraan normaalisti valikosta. Niin helppoa, että tuota oikeasti tulee tehtyä, jos tehokkuus kiinnostaa.

Gentoo/Arch-käyttäjien osuus kaikista Linux-käyttäjistä on olemattoman pieni.

Suurin osa normaalin linux-työasemista ajaa jotain Ubuntua tai Fedoraa tms. ja suurin osa softista asennetaan binääripaketteina repositoriosta, ja siellä repossa on lähinnä 32-bittiset P6-versiot sekä 64-bittiset versiot.

Ja sitten kaupalliset tehotyöasemasoftat tulee myös binääripaketteina muista lähteistä.

Esim. omaan työkoneeseeni olen käytännössä käännellyt itse vain LLVM-kääntäjän sekä omat softamme. Ja LLVMnkin olen käännellyt itse lähinnä sen takia, että omat softamme käyttävät sitä ja vaativat siitä hiukan patchätyn version.
 
Vauhtisokeushan ihmisille on näiden suhteen iskenyt. Pari vuotta sitten nuita 16-ytimisiä Threadrippereitä kuolattiin ja mietittiin että olisiko sellaiselle käyttöä kotona. Intelin 10-ytiminen HEDT-prosessori maksoi tonnin ja emolevy 300-500. Intelin 18-ytiminen palvelinprosessori maksoi 5000e (maksaa vieläkin Intel Intel Xeon E5-2699 v4, LGA2011-3, 2.2GHz, 55MB, Tray - 4 878,00€). Nuihin kun vertaa niin varsin halpaahan tämä on.
Xeonien vertailu on siitä hankalaa, että suuryritykset maksaa niistä jotain ihan muuta kuin listahintoja. Tiedustelin juuri 3970x tasoisen tupla-xeonilla varustetun tehotyöaseman hintaa ja koko työasema muisteineen yms. ja tehokkaalla RTX-quadrolla varustettuna maksoi suunnilleen sen mikä pelkkien prossujen listahinta oli. Kasailin vk.comista vastaavan 3970x kokoonpanon, ja hintaero oli yllättävän pieni - käytännössä olematon jos huomioi asentamiseen kuluvan ajan.

Tämä muuttaa kyllä pelin täysin, kun vastaavan tehoisten xeoneiden hinta karkaa käsistä isoillakin firmoilla.
 
Xeonien vertailu on siitä hankalaa, että suuryritykset maksaa niistä jotain ihan muuta kuin listahintoja. Tiedustelin juuri 3970x tasoisen tupla-xeonilla varustetun tehotyöaseman hintaa ja koko työasema muisteineen yms. ja tehokkaalla RTX-quadrolla varustettuna maksoi suunnilleen sen mikä pelkkien prossujen listahinta oli. Kasailin vk.comista vastaavan 3970x kokoonpanon, ja hintaero oli yllättävän pieni - käytännössä olematon jos huomioi asentamiseen kuluvan ajan.

Tämä muuttaa kyllä pelin täysin, kun vastaavan tehoisten xeoneiden hinta karkaa käsistä isoillakin firmoilla.
Toisaalta firmat saanevat jopa niistä Threadrippereistä (eikä vain Xeoneista ja Epyceistä) listahintaa pienemmät hinnat kun sopivissa määrin ostetaan
 
Onko yhdelläkään yritysrautaa myyvällä valmistajalla Threadrippereitä tarjolla valikoimissaan?
 
Onko yhdelläkään yritysrautaa myyvällä valmistajalla Threadrippereitä tarjolla valikoimissaan?
Luultavasti kaikilla jotka tekevät myös kuluttajakoneita. Eli käytännössä kaikilla paitsi Supermicrolla ja ehkä HPE:llä, jos se lasketaan erilliseksi kuluttaja-HP:sta?
(en tiedä mitä kaikkia nykyään lasketaan "yritysrautaa" tarjoaviksi)
 
Tarkoitin lähinnä näitä yrityksiä HP, Lenovo, Dell jne. joilta firmat työasemiaan ostavat. Mulle ei ole osunut silmiin yhtäkään TR-työasemaa, ja ennen kuin AMD saa tuotteitaan näille valmistajille kaupattua, niin TR tulee pysymään kuluttaja-/marginaalituotteena vaikka olisi kuinka ylivertainen.

Ja jos ainoa tapa hankkia TR-työasema on kasaamalla se palikoista, niin loppukäyttäjälle prossun hinta on tasan se mitä vk.com, Jimms jne. niistä pyytää (toisin kuin Xeonien tapauksessa)
 
Viimeksi muokattu:
Gentoo/Arch-käyttäjien osuus kaikista Linux-käyttäjistä on olemattoman pieni.

Suurin osa normaalin linux-työasemista ajaa jotain Ubuntua tai Fedoraa tms. ja suurin osa softista asennetaan binääripaketteina repositoriosta, ja siellä repossa on lähinnä 32-bittiset P6-versiot sekä 64-bittiset versiot.
Tarkoitus ei ollut sanoa, että Linuxistit käyttäisivät juuri noita distroja. Siitä on itsellä aikaa kun tullut mainstream-distrolla käännettyä mitään, joten enpä viitsinyt niiden osalta kommentoida. Fedora tai Ubuntu lienee hiukan työläämpi, mutta valintakysymyksiä nämä. Ainakin debian-pohjaisissa on aika selkeä kehikko pakettien kääntöön. Sitten taas jos miettii mitä virityksiä Windows-puolella tarvitaan että saa esim. open sourcen käännettyä. Ehkä tarvitaan Visual Studio, ehkä pari runtimeä, ehkä pari .NET-runtimeä, ehkä mingw, ehkä pythonin paketointia varten lisävirityksiä. Ja toki vielä se aspekti, että kaikkea softaa ei saa lähdekoodina eikä pysty kääntämään itse.

Ehkä yksi mainitsemisen arvoinen distro on Clear Linux, jota kai jo käytetään jossain päin tuotannossakin ja distro on keskittynyt optimoimaan softaansa tavanomaista enemmän.
 
Nyt mä näkisin että AMD on asian ytimessä. :smoke:

Ensi vuonna sitten 100 ydintä. :psmoke:



AMD vertasi prosessorin suorituskykyä myös V-Ray-renderöintisovelluksessa, jossa Threadripper 3990X:ää verrattiin kahteen Intelin Xeon Platinum 8280 -prosessoriin, joissa on käytössä yhteensä 56 ydintä ja 112 säiettä. Terminator: Dark Fate -elokuvasta lainattua ruutua renderöidessä Threadripperiltä vierähti aikaa tunti ja 3 minuuttia, kun Intel-kokoonpanolla aikaa meni peräti puolitoista tuntia. Samalla muistutettiin luonnollisesti Intel-vaihtoehdon viisinkertaisesta hinnasta.

Mutta kertokaas tyhmälle, että miksi yhden hikisen ruudun renderöinti vie edelleen noin kauan aikaa? Ja millähän tätä monsteria oikein jäähdytetään?
 
Mutta kertokaas tyhmälle, että miksi yhden hikisen ruudun renderöinti vie edelleen noin kauan aikaa?
Yksinkertaistettuna laskettavaa on niin paljon. Esim. Moana-elokuvasta on julkaistu saaren 3D-malli avoimeen jakeluun. Siinä on 90 miljoonaa kolmiota/neliötä
Download Disney’s data set for Motunui island from Moana | CG Channel

Ja säteenseurannan kanssa saadaan aina visuaalisesti parempi (tai ainakin fysikaalisesti tarkempi) lopputulos kun käytetään enemmän säteitä ja annetaan niiden kimpoilla pidempään. Eli vedoksia saadaan kyllä nopeasti aikaiseksi, mutta laadukkaan renderöinnin tekeminen vie aikaa.
 
Mutta kertokaas tyhmälle, että miksi yhden hikisen ruudun renderöinti vie edelleen noin kauan aikaa? Ja millähän tätä monsteria oikein jäähdytetään?
Renderöinti tehdään vähän kuin säteenseuranta, paitsi ettei käytetä mitään tekoälyä "korjaamaan" virheitä niin kuin peleissä. Ruutujen tarkkuus on siis todella korkea.

Threadripperiin riittää esim 280mm valmisvesijäähy. Intelin tupla xeon on taas serveritason vehje, joissa pelkät tuulettimet vie reippaasti yli 100W.
 
Periaatteessa geometrian monimutkaisuus ei vaikuta juurikaan renderöintiaikoihin, Valon käyttäytymistä ei pystytä koskaan simuloimaan photonien tarkkuudella ja mitä tarkemmin valon käyttäytymistä sen kohdatessa eri materiaaleja simuloidaan, sitä kauemmin laskennassa kestää. Toy Story 3:ssa yksittäisen framen laskenta vei pahimmillaan 39h ja tämä siis Pixarin resursseilla, joten tässä ei tule kattoa ihan heti vastaan. Renderöinnissä on kyse aina ajankäytön ja laadun optimoinnista.

AMD käyttää V-Ray testejä mielellään markkinoinnissa, kun V-Ray jostain syystä toimii AMD:n prossuilla todella hyvin. Erot muissa benchmarkeissa ei ole noin suuria.
 
Ja millähän tätä monsteria oikein jäähdytetään?
Eihän 3970x kuluta esim. blenderissä kuin samat mitä 9900k @5GHz. Lämpö tuotetaan huomattavasti isommalla alalla, niin sen jäähdytyäminen pitäisi olla huomattavasti helpompaa. Tän 3990x:n tdp on sama kuin tolla 3970x:llä ja AMD:n prossut tuppaa kaikki kuluttamaan saman verran sähköä jos niillä on sama tdp.

tldr. joku noctuan trx4 jäähy riittää helposti.
 
Renderöinti tehdään vähän kuin säteenseuranta, paitsi ettei käytetä mitään tekoälyä "korjaamaan" virheitä niin kuin peleissä. Ruutujen tarkkuus on siis todella korkea.

Renderöinti on yleisnimitys kaikelle grafiikan piirtämiselle jonkun tietokoneella jonkun geometrian pohjalta.

Säteenseuranta on yksi tapa tehdä renderöintiä, toinen yleisempi tapa on rasterointi.
Ja nämä kaksi toimivat täysin eri periaatteella.

"perinteset 3d-kiihdyttimet" on tehty nopeuttamaan rasterointia.

Säteenseurannalla ei ole mitään tekemistä minkään tekoälyn kanssa. nVidia vaan käyttää polunjäljityksensä (eräs tietty tapa tehdä säteenjäljitystä) kohinanvaimennukseen neuroverkkoa.


Ja V-ray ei tee "vähän kuin säteenseurantaa" vaan se tekee säteenseurantaa.
 

Statistiikka

Viestiketjuista
261 467
Viestejä
4 538 792
Jäsenet
74 801
Uusin jäsen
yliz

Hinta.fi

Back
Ylös Bottom