Järeä tehotyöasema muistikaistarajoitteiseen työhön

Liittynyt
17.10.2016
Viestejä
5 790
Olisi tarve päivittää työasemaa sellaiseksi, että isompien LLM:ien lokaali inferenssi onnistuu siedettävällä nopeudella. Kun aloin selvitellä vaihtoehtoja, kävi ilmi että valinnanvaraa on yllättävänkin paljon. Siksi kyselisinkin mille pohjalle porukka täällä lähtisi rakentamaan moista? Alla listattuna joitain rajoitteita ja ajatuksia eri osa-alueista.

GPU:
Pinkkaa ei ole 2x80GB tai 4x48GB kortteihin, joten realismia on ajaa CPU+GPU inferenssiä, silloin kun isommista (kvantisoimattomista) malleista kyse. GPU-päivitys on tarkoitus tehdä vasta Nvidian seuraavien työasemakorttien julkaisun jälkeen (oletetuksena sen tapahtuminen vuodenvaihteen 24/25 tienoilla), ja nitkutella siihen asti nykyisellä V100:lla. Todennäköisesti tuossa päivityksessä sitten tullaan tavoittelemaan nopeus/hinta-suhteeltaan järkevää komboa 80-96 GB VRAM:illa. Jos korttien nykyhinnoittelua katsoo, niin todennäköinen skenaario on 2 kappaletta jotakin työasemakorttia.

RAM:
Määrällisesti muistia tarvitaan nykyaikaisten 70B mallien kanssa 70B * 2 tavua = 140 GB, ja siihen sitten OS:lle ja muulle "ylimääräiselle" tauhkalle omansa, eli käytännössä 192GB on järkevä minimi. Ajettaessa CPU+GPU inferenssiä, käytännön pullonkaula on muistikaista, eli tämän optimointi niin muistikanavien kuin muistien nopeudenkin osalta on yksi avaintekijä tässä kokoonpanossa.

CPU:
Kun nyt järeämpää konetta muutoinkin kootaan, niin ehkä järkevää on lähteä liikenteeseen 16-ytimisistä prossuista. Kokoonpanon ikääntyessä voi sitten tarpeen vaatiessa vaihtaa järeämpää tilalle, kunhan käytettynä niiden hinnat on tulleet vähän alas.

SSD/HDD:
Datat istuu verkkolevyllä 10 Gbe verkon päässä, eli koneelle itsessään ei tarvita kovin kummoista tallennustilaa. Joku perus PCIe 5.0 NVMe 1-2 TB tilalla riittää mainiosti.

Emolevy/kotelo/PSU:
Tarkoitus on koota työpöytäkone, eli räkkiasenteiset laitteet jätetään tällä kertaa hyllyyn. Koska koneella on myös muuta käyttöä, niin yleisesti ottaen modernit liitännät (USB ym.) on plussaa, eli kaikista karsituimmat serverilankut ei houkuttele. Virtalähde ylimitoitetaan niin että kokoonpanoon voi myöhemmin sen puolesta lisätä surutta nuo aiemmin mainitut 2 näytönohjainta.

Jos uutena hankkisi, niin hintaa esim. Threadripper Pro-pohjaiselle kokoonpanolle tulisi helposti 5600e (ALV0), ilman että kauheasti säästelee mistään. Mutta mitä mieltä muut, löytyykö esim. Xeonista tai Epycistä haastajaa?
 
Liittynyt
16.10.2016
Viestejä
752
Kyllähän se Threadripperi (tai Epyc) on ainut vaihtoehto, jos tarvitaan paljon PCI-e linjoja niille myöhemmille näytönohjaimille, ja muistikaistaa. Xeonit eivät ole itselle oikein tuttuja, mutta ymmärtääkseni yleinen konseus on se, että AMD dominoi joka alalla, niin työpöytä-, workstation-, kuin palvelinhommissakin.

(Budjettivaihtoehto voisi olla perus X670 ProArt emo (x8/x8 Gen5 CPU + integroitu 10GbE), ja lyödä täyteen muistia eli 192GB, mutta se on vain dual channel eikä quad channel (TRX50) tai jopa octa channel (WRX90) kuten tuossa buildissasi on. Mutta se ei taida olla vaihtoehto ollenkaan, kun kyseessä oli juurikin se muistinopeus avaintekijänä.)

Epyc on enemmänkin palvelintavaraa ja niissä on pienemmät kellot, Threadripperillä voit jopa lyödä PBO:n päälle ja ottaa kaiken ylimääräisen irti. Silloin kannattaa harkita vesijäähdytystä, ainakin jos mennään tuosta 24-ytimisestä eteenpäin (7965WX ei ole siis 16c) - edellisen generaation 64c threadripper taisi imaista 800W PBO:lla :) Tuo PBO:n löytyminen BIOSista on kylläkin merkkikohtaista. Se myös varoittelee että takuu menisi, mutta AMD:n mukaan näin ei ole - ylikellotus ei evää takuuta. Jos prosessorin ylikellottaa rikki, takuu evätään - pelkkä PBO:n enablointi ei pitäisi mitään hajottaa.

Epyc-emolevyissä myös on aika karsitut liitännät, eli työkonekriteerisi mukaan tuo Threadripper soveltuu siihen parhaiten.

Redditissä on keskustelua, Asuksessa saattaa olla ongelmia: Should I be avoiding ASUS for new Threadripper Pro builds?

Video joka kannattaa katsoa:


Tämän jäähyn pitäisi olla parempi kuin NH-U14S, Noctualla kuulemma throttlaa:

Nuo emot syövät myös rdimmejä, jos virheenkorjaus (ECC) on tärkeää, niistä on julkaistu jopa "kellotettuja" versioita (normaalisti 4800MT/s), mutta hintakin nousee..:
(g.skillejä tarvii 2kpl)

Tuossa Define 7 XL:ssä on vain 9 PCI-e paikkaa, en kyllä tiedä minkä kokoisia nuo työasemanäyttikset ovat (1-slot?), mahtuuko tuohon yhdeksään kaikki tarvittava, myös mahdolliset lisäkortit tulevaisuudessa?

Tässä on 11kpl, ja tilaa alimman slotin kohdalla niin paljon, että ei haittaa vaikka laittaa 3-slottisen monsterin alimpaan pci-e slottiin:

Sitä ei löytynyt Datatronicilta, mutta varmaan pyynnöstä lisäävät sivuille. Löytyy kyllä eräältä kilpailijalta.. (Kaksi eri versiota, kiinteällä tai lasisella sivupaneelilla.)

1719876542854.png
 
Viimeksi muokattu:
Liittynyt
17.10.2016
Viestejä
2 568
Jos työkäyttöön tulossa niin suosittelen kyllä isojen valmistajien onsite-takuullisia koneita, että mahdollisen vian iskiessä systeemit ovat pois käytöstä mahdollisimman vähän aikaa eikä tarvitse itse lähteä mihinkään sitä koteloa kanniskelemaan. Esim. Lenovon P620 -masiinan 16-ytimisellä threadripperillä ja 8x 32 gigalla muistia (rdimm, ecc) saa noin viiteen ja puoleen tonniin. Toki siellä konfiguraattorissa on sitten kaikenlaista mitä voi ruksia mukaan, ja hinta pikkuhiljaa kipuaa.
 
Toggle Sidebar

Uusimmat viestit

Statistiikka

Viestiketjut
245 798
Viestejä
4 293 267
Jäsenet
71 723
Uusin jäsen
SamPeli

Hinta.fi

Ylös Bottom