NVIDIA julkisti "joka kodin supertietokoneen" Project DIGITS:n

Kaotik · 09.01.2025

NVIDIA julkisti CES-messuilla uusien GeForce-näytönohjainten ohella myös Project DIGITS -tietokoneen, jota se kutsuu maailman pienimmäksi tekoälysupertietokoneeksi, joka kykenee ajamaan 200 miljardin parametrin kielimalleja.
DIGITSin sydämenä sykkii uusi GB10 Superchip -piiri, jonka sisältä löytyy Grace-prosessorisiru 10 Cortex-X925- ja 10 Cortex-A725 -ytimellä sekä GPU-siru, joka yltää 1000 TFLOPSin suorituskykyyn FP4-tarkkuudella. Sirut on yhdistetty NVLink-C2C-linkillä toisiinsa. NVIDIAn mukaan se on tehnyt MediaTekin kanssa yhteistyötä prosessorin suunnittelussa.
GB10:n parina on yhteensä 128 Gt LPDDR5X-muistia ja 4 Tt:n SSD-asema.

Lähteet: NVIDIA Puts Grace Blackwell on Every Desk and at Every AI Developer’s Fingertips, NVIDIA Project DIGITS: The World’s Smallest AI Supercomputer.

Kaotik · 09.01.2025

Jos tuota 1 PetaFLOPSia haluaa verrata markkinoilta löytyviin piireihin niin FP16-tarkkuudella se tarkoittaisi enää 250 TFLOPSia. Oletettavasti kyse on tensori-FLOPSeista, mikä asettaisi piirin suorituskyvyn RTX 4080:n ja RTX 4090:n välimaastoon tai jos lukemassa on hyödynnetty sparsity-ominaisuutta niin se olisi vähän RTX 4070:iä nopeampi.
Tom's Hardware ehtikin jo uutisoida Raja Kodurin ja Tiny Corpin kommentoineen asiasta:

finWeazel · 09.01.2025

Olisi mielenkiintoista tietää miten kallis gpu:n ja cpu:n yhdistävä nvlink c2c linkki on. Voisiko tuo sama ratkaisu tulla käyttöön huhutuissa nvidia+mediatek yhteistön win11 läppäreissä vai onko tuo jollain tapaa huono teknologia kuluttajatuotteisiin ja nvidia+mediatek valitsee jonkin toisen tavan

Nvidian youtube videosta napatut screenshotit miten tuo digitsin "soc" on rakennettu. Mielenkiintoista että cachet on gpu;n puolella mutta muistiohjaimet cpu:n puolella. Välissä nvlink c2c.

nvidian omat ja nvidia+mediatek arm win11 koneet sai ainakin vahvan kiusoittelun jos ei nyt ihan vahvistusta jensenin puheista: https://www.reuters.com/technology/...be-able-sell-nvidias-desktop-cpus-2025-01-07/

finWeazel · 09.01.2025

Kaotik sanoi:
Jos tuota 1 PetaFLOPSia haluaa verrata markkinoilta löytyviin piireihin niin FP16-tarkkuudella se tarkoittaisi enää 250 TFLOPSia. Oletettavasti kyse on tensori-FLOPSeista, mikä asettaisi piirin suorituskyvyn RTX 4080:n ja RTX 4090:n välimaastoon tai jos lukemassa on hyödynnetty sparsity-ominaisuutta niin se olisi vähän RTX 4070:iä nopeampi.
Tom's Hardware ehtikin jo uutisoida Raja Kodurin ja Tiny Corpin kommentoineen asiasta:

Mulle jäi mielikuva, että digitsiä myydään r&d alustaksi niille jotka haluavat kehittää 200B tai dual digits konfigissa 400B malleja mitkä eivät mahdu pelikorttien muistiin. Toinen puoli optimointia se, että sama blackwell arkkitehtuuri ja iso 200B/400B malli digitsissä ja konesalissa. Ei tule yllätyksiä suorituskyvyssä kun siirtää mallin lokaalista pilveen. Debuggaus/optimontityökalu, ei tuotantohärpätin. Liekö sitten openai/asiakkaat tuollaista kyselleet, että saavat devaajien/tutkijoiden pöydälle rautaa joka helpottaa elämää versus yrität tehdä kaiken pilven läpi.

developers can prototype, fine-tune, and inference large AI models of up to 200B parameters locally, and seamlessly deploy to the data center or cloud.

NVIDIA DGX Spark

A Grace Blackwell AI supercomputer on your desk.

www.nvidia.com

Astire · 10.01.2025

finWeazel sanoi:
Olisi mielenkiintoista tietää miten kallis gpu:n ja cpu:n yhdistävä nvlink c2c linkki on. Voisiko tuo sama ratkaisu tulla käyttöön huhutuissa nvidia+mediatek yhteistön win11 läppäreissä vai onko tuo jollain tapaa huono teknologia kuluttajatuotteisiin ja nvidia+mediatek valitsee jonkin toisen tavan

Nvidian youtube videosta napatut screenshotit miten tuo digitsin "soc" on rakennettu. Mielenkiintoista että cachet on gpu;n puolella mutta muistiohjaimet cpu:n puolella. Välissä nvlink c2c.
...

"Miten kallis?" Eikös se ole ihan kyseisen lohkon pinta-alasta kiinni, Eli ei se mitenkään merkittävä ole suhteessa koko piirin pinta-alaan.

Wikipedian mukaan Blackwellin NVlink5.0:ssa (18kpl linkkejä) kaistaa löytyy 1800 GB/s, joka on sattumoisin samaa luokkaa kuin 5090:n muistikaista. Eli ei pitäisi jäädä pullonkaulaksi varmastikkaan tässä virityksessä, jossa muistikaista on muutenkin varmasti pienempi kuin RTX5090:ssä.
C2C (Chip-to-Chip) -tilanteessahan linkkejä on helppo laittaa enemmänkin. Kuvan ihan keskeltä voinee käytännössä laskea nuo linkit kun tarkasti katsoo tuota kampakuviota. Kuvasta arvioisin että linkkejä on 25 tai 26kpl.

jive · 10.01.2025

Vaikuttaa UMA vehkeeltä kuten Applen M, ei ole verrattavissa PC arkkitehtuuriin.

pomk · 10.01.2025

jive sanoi:
Vaikuttaa UMA vehkeeltä kuten Applen M, ei ole verrattavissa PC arkkitehtuuriin.

Applen koneetko ei ole ’PC’ kategoriassa? UMA ei ole mikään este sille etteikö laite olisi ’PC’. Windows ei toki moista voi käsittää olevan olemassa, mutta ei sekään ole mikään vaatimus että joku laite olisi ’PC’.

Hilppari · 10.01.2025

Tollane olkkariin niin voi ajaa kaikki kotiautomaatiot ja äänikäskyt lokaalisti.

jive · 10.01.2025

PC on arkkitehtuuri eikä Applen M laitteet sitä noudata lähtien ihan siitä että ovat Arm pohjaisia. Tämä piiri varmaankin sitoo suorittimen ja kiihdyttimen toisiinsa CHI:llä Documentation – Arm Developer

Griffin · 10.01.2025

Hyvä, että tulee vaihtoehtoja, varmasti muistin määrän takia moni ostaa AI leikkeihin tuon, ennemmin, kuin jonkun pelinäyttiksen..

Vaateri · 10.01.2025

jive sanoi:
PC on arkkitehtuuri

Tämä tuskin on mikään yleispätevä määritelmä vaan ennemminkin henkilökohtainen näkemys.

aop · 10.01.2025

jive sanoi:
PC on arkkitehtuuri eikä Applen M laitteet sitä noudata lähtien ihan siitä että ovat Arm pohjaisia. Tämä piiri varmaankin sitoo suorittimen ja kiihdyttimen toisiinsa CHI:llä Documentation – Arm Developer

Sinun kannattaisi varmaan tarkistaa, mitä PC tarkoittaa ja mistä se lyhenne tulee.

moukula · 10.01.2025

jive sanoi:
PC on arkkitehtuuri eikä Applen M laitteet sitä noudata lähtien ihan siitä että ovat Arm pohjaisia. Tämä piiri varmaankin sitoo suorittimen ja kiihdyttimen toisiinsa CHI:llä Documentation – Arm Developer

X86 on arkkitehtuuri ja IBM PC -yhteensopivuus on eräänlainen standardi. Apple ei ole kumpaakaan edellisistä, mutta Applen henkilökohtaiset tietokoneet ovat silti personal compuuttereita.

edit: Oli jokseenkin huvittavaa aikoinaan kun tyypit väänsi siitä että onko mäkit pc vai ei, kun mäkeissäkin oli sisällä prosessori jonka nimessä seisoi "Power PC".

pomk · 10.01.2025

jive sanoi:
PC on arkkitehtuuri eikä Applen M laitteet sitä noudata lähtien ihan siitä että ovat Arm pohjaisia.

Sekoitat nyt asioita aika huolella. Ei x86 ole mikään vaatimus sille että joku laite on ’PC’. Saati UMA:n puute.

finWeazel · 10.01.2025

Astire sanoi:
"Miten kallis?" Eikös se ole ihan kyseisen lohkon pinta-alasta kiinni, Eli ei se mitenkään merkittävä ole suhteessa koko piirin pinta-alaan.

Wikipedian mukaan Blackwellin NVlink5.0:ssa (18kpl linkkejä) kaistaa löytyy 1800 GB/s, joka on sattumoisin samaa luokkaa kuin 5090:n muistikaista. Eli ei pitäisi jäädä pullonkaulaksi varmastikkaan tässä virityksessä, jossa muistikaista on muutenkin varmasti pienempi kuin RTX5090:ssä.
C2C (Chip-to-Chip) -tilanteessahan linkkejä on helppo laittaa enemmänkin. Kuvan ihan keskeltä voinee käytännössä laskea nuo linkit kun tarkasti katsoo tuota kampakuviota. Kuvasta arvioisin että linkkejä on 25 tai 26kpl.

Kallis esimerkiksi vaadittavan paketoinnin kapasiteetin ja hinnan vuoksi. AI-Konesalipiireistä on pulaa lähinnä paketointikapasiteetin rajallisuuden vuoksi. Riittääkö paketointikapasiteettia kuluttajatuotteille vai tehdään vain konesalipiirejä? Vai onko nvlink c2c paketointi kenties triviaali ja kapasiteetti no problem? Toinen asia hinnasta, että jos joku muu tapa kytkeä piirit yhteen olisi tyyliin 10snt halvempi ja lasketaan 10snt*voluumi niin käytetään jotain muuta tapaa?

En tiedä paketoinneista juuri mitään. Sen vuoksi yritin miettiä ja kysyä, että onkohan nvlink c2c tapa mitä nvidia puskee win11 arm+nvidia gpu kuluttajatuotteisiin.

edit. Nvidia taitaa laskea tuon 100GB/s kaista nvlink5:lle niin, että on kaista ylös ja alas laskettu mukaan. Efektiivinen kaista yhteen suuntaan nvlink:ssa 50GB/s. Jos tuolla haluaisi tehdä esim. applen m4 max:in 546GB/s muistikaistaa vastaavn väylänleveyden niin tarvisi 11 linkkiä.

goes-brr · 10.01.2025

pomk sanoi:
Applen koneetko ei ole ’PC’ kategoriassa? UMA ei ole mikään este sille etteikö laite olisi ’PC’. Windows ei toki moista voi käsittää olevan olemassa, mutta ei sekään ole mikään vaatimus että joku laite olisi ’PC’.

Kyllähän Windows on UMAa ymmärtänyt ihan NT-kernelin alusta asti.

pomk · 10.01.2025

goes-brr sanoi:
Kyllähän Windows on UMAa ymmärtänyt ihan NT-kernelin alusta asti.

Sinänsä kyllä, mutta esim. näyttisten muisti ei ole sen alla.

goes-brr · 10.01.2025

pomk sanoi:
Sinänsä kyllä, mutta esim. näyttisten muisti ei ole sen alla.

Kyllähän esim. AMD:n uudet AI Max prosessorit käyttää UMA:ta, ja eikös noilla Snapdragoneila ole jaettu muisti kanssa?

pomk · 10.01.2025

goes-brr sanoi:
Kyllähän esim. AMD:n uudet AI Max prosessorit käyttää UMA:ta

Käyttääkö? Ainakin vanhoissa AMD:n integroiduissa on pitänyt erikseen rajata muistialueet ja niiden välillä data liikkuu hitaasti PCIE väylän kautta siinä missä muillakin näyttiksillä. Ymmärtääkseni tuo on ajuriongelma joka liittyy jotenkin windowsin sekoiluihin, varmuustaso tuohon tietoon ei ole tosin super korkea.

goes-brr · 10.01.2025

pomk sanoi:
Käyttääkö? Ainakin vanhoissa AMD:n integroiduissa on pitänyt erikseen rajata muistialueet ja niiden välillä data liikkuu hitaasti PCIE väylän kautta siinä missä muillakin näyttiksillä. Ymmärtääkseni tuo on ajuriongelma joka liittyy jotenkin windowsin sekoiluihin, varmuustaso tuohon tietoon ei ole tosin super korkea.

>For instance, if you have 128GB of total system memory, up to 96GB can be allocated to the GPU alone, with the remaining 32GB dedicated to the CPU. However, the GPU can still read from the entire 128 GB memory, thus eliminating costly memory copies via its unified coherent memory architecture.

AMD’s beastly ‘Strix Halo’ Ryzen AI Max+ debuts with radical new memory tech to feed RDNA 3.5 graphics and Zen 5 CPU cores

Disruption is a daily thing.

www.tomshardware.com

DirectX dokumentaatiota vuodelta 2019 Unified Memory Architecture - Win32 apps

> Applications running on UMA may want to have more resources with CPU access enabled than if it is not available. UMA enables applications to avoiding copying resource data around

pomk · 10.01.2025

goes-brr sanoi:
>For instance, if you have 128GB of total system memory, up to 96GB can be allocated to the GPU alone, with the remaining 32GB dedicated to the CPU. However, the GPU can still read from the entire 128 GB memory, thus eliminating costly memory copies via its unified coherent memory architecture.

Jos se muisti pitää erikseen näyttikselle karkeasti allokoida tuolla tavalla, niin ei se ole aito UMA toteutus. UMA toteutuksessa prossu ja näyttis voisivat käpistellä vaikka peräjälkeen samaa muistissa olevaa muuttujaa ilman että sitä tarvitsee siirtää näyttikselle ja prossulle allokoitujen muistialueiden välillä.

Ilmeisesti nyt GPU voi käyttää CPU:lle allokoitua muistia 'read only' tilassa. Hyvä muutos mutta aika kaukana vielä aidosta UMA toteutuksesta.
Applen vehkeissä ymmärtääkseni jo kunnon UMA setit.

Pakastu · 10.01.2025

Onko tuo nyt sitä että tunkee vanhaa ddr5 vramia kylkeen ja markkinoi sanalla AI ja gpun arvo nouse 1000%?
Mitähän tapahtuisi jos Asukset ja muut saisi laittaa 5090 siruille 100gb vram.

edup · 10.01.2025

Kaotik sanoi:
Jos tuota 1 PetaFLOPSia haluaa verrata markkinoilta löytyviin piireihin niin FP16-tarkkuudella se tarkoittaisi enää 250 TFLOPSia. Oletettavasti kyse on tensori-FLOPSeista, mikä asettaisi piirin suorituskyvyn RTX 4080:n ja RTX 4090:n välimaastoon tai jos lukemassa on hyödynnetty sparsity-ominaisuutta niin se olisi vähän RTX 4070:iä nopeampi.
Tom's Hardware ehtikin jo uutisoida Raja Kodurin ja Tiny Corpin kommentoineen asiasta:

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Suorituskyky ei tosin läheskään aina skaalaudu tällä tavoin lineaarisesti eri tarkkuuksien välillä. Onko jostain löytynyt lähdettä FP16 suorituskyvylle?

Tämä tapa ilmoittaa prosessointitehoa FP4-tarkkuudella on kyllä jo lähes rikollisen harhaanjohtavaa. Tuntuu että markkinoinnissa on haluttu mennä mallien parametrimäärä edellä, ja toivotaan että tuo FP4 osa jää potentiaalisilta ostajilta ymmärtämättä.

Kaotik · 10.01.2025

edup sanoi:
Suorituskyky ei tosin läheskään aina skaalaudu tällä tavoin lineaarisesti eri tarkkuuksien välillä. Onko jostain löytynyt lähdettä FP16 suorituskyvylle?

Tämä tapa ilmoittaa prosessointitehoa FP4-tarkkuudella on kyllä jo lähes rikollisen harhaanjohtavaa. Tuntuu että markkinoinnissa on haluttu mennä mallien parametrimäärä edellä, ja toivotaan että tuo FP4 osa jää potentiaalisilta ostajilta ymmärtämättä.

Nimenomaan skaalautuu lineaarisesti 4 FP4 = 2 FP8 = 1 FP16, kysehän on siis teoreettisesta laskentatehosta

pomk · 10.01.2025

Pakastu sanoi:
Onko tuo nyt sitä että tunkee vanhaa ddr5 vramia kylkeen ja markkinoi sanalla AI ja gpun arvo nouse 1000%?
Mitähän tapahtuisi jos Asukset ja muut saisi laittaa 5090 siruille 100gb vram.

Varmaan ihan hyviä juttuja tapahtuisi. Harmi ettei taida muistiohjain oikein tukea moista. Ehkä tuplattua sais clamshell mallisesti mut sit tulee ongelmaksi että isompia muistipiirejä ei saa yhteensopivalla io:lla mistään.

finWeazel · 10.01.2025

Pakastu sanoi:
Onko tuo nyt sitä että tunkee vanhaa ddr5 vramia kylkeen ja markkinoi sanalla AI ja gpun arvo nouse 1000%?
Mitähän tapahtuisi jos Asukset ja muut saisi laittaa 5090 siruille 100gb vram.

4090:en(ada102) oli 24GB muistia. ada102:sta on myös clamshell muistilla varustettu ada rtx 6000 missä muistia 48GB. Pelikortteihin joko ei kannata tai nvidia ei anna laittaa "isoja" muisteja. Arvelen että nvidia ei anna, isot muistikonfiguraatiot varattu pro korteille.

5090:sta voisi tulla 3GB gddr7 piirillä 48GB muistiversio. Clamshell gddr7 mahdollistaisi myös 64GB ja 96GB konfiguraatiot. Isomuistisia kortteja nähdäneen rtx blackwell 6000 tms. kortissa ja hinnat ihan jotain muuta kuin pelikorteissa.

DIGITS:in etu devaajille on siinä, että sama alusta ja isot mallit devaajan työpöydällä ja konesalissa. Voit optimoida digits:lla ja luottaa siihen, että optimoitu malli toimii samalla tavalla konesalissa.

Astire · 10.01.2025

finWeazel sanoi:
Kallis esimerkiksi vaadittavan paketoinnin kapasiteetin ja hinnan vuoksi. AI-Konesalipiireistä on pulaa lähinnä paketointikapasiteetin rajallisuuden vuoksi. Riittääkö paketointikapasiteettia kuluttajatuotteille vai tehdään vain konesalipiirejä? Vai onko nvlink c2c paketointi kenties triviaali ja kapasiteetti no problem? Toinen asia hinnasta, että jos joku muu tapa kytkeä piirit yhteen olisi tyyliin 10snt halvempi ja lasketaan 10snt*voluumi niin käytetään jotain muuta tapaa?

En tiedä paketoinneista juuri mitään. Sen vuoksi yritin miettiä ja kysyä, että onkohan nvlink c2c tapa mitä nvidia puskee win11 arm+nvidia gpu kuluttajatuotteisiin.

edit. Nvidia taitaa laskea tuon 100GB/s kaista nvlink5:lle niin, että on kaista ylös ja alas laskettu mukaan. Efektiivinen kaista yhteen suuntaan nvlink:ssa 50GB/s. Jos tuolla haluaisi tehdä esim. applen m4 max:in 546GB/s muistikaistaa vastaavn väylänleveyden niin tarvisi 11 linkkiä.

En tiedä kummalla meistä jää jotain huomaamatta.
Huomaathan, että kuvasta näkee että tuo c2c linkki on yhden ja saman piisirun sisäinen rakenne?
Miten se voisi tarvita jotain spesiaalia "paketointia"?

finWeazel · 10.01.2025

Astire sanoi:
En tiedä kummalla meistä jää jotain huomaamatta.
Huomaathan, että kuvasta näkee että tuo c2c linkki on yhden ja saman piisirun sisäinen rakenne?
Miten se voisi tarvita jotain spesiaalia "paketointia"?

siinä on kaksi eri piiriä. Mediatek arm cpu piiri ja nvidia gpu piiri. Paketoitu yhteen ja kommunikaatio nvlink chip to chip link:lla.

NVIDIA® NVLink®-C2C extends the industry-leading NVLink technology to a chip-to-chip interconnect. This enables the creation of a new class of integrated products with NVIDIA partners, built via chiplets, allowing NVIDIA GPUs, DPUs, and CPUs to be coherently interconnected with custom silicon

NVIDIA NVLink-C2C

Chip Interconnect Technology

www.nvidia.com

miksu8 · 10.01.2025

On tuo aika kova tarjous. Tähän asti 200b-mallin pyörittämiseen fp16-tarkkuudella on tarvinnut koneen jossa muutama A6000.

_j03_ · 10.01.2025

Kaotik sanoi:
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Vähän erikoisia kommentteja kun tuossa maksetaan käytännössä tuosta muistista ja sen kaistasta eikä mistään laskentatehosta.

Halpuuttaja · 10.01.2025

_j03_ sanoi:
Vähän erikoisia kommentteja kun tuossa maksetaan käytännössä tuosta muistista ja sen kaistasta eikä mistään laskentatehosta.

Hyvä kai olis olla sopivassa balansissa muistikapasiteettia ja -kaistaa sekä laskentatehoa. Ei ole kauheesti iloa että muistiavaruuteen mahtuu se 100B+ parametrinen kielimalli, jos tokeneita tulee etanavauhdilla.

Tai jos ei generointinopeudella ole väliä niin kandee varmaan kolmen tonnin koneen sijaan ostella joku halpa x86 emo ja prossu johon saa törkättyä 128 gigaa muistia. Kyllä se prossukin niitä tokeneita pikkuhiljaa ruksuttelee.

finWeazel · 10.01.2025

Halpuuttaja sanoi:
Hyvä kai olis olla sopivassa balansissa muistikapasiteettia ja -kaistaa sekä laskentatehoa. Ei ole kauheesti iloa että muistiavaruuteen mahtuu se 100B+ parametrinen kielimalli, jos tokeneita tulee etanavauhdilla.

Nvidian markkinointiviesti on, että DIGITSiä myydää devaajille jotka debuggaa ja/tai optimoi isoja kielimalleja. Tuotantomallit pilveen, ei DIGITSiin ajoon. Arvonsa sillä, että pönttö on devaajan/optimoijan pöydällä ja voi tehdä mitä vaan versus että yrität pilvessä debugata. Optimointia/debuggausta vaikea tehdä jos ei ole sama arkkitehtuuri alla kuin pilvessä + iso muisti johon mahtuu sama malli kuin pilvessä on ajossa. Nopeus on toisarvoista.

With the NVIDIA AI software stack preinstalled and 128GB of memory, developers can prototype, fine-tune, and inference large AI models of up to 200B parameters locally, and seamlessly deploy to the data center or cloud.

_j03_ · 10.01.2025

Halpuuttaja sanoi:
Hyvä kai olis olla sopivassa balansissa muistikapasiteettia ja -kaistaa sekä laskentatehoa. Ei ole kauheesti iloa että muistiavaruuteen mahtuu se 100B+ parametrinen kielimalli, jos tokeneita tulee etanavauhdilla.

Tai jos ei generointinopeudella ole väliä niin kandee varmaan kolmen tonnin koneen sijaan ostella joku halpa x86 emo ja prossu johon saa törkättyä 128 gigaa muistia. Kyllä se prossukin niitä tokeneita pikkuhiljaa ruksuttelee.

No ei tuo laskentateho nyt mikään etanavauhti ole. Vielä enemmän etanavauhdilla se 4090 niitä tokeneita puskee jos yrität isompia malleja ajaa, ihan niinkuin itse tuossa alla totesit. Käytännössä täysin eri käyttötarkoitukset tällä ja 1 x 4090.

Toki yksi vaihtoehto myös tuo twitter viestissäkin mainittu pari kipaletta vaikka 5070 ja hyödynnetään keskusmuistia nyt kun pcie 5.0 tuettuna.

Spesifinen markkinasegmentti, mutta eiköhän tuolle ostajia ole.

zepi · 10.01.2025

Applen Mac:it ovat unified memoryn ja integroidun siedettävän nopean GPU:n takia olleet "vahingossa" hyviä alustoja isojen kielimallien ajamiseen ja PC-arkkitehtuuri ei taas sovellu hommaan oikeastaan ollenkaan kun isoa ja nopeaa muistiavaruutta ole ole saanut mitenkään käyttöön GPU:lle.

Mac Studio M2 Ultralla ja 128GB muistilla maksaa luokkaa $6000 USD. Macbook Pro M4 Max 128GB muistilla $5000 USD. Nyt Nvidia undercuttaa noita hintoja, eikä Apple varmastikaan aloita hinnalla kilpailua.

Suurin etu Mac:eillä on edelleen nähdäkseni se, että sellainen voi olla tärkein työkone ja samalla AI-alusta. Itsekin kirjotan tätä M2 Max läppärillä jossa on 64GB muistia ja jolla pyörii aika iso lokaali malli siedettävästi.

finWeazel · 11.01.2025

Mulla on macbook pro m4 max 128GB mutta ei tuollaisella nvidia tai amd gpu pilveen optimoida kielimalleja kun CUDA/rocm puuttuu ja ei blackwell/MI arkkitehtuuria alla. ts. jos digitsiä myydään esim. meta, anthropic, openai jne. suuntaan, että heidän devaajien helpompi debugata ja optimoida 100B,200B,400B kielimalleja mitä ajavat pilvessä nvidian blackwell raudalla niin apple ei ole vaihtoehto.

On toki macbook pro 128GB kiva lelu leikkiä kielimallien kanssa. Testannut ollaman avulla kaikenlaisia kielimalleja lokaalisti.

Halpuuttaja · 11.01.2025

_j03_ sanoi:
No ei tuo laskentateho nyt mikään etanavauhti ole.

En osaa juuri tuosta laitteesta spesifisesti kommentoida, onko laskentatehoa tasapainoisesti vai ei. Muistikaistakaan ei ole vielä tiedossa.

Pointti lähinnä yleisellä tasolla, että sitä laskentatehoa on syytä olla sopiva määrä jottei se ole pullonkaula. Tämän vain heitin, koska sanoit ettei laskentatehosta makseta. Mutta ehkä ymmärsin väärin mitä sillä tarkoitit.

Astire · 13.01.2025

finWeazel sanoi:
siinä on kaksi eri piiriä. Mediatek arm cpu piiri ja nvidia gpu piiri. Paketoitu yhteen ja kommunikaatio nvlink chip to chip link:lla.

NVIDIA NVLink-C2C

Chip Interconnect Technology

www.nvidia.com

Jos tuo kuva on yhtään kuvaava, niin väitän että kyseessä on yksi ja sama piisiru, ei kahta erillistä.
Nvidian sivuilla:
"NVLink-C2C is extensible from PCB-level integration, multi-chip modules (MCM), and silicon interposer or wafer-level connections, enabling the industry’s highest bandwidth"

Kaotik · 13.01.2025

Astire sanoi:
Jos tuo kuva on yhtään kuvaava, niin väitän että kyseessä on yksi ja sama piisiru, ei kahta erillistä.
Nvidian sivuilla:
"NVLink-C2C is extensible from PCB-level integration, multi-chip modules (MCM), and silicon interposer or wafer-level connections, enabling the industry’s highest bandwidth"

Kyllä se ihan kaksi sirua on

weetabix · 13.01.2025

zepi sanoi:
Suurin etu Mac:eillä on edelleen nähdäkseni se, että sellainen voi olla tärkein työkone ja samalla AI-alusta. Itsekin kirjotan tätä M2 Max läppärillä jossa on 64GB muistia ja jolla pyörii aika iso lokaali malli siedettävästi.

Tähän segmenttiinhän AMD julkaisi sen M4 nopeamman monoliittinen piirin CESssä. Hieno julkaisu sieltä suunnalta ja tarvittaessa sillä vaikka pelaa: (ohessa hardware canucsin esittely)

moukula · 13.01.2025

weetabix sanoi:
Tähän segmenttiinhän AMD julkaisi sen M4 nopeamman monoliittinen piirin CESssä. Hieno julkaisu sieltä suunnalta ja tarvittaessa sillä vaikka pelaa: (ohessa hardware canucsin esittely)

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Kunhan näitä Strix Halo -piirejä tulee sopivanhintaisiin NUC-kokoluokan pikkukoneisiin, niin olohuoneeseen ilmaantuu telkkarin kaveriksi sellainen.

jive · 13.01.2025

pomk sanoi:
Sekoitat nyt asioita aika huolella. Ei x86 ole mikään vaatimus sille että joku laite on ’PC’. Saati UMA:n puute.

IBM on kanssasi eri mieltä

Astire · 13.01.2025

jive sanoi:
IBM on kanssasi eri mieltä

Eikös IBM itsekin käytä termiä IBM-PC, erona sille että olisi vain yleistermi PC, joka IBM:n mielestäkin on siis eri asia kuin IBM-PC.
MAC-PC on mielestäni ihan OK sanoa myös.
(Filosofista miekkailua)

Halpuuttaja · 13.01.2025

jive sanoi:
IBM on kanssasi eri mieltä

Siis IBM:n määritelmäkö on että pitää olla x86 vai mikä?

Griffin · 13.01.2025

Kun tuossa project digitsissä on 20 ARM coreakin, niin kyllähän siinä pitäisi muutkin softat pyöriä kohtuudella.. Toki pääseekö nuo ARM coret koko muistiin? (Edit: pääsevät).

jive · 13.01.2025

Halpuuttaja sanoi:
Siis IBM:n määritelmäkö on että pitää olla x86 vai mikä?

The IBM PC

A USD 1,500 open-architecture machine became an industry standard and brought computing to the masses

www.ibm.com

PC varmaan tarkoittaa ihmisille montaa asiaa. Tässä langassa puhutaan kuitenkin järjestelmän arkkitehtuurista. Sellainen PC on alunperin ollut.

Halpuuttaja · 13.01.2025

jive sanoi:
PC varmaan tarkoittaa ihmisille montaa asiaa. Tässä langassa puhutaan kuitenkin järjestelmän arkkitehtuurista. Sellainen PC on alunperin ollut.

IBM:llä on myös PowerPC joka on eri arkkitehtuuria kuin IBM PC. Onko mielestäsi PC vain sellainen laite, jonka juuri IBM on PC:ksi ristinyt? Eli onko PowerPC:kin PC?

Muut firmat, kuten Microsoft ja Qualcomm käyttävät termiä myös ARM tietokoneista.

zepi · 13.01.2025

moukula sanoi:
Kunhan näitä Strix Halo -piirejä tulee sopivanhintaisiin NUC-kokoluokan pikkukoneisiin, niin olohuoneeseen ilmaantuu telkkarin kaveriksi sellainen.

Ei kannata pidättää hengitystä "markkinoiden parhaan" piirin tulemiseksi halpaan koneeseen.

pomk · 13.01.2025

jive sanoi:
IBM on kanssasi eri mieltä

Sit kannattaa kirjoittaa että 'IBM PC' eikä PC.

Ens kerralla uusi yritys sitten.

PC on ihan vaan personal computer sen kummemmin mitään erittelemättä.

_j03_ · 13.01.2025

Liekköhän tuo läppäriversio on vaan leikelty versio tästä

https://videocardz.com/pixel/nvidia-n1x-soc-could-be-coming-to-lenovo-laptops

pomk · 13.01.2025

_j03_ sanoi:
Liekköhän tuo läppäriversio on vaan leikelty versio tästä

https://videocardz.com/pixel/nvidia-n1x-soc-could-be-coming-to-lenovo-laptops

Ei varmaan tarvi leikellä. Laskentatehot vs. sähkönkulutus on yleisesti parempi mitä isompi piiri on käytössä, laskemalla sähkönkulutusta kellontaajuutta ja voltteja tiputtamalla sirun leikkaamisen sijaan.

NVIDIA julkisti "joka kodin supertietokoneen" Project DIGITS:n

Banhammer

Banhammer

Banhammer

Banhammer

Uutiset

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi