AMD-spekulaatioketju (RDNA:n ja CDNA:n tulevat sukupolvet)

Mihin ihmeen "hitaaseen ensimmäiseen iteraatioon"? Siellä on se PC-maailmassa ennennäkemättömän tehokas integroitu GPU hoitamassa niitä tekoälylaskuja

PC maailmassa onkin ollut hirveä vaje noissa integroiduissa. Eivät ole viitsiineet tarjota niitä kun se söisi liikaa erillisnäyttisten kakkua tai ainakin niin pelkäävät. Enennäkemättömän tehokas juu mutta silti hidas.

Tuosta

AMD Ryzen™ Al Max+ 395​

tuotteesta tulee jossain kohtaa seuraava malli ja jos pyhä Liisa suo, niin isommalla maksimi muistilla.
 
Ja niitä firmoja kiinnostaa aika paljon enemmän sinua rikkaampien ja asioista paljon sinua paremmin perillä olevien asiakkaiden lompakot kuin juuri sinun lompakkosi.

Kiinostaa juu vai kiinnostaako? Voitaisiinko sanoa, että paljon kiinnostaa myös asioista huonosti perillä olevien lompakot ja onneksi Nvidian kohdalla se kuluttajan aliarvioiminen on osunut kipeästi myyntilukuihin. Huonosta 5060 8gb myynnistä kiitos lienee pitkälti rautatubekanavien neuvojen. Todella moni 5060 8GB testivideo suositteli välttämään sitä. Mutulla veikkaan, että 5060 8GB variantti ei tunnu myyvän edes puolta siitä mitä oltiin toivottu. 12GB 5070 käy sekin huonosti kaupaksi ja AMD ottaa hienosti masseja kotiin. Eli lompakolla äänestäminen kannattaa niin saattaa tulla vauhtia tehdä kilpailukykyisempiä tuotteita. 5070super lienee seurausta huonoista myyntiluvuista.
 
PC maailmassa onkin ollut hirveä vaje noissa integroiduissa. Eivät ole viitsiineet tarjota niitä kun se söisi liikaa erillisnäyttisten kakkua tai ainakin niin pelkäävät

Tällaisen salaliittohörhöilyn sijaan kannattaisi yrittää opetella ymmärtämän vähän sitä tekniikkaa, mistä höpisee.

Tässä ei ole kyse pelkästään mistään "viitsimisestä" vaan myös oleellisista teknisistä rajoitteista.

Tehokas näyttis tarvii paljon muistikaistaa, ja:

1) normaaleilla laajennettavilla DRAM-keskusmuistityypeillä (DDR4, DDR5) se tehokkaan näyttiksen tarvitsema kaista tulee hyvin kalliiksi ja lisää virrankulutusta selvästi. Se, että siinä Strix Halossa on 256-bittinen muistiväylä (siinä missä muissa kuluttaja-PC-CPU-piireissä on vain 128-bittinen muistiväylä) on yksi oleellinen syy sen korkeaan hintaan.

2) grafiikkaoptimoiduilla DRAM-muisteilla (GDDR, HBM) joilla kaistaa on enemmän se muisti pitää kolvata emolevylle tai laittaa näyttiksen kanssa samaan pakettiin mikä tekee mahdottomaksi sen muistin laajentamisen tai vaihtamisen jälkikäteen. Lisäksi voi tulla ongelmaksi, että jos esim paketointivaiheessa menee jotain pieleen, on sekä muistit että itse prossupiilastu kaikki käyttökelvottomia.
Lisäksi ne graffaoptimoidut muistit on usein viiveiltään huonompia kuin "normaalit" CPU-optimoidut DRAM-muistit tai niiden (liian pitkät) purskekoot sopivat huonosti CPU:iden välimuisteille, voi esim. olla että CPUn ladatessa dataa muistista joudutaan käytännössä lataamaan tuplasti enemmän, tuhlaten kaistaa ja virtaa, mikäli pienin puskekoko on tuplasti isompi kuin CPUn välimuistilinjan koko. Ja se välimuistilinjan koko on käytännössä modernissa x86-64ssa lukittu 64 tavuun, sen vaihtaminen olisi hyvin ongelmallista.


. Enennäkemättömän tehokas juu mutta silti hidas.

Verrattuna mihin?

Tämän valittamisen sijaan, suunnittele itse nopeampi. Palaa takaisin haukkumaan tätä hitaaksi vasta kun olet onnistunut.
 
Viimeksi muokattu:
Tällaisen salaliittohörhöilyn sijaan kannattaisi yrittää opetella ymmärtämän vähän sitä tekniikkaa, mistä höpisee.

Tässä ei ole kyse pelkästään mistään "viitsimisestä" vaan myös oleellisista teknisistä rajoitteista.

Tehokas näyttis tarvii paljon muistikaistaa, ja:

1) normaaleilla laajennettavilla DRAM-keskusmuistityypeillä (DDR4, DDR5) se tehokkaan näyttiksen tarvitsema kaista tulee hyvin kalliiksi ja lisää virrankulutusta selvästi. Se, että siinä Strix Halossa on 256-bittinen muistiväylä (siinä missä muissa kuluttaja-PC-CPU-piireissä on vain 128-bittinen muistiväylä) on yksi oleellinen syy sen korkeaan hintaan.

2) grafiikkaoptimoiduilla DRAM-muisteilla (GDDR, HBM) joilla kaistaa on enemmän se muisti pitää kolvata emolevylle tai laittaa näyttiksen kanssa samaan pakettiin mikä tekee mahdottomaksi sen muistin laajentamisen tai vaihtamisen jälkikäteen. Lisäksi voi tulla ongelmaksi, että jos esim paketointivaiheessa menee jotain pieleen, on sekä muistit että itse prossupiilastu kaikki käyttökelvottomia.
Lisäksi ne graffaoptimoidut muistit on usein viiveiltään huonompia kuin "normaalit" CPU-optimoidut DRAM-muistit tai niiden (liian pitkät) purskekoot sopivat huonosti CPU:iden välimuisteille, voi esim. olla että CPUn ladatessa dataa muistista joudutaan käytännössä lataamaan tuplasti enemmän, tuhlaten kaistaa ja virtaa, mikäli pienin puskekoko on tuplasti isompi kuin CPUn välimuistilinjan koko. Ja se välimuistilinjan koko on käytännössä modernissa x86-64ssa lukittu 64 tavuun, sen vaihtaminen olisi hyvin ongelmallista.




Verrattuna mihin?

Tämän valittamisen sijaan, suunnittele itse nopeampi. Palaa takaisin haukkumaan tätä hitaaksi vasta kun olet onnistunut.

Aika villiä huhua taas MLID tarinoi tänään tulevista AMD RDNA5 low end ja mid range korteista. Eli tuon "vuodon" mukaan myös erillisnäyttiksiin olisi tulossa LPDDR6 / LPDDR5X muistiohjaimet ja 128bit / 256bit / 384bit muistiväylät.

Eikö tuollaisen valmistaminen olisi kohtuu kallista jos on noin leveät muistiväylät, vaikka kuinka käyttäisi läppärimuistia?
Toki tuollaisessa etuna varmaan olisi se että voisi tehdä AI variantteja korteista todella suurilla muistimäärillä.

1755844638987.png
 
Tuosta

AMD Ryzen™ Al Max+ 395​

tuotteesta tulee jossain kohtaa seuraava malli ja jos pyhä Liisa suo, niin isommalla maksimi muistilla.
Ite näkisin että muistia tuossa on jo nyt runsaasti mutta kaistaa ja laskentatehoa suhteessa turhan vähän, mitä AI puuhasteluun tulee. Tasapaino siis päinvastaisella tavalla heikko kuin 4090:ssä.
 
jos kiinnostaa on tuon Ai Max+ 395:sen tehosta myös testejä. tämä Phoronixin testi on aika hyvä.

Heillä on testi myös Intelin 285K:ta vastaan ajettuna. Se mitä nuo testit näyttää hyvin on tuon AMD tuotteen hyötysuhteen monissa asioissa.

mm sivu 5 /11, jossa testattavana Blender 4.5 - keskikulutus 98.4 Watt kun taas 9950X samasta 171 Watt. Toki tuota 9950X prossaa ei ole alivoltitettu. Senkin hyötysuhden paranee aika hyvin jos osaa optimaalisesti alivoltittaa.

 
Viimeksi muokattu:
Aika villiä huhua taas MLID tarinoi tänään tulevista AMD RDNA5 low end ja mid range korteista. Eli tuon "vuodon" mukaan myös erillisnäyttiksiin olisi tulossa LPDDR6 / LPDDR5X muistiohjaimet ja 128bit / 256bit / 384bit muistiväylät.

Eikö tuollaisen valmistaminen olisi kohtuu kallista jos on noin leveät muistiväylät, vaikka kuinka käyttäisi läppärimuistia?
Toki tuollaisessa etuna varmaan olisi se että voisi tehdä AI variantteja korteista todella suurilla muistimäärillä.

1755844638987.png

Tuossa on siis sekaisin APU-piirejä ja erillisnäyttiksiä.


Tuo ensimmäinen APU-piiri 4+4+2 ytimellä ei IMHO vaikuttaisi kovin järkevältä, ja 16+4+2 vielä vähemmän. Zen6c-ytimiä kannattaisi olla enemmän kuin zen6-ytimiä, koska zen6c-ytimet ovat energiatehokkaampia ja halvempia ja silloin kun säikeitä on ajossa paljon, suurella määrällä zen6-ytimiä homma käy helposti tehorajoitteiseksi. Toisaalta AMD kuitenkin strix haloon laittoi pelkkiä normaaleita zen6-ytimiä, joten ei nämä kokoonpanot ole poissuljettuja.

Tuo 8 on myös vähän hassu CU-määrä, se on liikaa siihen että tehdään minimilistinen näyttis joka on vaan sitä varten että saadaa kone bootattua ja windowsin työpöytää pyöritettyä(kuten zen4/zen5n IOD:n integroitu näyttis), mutta vähänlaisesti siihen että sitä voisi oikeasti käyttää johonkin pelaamiseen pienelläkään resoluutiolla.

En kuitenkaan silti tuomitse tätä huhua varmuudella vääräksi.

Tuosta seuravasta(AT4) taas: 128-bittinen LPDDR5X olisi selvä kaistapullonkaula 24 CU:lle.
 
Viimeksi muokattu:
Asiaa nykysukupolvesta mutta laitan silti tänne, koska täällä on enemmän tätä enemmän arkkitehtuurikeskustelua kuitenkin kuin suoriin tuotteisiin liittyvissä ketjuissa, ja tämä liittyy moniin eri tuotteisiin

AMDn nykyisissä integroiduissa näyttiksissä arkkitehtuurina on "RDNA3.5" , AMDn nykysukupolven erillisnäyttikset on arkkitehtuuriltaan "RDNA4".

Tuosta RDNA3.5sta on ollut vähän huonosti artikkeleita, että mitä se tarkkaanottaen sisältää.

AMD on kuitenkin julkaissut sen käskykantamanuaalit, joten silmäilin pikaisesti läpi AMDn käskykantamanuaalit RDNA3lle, RDNA3.5lle ja RDNA4lle, ja löysin sieltä seuraavat asiat:

* Säteenjäljitysparannukset tuli vasta RDNA4ssa (kappale 10.9)
* 8-bittinen laskentatarkkuus(neuroverkkoja varten) tuli vasta RDNA4ssa (kappale 7.5)
* Vektorirekisterien dynaaminen allokointi tuli vasta RDNA4ssa (kappale 3.3.3)
* Muistin osoitteistukseen liittyviä parannuksia tuli pääosin vasta RDNA4ssa (10.4.1)
... mutta yhteen latauskäskyyn liittyvä integroitu datankonversio tuli jo RDNA3.5ssa (kappale 10.1)
* Skalaari-liukuluku-ALU tuli jo RDNA3.5ssa (kappale 6.8)


Eli melko linjassa sen oletuksen kanssa, että RDNA3.5 on "RDNA4 - säteenjäljitysparannukset - neuroverkkoparannukset", joskaan asia ei ole ihan 100% näin vaan RDNA3.5 ->RDNA4 -välillä tuli vähän muutakin



 
Viimeksi muokattu:
Lisa Sun mukaan MI450 valmistetaan (ainakin osittain) 2nm prosessilla. Vuoden 2026 jälkimmäisellä puoliskolla ilmeisesti ovat toimittamassa tuota.

Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://x.com/HyperTechInvest/status/1975635156796121551
 
Lisa Sun mukaan MI450 valmistetaan (ainakin osittain) 2nm prosessilla. Vuoden 2026 jälkimmäisellä puoliskolla ilmeisesti ovat toimittamassa tuota.
OpenAI diilissä sanottiin selkeästi, että mi450 ensimmäisen GW toimitukset alkavat 2026 toisella vuosipuoliskolla. Iso muutos amd:lle kun samalla tulee uusi räkki missä 72gpu:ta yhteenkytketty nopealla linkillä. Ensimmäinen oikea rackscale ratkaisu, edellinen ratkaisu ei oikein skaalannut suorituskykyisesti yli 8gpu:lle jaettuun kuormaan.

Varmaan menee kaikki kaupaksi mitä amd saa tehtyä. Tällä hetkellä kai konesaliratkaisujen myyntiä rajoittaa tarjolla olevien hbm-muistien määrä. Varmaan tän vuoksi OpenAI ostanut hbm-muistikapasiteettia,...
 
Amd ja sony kertoivat amd:n gpu-raudan tulevista ominaisuuksista.
  • Neural Arrays: A collection of compute units configured to share and process data to work together like a single AI engine.
  • Radiance Cores: New dedicated ray traversal hardware to deliver high-performance real-time ray tracing and path tracing.
  • Universal Compression: A new system that evaluates and compresses all available data within the GPU to dramatically reduce memory bandwidth usage.
Tämän sisällön näkemiseksi tarvitsemme suostumuksesi kolmannen osapuolen evästeiden hyväksymiseen.
Lisätietoja löydät evästesivultamme.

Linkki: https://youtu.be/ItXPvGrI6gY?si=aNQor_KeD5hgDP9S
 

Statistiikka

Viestiketjuista
289 423
Viestejä
4 958 683
Jäsenet
79 627
Uusin jäsen
LP000001

Hinta.fi

Back
Ylös Bottom