Suurenpieni konesalitason AI-kiihdytinkeskustelu (AMD, Intel, Nvidia,...)

finWeazel · 06.01.2026

antti-x sanoi:
Aika mielenkiintoinen ja haastava kokonaisuus kuitenkin kaikille pelureille pallotella. Muistia riittää vain rajallisesti vaikka kaikki kapasiteetti on jo varattu, joten minkä verran mitäkin sukupolvea on järkevä valmistaa? Uutta räkkiä joka on vähintään tuplat tehokkaampi kuin vanha, tulee melkein vuoden välein. Eli ei kannata ostaa todellakaan 4milliä / kpl räkkejä kuukausiksi odottamaan että konesali-infra+ sähkön saatavuus valmistuu jne.

Eiköhän ne osaa sen verran rakentaa valmistuslinjoja kuin osia riittää. Perus hankinta ja valmistusketjujen hallintaa joskin giganttisella skaalalla. Nvidia on hyvä esimerkki tästä. Näkee miten melkein lineaarisesti konesalipuolen tulos kasvanut kvartaalista toiseen. Kysyntää enemmän kuin tarjontaa. Näkee lineaarisesta liikevaihdon kasvusta millä vauhdilla tuotantokapasiteettia saatu lisättyä kvartaalista toiseen. Blackwell epäjatkuvuuskohta kun räkin hinta lähes tuplaantui niin saadaan samastakin voluumista enemmän liikevaihtoa. vera-rubin lienee myös epäjatkuvuuskohta kun räkin hinta pompsahtaa taas ylöspäin.

Googlesta. Googlella kai päitä tippui kun muistipiirejä ei oltu tajuttu tilata etukäteen tarpeeksi. Google rakentaa melko valtavia määriä tpu:ta.

According to the report, Google’s TPU will enter its eighth generation in 2026, with mass production set to begin in Q3 on TSMC’s 3nm node. Production volume is expected to reach 5 million units in 2027 and rise further to 7 million in 2028, the report suggests, adding both Broadcom and MediaTek, as ASIC partners, are actively preparing capacity to meet the demand.

[News] Google Led TPU Innovation with Patent Spike; Broadcom, MediaTek Reportedly Boost Reserved Wafers

As Google intensifies its push for Tensor Processing Units (TPUs), aiming to secure more orders from major tech players, the company’s R&D efforts...

www.trendforce.com

Potkuista googlella:

Microsoft Rages, Google Fires Exec: The "War" For AI Memory Explodes

The ongoing HBM shortage is forcing Google and Microsoft to prostrate themselves at the altars of Samsung, SK hynix, and Micron.

wccftech.com

weetabix · 06.01.2026

Kovasti joo höpötetään että kysyntää enemmän kuin tarjontaa, mutta sitten joku Intel istuskelee niiden AI kiihdyttimiensä päällä kun ei saada niitä käyttöön. Toisekseen jos muistia on kolme kertaa enemmän niin veikkaan että hinta nousee 10x lukemiin nykymenolla.

finWeazel · 06.01.2026

weetabix sanoi:
Kovasti joo höpötetään että kysyntää enemmän kuin tarjontaa, mutta sitten joku Intel istuskelee niiden AI kiihdyttimiensä päällä kun ei saada niitä käyttöön. Toisekseen jos muistia on kolme kertaa enemmän niin veikkaan että hinta nousee 10x lukemiin nykymenolla.

Intelillä ei ole kilpailukykyisiä kiihdyttimiä. AMD:n nykyiset kiihdyttimet eivät skaalaannu yli 8GPU kuormiin. AMD korjaa tilanteen helios räkillä kera mi450:en. 72gpu:ta räkissä ja nopea+joustava verkko niiden välissä. Se kolmas juttu että pelkkä kiihdytin ei riitä vaan pitää olla myös softa joka skaalaa konesalikokoon. Aika on rahaa, konesalin pitää toimia heti, ei ole aikaa odotella 6kk, 12kk että softa valmistuu. AMD ja OpenAI teki diilin paljon etukäteen, että saavat softan ja mallit optimoitua etukäteen ennen kuin koko konesalia on olemassa.

--

Nvidia alleviivaa mun yrittämää pointtia hankinta ja valmistusketjusta. Miksi nvidiaan ei vaikuta yhtä pahasti muisti yms. pula kuin moneen muuhun

Question: Wells Fargo: Supply chain variables seem numerous—1) DRAM pricing, 2) available supply volumes, etc. Please explain.

we prepared for this kind of major ramp-up with partners well in advance. We invested heavily in partners, much of it in the form of prepayments, enabling them to expand capacity. Thanks to long-standing relationships, we believe we are in a strong position.

We are essentially the only semiconductor company in the world that directly purchases DRAM at global scale. People ask, "Why buy DRAM?" The reason is simple: transforming that DRAM into CoWoS supercomputers is extraordinarily difficult. Properly connecting that supply chain like "plumbing" is a major advantage for us. In tight situations like now, having this capability is also fortunate.

NVIDIA Reveals Why the Company Is “Immune” to Memory Shortages — and How The Firm Prepaid Inventory to Keep the AI Boom Running

NVIDIA has responded to the ongoing memory shortages and how the company has positioned itself to ensure that Team Green doesn't compromise.

wccftech.com

finWeazel · 08.01.2026

Vera-Rubinin vesijäähdytyksessä käytettävä 45C asteinen vesi mielenkiintoinen asia mikä monelta uutisoijalta mennyt ohi. Säästää valtavasti sähköä kun vettä ei tarvi jäähdyttää jonnekin 10C tienoille. Joka puolelta tuota virrankulutusta yritetään viilata pienemmäksi ja silti vuosi vuodelta konesalit syövät entistä enemmän virtaa.

Vera Rubin NVL72 systems instead use warm-water, single-phase direct liquid cooling (DLC) with a 45-degree Celsius supply temperature

Toinen mielenkiintoinen juttu räkkitasolla toteutettu virrankulutuksen "tasoittaminen". Virrankulutus voi piikata todella paljon kun kuorma konesalissa muuttuu ja tämä voi johtaa jopa sähköverkon romahtamiseen. Tän takia esim. meta joissain konesaleissa ajanut idle-loopissa gpu:ta isolla kuormalla ettei virrankulutus vaihtelisi ja toisaalta xAI käyttää isoja akustoja tasaamaan piikkejä

At the rack level, Vera Rubin NVL72 evens out power swings with power smoothing and incorporates approximately 6x more local energy buffering than Blackwell Ultra, absorbing rapid power transients directly at the source.

Liikenne kaikkien linkkien, väylien, kiihdyttimien yms. osalta salattua. Ratkaisu mahdollistaa "on prem" kaltaisia ratkaisuja missä koneet ovat kuitenkin pilvessä. Mistään välistä ei pääse lukemaan/ryöstämään dataa.

FP64 matriisioperaatioita emuloidaan ajamalla useita iteraatiota pienemmän tarkkuuden laskentayksiköillä

With Blackwell and now Rubin, NVIDIA has evolved this strategy, achieving high FP64 matrix throughput through multiple passes over lower-precision execution units while preserving architectural flexibility for converged workloads.

Linkinpäässä dokumentti missä on paljon jännää tietoa.

Inside the NVIDIA Vera Rubin Platform: Six New Chips, One AI Supercomputer | NVIDIA Technical Blog

Update March 16, 2026: The NVIDIA Vera Rubin platform now has a seventh chip. Learn more about NVIDIA Groq 3 LPX: The Low-Latency Inference Accelerator for the NVIDIA Vera Rubin Platform.

developer.nvidia.com

finWeazel · 15.01.2026

OpenAI teki 10 miljardin diilin Cerebrasin kanssa. Cerebras tekee piikiekkotason kiihdytintä jossa muisti on piikiekolla. Tämä lienee cerebrasin isoin diili. Voi miettiä johtuuko tämä diili siitä, että cerebrasin kiihdytin on erinomainen vai onko osasyy diiliin se, että kiihdytin ei tarvitse isoa määrää erillistä muistia. HBM-muistit huhujen mukaan myyty 2027 tuotannon osaltakin lähes loppuun.

OpenAI announced Wednesday that it had reached a multi-year agreement with AI chipmaker Cerebras. The chipmaker will deliver 750 megawatts of compute to the AI giant starting this year and continuing through the year 2028, Cerebras said.

The deal is worth over $10 billion, a source familiar with the details told TechCrunch. Reuters also reported the deal size.

OpenAI signs deal, worth $10B, for compute from Cerebras | TechCrunch

The collaboration will help OpenAI's models deliver faster response times for more difficult or time-consuming tasks, the companies said.

techcrunch.com

saippuakauppias · 17.01.2026

finWeazel sanoi:
Mistään välistä ei pääse lukemaan/ryöstämään dataa.

Pata kattilaa soimaa.

finWeazel · 17.01.2026

saippuakauppias sanoi:
Pata kattilaa soimaa.

En ymmärrä, haluatko avata? Tämä datansuojaus liittyy esim. googlen sertifioituun pilvi "on prem" ratkaisuun. Toiselta puolelta liittyy siihen, että yritykset voivat ajaa omia malleja pilvessä ilman, että pilvipalvelun tarjoajalla on pääsyä yrityksen malleihin ja dataan. ts. tän taustalla on halu laajentaa pilveä sellaisiin käyttötapauksiin missä aikaisemmin pilvi ei ollut vaihtoehto. Google "on prem"-pilvi sertifioitu esim. pankkien ja yhdysvaltain sotilaspuolen käyttöön.

finWeazel · 19.01.2026

xAI sai 1GW ai-konesalin rakennettua ja käyttöön. Huhtikuuhun mennessä 1.5GW ja kai nostetaan 2GW jossain kohtaa. Tuo lienee GB300:ia täynnä ja käytetään uuden grok5:en opettamiseen. Tässä kontekstissa ketunhäntä se, että 1GW on muistikoherenttia kapasiteettia joka ajaa "läpinäkymättömästi" samaa kuormaa. Isompia konesaleja varmasti on, mutta muistikoherenttius ja nopea kommunikaatio puuttuu.

Huvittava juttu, että konesaleissa on siirrytty pois flopseista ja mitataan suorituskykyä gigawatteina.

finWeazel · 26.01.2026

Microsoft julkaisi Maia 200 AI-kiihdyttimen. Kiihdyttimellä on tarkoitus ajaa erityisesti inferenssikuormia. Seuraavan sukupolven kiihdytin on jo työnalla

Maia 200 is an AI inference powerhouse: an accelerator built on TSMC’s 3nm process with native FP8/FP4 tensor cores, a redesigned memory system with 216GB HBM3e at 7 TB/s and 272MB of on-chip SRAM, plus data movement engines that keep massive models fed, fast and highly utilized. This makes Maia 200 the most performant, first-party silicon from any hyperscaler, with three times the FP4 performance of the third generation Amazon Trainium, and FP8 performance above Google’s seventh generation TPU. Maia 200 is also the most efficient inference system Microsoft has ever deployed, with 30% better performance per dollar than the latest generation hardware in our fleet today.

Maia 200: The AI accelerator built for inference - The Official Microsoft Blog

Today, we’re proud to introduce Maia 200, a breakthrough inference accelerator engineered to dramatically improve the economics of AI token generation. Maia 200 is an AI inference powerhouse: an accelerator built on TSMC’s 3nm process with native FP8/FP4 tensor cores, a redesigned memory system...

blogs.microsoft.com

Microsoft introduces newest in-house AI chip — Maia 200 is faster than other bespoke Nvidia competitors, built on TSMC 3nm with 216GB of HBM3e

30% more performance per dollar than Maia 100, and faster than Amazon or Google.

www.tomshardware.com

finWeazel · 17.03.2026

Nvidialta tuli GTC-messujen yhteydessä uutisia konesaliraudoista

Rubin CPX kuopattu: Nvidia removes Rubin CPX accelerators from its roadmap — Groq 3 LPUs take center stage as CPX is removed

Rubinin cpx:n paikan ottanee Groq:lta lisensoitu kiihdytin: Nvidia Groq 3 LPU and Groq LPX racks join Rubin platform at GTC — SRAM-packed accelerator boosts 'every layer of the AI model on every token' Groq:n next gen kiihdytin integroidaan 3d-paketoinnilla feynman gpu:hun 2028. 2028 tulee myös uusi cpu ROSA. Groq:ssa on mielenkiintoista, että prosessointi tehdään piirille integroidulla erittäin nopealla sram:lla, ei keskusmuistia.

Inside NVIDIA Groq 3 LPX: The Low-Latency Inference Accelerator for the NVIDIA Vera Rubin Platform | NVIDIA Technical Blog

NVIDIA Groq 3 LPX is a new rack-scale inference accelerator for the NVIDIA Vera Rubin platform, designed for the low-latency and large-context demands of agentic systems. Co-designed with the NVIDIA…

developer.nvidia.com

finWeazel · 27.03.2026

Mielenkiintoinen video lpu-groq-nvidia taustasta. Yhteistyö alkoikin vähän aikaisemmin siitä, että groq teki kokeen millä integroidaan heidän piirinsä nvlinkin yli gpu:hun ja jaetaan kuormaa näiden kesken. Tuosta yhteistyö sitten lähti ja hyvin nopeasti tuon jälkeen lisensointidiili ja rekry

With language processing units (LPUs) and GPUs in the same data center, developers can optimize for both ultra-low latency and high throughput. LPUs excel at token-by-token and interactive workloads, while GPUs excel at massive parallelism and larger batches. This fireside chat helps developers understand the complementary strengths of LPUs and GPUs.

GPU ♥ LPU: Everything You Wanted to Know S82419 | GTC San Jose 2026 | NVIDIA On-Demand

With language processing units (LPUs) and GPUs in the same data center, developers can optimize for both ultra-low latency and high throughput

www.nvidia.com

Kaotik · 28.03.2026

finWeazel sanoi:
Mielenkiintoinen video lpu-groq-nvidia taustasta. Yhteistyö alkoikin vähän aikaisemmin siitä, että groq teki kokeen millä integroidaan heidän piirinsä nvlinkin yli gpu:hun ja jaetaan kuormaa näiden kesken. Tuosta yhteistyö sitten lähti ja hyvin nopeasti tuon jälkeen lisensointidiili ja rekry

GPU ♥ LPU: Everything You Wanted to Know S82419 | GTC San Jose 2026 | NVIDIA On-Demand

With language processing units (LPUs) and GPUs in the same data center, developers can optimize for both ultra-low latency and high throughput

www.nvidia.com

MIelenkiintoista sinänsä kun kuitenkin vasta kolmas Groqin piiri NVIDIAn roadmapissa lisää NVLINKin mukaan kuvioihin

finWeazel · 28.03.2026

Kaotik sanoi:
MIelenkiintoista sinänsä kun kuitenkin vasta kolmas Groqin piiri NVIDIAn roadmapissa lisää NVLINKin mukaan kuvioihin

Eka iteraatio loppuvuodesta 2026 on erillinen räkki ja kiinni verkon yli. Feynman ja next gen lpu 2028 tuovat nvlink:lla integroidun ratkaisun. Nopeasti tuo eka räkkikin syntynyt kun alle vuodessa groq yhteistyön aloittamisesta räkki konesaleissa käytössä. Ei about 2.5v feynman aikajanakaan kovin hidas ole kun miettii että räkit ja piirit tarvii olla 2027 loppupuolella labrassa takaisin jos nvidia aikoo pitää normaalin 1v kadenssin ja feynmanit konesaleissa käytössä 2028 h2:lla. Vera-rubin tapeout oli kesäkuu 2025, piirit labrassa q4 alussa, nyt on asiakkaiden käsissä samplet+massatuotanto käynnistetty CES:in aikaan. Ekat vera-rubin konesalit pyörähtää tuotantokäyttöön h2 aluissa. Jos feynman menee vera-rubin aikataululla niin alle 1.5v aikana yhteistyön aloittamisesta piiri tapeouttiin, 2.5v jälkeen konesaleissa asennettuna ja tuotannossa. Sairaan nopeaa toimintaa. Toki vaatii, että asiat mene kuin stromsössä, blackwell vaati respinnin, vera-rubin ei. Joskus osuu, joskus ei.

finWeazel · eilen klo 18:10

Googlelta uudet TPU:t. Kaksi eri piiriä, toinen opetukseen ja toinen inferenssiin optimoitu. Mielenkiintoista, että google mainostaa natiivia fp4:sta nimenomaan opetukseen suunnitellun piirin kohdalla. Googlen blogissa on paljon mielenkiintoista tietoa uudesta tpu:sta.

Our eighth generation TPUs: two chips for the agentic era

An overview of Google’s eighth generation TPUs, built for the agentic era.

blog.google

Google Bets On The Agentic AI Era With Its AI Hypercomputer, Merges 8th-Gen TPUs, NVIDIA Rubin, & Axion CPUs Together

Google has announced the AI Hypercomputer, which brings together TPUv8 series, NVIDIA Rubin, & Axion CPUs to power the Agentic AI era.

wccftech.com

Suurenpieni konesalitason AI-kiihdytinkeskustelu (AMD, Intel, Nvidia,...)

finWeazel

[News] Google Led TPU Innovation with Patent Spike; Broadcom, MediaTek Reportedly Boost Reserved Wafers

Microsoft Rages, Google Fires Exec: The "War" For AI Memory Explodes

weetabix

finWeazel

NVIDIA Reveals Why the Company Is “Immune” to Memory Shortages — and How The Firm Prepaid Inventory to Keep the AI Boom Running

finWeazel

Inside the NVIDIA Vera Rubin Platform: Six New Chips, One AI Supercomputer | NVIDIA Technical Blog

finWeazel

OpenAI signs deal, worth $10B, for compute from Cerebras | TechCrunch

saippuakauppias

finWeazel

finWeazel

finWeazel

Maia 200: The AI accelerator built for inference - The Official Microsoft Blog

Microsoft introduces newest in-house AI chip — Maia 200 is faster than other bespoke Nvidia competitors, built on TSMC 3nm with 216GB of HBM3e

finWeazel

Inside NVIDIA Groq 3 LPX: The Low-Latency Inference Accelerator for the NVIDIA Vera Rubin Platform | NVIDIA Technical Blog

finWeazel

GPU ♥ LPU: Everything You Wanted to Know S82419 | GTC San Jose 2026 | NVIDIA On-Demand

Kaotik

Banhammer

GPU ♥ LPU: Everything You Wanted to Know S82419 | GTC San Jose 2026 | NVIDIA On-Demand

finWeazel

finWeazel

Our eighth generation TPUs: two chips for the agentic era

Google Bets On The Agentic AI Era With Its AI Hypercomputer, Merges 8th-Gen TPUs, NVIDIA Rubin, & Axion CPUs Together

Uutiset

Uutisia lyhyesti

Uusimmat viestit

Statistiikka

Hinta.fi

Arvostamme yksityisyyttäsi