Pari päivää olen nyt lyönyt päätäni seinään Windowsin WHEA-errorien takia. Sain ratkaistua ongelman.
Laitteisto: Asus X570-e gaming emolevy, Ryzen 3900X, 32GB G.Skill 3600/CL17 muistia (kaksi kampaa F4-3600C17-16GTZR, b-die), Gigabyte RTX2080ti, Samsung nvme-ssd, Prossujäähy Noctuan NH-D15.
Aluksi kellottelin muistia ja prossua ja etsin rajoja. Homma on minulle kokonaan uutta ja hapuilua tapahtui. Tyydyin lopulta prossun osalta automaattiseen ylikellotukseen mutta disabloin PBO:n ja laskin jännitteen 1,2V. Prosessori pyörii Cinebench-kuormalla kaikilla coreilla noin 4,1GHz ja lämmöt maksimissaan 72C, Neljä parasta ydintä boostaa noin 4,5GHz ja heikoin ydinkin 4,26GHz. Bueno.
Muisteja aloin kellottamaan ja säätämään, mutta menee minulta yli viitseliäisyyden rajan. Päädyin lataamaan XMP-profiilin mukaisen kellotuksen. Sen verran muokkasin arvoja, että muutin koneen ehdottaman CAS 18->17. Myös Trfc oli oletuksena 690. Sen pudotin alemmas arvoon 312 DRAM Calculatorin suosituksen mukaisesti. (säädetyt arvot 3600, 17-19-19-39-85, FCLK 1800MHz). Annoin memtest86:n jauhaa muisteja yli yön. Testi meni virheettä läpi.
HWinfo86 oli koko tämän säätörupeaman ajan ilmoitellut HWEA erroreista. Pudotin kokeeksi BIOSin asetukset optimized defaultille (muistit 2133, FCLK 1066) mutta WHEA-errorit jatkuivat. Alkoi jo tuntua, että AMD:n vika. BIOS on uusin Asus 1005 (AGESA 1.0.0.3ABB). Kaikki virheet syntyivät Event viewerin ja hwinfon mukaan PCIe-väylässä ja erityisesti verkkokortin suunnalla. Vaihdoin näytönohjaimen paikkaa, kun kuvittelin piirisarjan käyvän liian kuumana (maksimissaan 70,5C). Ei vaikutusta. Itseasiassa näytönohjaimen paikka ei vaikuttanut piirisarjan lämpöihin juuri ollenkaan.
Ongelma alkoi aukeamaan, kun huomasin osan error-viesteistä olevan sisältöä: "Component: PCI Express Endpoint". En ollut kytkenyt emolevylle wifi-antenneja, koska en tarvitse wifiä enkä bluetoothia. Molemmat olivat myös disabloitu BIOSissa, samoin kuin 2,5G lan. Elektroniikkateollisuuden työni sisältää väylätekniikkaa, joten olisi tuo pitänyt muistaa. Väylää ei saa terminoida katkaisemalla se hallitsemattomasti. Wifi-antenni on yksi terminointipiste pcie-väylässä. Ongelma ratkesi liittämällä antenni paikoilleen. Yhtään WHEA erroria ei ole tullut sen jälkeen.
Toivottavasti tämä tekstiripuli auttaa jotain muuta saman ongelman kanssa.
edit: typoja