Ratkaistu Hankala epävakausongelma - Sittenkin muistivika

Rauta olisi tämmöttinen

Asus X370 Prime PRO
Ryzen 7 1700 @ stock 1,1 V SOC
G.Skill 16GB (2x8GB), Ripjaws V, DDR4 3200MHz, CL16 (F4-3200C16-8GVKB) @ JDEC 2133MHz CL16 @ 1,4 V
Corsair 650W PSU
GTX1060 6GB @ stock
Win 10 Pro

Kone on ajamassa kamerastreamia nettiin IP kameroista ja HDMI kaapparilla. Softana iSPY + OBS + VLC viritelmä. Ostin koneen aikanaan käytettynä pelikoneena enkä osaa sanoa onko se ollut aina tämmöinen.

Whocrashed dataa muutamasta viimeisimmästä crashista. Kone siis BSODaa MEMORY_MANAGEMENT virheeseen 2-500h välein tuossa streamauskäytössä.

On Fri 17/12/2021 6.48.41 your computer crashed or a problem was reported
crash dump file: C:\WINDOWS\Minidump\121721-12765-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3F6C20)
Bugcheck code: 0x1A (0x403, 0xFFFF8000EA2F9040, 0x80000001B2D23867, 0xFFFF804B417B4DB8)
file path: C:\WINDOWS\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that a severe memory management error occurred. The page table and PFNs are out of sync . This is probably a hardware error, especially if parameters 3 & 4 differ by only a single bit.
This is likely to be caused by a hardware problem. This error suggests a case of memory corruption because of a hardware problem. It is suggested you do a test on your RAM modules (memory test) and make sure your system is not getting overheated. This problem might also be caused because of overheating (thermal issue).
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.

On Sat 11/12/2021 4.21.12 your computer crashed or a problem was reported
crash dump file: C:\WINDOWS\Minidump\121121-11125-01.dmp
This was probably caused by the following module: hardware.sys (hardware)
Bugcheck code: 0x1A (0x41792, 0xFFFF8180DDC36508, 0x8000000, 0x0)
Bug check description: This indicates that a severe memory management error occurred. A corrupted PTE has been detected.
This might be a case of memory corruption. This may be because of a hardware issue such as faulty RAM, overheating (thermal issue) or because of a buggy driver. This problem might also be caused because of overheating (thermal issue).
A third party driver was identified as the probable root cause of this system error. It is suggested you look for an update for the following driver: hardware.sys .
Google query: hardware.sys MEMORY_MANAGEMENT

On Thu 09/12/2021 14.49.52 your computer crashed or a problem was reported
crash dump file: C:\WINDOWS\Minidump\120921-9468-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3F6C20)
Bugcheck code: 0x1A (0x403, 0xFFFFE1810E978588, 0x81000002D7D61867, 0xFFFFE1810EAB8B08)
file path: C:\WINDOWS\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that a severe memory management error occurred. The page table and PFNs are out of sync . This is probably a hardware error, especially if parameters 3 & 4 differ by only a single bit.
This is likely to be caused by a hardware problem. This error suggests a case of memory corruption because of a hardware problem. It is suggested you do a test on your RAM modules (memory test) and make sure your system is not getting overheated. This problem might also be caused because of overheating (thermal issue).
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.

On Fri 03/12/2021 2.13.06 your computer crashed or a problem was reported
crash dump file: C:\WINDOWS\Minidump\120321-8171-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3F6C20)
Bugcheck code: 0x1A (0x403, 0xFFFFC400EFEC60B8, 0x8100000311AA7867, 0x0)
file path: C:\WINDOWS\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that a severe memory management error occurred. The page table and PFNs are out of sync . This is probably a hardware error, especially if parameters 3 & 4 differ by only a single bit.
This is likely to be caused by a hardware problem. This error suggests a case of memory corruption because of a hardware problem. It is suggested you do a test on your RAM modules (memory test) and make sure your system is not getting overheated. This problem might also be caused because of overheating (thermal issue).
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.

On Thu 02/12/2021 23.33.58 your computer crashed or a problem was reported
crash dump file: C:\WINDOWS\Minidump\120221-7718-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3F6C20)
Bugcheck code: 0x1A (0x403, 0xFFFF9E013FF80500, 0x8000000006AB0867, 0xFFFF9E013FD53ED8)
file path: C:\WINDOWS\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that a severe memory management error occurred. The page table and PFNs are out of sync . This is probably a hardware error, especially if parameters 3 & 4 differ by only a single bit.
This is likely to be caused by a hardware problem. This error suggests a case of memory corruption because of a hardware problem. It is suggested you do a test on your RAM modules (memory test) and make sure your system is not getting overheated. This problem might also be caused because of overheating (thermal issue).
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.

Tehtyjä asioita jotka eivät auttaneet mitään
- Windows uusiksi, eri ajureita
- Päivitin 3 vuotta vanhan biosin uusimpaan
- Nostin SOC ja muistien jännitteitä
- Toista muistikittiä kokeiltu

Testisoftista havaintoja:
- Ennen jännitteiden korottamista HCI memtesti antoi muutaman kymmenen erroria kun ajoi yön yli. Nyt korotetuilla jännitteillä ajoin 6x 2000MB HCI memtestit 10000% coverageen asti. Tämä kesti jotain 4 päivää. Ei erroreita.

- Prime95 small FFT pyörii hyvin
- Prime95 blendi yön yli ajettuna joko bsodaa koneen tai workerit kuolee yksitellen fatal erroriin
- Core cycler AVX heavy preseteillä kaatoi koneen 16 minuutissa
- Memtest86 ei löydä mitään

Alkaa tuntua että voisi vaihtaa prossun seuraavaksi vai mitä olette mieltä?
Kannattaa ainakin varmistaa, että emolla on viimeisin bios.

Ainakin Z390 emolevyllä oli välillä juonittelevia biosksia ja ongelmat oli samankaltaisia kuin sinulla nyt. Pari viimeistä biosia ovat olleet vakaampia.
Joo, aivan viimeisimmän biosin sinne päivitinkin.

POSTaaminen nopeutui ja biosin käyttöliittymän FPS ei ole enää 3. Mutta kaatuiluun tuo ei auttanut mitään :(
Kokeile muisteja erikseen. Ei vaikuta kovin vakailta jos erroreita antoivat vakiojännitteillä.
Hmm oliko 1700 cpu niitä viallisia? Niillehän tietylle erälle tehtiin aiemmin se takaisinveto, kun oli se spesiaalimpi rautaongelma.
En muista enää miten sen vian saikaan esiin, mutta googlettamalla jotain faulty ryzen 1700 voipi löytyä paremmat linkit.

Mutta muistien vaihto voisi tulla kyseeseen, nuo vanhat Ryzenit tykkää eniten Samsungeista. Hynixiä luultavimmin nuo. Katso Typhoonilla, voivat olla ehkä myös Samsung E-Die.

Lisäksi uskoisin että sulla kammat on jo A2 B2 sloteissa? :kahvi:
Joo, tosiaan tilanne on nyt tämä noilla aloituspostauksen asetuksilla.

telkkäkone.JPG P95_smallffts.JPG

Mutta P95 blend ei mene läpi edes paria tuntia. Ja streamaaminen kaatuilee entiseen malliin.

Pitää kurkata missä sloteissa muistit on kun seuraavan kerran käyn koneen luona. Sen tiedän että noissa G.Skilleissä on hynixin piirit.
Ei oikein heti auttavaa neuvoa ole antaa, mutta x370 Prime Pro on nirso muistien suhteen kuten ensimmäisen sukupolven Ryzenitkin. Command rate 1t ei tainnut itsellä koskaan vakaa. En ole varmaan vuoteen tuota omaa Prime Pro konetta käynnistänyt.

Ehkä näistä voisi olla apua tuon diagnosoimisessa eli ZenTimings nähdään kaikki nuo tämän hetkiset muistiasetukset. Ja Thaiphoon burnerilla Thaiphoon Burner - Official Support Website sitten muistikampojen raportti. Jos noissa olisi jotain suurempaa eroavaisuutta.

Toki prosessori voi myös olla syyllinen.
Tuo 2T:lle pudotus vois olla kyl hyvä homma myös tosiaan. :tup: Ja käsittääkseni ei ollut sekalainen seurakunta muisteja, vaan iha perus kitti.
Pudotin 2T:lle ja prime95 blend tökkäsi alle minuutissa.

Small FFTs ja HCI memtest pyörii kuten ennenkin virheettä.
Jopas tämä otti täyskäännöksen kuuseen.

Omistan näköjään sitten kaksi 2x8GB 3200MHz muistikittiä joissa kummassakin toinen kampa on sillä tavalla viallinen että prime95 kippaa joko heti tai parissa tunnissa jopa jdec kelloilla ja asetuksilla ja xmp jännitteillä.

Noh, tulipahan "turhaan" päivitettyä R7 1700 -> R7 2700X

Eli muistivika se oli sittenkin. Jännä että memtest86 tai hci memtest ei tätä vikaa saaneet kiinni. Mutta prime95 large FFT leipoi lähes heti.

En muista että kellotushommissa olisi ikinä mennyt niin päin että memtest86 ja HCI antaa puhtaat paperit mutta sitten muisti ei prime95:sta kestä. Outoa.
Jotkut Ryzenit tuntuvat olevan aika valikoivia muistin suhteen. Tuo ei tarkoita, että muisti on rikki.
Eiköhän se ole rikki kun toinen kampa toimii missä tahansa slotissa ja toinen tekee erroreita primessä missä tahansa slotissa.
Olisi mielenkiintoista testata nuo Intelin prosessorilla.
Joillain Ryzeneillä muistiongelmat ovat ominaisuus.
Voisin kokeilla Z270 vehkeillä.

Ripjaws V ja HyperX kitit on kyseessä.
Testin tulos saattaisi olla mielenkiintoinen.
Miten vanhoja tai uusia muistit ovat?

Edit: mites noiden takuu, useimmissa muisteissa on elinikäinen takuu.

