Kone kaatuilee pelatessa ja välillä kevyessäkin käytössä

Liittynyt
07.07.2018
Viestejä
14
Morjens

Uusi/uudehko tiukahkolla budjetilla itse kasattu kone kaatuilee pelatessa ja välillä ihan kevyessä peruskäytössäkin. Kaatumisen jälkeen kone kyllä buuttaa normaalisti ja Windowsiin pääsee kirjautumaan. Ongelma on toistunut lähes joka päivä (jonain päivinä useammankin kerran) koneen kasaamisesta alkaen.

Kokoonpano:
emolevy: Asus TUF GAMING X670E-PLUS WIFI
CPU: AMD Ryzen 5 7600X
CPU cooler: Thermalright Peerless Assassin 120 SE
muistit: Corsair Vengeance DDR5 2x16GB 6000 Mhz CL30
näytönohjain: Nvidia GeForce GTX 1080 Founders Edition
kovalevy: Western Digital Black SN850X M.2 2000 GB PCIe 4.0 NVMe
kotelo: Fractal Design Define 7 Compact
virtalähde: Asus ROG Strix 850W
OS: Windows 11 Pro

Kotelossa on 2 etutuuletinta, takatuuletin ja "kattotuuletin". Eli ilmankierto pitäisi olla ihan ok.

Kovalevy, CPU ja sen cooler ovat uusina hankittuja, muut on ostettu käytettyinä sieltä sun täältä. Näytönohjain on siirretty vanhasta koneesta.

Tähän mennessä on kokeiltu mm:
- Päivitin emoon uusimman BIOSsin (2613).
- Asensin uusimmat piirisarja-ajurit
- Pistin BIOSsista muistien EXPO-asetuksen disabled-tilaan, eli ihan vakiomuistiasetuksilla mennään, 4800 MHz muistaakseni.
- Laitoin uudet tahnat prossuun+cooleriin.
- Putsasin näytönohjaimen pölyt ja asensin sinnekin uudet tahnat.
- Kiristin tuulettimien asetuksia BIOSsista ns. turbo-tilaan, eli ne reagoi ärhäkämmin lämpötilojen nousuun yms.

Tuulettimista ja HWiNFOa kyttäämällä olen huomannut, että prossulla lämmöt nousee ihan pienestäkin ponnistuksesta välillä todella nopeasti jostain vähän yli 40 asteesta yli 70 asteeseen, mutta tulee sitten alas.

Omat epäilykset kohdistuvat tällä hetkellä virtalähteeseen ja/tai prossuun, mutta en kyllä osaa perustella miksi :)

Lokitin HWiNFO-softalla muutamia aikasarjoja. Jätin CSV-tiedostoihin viimeisimmän 5 minuutin pätkän merkinnät, eli merkinnät päättyvät juuri ennen kaatumista. En nyt ole mikään asiantuntija noissa kaikissa jännitteissä yms, joten jos jaksat vilkaista lukemia joko suoraan CSV:stä tai käppyröitä jollain lokisoftalla (esim. https://www.hwinfo.com/files/GenericLogViewer/GenericLogViewer_v6.4.zip), kerro ihmeessä onko niissä jotain huolestuttavaa tai muuten vain huomion arvoista. Kiitos!

hwinfo 2024-06-02 p03 5min.CSV
hwinfo 2024-06-03 p01 5min.CSV
hwinfo 2024-06-03 p02 5min.CSV

Alla esimerkki Windowsin system-lokita. Kaikki critical-merkinnät ovat tähän mennessä lähes identtisiä, eli niissä on sama Event ID (41), Task Category (63) ja Keywords (70368744177664),(2).

Log Name: System
Source: Microsoft-Windows-Kernel-Power
Date: 3.6.2024 13.43.40
Event ID: 41
Task Category: (63)
Level: Critical
Keywords: (70368744177664),(2)
User: SYSTEM
Computer: EMKKPC
Description:
The system has rebooted without cleanly shutting down first. This error could be caused if the system stopped responding, crashed, or lost power unexpectedly.
Event Xml:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-Kernel-Power" Guid="{331c3b3a-2005-44c2-ac5e-77220c37d6b4}" />
<EventID>41</EventID>
<Version>9</Version>
<Level>1</Level>
<Task>63</Task>
<Opcode>0</Opcode>
<Keywords>0x8000400000000002</Keywords>
<TimeCreated SystemTime="2024-06-03T10:43:40.2749749Z" />
<EventRecordID>22221</EventRecordID>
<Correlation />
<Execution ProcessID="4" ThreadID="8" />
<Channel>System</Channel>
<Computer>EMKKPC</Computer>
<Security UserID="S-1-5-18" />
</System>
<EventData>
<Data Name="BugcheckCode">0</Data>
<Data Name="BugcheckParameter1">0x0</Data>
<Data Name="BugcheckParameter2">0x0</Data>
<Data Name="BugcheckParameter3">0x0</Data>
<Data Name="BugcheckParameter4">0x0</Data>
<Data Name="SleepInProgress">0</Data>
<Data Name="PowerButtonTimestamp">0</Data>
<Data Name="BootAppStatus">0</Data>
<Data Name="Checkpoint">0</Data>
<Data Name="ConnectedStandbyInProgress">false</Data>
<Data Name="SystemSleepTransitionsToOn">0</Data>
<Data Name="CsEntryScenarioInstanceId">0</Data>
<Data Name="BugcheckInfoFromEFI">false</Data>
<Data Name="CheckpointStatus">0</Data>
<Data Name="CsEntryScenarioInstanceIdV2">0</Data>
<Data Name="LongPowerButtonPressDetected">false</Data>
<Data Name="LidReliability">false</Data>
<Data Name="InputSuppressionState">0</Data>
<Data Name="PowerButtonSuppressionState">0</Data>
<Data Name="LidState">3</Data>
</EventData>
</Event>
 
Viimeksi muokattu:
Omat epäilykset kohdistuvat tällä hetkellä virtalähteeseen ja/tai prossuun, mutta en kyllä osaa perustella miksi

eikö toi vois RAM muistitkin olla ongelma jos saattaa kevyessäkin käytössä kaatua? luultavasti lämmöt ei ole kyseessä
 
23:02:22 tullut 11 virhettä. Mitäs nuo ovat jos tapahtumienvalvonnasta vilkaisee.

Esim itsellä event-id 29 kernel-boot "Windowsin nopea käynnistys epäonnistui" kun avannut koneen ja sen jälkeen event-id 41 "Järjestelmä on käynnistetty uudelleen sammuttamatta kokonaan ensin" vaikka kone vaikutti käynnistyvän normaalisit eikä kaatunut.

tuo Kernel-power event-id 41 ei yksinään kerro mikä tuon aiheutti.

toisena kysymyksenä muistatko mikä bios versio oli ennen päivitystä ? Versiosta 1413 2023/04/27 alkaen korjattu tuo soc jänniteen aiheuttama prossun ja socketin kokkaaminen.
Oliko socketissa mitään tummentumaa kun laitoit prossun paikoilleen.
 
Viimeksi muokattu:
Lähinnä tulee mieleen 2 todennököistä vaihtoehtoa:

1) Piitahnaa liikaa. Ja tahnojen uusiminen ei auta jos uusia tahnoja laittaessa tekee saman virheen

2) Joku muistipiiri rikki. Testaa ottamalla toinen muistikampa pois ja käyttämällä konetta vain yhdellä muistikammalla vaikka pari päivää, ja vuorotellen vaihtaen kampaa välissä.
 
23:02:22 tullut 11 virhettä. Mitäs nuo ovat jos tapahtumienvalvonnasta vilkaisee.

Tällaisia WHEA-herjoja löytyi tapahtumalokilta 11 kappaletta. Kaikki lähes identtisiä keskenään, ainoastaan Processor APIC ID -arvot vaihtelevat (6, 4, 2, 10, 1, 3). Alla olevassa esimerkissä siis arvolla 6.

Log Name: System
Source: Microsoft-Windows-WHEA-Logger
Date: 2.6.2024 23.02.20
Event ID: 19
Task Category: None
Level: Warning
Keywords:
User: LOCAL SERVICE
Computer: EMKKPC
Description:
A corrected hardware error has occurred.

Reported by component: Processor Core
Error Source: Corrected Machine Check
Error Type: Cache Hierarchy Error
Processor APIC ID: 6

The details view of this entry contains further information.
Event Xml:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{c26c4f3c-3f66-4e99-8f8a-39405cfed220}" />
<EventID>19</EventID>
<Version>0</Version>
<Level>3</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime="2024-06-02T20:02:20.0774969Z" />
<EventRecordID>21827</EventRecordID>
<Correlation ActivityID="{d76e2788-1824-42b2-bed0-8295ea7c228c}" />
<Execution ProcessID="6080" ThreadID="1736" />
<Channel>System</Channel>
<Computer>EMKKPC</Computer>
<Security UserID="S-1-5-19" />
</System>
<EventData>
<Data Name="ErrorSource">1</Data>
<Data Name="ApicId">6</Data>
<Data Name="MCABank">2</Data>
<Data Name="MciStat">0x9c20400004020152</Data>
<Data Name="MciAddr">0x71bb12680</Data>
<Data Name="MciMisc">0xd01a0ffe00000000</Data>
<Data Name="ErrorType">9</Data>
<Data Name="TransactionType">0</Data>
<Data Name="Participation">256</Data>
<Data Name="RequestType">5</Data>
<Data Name="MemorIO">256</Data>
<Data Name="MemHierarchyLvl">2</Data>
<Data Name="Timeout">256</Data>
<Data Name="OperationType">256</Data>
<Data Name="Channel">256</Data>
<Data Name="Length">1163</Data>
<Data Name="RawData">435045521002FFFFFFFF040002000000020000008B04000013021400020618140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B248949139377F4BA8F1E0062805C2A3A68256D215B5DA01000000000000000000000000000000000000000000000000A0010000C00000000003000001000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000002000000000000000000000000000000000000000000000060020000E00000000003000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000000000000000000002000000000000000000000000000000000000000000000040030000240100000003000000000000011D1E8AF94257459C33565E5CC3F7E80000000000000000000000000000000002000000000000000000000000000000000000000000000064040000270000000003000000000000A13248C3C302524CA9F19F1D5D7723FC000000000000000000000000000000000300000000000000000000000000000000000000000000007F010000000000000002010300020000120FA6000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000600000000000000000000000000000000000000000000000000000000000000000000000000000007010000000000000600000000000000120FA60000080C060B32D87EFFFB8B170000000000000000000000000000000000000000000000000000000000000000F50157A5EFE3DE43AC72249B573FAD2C03000000000000009F009400000000008026B11B070000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001000800800100000000000000000000000000000000000000000000000000000300000002000000D7F1F9C527B5DA01060000000000000000000000000000000000000002000000520102040040209C8026B11B0700000000000000FE0F1AD00A00000006000000008A0A20B000020043104C1AE7870300FF010000250000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001B00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000010000000000000000000000FF00000000000000000000000000000000000000000000000000</Data>
</EventData>
</Event>
 
toisena kysymyksenä muistatko mikä bios versio oli ennen päivitystä ? Versiosta 1413 2023/04/27 alkaen korjattu tuo soc jänniteen aiheuttama prossun ja socketin kokkaaminen.
Oliko socketissa mitään tummentumaa kun laitoit prossun paikoilleen.

Emon alkuperäinen omistaja oli päivittänyt BIOSin 2413-versioon (2024/02/07). Päivitin sen uusimpaan (2613 - 2024/04/17) kun bongasin sen Asuksen sivuilta.

Prossu on ulkoisesti kunnossa, eli mitään tummentumia tms ei näy.
 
Kiitos kaikille kommenteista ja vinkeistä tähän mennessä. Pitää tsekata taas nuo prossun lämpötahnat huolellisemmin kun ehtii. Ja sitten testata vain yhdellä muistikammalla vuorotellen.
 
Tällaisia WHEA-herjoja löytyi tapahtumalokilta 11 kappaletta. Kaikki lähes identtisiä keskenään, ainoastaan Processor APIC ID -arvot vaihtelevat (6, 4, 2, 10, 1, 3). Alla olevassa esimerkissä siis arvolla 6.

Log Name: System
Source: Microsoft-Windows-WHEA-Logger
Date: 2.6.2024 23.02.20
Event ID: 19
Task Category: None
Level: Warning
Keywords:
User: LOCAL SERVICE
Computer: EMKKPC
Description:
A corrected hardware error has occurred.

Reported by component: Processor Core
Error Source: Corrected Machine Check
Error Type: Cache Hierarchy Error
Processor APIC ID: 6

The details view of this entry contains further information.
Event Xml:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
<System>
<Provider Name="Microsoft-Windows-WHEA-Logger" Guid="{c26c4f3c-3f66-4e99-8f8a-39405cfed220}" />
<EventID>19</EventID>
<Version>0</Version>
<Level>3</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime="2024-06-02T20:02:20.0774969Z" />
<EventRecordID>21827</EventRecordID>
<Correlation ActivityID="{d76e2788-1824-42b2-bed0-8295ea7c228c}" />
<Execution ProcessID="6080" ThreadID="1736" />
<Channel>System</Channel>
<Computer>EMKKPC</Computer>
<Security UserID="S-1-5-19" />
</System>
<EventData>
<Data Name="ErrorSource">1</Data>
<Data Name="ApicId">6</Data>
<Data Name="MCABank">2</Data>
<Data Name="MciStat">0x9c20400004020152</Data>
<Data Name="MciAddr">0x71bb12680</Data>
<Data Name="MciMisc">0xd01a0ffe00000000</Data>
<Data Name="ErrorType">9</Data>
<Data Name="TransactionType">0</Data>
<Data Name="Participation">256</Data>
<Data Name="RequestType">5</Data>
<Data Name="MemorIO">256</Data>
<Data Name="MemHierarchyLvl">2</Data>
<Data Name="Timeout">256</Data>
<Data Name="OperationType">256</Data>
<Data Name="Channel">256</Data>
<Data Name="Length">1163</Data>
<Data Name="RawData">435045521002FFFFFFFF040002000000020000008B04000013021400020618140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B248949139377F4BA8F1E0062805C2A3A68256D215B5DA01000000000000000000000000000000000000000000000000A0010000C00000000003000001000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000002000000000000000000000000000000000000000000000060020000E00000000003000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000000000000000000002000000000000000000000000000000000000000000000040030000240100000003000000000000011D1E8AF94257459C33565E5CC3F7E80000000000000000000000000000000002000000000000000000000000000000000000000000000064040000270000000003000000000000A13248C3C302524CA9F19F1D5D7723FC000000000000000000000000000000000300000000000000000000000000000000000000000000007F010000000000000002010300020000120FA6000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000600000000000000000000000000000000000000000000000000000000000000000000000000000007010000000000000600000000000000120FA60000080C060B32D87EFFFB8B170000000000000000000000000000000000000000000000000000000000000000F50157A5EFE3DE43AC72249B573FAD2C03000000000000009F009400000000008026B11B070000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001000800800100000000000000000000000000000000000000000000000000000300000002000000D7F1F9C527B5DA01060000000000000000000000000000000000000002000000520102040040209C8026B11B0700000000000000FE0F1AD00A00000006000000008A0A20B000020043104C1AE7870300FF010000250000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001B00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000010000000000000000000000FF00000000000000000000000000000000000000000000000000</Data>
</EventData>
</Event>
nuo apic arvot tarkoittaa ytimiä. mitenköhän ytimet kaatuilee tuohon malliin. onko jotain curve optimiseria tai optimointia päällä ?
 
Pientä väliaikapäivitystä... huoh, tästä taitaa tulla pitkä ja tuskainen projekti.

On vaihdettu PSU:n ja emon välisiä piuhoja, asennettu Windows uudelleen parikin kertaa, tsekattu prossun ja näytönohjaimen tahnat yms. Kone on pysynyt vakaana normikäytössä ja kevyemmissä peleissä, mutta vähänkään raskaammissa peleissä (Far Cry 6, Ghost Recon Wildlands) kone buuttaa yhtäkkiä.

Viimeisimpänä temppuna vaihdoin virtalähteen vähän uudempaan ja tehokkaampaan (Corsair RM1000X), mutta eipä sekään auttanut. Testasin heti Ghost Reconia, ja crash+boot tuli tällä kertaa noin 25 minuutin pelailun kohdalla.

Seuraavana pitänee vaihtaa muistit ja katsoa, jatkuuko kaatuilu. Sitten on vuorossa varmaankin prossu, GPU, kovalevy ja vihoviimeisenä emolevy... ehkä.

Alla linkki muutamaan HWiNFO64-lokiin, joissa lukemat päättyvät juuri ennen kaatumista.

Windowsin system-loki näyttää critical-tapahtumien osalta samaa kuin ennenkin, eli Event ID 41, Task Category 63 ja Keywords (70368744177664),(2).
 
Viimeksi muokattu:
Mä lähtisin paikantamaan vikaa näyttikseen,eli onko sulla ddulla ajurit asennettu ja viimeisimmät.Toki myös vika voi olla muistien aiheuttamana onko sulla oikeat muistit ja ne oikeissa sloteissa.
 
Pientä väliaikapäivitystä... huoh, tästä taitaa tulla pitkä ja tuskainen projekti.

On vaihdettu PSU:n ja emon välisiä piuhoja, asennettu Windows uudelleen parikin kertaa, tsekattu prossun ja näytönohjaimen tahnat yms. Kone on pysynyt vakaana normikäytössä ja kevyemmissä peleissä, mutta vähänkään raskaammissa peleissä (Far Cry 6, Ghost Recon Wildlands) kone buuttaa yhtäkkiä.

Viimeisimpänä temppuna vaihdoin virtalähteen vähän uudempaa ja tehokkaampaan (Corsair RM1000X), mutta eipä sekään auttanut. Testasin heti Ghost Reconia, ja crash+boot tuli tällä kertaa noin 25 minuutin pelailun kohdalla.

Seuraavana pitänee vaihtaa muistit ja katsoa, jatkuuko kaatuilu. Sitten on vuorossa varmaankin prossu, GPU, kovalevy ja vihoviimeisenä emolevy... ehkä.

Alla linkki muutamaan HWiNFO64-lokiin, joissa lukemat päättyvät juuri ennen kaatumista.

Windowsin system-loki näyttää critical-tapahtumien osalta samaa kuin ennenkin, eli Event ID 41, Task Category 63 ja Keywords (70368744177664),(2).
Otitko C-statet pois päältä biosista kuten ohjeistin edellisessä viestissäni?
 
Otitko C-statet pois päältä biosista kuten ohjeistin edellisessä viestissäni?

BIOSista löysin kohdan "Global C-state Control", jonka pistin pois päältä (disabled) yli kuukausi sitten.

Vai olisiko BIOSissa useampikin "C-state -vipu" joka pitäisi pistää pois päältä?

BIOS C-state 20240712_171711.jpg
 
niin kaatuileeko nuo ytimet vieläkin ?

jos laittaisi prossun takuuseen ja kattoo mitä sanovat.
 
Mä lähtisin paikantamaan vikaa näyttikseen,eli onko sulla ddulla ajurit asennettu ja viimeisimmät.Toki myös vika voi olla muistien aiheuttamana onko sulla oikeat muistit ja ne oikeissa sloteissa.

Näyttis on toki vähän tehoton mopo nykyiseen kokoonpanoon, mutta se kyllä toimi moitteettomasti vanhassa koneessa ja ihan tavallisen tallaajan Nvidia Geforce Experience -päivityksillä.

Tarkoititko DDU:lla tätä?

En ole ikinä mitään DDU-kikkailuja harrastanut, mutta kai sitäkin voisi kokeilla.

Muistit (2 x 16 GB DDR5) on laitettu kuten emon manuaalissa ohjeistetaan eli A2- ja B2-paikoille.

muistit.PNG
 
Näyttis on toki vähän tehoton mopo nykyiseen kokoonpanoon, mutta se kyllä toimi moitteettomasti vanhassa koneessa ja ihan tavallisen tallaajan Nvidia Geforce Experience -päivityksillä.

Tarkoititko DDU:lla tätä?

En ole ikinä mitään DDU-kikkailuja harrastanut, mutta kai sitäkin voisi kokeilla.



Muistit (2 x 16 GB DDR5) on laitettu kuten emon manuaalissa ohjeistetaan eli A2- ja B2-paikoille.

muistit.PNG
Kokeilisin A1B1 paikoissa.Lipsahti väärä niin korjasin
Juu se poistaa näyttis ajurit ja sit lataat ajurit nvidian sivulta.Ei mitään Nvidia Geforce Experience kikkaretta siis ei asennuksia sieltä.Se voi olla toki asennettu jos jonkun pelin haluaa sieltä mut muuten ei.
 
Emolevyn manuaalissa tosiaan sanottiin et A2b2 on myös oikein ,mut kokeile A1B1.Jos emolevyn sloteissa on jotain vikaaa.Error koodi vois viitata muisteihin.
 
niin kaatuileeko nuo ytimet vieläkin ?

jos laittaisi prossun takuuseen ja kattoo mitä sanovat.

Edellisen Windowsin uudelleen asennuksen jälkeen noita APIC-herjoja ei ole Windows-lokilla näkynyt. Eikä muutakaan WHEA-loggeriin viittaavaa.
 

Statistiikka

Viestiketjuista
261 785
Viestejä
4 547 037
Jäsenet
74 849
Uusin jäsen
ookooo

Hinta.fi

Back
Ylös Bottom