Järjestelmä
CPU: Intel Core i7-5960X @ 3.00GHz (Ylikellotettuna 4.3GHz:ssä adaptive offsetillä, 0.3V n. 3 vuotta, eli "alusta asti")
GPU: MSI 980 Ti 6G (rikkoutui 30.3.2018*, RMA:n kautta korvaava MSI 1080 8G 30.4.2018 lähtien käytössä)
Emolevy: Asus X99 Deluxe
Virtalähde: 750 Watt EVGA SuperNOVA G2 Modular 80+ Gold
CPU jäähdytys: Corsair Hydro Series H110i GT Complete Water Cooling
Keskusmuisti: G Skill Intl / F4-2133C15-8GNT x 4 (yhteensä 32GB)
Käyttöjärjestelmä: Windows 10 Pro
SSD (jolle Windows uudelleenasennettuna testinä): Crucial® MX300 1TB 2.5" SSD, tilattu 25.11.2017
Koottu ja käytetty: 2015 kesäkuun lopusta lähtien.
Kaikki osat ovat ostettu/hankittu uusina samaan aikaan luukuunottamatta myöhemmin hankittua uutta SSD:tä ja takuuvaihdettua näytönohjainta.
980 Ti:n rikkoutuminen
Päästi taikasavut pihalle. Nähtävästi mitään muuta ei mennyt rikki, sillä kone toimi normaalisti kaverilta lainatulla 960:lla, paitsi yksi RAM-kampa ei tunnistunut enää (Windows näytti 24 GB). Irrotin ko. kamman ja laitoin takaisin paikalleen. Tämä näytti korjaavan ongelman, sillä sekä BIOS että Windows tunnistivat nyt kaikki kammat (yht. 32GB).
Näiden muistiongelmien jälkeen kone toimii normaalisti 960:lla kuukauden ja 1080:n saavuttua yli 2 viikkoa ennen ensimmäistä BSODia.
BSODien alku
- Satunnaisilta vaikuttavat BSODit alkoivat tapahtua kun kone oli hetken käyttämättä/valvomatta, arviolta 5..15 min kerrallaan.
- Kerran yksi BSOD tapahtui välittömästi uudelleen Chromen välilehtien palautuksen jälkeen.
- Lisää BSODeja koneen ollessa käyttämättä/valvomatta
- Ensimmäinen aktiivikäytössä tapahtunut BSOD pelissä (Company of Heroes 2)
- Muistaakseni peli kaatui ja BSOD ilmeni vasta Windowsin "ohjelma kaatui" -dialogin "sulje"-painikkeen painamisen jälkeen
- Sama peli toimi normaalisti useamman matsin ajan seuraavina päivinä, eli ei suoraan voida käyttää BSODin aiheuttamiseen
- Päivitin BIOSin ja piirisarja-, ääni- ja grafiikka-ajurit uusimpaan versioon
- Viimeinen ja vakavin BSOD ilmeni samassa pelissä: 5..6 minuuttia matsin alkamisen jälkeen peli kaatui. BSOD ilmeni heti, kun windowsin “ohjelma kaatui” -dialogin “sulje”-painiketta painettiin: System_Service_Exception win32kbase.sys
- Kone meni boot-looppiin (käynnistyy, tekee jotain n. 5..10 sekuntia, sammuu, sama uudestaan)
- Boot-loop poistui, kun koneen antoi olla hetken sammutettuna ilman virtoja (virtalähteen pääkytkin pois päältä)
- Kone ei enää boottaa windowsiin, vaan menee suoraan BIOSiin - Windowsin bootti rikki/tuhoutunut?
- Muutaman kerran koneen bootatessa BIOSiin BIOS jäätyi (ei vastaa hiiren tai näppäimistön komentoihin)
- BIOSin jäätymiset loppui parin bootin jälkeen
Boottauksen korjausyritykset Windowsin asennusmedialla
- Automaattinen korjaus epäonnistui
- bootrec /fixboot aiheuttaa “Access is denied”
- bootrec /rebuildbcd aiheuttaa “The requested system device cannot be found”
Tässä kohtaa en kuitenkaan pidä bootin korjausta tärkeimpänä. Mahdollinen laitteistovika pitää selvittää ensin.
memtest86
- memtestin ensimmäinen ajo ilman mitään muutoksia laitteistoon kaatui ja jätti lokiin kaksi muistivirhettä:
Tästä ajosta tekee vielä mielenkiintoisemman se, että memtestin loki ensimmäiseltä ajolta korruptoitui osittain:
(satunnaisia vääriä tavuja siellä sun täällä. Korruptiota ei ilmennyt seuraavilla memtesta-ajoilla)
- Ajoin memtestin uudelleen, mutta vain yhdellä RAM-kammalla. Ensimmäinen pass meni läpi, joten keskeytin sen.
- Laitoin loput kammat takaisin paikalleen. Kuuden tunnin jälkeen kaikki neljä passia meni läpi ilman virheitä.
Windowsin uudelleenasennus tyhjälle SSD:lle
- Asensin windowsin uudelleen tyhjälle SSD:lle. Kaikki sujui ongelmitta. Asensin edellä mainitun pelin Company of Heroes 2 ja ajoin sillä yhden testipelin, ei ongelmia.
- Päätin ajaa Prime95-testin. Käynnistin Prime95:n uudelleen noin vartin ajon jälkeen.
- Toisella Prime95-ajokerralla ilmeni BSOD (samaan aikaan Chromessa usea välilehti, muokkasin Google drivessä dokumentteja). En ehtinyt lukea virhekoodia.
- Tämän jälkeen kone ei suostunut boottaamaan hetkeen (boottaa, sammuu. Ei looppia). Jätin sen jälleen kerran ilman sähköjä hetkeksi: Boottaa jälleen Windowsiin.
- Tämän jälkeen huomasin outoja lämpötiloja usealla työkalulla (Open Hardware monitor, HWMonitor, HWInfo64):
- BIOS ei näytä mitään näistä, joten saattaa olla vain asentamaton lisätuuletinkortti/anturi?
Tällä hetkellä ei tunnu olevan mitään varmaa tapaa tuottaa BSODia uudelleen. Memtestin perusteella keskusmuisti ei välttämättä ole syypää. Mitä kannattaa koittaa seuraavaksi?
CPU: Intel Core i7-5960X @ 3.00GHz (Ylikellotettuna 4.3GHz:ssä adaptive offsetillä, 0.3V n. 3 vuotta, eli "alusta asti")
GPU: MSI 980 Ti 6G (rikkoutui 30.3.2018*, RMA:n kautta korvaava MSI 1080 8G 30.4.2018 lähtien käytössä)
Emolevy: Asus X99 Deluxe
Virtalähde: 750 Watt EVGA SuperNOVA G2 Modular 80+ Gold
CPU jäähdytys: Corsair Hydro Series H110i GT Complete Water Cooling
Keskusmuisti: G Skill Intl / F4-2133C15-8GNT x 4 (yhteensä 32GB)
Käyttöjärjestelmä: Windows 10 Pro
SSD (jolle Windows uudelleenasennettuna testinä): Crucial® MX300 1TB 2.5" SSD, tilattu 25.11.2017
Koottu ja käytetty: 2015 kesäkuun lopusta lähtien.
Kaikki osat ovat ostettu/hankittu uusina samaan aikaan luukuunottamatta myöhemmin hankittua uutta SSD:tä ja takuuvaihdettua näytönohjainta.
980 Ti:n rikkoutuminen
Päästi taikasavut pihalle. Nähtävästi mitään muuta ei mennyt rikki, sillä kone toimi normaalisti kaverilta lainatulla 960:lla, paitsi yksi RAM-kampa ei tunnistunut enää (Windows näytti 24 GB). Irrotin ko. kamman ja laitoin takaisin paikalleen. Tämä näytti korjaavan ongelman, sillä sekä BIOS että Windows tunnistivat nyt kaikki kammat (yht. 32GB).
Näiden muistiongelmien jälkeen kone toimii normaalisti 960:lla kuukauden ja 1080:n saavuttua yli 2 viikkoa ennen ensimmäistä BSODia.
BSODien alku
- Satunnaisilta vaikuttavat BSODit alkoivat tapahtua kun kone oli hetken käyttämättä/valvomatta, arviolta 5..15 min kerrallaan.
- Kerran yksi BSOD tapahtui välittömästi uudelleen Chromen välilehtien palautuksen jälkeen.
- Lisää BSODeja koneen ollessa käyttämättä/valvomatta
- Ensimmäinen aktiivikäytössä tapahtunut BSOD pelissä (Company of Heroes 2)
- Muistaakseni peli kaatui ja BSOD ilmeni vasta Windowsin "ohjelma kaatui" -dialogin "sulje"-painikkeen painamisen jälkeen
- Sama peli toimi normaalisti useamman matsin ajan seuraavina päivinä, eli ei suoraan voida käyttää BSODin aiheuttamiseen
- Päivitin BIOSin ja piirisarja-, ääni- ja grafiikka-ajurit uusimpaan versioon
- Viimeinen ja vakavin BSOD ilmeni samassa pelissä: 5..6 minuuttia matsin alkamisen jälkeen peli kaatui. BSOD ilmeni heti, kun windowsin “ohjelma kaatui” -dialogin “sulje”-painiketta painettiin: System_Service_Exception win32kbase.sys
- Kone meni boot-looppiin (käynnistyy, tekee jotain n. 5..10 sekuntia, sammuu, sama uudestaan)
- Boot-loop poistui, kun koneen antoi olla hetken sammutettuna ilman virtoja (virtalähteen pääkytkin pois päältä)
- Kone ei enää boottaa windowsiin, vaan menee suoraan BIOSiin - Windowsin bootti rikki/tuhoutunut?
- Muutaman kerran koneen bootatessa BIOSiin BIOS jäätyi (ei vastaa hiiren tai näppäimistön komentoihin)
- BIOSin jäätymiset loppui parin bootin jälkeen
Boottauksen korjausyritykset Windowsin asennusmedialla
- Automaattinen korjaus epäonnistui
- bootrec /fixboot aiheuttaa “Access is denied”
- bootrec /rebuildbcd aiheuttaa “The requested system device cannot be found”
Tässä kohtaa en kuitenkaan pidä bootin korjausta tärkeimpänä. Mahdollinen laitteistovika pitää selvittää ensin.
memtest86
- memtestin ensimmäinen ajo ilman mitään muutoksia laitteistoon kaatui ja jätti lokiin kaksi muistivirhettä:
Koodi:
2018-05-22 18:52:46 - All memory ranges successfully locked
2018-05-22 18:53:31 - [MEM ERROR - Data] Test: 5, CPU: 4, Address: 545E5F274, Expected: 6C1DF4BE, Actual: 6C3DF4BE
2018-05-22 18:53:32 - [MEM ERROR - Data] Test: 5, CPU: 12, Address: 55632B914, Expected: D71923D6, Actual: D73923D6
Tästä ajosta tekee vielä mielenkiintoisemman se, että memtestin loki ensimmäiseltä ajolta korruptoitui osittain:
- Ajoin memtestin uudelleen, mutta vain yhdellä RAM-kammalla. Ensimmäinen pass meni läpi, joten keskeytin sen.
- Laitoin loput kammat takaisin paikalleen. Kuuden tunnin jälkeen kaikki neljä passia meni läpi ilman virheitä.
Windowsin uudelleenasennus tyhjälle SSD:lle
- Asensin windowsin uudelleen tyhjälle SSD:lle. Kaikki sujui ongelmitta. Asensin edellä mainitun pelin Company of Heroes 2 ja ajoin sillä yhden testipelin, ei ongelmia.
- Päätin ajaa Prime95-testin. Käynnistin Prime95:n uudelleen noin vartin ajon jälkeen.
- Toisella Prime95-ajokerralla ilmeni BSOD (samaan aikaan Chromessa usea välilehti, muokkasin Google drivessä dokumentteja). En ehtinyt lukea virhekoodia.
- Tämän jälkeen kone ei suostunut boottaamaan hetkeen (boottaa, sammuu. Ei looppia). Jätin sen jälleen kerran ilman sähköjä hetkeksi: Boottaa jälleen Windowsiin.
- Tämän jälkeen huomasin outoja lämpötiloja usealla työkalulla (Open Hardware monitor, HWMonitor, HWInfo64):
- BIOS ei näytä mitään näistä, joten saattaa olla vain asentamaton lisätuuletinkortti/anturi?
Tällä hetkellä ei tunnu olevan mitään varmaa tapaa tuottaa BSODia uudelleen. Memtestin perusteella keskusmuisti ei välttämättä ole syypää. Mitä kannattaa koittaa seuraavaksi?
- 24.5.2018 Jätin Prime95 ajamaan n. 1h 30min ajaksi ja Chromeen testinä yhden twitch-streamin auki. Ei BSODia. Prime95 ei siis suoraan ainakaan aiheuta BSODia.
- 25.5.2018 Tarkastin BIOSin asetukset: BIOS näyttäisi palautuneen oletusarvoihin, eli ylikellotus ei ole enää päällä. En tiedä tarkalleen missä kohtaa BIOS oli nollaantunut, ehkä päivityksen yhteydessä?
- Lisähistoriaa: Aivan koneen alkuaikoina oli ongelmia CPU:n power managementin ja ko. virtalähteen kanssa: C6 taso aiheutti selittämättömiä sammutuksia. Ei siis BSODeja, virtalähde vain sammui. Silloin ongelmaan auttoi C3-C6 tasojen raportoinnin poisto käytöstä: EVGA 750 Supernova G2 sammuu yllättäen | MuroBBS
Tämä ongelma ei toistunut sen jälkeen ja kone toimi normaalisti ~2v 10kk, eli alussa kuvattuun ensimmäiseen BSODiin asti.
- 25.5.2018 Tarkastin BIOSin asetukset: BIOS näyttäisi palautuneen oletusarvoihin, eli ylikellotus ei ole enää päällä. En tiedä tarkalleen missä kohtaa BIOS oli nollaantunut, ehkä päivityksen yhteydessä?
- Lisähistoriaa: Aivan koneen alkuaikoina oli ongelmia CPU:n power managementin ja ko. virtalähteen kanssa: C6 taso aiheutti selittämättömiä sammutuksia. Ei siis BSODeja, virtalähde vain sammui. Silloin ongelmaan auttoi C3-C6 tasojen raportoinnin poisto käytöstä: EVGA 750 Supernova G2 sammuu yllättäen | MuroBBS
Tämä ongelma ei toistunut sen jälkeen ja kone toimi normaalisti ~2v 10kk, eli alussa kuvattuun ensimmäiseen BSODiin asti.
- Koneessa on nyt kiinni kaverin XFX Pro 750W virtalähde
- Sama kaatuminen, kuin aloitusviestin kohdassa "Windowsin uudelleenasennus tyhjälle SSD:lle" on kuvattu, ilmeni uudelleen Prime95:n ollessa käynnissä. En nähnyt varsinaista BSODia; Sivunäytöistä oli hävinnyt kuva ja keskimmäisessä näkyi ohjelmat, jotka olivat auki sillä hetkellä. Kone ei vastannut inputtiin (hiiri, näppäimistö) ja sammui hetken päästä itsestään. WIndowsin luotettavuuden valvonnassa ei tällä kertaa näy laitteistovirhettä. Corsair link ehti kaatua kahdesti, ajankohdallisesti ehkä samaan aikaan, kuin jäätyminen ilmeni.
- Sama jälkioire: Kone ei boottaa, vaan sammuu hetken päästä (Edes emolevyn logo ei ilmesty näytölle yrityksen aikana). n. 10 min virrat pois ja boottaa normaalisti Windowsiin.
- Käynnistin selaimen ja Prime95:n uudellen. Tällä kertaa ilmeni oikea BSOD: KMODE_EXCEPTION_NOT_HANDLED: tcpip.sys
- Kirjoitushetkellä tämän BSODin dump on vieläkin kesken (0%), taitaa olla jumissa. Odotan jonkin aikaa.
- BSODit siis jatkuvat virtalähteen vaihdosta huolimatta samankaltaisilla oireilla.
- Sama kaatuminen, kuin aloitusviestin kohdassa "Windowsin uudelleenasennus tyhjälle SSD:lle" on kuvattu, ilmeni uudelleen Prime95:n ollessa käynnissä. En nähnyt varsinaista BSODia; Sivunäytöistä oli hävinnyt kuva ja keskimmäisessä näkyi ohjelmat, jotka olivat auki sillä hetkellä. Kone ei vastannut inputtiin (hiiri, näppäimistö) ja sammui hetken päästä itsestään. WIndowsin luotettavuuden valvonnassa ei tällä kertaa näy laitteistovirhettä. Corsair link ehti kaatua kahdesti, ajankohdallisesti ehkä samaan aikaan, kuin jäätyminen ilmeni.
- Käynnistin selaimen ja Prime95:n uudellen. Tällä kertaa ilmeni oikea BSOD: KMODE_EXCEPTION_NOT_HANDLED: tcpip.sys
- Kirjoitushetkellä tämän BSODin dump on vieläkin kesken (0%), taitaa olla jumissa. Odotan jonkin aikaa.
- BSODit siis jatkuvat virtalähteen vaihdosta huolimatta samankaltaisilla oireilla.
Irrotin molemmat lan-porttien kaapelit ja yhdistin nettiin pelkällä wifillä (emolevyn integroitu). Prime95 raportoi varsin huolestuttavia virheitä (ks. liitetiedosto "prime95_error.zip").
Virhe tuntuu toistuvan; Prime95:n uudelleenkäynnistyksen jälkeen virheet jatkuvat.
Koneen uudelleenkäynnistyksen jälkeen Prime95 ei enää raportoi virheitä.
Virhe tuntuu toistuvan; Prime95:n uudelleenkäynnistyksen jälkeen virheet jatkuvat.
Koneen uudelleenkäynnistyksen jälkeen Prime95 ei enää raportoi virheitä.
Päivitys #4
BSODit loppuivat varsin yllättäen 26.5.
Korjasin bootin ja jatkoin koneen käyttöä. BSODeja ei nää ilmennyt.
Uutena yllätyksenä USB-mikrofoni ei toimi kunnolla emolevyn takapaneelin USB-porteissa. Toimii siis hetken, jonka jälkeen "sammuu". Jostain syystä toimii kotelon etupaneelin porteissa.
Kuvan ao. kuvassa näkyy, ongelmat hävisivät niin pitkäksi aikaa, että koneen luotettavuus alkoi hipoa yhdeksää.
12.6.2018 klo 17.05: BSOD pelatessa CoH2:ta. Varsin kummallista, sillä 26.5. -> 12.6. välille on osunut ko. peliä paljonkin.
12.6.2018 klo 17.06: Windowsin bootti vaihteeksi rikki: Your PC/Device needs to be repaired, File: \windows\system32\ntoskrnl.exe, Error code: 0xc0000221
12.6.2018 klo 17.07: BSOD sisäänkirjautumisen jälkeen: PAGE_FAULT_IN_NONPAGED_AREA, NTFS.sys
12.6.2018 klo 17.31: Bootin korjaus "normaalilla" tavalla
Jälleen boottaa normaalisti.
12.6.2018 klo 17.48: BSOD selatessa nettiä, SYSTEM_SERVICE_EXCEPTION, NTFS.sys
12.6.2018 klo 18.09: BSOD selatessa nettiä, IRQL_NOT_LESS_OR_EQUAL
Ongelman aiheuttajan metsästys siis jatkuu. Memdumpit eivät oiken tunnu toimivan; Joko ei dumppaa mitään tai dumppaa korruptoituneen (WhoCrashed.exe). Tapahtumalokeihin ei jää muuta, kuin "Windowsia ei suljettu oikein". BSODien virhekoodit ovat vähän mitä sattuu.
Mitäköhän voisi koittaa seuraavaksi? Kone on kirjoitushetkellä taas vaihteeksi epäilyttävän vakaa. Sama kuvio kuitenkin tuntui toistuvan; Kriittinen kaatuminen pelissä, jota seuraa joukko "vähemmän" kriittisiä kaatumisia, jotka lopulta loppuvat itsestään. Edelleenkään ei näytä olevan selvää, mistä kaatumiset johtuvat. 3v alkaa tulla täyteen, joten takuut alkavat raukeamaan.
- Keskusmuistit selvisivät aikoinaan 6h ajosta, ehkäpä pitää ajaa tupla- tai triplakestoinen ajo? Näin saisi ehkä ainakin varmistettua muistin kunnon & mahdollinen virhe tallentuisi memtestin lokiin.
- Massamuistien läpikotainen testaus/skannaus?
Tässä kohtaa alkaa lähinnä kiinnostaa mitkä osat ovat kelvollisia kierrättää seuraavaan koneeseen. Alustavasti ainakin uudempi 1 TB SSD (11/2017) ja varsin tuore RMA:n tarjoama MSI 1080 8G (5/2018).
BSODit loppuivat varsin yllättäen 26.5.
Korjasin bootin ja jatkoin koneen käyttöä. BSODeja ei nää ilmennyt.
Uutena yllätyksenä USB-mikrofoni ei toimi kunnolla emolevyn takapaneelin USB-porteissa. Toimii siis hetken, jonka jälkeen "sammuu". Jostain syystä toimii kotelon etupaneelin porteissa.
Kuvan ao. kuvassa näkyy, ongelmat hävisivät niin pitkäksi aikaa, että koneen luotettavuus alkoi hipoa yhdeksää.
12.6.2018 klo 17.05: BSOD pelatessa CoH2:ta. Varsin kummallista, sillä 26.5. -> 12.6. välille on osunut ko. peliä paljonkin.
12.6.2018 klo 17.06: Windowsin bootti vaihteeksi rikki: Your PC/Device needs to be repaired, File: \windows\system32\ntoskrnl.exe, Error code: 0xc0000221
12.6.2018 klo 17.07: BSOD sisäänkirjautumisen jälkeen: PAGE_FAULT_IN_NONPAGED_AREA, NTFS.sys
12.6.2018 klo 17.31: Bootin korjaus "normaalilla" tavalla
Koodi:
bcdedt /export c:\BCD_Backup
e:
cd boot
attrib bcd -s -h -r
ren e:\boot\bcd bcd-12-06-2018.old
bootrec /rebuildbcd
Select one and only OS
> The operation completed successfully
12.6.2018 klo 18.09: BSOD selatessa nettiä, IRQL_NOT_LESS_OR_EQUAL
Ongelman aiheuttajan metsästys siis jatkuu. Memdumpit eivät oiken tunnu toimivan; Joko ei dumppaa mitään tai dumppaa korruptoituneen (WhoCrashed.exe). Tapahtumalokeihin ei jää muuta, kuin "Windowsia ei suljettu oikein". BSODien virhekoodit ovat vähän mitä sattuu.
Mitäköhän voisi koittaa seuraavaksi? Kone on kirjoitushetkellä taas vaihteeksi epäilyttävän vakaa. Sama kuvio kuitenkin tuntui toistuvan; Kriittinen kaatuminen pelissä, jota seuraa joukko "vähemmän" kriittisiä kaatumisia, jotka lopulta loppuvat itsestään. Edelleenkään ei näytä olevan selvää, mistä kaatumiset johtuvat. 3v alkaa tulla täyteen, joten takuut alkavat raukeamaan.
- Keskusmuistit selvisivät aikoinaan 6h ajosta, ehkäpä pitää ajaa tupla- tai triplakestoinen ajo? Näin saisi ehkä ainakin varmistettua muistin kunnon & mahdollinen virhe tallentuisi memtestin lokiin.
- Massamuistien läpikotainen testaus/skannaus?
Tässä kohtaa alkaa lähinnä kiinnostaa mitkä osat ovat kelvollisia kierrättää seuraavaan koneeseen. Alustavasti ainakin uudempi 1 TB SSD (11/2017) ja varsin tuore RMA:n tarjoama MSI 1080 8G (5/2018).
Viimeksi muokattu: