BSOD: Memory Management tritt sporatisch und nur teilweise reproduzierbar auf

Naphtor

Cadet 4th Year
Registriert
Dez. 2012
Beiträge
91
Hallo in die Runde,

ich bin auf eure Hilfe angewiesen, da ich selbst nicht genau weiß, ich welche Richtung ich suchen soll. Ich habe seit knapp vier Jahren meinen PC und in sehr unregelmäßigen Abständen liefert er den oben genannten BlueScreen. Hier sind aber erstmal die Eckdaten des PCs:
  • CPU: Intel i7-6700 (non-k)
  • Kühler: EKL Ben Nevis
  • MB: Asus H170 Pro Gaming
  • RAM: 2x 8GB Kingston HyperX Fury DDR4-2133Mhz CL14-14-14-33
  • GPU: GeForce GTX960 4GB JetStream
  • PSU: 500W BQ Straight Power 10
  • System-SSD: Samsung 960 Evo 250GB
  • Spiele-SSD: Crucial BX100 250GB (nur Steam-Ordner drauf)
  • Gehäuse: Nanoxia Deep Silence 3
Ich habe den BSOD schon seit einigen Jahren und kann die Ursache nicht finden. Gestern Abend kam der BSOD gleich 3x hintereinander und am Ende auch noch einmal die Meldung "Kernel Data Inpage Error" - das hatte bisher nur sehr selten/gar nicht. Ich habe schon mehrfach den RAM überprüft, jedoch keinen Fehler gefunden. Heute Nacht werde ich erneut einen Scan laufen lassen. Ich habe in den Jahren den PC öfter offen gehabt zum Entstauben und für diverse Festplatten-Wechsel. Die Kabel habe ich dabei immer mal wieder auf festen Sitz überprüft. Auch können es die SSDs nicht sein, da die Samsung Evo erst vor ca. 1,5 Jahren dazu kam und die BX100 als Systemplatte abgelöst hat. Auch habe ich den PC während der 4 Jahre mehrfach neu aufgesetzt, sodass auch alte Treiber immer wieder ersetzt wurden.
Was ich sehr komisch finde: Wenn ich am Gehäuse die Frontlüfter auf die niedrigste Drehzahl stelle, dann tritt der BSOD häufiger auf (so entstand auch der letzte Fehler diese Woche - ich habe Nachmittags die Lüfter runter gedreht und Abends kamen dann die BSODs).
Die Lüfter sind dabei jedoch nicht aus, drehen nur sehr langsam. Ich habe den PC in der Zeit auch nicht belastet, sondern nur zwei Word-Dokumente offen gehabt, auch vorher wurde der PC nicht belastet, sodass eventuell einige Komponenten heiß geworden sein könnten.
Kann es wirklich der RAM sein? Müsste das nicht in dem Scan erkennbar sein? Ich werde morgen früh nochmal das Ergebnis des Windows-eigenen Scans (Windows Memory Diagnostic) hier reinstellen.

Welche Ursache könnte es sein? Was kann ich noch machen, um dem Fehler auf die Schliche zu kommen?

Viele Grüße
Naphtor
 
So unwahrscheinlich das klingen mag, aber ich tippe auf die CPU.
Wenn Du RAM und Board durch Querchecks ausschließen kannst und auch die Laufwerke safe sind, dann bleibt nur noch die CPU.

Mir ist in den letzten Jahren als PC-Techniker genau 4x eine defekte CPU untergekommen, wenn man die Fälle grober Gewalt oder Unvermögen heraus nimmt. Davon waren es zwei AM1-CPUs und zwei i7-6700 (1x mit k und 1x ohne). Wundert mich also nicht, wenn auch hier die CPU das Problem wäre, weil sich so etwas wie ein Serienproblem abzeichnet, denn die Symptome kommen mir bekannt vor...

Mein Tip:
Verkauf das Board und hol Dir einen i5-9400f plus passendes Board (S.1151 v2, also ab 300er Chipsatz).
Alternativ einen AMD Ryzen 5 plus Board, aber dann sollte auch der Speicher gegen höher getaktete Modelle getauscht werden (ab DDR4-2666 bis DDR4-3200).
Wenn das Geld lockerer sitzt, darfst Du je nach Zielsetzung bei der CPU natürlich gerne nach oben gehen. ;)
 
Puh aber nach welcher Logik produziert die CPU den Fehler? Kann ich das irgendwie nachprüfen, z.B. aus den Dumpfiles der Bluescreens? Ich hatte gehofft, einer Neuanschaffung noch ein bis zwei Jahre zu entkommen (wobei AMD momentan ja sehr attraktive Angebote hat...).
Das Ergebnis des RAM-Tests war - wie zu erwarten - ein fehlerfreier RAM...

Ich möchte noch ergänzen, dass ich nie die CPU übertaktet habe (im Rahmen der beschränkten Möglichkeiten).
 
Naphtor schrieb:
Puh aber nach welcher Logik produziert die CPU den Fehler?

Ich tippe auf Speichercontroller o.ä., der ggf. bei Lastwechseln unsauber arbeitet.


Naphtor schrieb:
Kann ich das irgendwie nachprüfen, z.B. aus den Dumpfiles der Bluescreens?

Nein, weil dort meist nur das Symptom erkennbar ist, aber selten die Ursache.
 
Hatte das Problem auch und memtest hat bei mir auch nie etwas gefunden. Ich habe dann die Riegel einzeln ausprobiert und mit einem ist der Bluescreen permanent aufgetreten, der andere hat fehlerfrei funktioniert.
Deshalb würde ich einen RAM Defekt bei dir nicht ausschliessen.

Überprüfe das vielleicht besser erst noch mal genau, bevor du Geld für einen neuen Prozessor + Mainboard ausgibst. Dabei solltest du darauf achten, dass der RAM möglichst komplett gefüllt ist.

Theoretisch könnte es auch am Grafikkarten Speicher liegen.

Statt der Graka könntest du es mal mit der iGPU versuchen.
 
Danke nochmal für die Tipps - ich versuche auf jeden Fall weiterhin mein Glück. Gestern hatte ich noch in der Windows-Ereignisanzeige etwas gestöbert und mich eines eventuellen Problems angenommen - vielleicht war es am Ende doch ein Treiberproblem (wobei ich das immernoch für sehr unwahrscheinlich halte).

Den Tipp, die Riegel einzeln zu testen probiere ich auf jeden Fall auch nochmal aus. Sollte der Defekt am Ende doch bei der CPU/Mainboard liegen, schadet es zumindest nicht.
 
@Naphtor

Lass uns mal pragmatisch vorgehen:

So du denn versiert bist das Abbild zu interpretieren: die Error Parameter sind der Schlüssel. Hier sollten sich eindeutige Hinweise darauf finden welche Art von Speicher der Verursacher ist. Andernfalls die letzten 3 Dumps hier verlinken.

Ein Bildchen von der (aufgezogenen) Datenträgerverwaltung wäre schön.

Konfiguration deines SWAP-Files?

Wurde das Datenkabel der SSD mal von dir überprüft?

Chkdsk über das System Volume, danach Chrystal Disk Info oder besser das herstellereigene Tool (SAMSUNG Magician). Die Ergebnisse der Untersuchung hier als Screenshot einstellen. Auf der Herstellerseite ggf. nach einem Firmwareupdate umsehen.

IT_Nerd
 
@IT_Nerd
Leider bin ich jetzt eine Woche nicht zuhause und kann nicht auf den PC zugreifen - ich würde aber die gewünschten Sachen nächste Woche hier hochladen bzw. Die Verbindungen überprüfen.
Die Kabelsache betrifft aber nur die SPIELE-SSD, da die 860 Evo per M2 direkt auf dem Mainboard angebunden ist. Einen Scan lasse ich dann laufen.
Die Dumpfiles kann ich leider nicht interpretieren - mich da einzulesen / länger als 10 min Googlen hatte ich noch keine Zeit. Ich werde die Daten hier hochladen.

Viele Grüße
Naphtor
 
@IT_Nerd

So, ich bin wieder im Lande und habe mich gleich mal daran gemacht, die vorgeschlagenen Tests durchzuführen. Ich habe mich zwar belesen, wie man die Dumpfiles öffnet und ausliest (ich bin den Weg über den Windows Debugger gegangen), jedoch hört es dann auf, da ich das angezeigte nicht wirklich interpretieren kann. Ich habe somit die letzten 5 Dumps, die in der kurzen Zeit auftraten hier verlinkt.

Ein Bild von der Datenträgerverwaltung ist hier:
809672


Konfiguration des Swap-Files:
809673


Wie gesagt steckt die System-SSD in einem M2-Slot und ist dort auch ordnungsgemäß festgeschraubt (gerade nochmal überprüft). Auch bei der Spiele-SSD sitzen alle Kabel wie sie sollen. Auch sonst saßen alle Stecker/Bauteile fest an ihrem Platz.

Chkdsk habe ich auch durchgeführt - den Log habe ich als txt beigefügt.

Ansonsten habe ich einen Perfomance-Test von CrystalDiskMark durchgeführt:
809675


Und hier ist das Ergebnis bzw. die Übersicht von Samsung Magician - die Firmware war schon aktuell.
809676


809677


Ich hoffe mit diesen weiterführenden Informationen kann mir geholfen werden!

Viele Grüße
naphtor
 

Anhänge

  • Chkdsk.txt
    2,7 KB · Aufrufe: 255
  • Minidump.7z
    430,6 KB · Aufrufe: 234
Mach mal ein Foto von der Ereignisanzeige mit den schweren Fehlern,und klicke diese an dann öffnet sich unterhalb ein Fenster wo der Fehler genau beschrieben wird
 
Es sind eigentlich immer die folgenden drei Einträge in der Ereignisanzeige, die einen Fehler liefern:
809781


809782


809783
 
Die "DistributedCOM" Fehlermeldung wird wohl jeder in der Ereignisanzeige finden, das wird nicht das Problem sein.
 
Ich habe jetzt nochmals die Ereignisanzeige durchforstet und bin aber auf keine weiteren offensichtlichen Hinweise gestoßen. Ich habe von zwei weiteren Typen noch ein Screeshot gemacht:

809802


809803
 
ich konnte den Fehler so glaube ich reproduzieren habe bei meinem testsystem ein altes netzteil montiert,
habe den selben kernel Fehler bekommen und das system kakt ab ohne Bluescreen.
er schreibts unten auch unter General. mit grosser Wahrscheinlichkeit ist das Netzteil schuld.
 
ich denke das Netzteil wird es nicht sein. die Kernep-Power Meldung ist eine Standardmeldung, wenn das System aus eben unbekannten Gründen neustartet. Darauf zu schließen, dass es am Netzteil liegt, kann ich nicht nachvollziehen.

Natürlich könnte es sein, dass wenn die Spannung instabil ist, dass möglicherweise solche Bluescreens auftreten können mit den o.g. Meldungen, aber da reicht meine Praxis Erfahrung nicht für aus. Mal davon ab, ist das Netzteil ausreichend dimensioniert und eine bewährte Modellreihe von BQ.
 
Ein Fehler des Netzteils würde mich auch wundern, vor allem da der Bluescreen auch gerne auf dem Desktop und nicht bei Spielen auftritt, wo ja die meiste Last anliegt. Oder könnten eventuelle Lastwechsel-Szenarien der Auslöser sein?
Ich würde den Fehler aber auch eher woanders vermuten...
 
Zurück
Oben