Sporadische Bluescreens

Shor

Commander
Registriert
Jan. 2005
Beiträge
2.368
Hallo zusammen!

System:
  • MB: ASUS ROG Strix B550-I Gaming
  • CPU: AMD Ryzen 5900X mit EKWB AIO 280
  • RAM: 32 GB G.Skill RipJaws V 3600
  • GPU: Gigabyte RTX 3080 Gaming OC
  • SSD: Samsung PM9A1 2TB
  • Netzteil: Corsair SF750
  • OS: Windows 10 Prof. 21H2 (inkl. aller Updates)

Ich hab "aus dem Nichts" seit einigen Tagen sporadische Bluescreens beim Starten meines PCs. Ganz am Anfang kam einmalig (!) SYSTEM_THREAD_EXCEPTION_NOT_HANDLED. Seitdem kommt "nur" noch PAGE_FAULT_IN_NONPAGED_AREA. Aber wie gesagt sporadisch: Mal kommt es gar nicht, mal kommt es zwei oder drei Mal hintereinander. Ich starte dann einfach immer wieder neu - und irgendwann geht es halt. Wenn das System dann einmal läuft, stürzt es auch nicht ab oder so.

Ein Windows Update hab ich am Tag zuvor nicht installiert; hab ich schon gecheckt. Nur eine wenig spannende Software, die ich aber schon wieder deinstalliert habe. Und ich hab eine ziemlich große Dateimenge von meinem NAS auf meine SSD kopiert; ca. 700 GB. Das hatte ich tatsächlich zuvor noch nie gemacht. Ansonsten ist aber nichts Spannendes passiert.

Was ich schon probiert habe:
  • Arbeitsspeicher außerhalb von Windows mit MemTest86 geprüft. Keine Fehler.
  • Per chkdsk fehlerhafte Sektoren gesucht und repariert. Keine Besserung.
  • Prime95 ein paar Stunden laufen lassen: Alles stabil.
  • Grafikkarten-Treiber (allerdings bisher ohne DDU) neu installiert: Keine Besserung.
  • Temperaturen überprüft, alles, auch unter Volllast, im grünen Bereich

Mein Bauchgefühl tippt irgendwie auf die SSD. Leider fällt mir jetzt scheinbar auf die Füße, dass ich mir eine OEM Platte gekauft habe. Drive Info und SSDLife Pro erkennen die Platte nur teilweise; und selbst Samsuns Magician gibt mir keinen Laufwerkszustand an, sondern lässt lediglich einen Schreib- und Lesebenchmark zu sowie das Auslesen der SMART-Werte zu. Tatsächlich fallen mir hier zwei Dinge auf:

- Die Speeds meiner Platte waren in einigen Tests deutlich schlechter als ursprünglich; die Lese- und Schreibraten waren teilweise nur noch halb so hoch. Wobei ich hier leider nicht 100%ig sicher bin, wie gut und schlecht die Werte genau waren, da irgendwie die History gelöscht wurden. Insofern die Speed-Thematik am besten mit Vorsicht genießen

- Sie SMART-Werte zeigen Media Error:

1643454973824.png


Davon abgesehen, dass ich nicht weiß, ob 5.136 Media Error wirklich ein Problem sind, habe ich im Kopf, dass SMART-Werte ohnehin mit Vorsicht zu genießen sind.

Firmware GXB7301Q.

Kann da irgendwas wer zu sagen? Und gibt es vielleicht noch ganz andere Ansätze?

Gruß und danke
Jens
 
Zuletzt bearbeitet:
Oh, guter Tipp. Danke dir! Ist ergänzt.
 
Die SSD lieber mal mit "CrystalDiskInfo " auslesen,
Screenshot posten aber so dass man alle Parameter/Werte sehen kann.
"PAGE_FAULT_IN_NONPAGED_AREA" meist ein Software/Treiber Problem.
 
Im Ordner C:/Windows/Minidump
befinden sich die Informationen zum blue screen.
Die letzten fünf Files auf den Desktop kopieren.
Mit rar oder zip verpacken.
Hier im Forum hoch laden.
 
Silver Server schrieb:
Im Ordner C:/Windows/Minidump
befinden sich die Informationen zum blue screen.
Die letzten fünf Files auf den Desktop kopieren.
Mit rar oder zip verpacken.
Hier im Forum hoch laden.

Anbei.

Nickel schrieb:
Hier solltest du aber "MemTest86" nehmen, "Memtest86+" ist für DDR4 nicht geeignet
und dadurch nicht zuverläßig.

Hab via https://www.memtest86.com/ die memtest86-usb.zip runtergeladen. Sollte dann ja die richtige Version gewesen sein, wenn ich das gerade nicht verchecke.
 

Anhänge

  • Minidumps.zip
    959,4 KB · Aufrufe: 169
Ist ne NVme, kann ich nicht viel dazu sagen was Parameter und Werte betrifft.
Google mal nach den Parameter/Wert "media and data integrity errors",
inwieweit diese kritisch sein können. Ergebnisse gibt es viele..
Ergänzung ()

Silver Server schrieb:
Umgerechnet sind das 20790 Errors
Wenn es denn welche sind, da muss man sich informieren, weil das keine Fehler sein müssen.
Ergänzung ()

"SYSTEM_THREAD_EXCEPTION_NOT_HANDLED"
"PAGE_FAULT_IN_NONPAGED_AREA"

Versuche ne Windows Neuinstallation bevor du neue Hardware kaufst/austauschst.
Kein Antivirenprogramm installieren (Windows Defender nutzen)
keine unnötigen Treiber und Systemtools.

Viel Erfolg.
 
Zuletzt bearbeitet:
Das ist fünf mal der gleiche Fehler

PAGE_FAULT_IN_NONPAGED_AREA (50)
Invalid system memory was referenced. This cannot be protected by try-except.
Typically the address is just plain bad or it is pointing at freed memory.

Es wurde auf einen ungültigen Systemspeicher verwiesen. Dies kann nicht durch try-außer geschützt werden. Normalerweise ist die Adresse einfach nur schlecht oder sie zeigt auf freigegebenen Speicher.

Es liegt ein Speicher Fehler vor. Das kann die Festplatte betreffen, aber meistens liegt es am Arbeitsspeicher.

Passt der Arbeitsspeicher zum Motherboard? steht er in der QVL Liste?
Sitzt der Arbeitsspeicher im richtigen Slot?
Bios Aktuell?
Chipsatztreiber neu installiert?
Arbeitsspeicher übertaktet?
Auch mal einen Memtest 86 durchführen. https://www.memtest86.com/download.htm
 
Silver Server schrieb:
Es liegt ein Speicher Fehler vor. Das kann die Festplatte betreffen, aber meistens liegt es am Arbeitsspeicher.
Nein, es ist meist ein Treiber/Software Problem:
"PAGE_FAULT_IN_NONPAGED_AREA"
Und Memtest86 war ja auch ok.
Hier sollte man aber nicht den alten "Memtest86+" nehmen.
 
Hi Silver Server,

ja, wie beschrieben tritt nur noch der PAGE_FAULT_IN_NONPAGED_AREA auf. Nur ganz am Anfang kam einmal der SYSTEM_THREAD_EXCEPTION_NOT_HANDLED.

Ansonsten:

Ja, MB und RAM passen zusammen. Steht in der QVL.
Ja, die Riegel sitzen definitiv in den richtigen Slots-
BIOS überprüfe ich gleich; müsste aktuell sein.
Chipsatztreiber dasselbe.
Arbeitsspeicher läuft per XMP auf den Spezifikationen der Riegel.
Memtest86 (nicht der alte Memtest86+) hab ich durchgeführt; keine Fehler.

Jens
 
Der oben Verlinkte Memtest86?

Ok, hast ergänzt, gesehen.

Mit dem Verweis auf #10 bzgl Neuinstallation lass ich euch mal weitermachen.
BIOS Update bringt wohl eher nichts, da es ja vorher lief und nun plötzlich so ist.
 
Shor schrieb:
BIOS überprüfe ich gleich; müsste aktuell sein.
Machine ID Information [From Smbios 3.3, DMIVersion 0, Size=2411]
BiosMajorRelease = 5
BiosMinorRelease = 17
BiosVendor = American Megatrends Inc.
BiosVersion = 2423
BiosReleaseDate = 08/11/2021

SystemManufacturer = ASUS
SystemProductName = System Product Name
SystemFamily = To be filled by O.E.M.
SystemVersion = System Version
SystemSKU = SKU
BaseBoardManufacturer = ASUSTeK COMPUTER INC.
BaseBoardProduct = ROG STRIX B550-I GAMING
BaseBoardVersion = Rev X.0x
Bios ist die Version 2423 vom 11.08.2021 .

----------

Dein Arbeitsspeicher taktet mit 3600MHz
[Memory Device (Type 17) - Length 92 - Handle 0030h]
Memory Error Info Handle 002fh
Total Width 64 bits
Data Width 64 bits
Size 16384MB
Form Factor 09h - DIMM
Device Set [None]
Device Locator DIMM_A1
Bank Locator BANK 0
Memory Type 1ah - DDR4
Type Detail 4080h - Synchronous Unbuffered (Unregistered)
Speed 3600MHz
Manufacturer G-Skill
Serial Number
Asset Tag Number [String Not Specified]
Part Number F4-3600C16-16GVKC
Attributes 2
Extended Size 0
Configured Memory Speed 3600
Minimum Voltage 1200
Maximum Voltage 1200
Configured Voltage 1200
Dein Prozessor ist aber für maximal 3200MHz ausgelegt.
Das kann funktionieren, muss es aber nicht.
Stelle mal ein Frequenz von 3200 MHz ein und schaue ob es trotzdem noch zu Fehlern kommt?
 
Zuletzt bearbeitet:
BIOS wie erwartet aktuell. Chipsatztreiber zu 99% auch; hab sie trotzdem neu installiert. Ich gehe mal vorsichtig davon aus, dass das den Fehler nicht behoben hat. Neuinstallation würde ich natürlich vor einem Hardwaretausch probieren, zumal ich ja aktuell - bis auf eventuell die SSD - keinen Grund zur Annahme für einen Defekt habe. Aber auch Neuinstallation ist für mich noch nicht das Mittel der Wahl. Ich hoffe, es hat noch wer eine Idee. Ich schau auch grad nochmal wegen der Media Error, aber es gibt keine stichhaltigen Google Ergebnisse.

Unnötige Treiber/Systemstools/Software allgemein hab ich eh nie drauf. Ich halte meine Systeme immer sehr "rein".
 
Shor schrieb:
Ich schau auch grad nochmal wegen der Media Error, aber es gibt keine stichhaltigen Google Ergebnisse.
Du hast auch 15 mal hartes Ausschalten "Unsafe Shutdowns", die wohl auch durch
die Bluesreens kommen und evt. möglich das "media and data integrity errors"
hiermit verknüpft ist.
Aber man findet auch Unterhaltungen im Netz wo bei "media and data integrity errors"
eine Reklamation der SSD empfohlen wird. Wende dich mal an Samsung diesbezüglich.
Evtl. kann ja auch mal hier jemand mit eine Samsung NVMe nachschauen wie das bei ihm aussieht.
Ergänzung ()

Silver Server schrieb:
Dein Prozessor ist aber für maximal 3200MHz ausgelegt.
Das kann funktionieren, muss es aber nicht.
Bedeutet ja jetzt nicht unbedingt das der RAM mit 3600 läuft
nur weil das Tools es so anzeigt. Da stand ja schon öfter mal irreführendes.
Da steht ja jetzt auch für die VDimm des RAM:
Minimum Voltage 1200
Maximum Voltage 1200
Configured Voltage 1200
Was soll es bedeuten?
DDR4 Standard VDimm ist zwar 1.200V (1.2V) aber nie bei XMP.
Und 3600MHz @ 1.2V, das wird nicht klappen und Memtest86
war ja angeblich fehlerfrei.
Ergänzung ()

Stell den RAM mal auf 3200MHz @ 1.35V und beobachte eine Weile.
 
Zuletzt bearbeitet:
Der RAM läuft wie gesagt per XMP auf 3.600 MHz mit 16-19-19-39. Spannung 1.35V wie von der RAM-Spezifikation vorgesehen. Inwieweit die CPU durch die 3.600 MHz plötzlich problematisch sein und die Bluescreens machen könnte, kann ich nicht einschätzen. Ich kenn mich mit OC nicht mehr aus. Werde das aber gerne mal auf 3.200 MHz senken und testen.

1643459402110.png


Das Memtest-Ergebnis war nicht "angeblich", sondern 100%ig völlig fehlerfrei. Es wurde am Ende mit einem grünen, großen "PASSED" quittiert und einem Error Count von 0. Ich werde das aber heute Nacht auch nochmal durchlaufen lassen und das Ergebnis fotografieren.
 
  • Gefällt mir
Reaktionen: Silver Server
Shor schrieb:
ich nicht weiß, ob 5.136 Media Error wirklich ein Problem sind
Ist zwar eine 980 Pro, aber sieht ganz danach aus:
https://eu.community.samsung.com/t5...-wieder-defekt-magician-diagnose/td-p/4616908
Silver Server schrieb:
Umgerechnet sind das 20790 Errors
Ich fürchte das ist mehr als eindeutig ein Problem (unabhängig von eventuellen RAM-Problemen).
Der Wert sollte eigentlich bei 0 stehen.
Als Vergleich mal eine Enterprise SSD mit wesentlich(!) höherer Schreiblast:
1643478344092.png


Und meine Systemplatte:

1643478984025.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Nickel
Hab auch mal die Google Bilder-Suche genutzt und sehe eigtl. nur Bilder mit Wert 0,
bei "media and data integrity errors" - SSD: Samsung PM9A1 2TB
 
Zurück
Oben