Systemabstürze / Neustarts mit vermeintlich diversen Fehlerquellen

AchimSPunkt

Newbie
Registriert
Nov. 2022
Beiträge
3
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 7 5800X
  • Arbeitsspeicher (RAM): 2 x 16 GB G.Skill F4-3000C16-16GISB
  • Mainboard: ASUS ROG Strix B550-E Gaming
  • Netzteil: be quiet! Straight Power 11 750 Watt
  • Gehäuse: be quiet! Pure Base 600
  • Grafikkarte: MSI RTX 2060 Ventus XS 6G
  • HDD / SSD: Sys-SSD: Samsung 980 Pro 1TB / Games/Daten Samsung 970 EVO Plus 2 TB
  • OS: aktuell Win 10 Pro vorher Win 11 Pro

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Hallo CB Community, da ich mir mittlerweile keinen Rat mehr weiß, erhoffe ich mir im Netz ggf. Schwarm- bzw. Expertenwissen, was mir vielleicht weiterhilft.

Mein System lief ca. 1 Jahr vollkommen schmerzfrei mit den verbauten Komponenten. Seit mehreren Monaten schmiert der Rechner im laufenden Betrieb ab, egal ob Browser, Photoshop oder Gaming. Dies passiert aus meiner Sicht entweder seit dem Upgrade auf Win 11 oder eines Nvidia Treiber Updates vor 5 Monaten. Mittlerweile ist der Rechner zum dritten Mal neu aufgesetzt - Diesmal mit Win 10 Pro aktuellste Version, um das FTPM Problem auszuklammern.

Zu Beginn gab es FPS Drops / Mikroruckler und Ton-Aussetzer bis hin zum schwarzen Bildschirm oder Neustart. Ab und zu fing sich der Rechner auch wieder. Diese führte ich auf das bekannte AMD / TPM Problem zurück. Also habe ich bis zum Release des ASUS Bios Updates gewartet und dem BIOS das Update spendiert. Keine wirkliche Verbesserung.

Dann kamen laufend die klassischen "nvlddmkm Probleme" auf. Also mit DDU mehrfach die Treiber sauber entfernt und wieder neu aufgespielt. Sowohl den alten Treiber aus 2021 als auch immer mal wieder den aktuellsten von Nvidia, welcher auch gerade installiert ist.

Geändert hat sich nichts: manchmal läuft der Rechner konstant 8 Stunden durch ohne zu Meckern, dann irgendwann wieder FPS Drops, Ruckler oder ein kompletter Neustart ohne jegliche Vorwarnung. Sogar im Idle Betrieb, wenn ich mal ne halbe Stunde afk war.

Die Ereignisanzeige ist voll von diversen Warnungen bis hin zu kritischen Fehlern, von welchen ich aber die meisten nicht deuten/lesen kann. Google hat mich da leider auch nicht wirklich schlauer gemacht. Die Zuverlässigkeitsanzeige wirft auch mehrere unspezifizierte Hardwarefehler aus.

Die Hardwareauslastung und Temperaturen sind vollkommen im Normalbereich.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
  • BIOS Update des Mainboards
  • aktuelle Treiber-Updates von den Herstellerseiten
  • mehrere Neuinstallation des Systems
  • diverse Tests mit HW-Info und 3D Mark gelogged.
  • heute wieder einen kompletten 3D-Mark Firestrike durchlaufen lassen ohne Probleme. 1 Stunde später Neustart während einer Bowsersession.

Ich bin mit meinem Latein am Ende. Vielleicht hat jemand noch eine Idee oder kann mir aus den Logs einen Tipp geben. Ich hänge mal einige Files hier an.

Im Voraus schon einmal vielen Dank!

Gruß
Achim
 

Anhänge

  • hwinfo_log7.CSV
    443,5 KB · Aufrufe: 110
  • Win Ereignisanzeige.zip
    844,8 KB · Aufrufe: 120
Ich tippe mal auf RAM. Evtl. kannst du dir von einem Bekannten einmal zwei RAMs ausborgen und diese einsetzten. Oder du machst einen Stabilitätstest mit Memtest.
 
  • Gefällt mir
Reaktionen: AchimSPunkt, Baal Netbeck und Dama
Wobei der MemTest86 afaik eher auf Fehler testet als auf Stabilität, auch wenn es durchaus vorkommen kann, dass er mit DOCP Fehler ausspuckt aber ohne dann nicht mehr. In welchen Slots steckt eigentlich der RAM?

Ich würde es daher erstmal ohne DOCP probieren. Ja das dürfte etwas dauern um das als Lösung verifizieren zu können, aber so ist das nunmal bei nicht reproduzierbaren Problemchen. Habe ich auch gerade erst durch.
 
  • Gefällt mir
Reaktionen: AchimSPunkt
DOCP hat er sowieso schon nicht an, da juckt es auch nicht groß wo die Stecken.


RAM ist da tatsächlich einer der Verdächtigen, die CPU wäre aber auch möglich.
Hast du geschaut ob du WHEAs in der Ereignisanzeige hast?
 
  • Gefällt mir
Reaktionen: AchimSPunkt
Erst einmal vielen Dank für eure Rückmeldungen. 👍

Der RAM steckt auf den Bänken 2 und 3 weil der erste Slot vom CPU Kühler verdeckt wird. Bringt hier ggf. ein Umstecken zum testen was? Wollte die gesamte HW-Info als Bericht hochladen, ging aber leider nicht.

Ich bin jetzt seit Jahren aus der Technik raus. Meinen letzten Rechner im Eigenbau habe ich vor 10 Jahren realisiert. Diesen hier habe ich bauen lassen daher mein Fragen:

Was ist DOCP bzw was macht es?
EDIT: Was sind WHEAs?

Ich ziehe mir Memtest runter und lassen den mal drüber laufen? Reicht ein kurzer Test oder soll ich den Rechner mal ein paar Stunden rödeln lassen?

Gibt es sonst noch Logs die weiterhelfen können, bzw kann ich im Windows noch etwas einstellen, um das Problem einzugrenzen?

Besten Dank!
Gruß Achim
 
Also kann man von A2/B1 ohne DOCP ausgehen, das sollte, sofern alles technisch einwandfrei ist, dennoch keine Probleme machen.

AchimSPunkt schrieb:
Reicht ein kurzer Test oder soll ich den Rechner mal ein paar Stunden rödeln lassen?
Mach das vielleicht über Nacht, bei 32GB kann das ein paar Stündchen dauern.
 
  • Gefällt mir
Reaktionen: AchimSPunkt
selbst ohne XMP/DOCP kann falsch gesteckt RAM probleme bereiten.
 
  • Gefällt mir
Reaktionen: AchimSPunkt
hatte ich schon 2 mal sowas: beim erstenmal wars ein gebrochenes Satakabel, beim zweiten war die Steckdose in der Wand durch reingelaufene Farbe (von vor 2 Jahren ^^) "instabil" mit Stromabgabe... dauert nur Wochen und Monate SOWAS zu tracken...
viellei kannst du beides erstmal ausschließen.
 
  • Gefällt mir
Reaktionen: AchimSPunkt
Danke für eure Rückmeldungen!

@Denniss ich werde die Bänke mal tauschen. Hätte das System dann nicht auch im ersten Jahr Fehler aufweisen müssen?

@pvcf Schaue ich mir auch an und teste einfach mal eine andere Leitung.


Zwischenergebnis von ein paar Tests heute:

  • Memtest 4 Stunden: bisher fehlerfrei. Lasse ich heute die Nacht durchlaufen
  • Prime95 BurnIn Test 1 Stunde: Ohne Beanstandung CPU Max 90° AVG 85°/ GPU 73° max / RAM Auslastung 98%+
  • FurMark 1 Stunde QHD keine Fehler
  • 3D-Mark FireStrike DX11 keine Fehler

  • 3D-Mark TimeSpy DX12 - Nvidia Treiber steigt aus:

    Die Beschreibung für die Ereignis-ID "0" aus der Quelle "nvlddmkm" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.

    Falls das Ereignis auf einem anderen Computer aufgetreten ist, mussten die Anzeigeinformationen mit dem Ereignis gespeichert werden.

    Die folgenden Informationen wurden mit dem Ereignis gespeichert:
    \Device\00000099
    Restarting TDR occurred on GPUID:800
    Die Nachrichtenressource ist vorhanden, die Nachricht wurde in der Nachrichtentabelle jedoch nicht gefunden

    Die Fehlermeldung dann in mehreren Ausführungen immer mit ID "0"

    Treiber wurde neu gestartet und dann war der Monitor wieder da.


  • 15 Minuten später beim Schreiben dieser Antwort hier (nur der Browser aktiv) zack Rechner steigt ohne irgendeine Belastung aus und startet komplett neu. :freak::grr:

    Fehlermeldungen aus dem Eventlog:

    Das System wurde zuvor am ‎16.‎11.‎2022 um 19:14:10 unerwartet heruntergefahren.

    Erstellung einer Abbilddatei aufgrund eines Fehlers beim Erstellen der Abbildkopie fehlgeschlagen.

    Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.
Ich hänge alle Events ab dem GPU-Ausstieg mal an, falls jemand damit was anfangen kann.

EDIT: HW-Info Report als PDF angehängt, falls das ggf. noch hilft.

Gruß

Achim
 

Anhänge

  • Hardware Logs GPU Ausstieg Browser.zip
    326,6 KB · Aufrufe: 102
  • HWiNFO64 Report.pdf
    3,4 MB · Aufrufe: 142
  • Gefällt mir
Reaktionen: pvcf
Zurück
Oben