Ungeplante Neustarts

darkfight14

Cadet 1st Year
Registriert
Okt. 2019
Beiträge
10
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
aktuelle Hardware:
  • Prozessor (CPU): Ryzen 7 5800X
  • Arbeitsspeicher (RAM): G.Skill Aegis 3200MHz 32GB (2x 16GB) Kit F4-3200C16D-32GIS
  • Mainboard: MSI MPG B550 Gaming Plus
  • Netzteil: be quiet PurePower M13 650W
  • Gehäuse: CoolerMaster QUBE 500 Flatpack White
  • Grafikkarte: GigaByte GeForce RTX 5060Ti Eagle Max OC 16G
  • HDD / SSD: WD_BLACK SN770 1TB
  • Betriebssystem: Windows 11 Pro (neu aufgesetzt)
  • CaptureCard: Elgato GameCapture Pro (PCIe)
vorherige Hardware:
  • Prozessor (CPU): Ryzen 7 2700X
  • Arbeitsspeicher (RAM): G.Skill Trident Z RGB 3200MHz 32GB (2x 16GB) Kit F4-3200C16D-32GTZRX
  • Mainboard: MSI x470 Gaming Plus
  • Netzteil: bitfenix Whisper M 80 Plus Gold 650W
  • Grafikkarte: Gigabyte GeForce RTX 3060Ti Gaming OC 8G (Rev. 1.0)

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Seit geraumer Zeit habe ich ungewolltes Ausschalten des PC, wenn ich bestimmte Spiele spiele oder beispielsweise den Curve Optimizer im Ryzen Master ausführe.
Am einfachsten reproduzieren lässt sich das Verhalten, indem ich eine Runde in Fortnite starte und auf die Map geladen wird. Lobby soweit keine Probleme. Sobald die Runde startet oder wenn man landet freiert der ganze PC ein, es dauert dann ca. 30 Sekunden, der PC geht aus, , DEBUG LED leuchtet kurz bei VGA und ein Neustart wird eingeleitet, gefolgt von einem WHEA-Logger Eintrag in der Ereignisanzeige.
Stets mit wechselnden Prozessor-APIC-IDs.

In anderen Spielen wie beispielsweise Valorant, Anno 1800, Satisfactory, StarRupture gibt es keine Freezes gefolgt von einem Neustart.

1770143467560.png



Der Zuverlässigkeitsverlauf ist auch mit entsprechenden Ereignissen gespickt.
1770142767396.png


Auf der alten Hardware trat das Verhalten erst rein zufällig vor ca. 4 Monaten auf und dann hatte ich lange Zeit zu viel zu tun und habe mich nicht weiter um meinen PC gekümmert und wenn nur kleine Spiele gespielt, wo keine Fehler auftraten.

Ich ging Anfangs davon aus, das meine GPU oder CPU einen weg haben und erst zum Schluss vielleicht der RAM, daher habe ich nicht direkt alles getauscht.
Mit dem 2700x hatte ich immer eine feste Taktrate von 4GHz eingestellt über das BIOS. Ging für locker Sieben Jahre alles glatt bis dann die Neustarts dazukamen. Davor hatte ich von 16GB auf 32GB des gleichen RAMs erhöht. Jeweils immer als Dual Kit.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Da dieses Verhalten schon mit meiner vorherigen Hardware auftrat und auch die gleiche Meldung in der Ereignisanzeige stand, habe ich schon folgende Dinge getestet:
  • CMOS Reset (brachte zwischenzeitig Abhilfe, nach erneuten Auftreten der Problematik bringt das auch nichts mehr)
  • OC deaktiviert (kein Gameboos oder A-XMP) -> keine Verbesserung
  • MemTest (kein Befund)
  • OCCT Tests, sowohl CPU als auch GPU und in Kombination, Rotierende Kerntests (kein Befund)
  • Prime95 (kein Absturz)
  • RAM in einem anderen PC getestet (keine Abstürze)
  • Fremden Ram im PC getestet -> keine Verbesserung
  • Grafikkarte getauscht von 3060ti auf 5060ti -> keine Verbesserung
  • Prozessor getauscht von 2700x zu 5800x -> keine Verbesserung
  • Mainboard getauscht von x470 auf b550 -> keine Verbesserung
  • Windows neu installiert -> keine Verbesserung (sogar neustarts während der Installation, CMOS Reset hat geholfen)
  • Netzteil getauscht von Whisper M 80 Plus Gold 650W zu PurePower M13 650W -> keine Verbesserung
  • Arbeitsspeicher getauscht von trident z 32Gb zu aegis 32Gb -> keine Verbesserung
  • Prozessor in der Prozessorenergieverwaltung auf 99% begrenzt (keine Verbesserung)

Werte zu Spannungen und co habe ich nie angefasst, da ich da nicht rumbasteln wollte mit der Gefahr, dass ich hier Fehler mache und mir die Kiste ganz kaputt geht.

Welche Infos könnten noch fehlen und was für Ansätze habt ihr für mich?

P.S.: Beachte auch die verschiedenen angepinnten Themen und die Forensuche. Möglicherweise findest du da bereits die Lösung zu deinem Problem.

Bisherige Threads haben scheinbar noch keine Lösungen dokumentiert, die bei mir Anwendung finden können bzw. ähnliche Lösungsansätze aus ChatGPT wurden schon versucht bis auf Spannungsanpassungen.

Bitte verzeiht, wenn ich doch einen sehr änliches Thread übersehen habe, verlinkt diese gerne und ich lese mir die ebenfalls durch.

So allmählich verliere ich die Hoffnung darin, hier wieder auf einen gesunden Zweig zu stehen und normal ohne Ausetzer zu zocken/arbeiten.

Mit freundlichen Grüßen
Darkfight14
 
Du hast die komplette Hardware ausgetauscht. Es bleibt jetzt nur noch die Software als Ursache übrig.

Hast du schon mal Windows neu installiert?
Edit: Ach das hast du schon gemacht.

Uff, was bleibt denn dann noch übrig? Sind es immer die gleichen Fehler? Oder haben die sich zwischendurch auch mal geändert? Vielleicht hast du durch den HW-Tausch das ursprüngliche Problem behoben, aber gleichzeitig ein neues ins Haus geholt.
 
darkfight14 schrieb:
Prozessor getauscht von 2700x zu 5800x -> keine Verbesserung
War das ein 5800X, der auch definitiv in einem anderen System stabil läuft? Oder ist das ein Neukauf gewesen?

WHEA mit Machine Check Exception deutet nämlich in eine ziemlich klare Richtung: CPU. Es könnte eine Unterversorgung bei der Stromversorgung vorliegen, oder das Mainboard stellt eine zu starke LLC ein, die CPU könnte auch einfach defekt sein (nicht unwahrscheinlich bei Zen3 Chiplet CPUs) oder es wird zu starkes OC/UV betrieben. Einige Sachen hast du ja schon durch dein Vorgehen ausgeschlossen (CMOS-Reset, Windows Neuinstallation). Wenn du mit Default-BIOS-Settings schon bei der Windows Installation Neustarts hast, stimmt was mit der Hardware nicht und mein stärkster Guess bleibt eine defekte CPU (auch neue CPUs können defekt sein).

Edit: Ansonsten kann man auch die üblichen Workarounds abklappern. Wenn eines (oder mehrere) dieser Workarounds zum stabilen Betrieb führt, ist die CPU defekt (von Punkt 1 u. 4 mal abgesehen).
  • Idle Power Control: Typical Current Idle
  • Global C-States: disabled
  • DF C-States: disabled
  • PBO: disabled (sollte eigt. nach CMOS Reset eh aus sein)
  • CPB: disabled (CPU boostet dann nur noch bis Basistakt)
  • Curve Optimizer: +20
  • festen Takt/VCore einstellen, z.B. 3GHz @1V
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Firle
darkfight14 schrieb:
Windows neu installiert -> keine Verbesserung (sogar neustarts während der Installation, CMOS Reset hat geholfen)
Für mich spricht das irgendwie dafür, dass Bios und Ram nicht zusammengehen. Was da falsch sein könnte, erst recht noch nach einem Reset, da bin ich aber überfragt.

Und manche Mainboards/Sockel mögen es nicht, wenn man den CPU-Kühler zu dolle festschraubt. Das äußert sich eher in anderen Fehlern, aber würde wie @qiller bemerkt auch in Richtung CPU-Fehler gehen (nur halt nicht als Hardware-Schaden). Kannst du das ausschließen bzw. einfach testweise etwas Anpressdruck rausnehmen?
 
Looniversity schrieb:
Und manche Mainboards/Sockel mögen es nicht, wenn man den CPU-Kühler zu dolle festschraubt.
Wobei das tendenziell eher ein Problem von LGA ist und mir zumindest bei PGA noch nicht vorgekommen ist.

Ich würde noch den Austausch der SSD probieren - neben den Tipps zum Ausschluss der CPU. Weil auch die Festplatte kann durchaus ein Problem sein, wenn sie fehlerhafte Daten produziert.
 
  • Gefällt mir
Reaktionen: Looniversity
WHEA Errors mit Verweis auf die CPU sind bei AMD praktisch immer defekte CPUs oder seltener eine BIOS Version die nicht sauber funktioniert.

Das neueste BIOS ist drauf? Wenn ja, mal eine Version davor versuchen, wenn nein die neueste aufspielen.

Möglicherweise hattest du einfach Pech und die Alte als auch die neue CPU sind defekt. Ich würde die CPU reklamieren dann.

Das System muss ohne irgendwelche Anpassungen im BIOS funktionieren. Tut es das nicht ist was kaputt.
 
  • Gefällt mir
Reaktionen: Firle und qiller
Krik schrieb:
Uff, was bleibt denn dann noch übrig? Sind es immer die gleichen Fehler? Oder haben die sich zwischendurch auch mal geändert? Vielleicht hast du durch den HW-Tausch das ursprüngliche Problem behoben, aber gleichzeitig ein neues ins Haus geholt.
Möglich. Gehe ich aber weniger von aus, da der Fehler schon mit altem Board und CPU auftrat.

qiller schrieb:
War das ein 5800X, der auch definitiv in einem anderen System stabil läuft? Oder ist das ein Neukauf gewesen?
Ich habe den 5800x neugekauft, da ich schon länger einen Neukauf geplant hatte.
Im Bekanntenkreis hat nur einer die CPU aber braucht den PC aktiv zum Arbeiten, sonst hätte ich die sicherlich testen können.

qiller schrieb:
WHEA mit Machine Check Exception deutet nämlich in eine ziemlich klare Richtung: CPU. Es könnte eine Unterversorgung bei der Stromversorgung vorliegen, oder das Mainboard stellt eine zu starke LLC ein, die CPU könnte auch einfach defekt sein (nicht unwahrscheinlich bei Zen3 Chiplet CPUs) oder es wird zu starkes OC/UV betrieben. Einige Sachen hast du ja schon durch dein Vorgehen ausgeschlossen (CMOS-Reset, Windows Neuinstallation). Wenn du mit Default-BIOS-Settings schon bei der Windows Installation Neustarts hast, stimmt was mit der Hardware nicht und mein stärkster Guess bleibt eine defekte CPU (auch neue CPUs können defekt sein).

Edit: Ansonsten kann man auch die üblichen Workarounds abklappern. Wenn eines (oder mehrere) dieser Workarounds zum stabilen Betrieb führt, ist die CPU defekt (von Punkt 1 u. 4 mal abgesehen).
  • Idle Power Control: Typical Current Idle
  • Global C-States: disabled
  • DF C-States: disabled
  • PBO: disabled (sollte eigt. nach CMOS Reset eh aus sein)
  • CPB: disabled (CPU boostet dann nur noch bis Basistakt)
  • Curve Optimizer: +20
  • festen Takt/VCore einstellen, z.B. 3GHz @1V

Das es eine Unterversorgung sein kann, hatte mir ChatGPT auch ausgespuckt. Konnte ich mir aber auch nicht so wirklich vorstellen, dass dieses Verhalten erst beim 2700x aus dem Nichts auftrat und mit dem Wechsel der CPU gleich bleibt.

Also das mit dem CMOS Reset bei der Neuinstallation von Windows hatte ich sowohl mit dem alten als auch mit dem neuen Board machen müssen, damit er ohne Mucken die Installation durchführt.
Im Idle-Betrieb gibt es keine sporadischen Neustarts oder Ausfälle. Ich meine selbst unter Volllast in OCCT oder Prime bleibt das System stabil und gibt nirgends nach.
Cinebech ebenfalls laufen lassen, ging auch ohne Aussetzer durch.
Kann aber natürlich dennoch die CPU sein, die einen von Haus aus weg hat.

Die genannten Punkte werde ich durchgehen.
Also Global C-States und DF C-States deaktivieren, CPB deaktivieren;
Curve Optimizer hatte ich bisher nicht wieder ausgeführt und nach einem Durchlauf sind die Aussetzer schlimmer, das hatte ich gestern nicht mehr auf dem Schirm.
Einen festen Takt hatte ich schon probiert, ohne Erfolg. Aber ich teste das mit deinem Beispiel nochmal.

kachiri schrieb:
Die Festplatte nicht.
Gut das du das erwähnst. Ich hatte die NVME zwischenzeitig wegen Platzmangel getauscht gehabt. Auch zum Zeitpunkt mit dem alten Mainboard, wo die Problematik schon herrschte. Neuste Firmware ist ebenfalls drauf und SanDisk Dashboard sowie CrystalDiskInfo geben mir keine Fehlerwerte aus, die bedenklich sind.

Looniversity schrieb:
Für mich spricht das irgendwie dafür, dass Bios und Ram nicht zusammengehen. Was da falsch sein könnte, erst recht noch nach einem Reset, da bin ich aber überfragt.

Und manche Mainboards/Sockel mögen es nicht, wenn man den CPU-Kühler zu dolle festschraubt. Das äußert sich eher in anderen Fehlern, aber würde wie @qiller bemerkt auch in Richtung CPU-Fehler gehen (nur halt nicht als Hardware-Schaden). Kannst du das ausschließen bzw. einfach testweise etwas Anpressdruck rausnehmen?
Anpressdruck teste ich gleich mal, wobei wie @kachiri schrieb, das eher unüblich für den Sockeltyp ist. Aber einen Versuch ist es natürlich wer.

Mojo1987 schrieb:
WHEA Errors mit Verweis auf die CPU sind bei AMD praktisch immer defekte CPUs oder seltener eine BIOS Version die nicht sauber funktioniert.

Das neueste BIOS ist drauf? Wenn ja, mal eine Version davor versuchen, wenn nein die neueste aufspielen.

Möglicherweise hattest du einfach Pech und die Alte als auch die neue CPU sind defekt. Ich würde die CPU reklamieren dann.

Das System muss ohne irgendwelche Anpassungen im BIOS funktionieren. Tut es das nicht ist was kaputt.
Bios Version ist aktuell 7C56v1K. Also die Version vor der Beta. Ich probiere die vorherige Version und teste die Stabilität im Anschluss.

Wenn alles nichts bringt, werde ich eine RMA veranlassen und die CPU tauschen.

Ergebnisse werde ich später als Edit oder neuen Post nachreichen.
 
  • Gefällt mir
Reaktionen: qiller
Die Fehlermeldung deutet für mich auf eine zu geringe Core-Spannung über den Curve Optimizer hin, allerdings verwirrt mich das im Zusammenhang mit einem 2700X? Ich kenne das nur von 5000er CPUs im Bios, nicht bei 2000er über AMD-Software. Wird hier UV versucht? Falls nicht, könnte man trotzdem die Spannungen mal schrittweise moderat anheben, falls möglich nur bei den betroffenen Cores.
 
So ein Verhalten hatte mein PC vor Jahren gezeigt als die Grafikkarte anfing zu schwächeln. Die Neustarts wurden immer häufiger durchgeführt bis zum Totalausfall.

EDIT: Ich habe überlesen, dass du schon versucht hattest die GPU zu tauschen.
 
Zurück
Oben