Ungeplante Neustarts

darkfight14

Cadet 1st Year
Registriert
Okt. 2019
Beiträge
13
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
aktuelle Hardware:
  • Prozessor (CPU): Ryzen 7 5800X
  • Arbeitsspeicher (RAM): G.Skill Aegis 3200MHz 32GB (2x 16GB) Kit F4-3200C16D-32GIS
  • Mainboard: MSI MPG B550 Gaming Plus
  • Netzteil: be quiet PurePower M13 650W
  • Gehäuse: CoolerMaster QUBE 500 Flatpack White
  • Grafikkarte: GigaByte GeForce RTX 5060Ti Eagle Max OC 16G
  • HDD / SSD: WD_BLACK SN770 1TB
  • Betriebssystem: Windows 11 Pro (neu aufgesetzt)
  • CaptureCard: Elgato GameCapture Pro (PCIe)
vorherige Hardware:
  • Prozessor (CPU): Ryzen 7 2700X
  • Arbeitsspeicher (RAM): G.Skill Trident Z RGB 3200MHz 32GB (2x 16GB) Kit F4-3200C16D-32GTZRX
  • Mainboard: MSI x470 Gaming Plus
  • Netzteil: bitfenix Whisper M 80 Plus Gold 650W
  • Grafikkarte: Gigabyte GeForce RTX 3060Ti Gaming OC 8G (Rev. 1.0)

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Seit geraumer Zeit habe ich ungewolltes Ausschalten des PC, wenn ich bestimmte Spiele spiele oder beispielsweise den Curve Optimizer im Ryzen Master ausführe.
Am einfachsten reproduzieren lässt sich das Verhalten, indem ich eine Runde in Fortnite starte und auf die Map geladen wird. Lobby soweit keine Probleme. Sobald die Runde startet oder wenn man landet freiert der ganze PC ein, es dauert dann ca. 30 Sekunden, der PC geht aus, , DEBUG LED leuchtet kurz bei VGA und ein Neustart wird eingeleitet, gefolgt von einem WHEA-Logger Eintrag in der Ereignisanzeige.
Stets mit wechselnden Prozessor-APIC-IDs.

In anderen Spielen wie beispielsweise Valorant, Anno 1800, Satisfactory, StarRupture gibt es keine Freezes gefolgt von einem Neustart.

1770143467560.png



Der Zuverlässigkeitsverlauf ist auch mit entsprechenden Ereignissen gespickt.
1770142767396.png


Auf der alten Hardware trat das Verhalten erst rein zufällig vor ca. 4 Monaten auf und dann hatte ich lange Zeit zu viel zu tun und habe mich nicht weiter um meinen PC gekümmert und wenn nur kleine Spiele gespielt, wo keine Fehler auftraten.

Ich ging Anfangs davon aus, das meine GPU oder CPU einen weg haben und erst zum Schluss vielleicht der RAM, daher habe ich nicht direkt alles getauscht.
Mit dem 2700x hatte ich immer eine feste Taktrate von 4GHz eingestellt über das BIOS. Ging für locker Sieben Jahre alles glatt bis dann die Neustarts dazukamen. Davor hatte ich von 16GB auf 32GB des gleichen RAMs erhöht. Jeweils immer als Dual Kit.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Da dieses Verhalten schon mit meiner vorherigen Hardware auftrat und auch die gleiche Meldung in der Ereignisanzeige stand, habe ich schon folgende Dinge getestet:
  • CMOS Reset (brachte zwischenzeitig Abhilfe, nach erneuten Auftreten der Problematik bringt das auch nichts mehr)
  • OC deaktiviert (kein Gameboos oder A-XMP) -> keine Verbesserung
  • MemTest (kein Befund)
  • OCCT Tests, sowohl CPU als auch GPU und in Kombination, Rotierende Kerntests (kein Befund)
  • Prime95 (kein Absturz)
  • RAM in einem anderen PC getestet (keine Abstürze)
  • Fremden Ram im PC getestet -> keine Verbesserung
  • Grafikkarte getauscht von 3060ti auf 5060ti -> keine Verbesserung
  • Prozessor getauscht von 2700x zu 5800x -> keine Verbesserung
  • Mainboard getauscht von x470 auf b550 -> keine Verbesserung
  • Windows neu installiert -> keine Verbesserung (sogar neustarts während der Installation, CMOS Reset hat geholfen)
  • Netzteil getauscht von Whisper M 80 Plus Gold 650W zu PurePower M13 650W -> keine Verbesserung
  • Arbeitsspeicher getauscht von trident z 32Gb zu aegis 32Gb -> keine Verbesserung
  • Prozessor in der Prozessorenergieverwaltung auf 99% begrenzt (keine Verbesserung)

Werte zu Spannungen und co habe ich nie angefasst, da ich da nicht rumbasteln wollte mit der Gefahr, dass ich hier Fehler mache und mir die Kiste ganz kaputt geht.

Welche Infos könnten noch fehlen und was für Ansätze habt ihr für mich?

P.S.: Beachte auch die verschiedenen angepinnten Themen und die Forensuche. Möglicherweise findest du da bereits die Lösung zu deinem Problem.

Bisherige Threads haben scheinbar noch keine Lösungen dokumentiert, die bei mir Anwendung finden können bzw. ähnliche Lösungsansätze aus ChatGPT wurden schon versucht bis auf Spannungsanpassungen.

Bitte verzeiht, wenn ich doch einen sehr änliches Thread übersehen habe, verlinkt diese gerne und ich lese mir die ebenfalls durch.

So allmählich verliere ich die Hoffnung darin, hier wieder auf einen gesunden Zweig zu stehen und normal ohne Ausetzer zu zocken/arbeiten.

Mit freundlichen Grüßen
Darkfight14
 
Du hast die komplette Hardware ausgetauscht. Es bleibt jetzt nur noch die Software als Ursache übrig.

Hast du schon mal Windows neu installiert?
Edit: Ach das hast du schon gemacht.

Uff, was bleibt denn dann noch übrig? Sind es immer die gleichen Fehler? Oder haben die sich zwischendurch auch mal geändert? Vielleicht hast du durch den HW-Tausch das ursprüngliche Problem behoben, aber gleichzeitig ein neues ins Haus geholt.
 
darkfight14 schrieb:
Prozessor getauscht von 2700x zu 5800x -> keine Verbesserung
War das ein 5800X, der auch definitiv in einem anderen System stabil läuft? Oder ist das ein Neukauf gewesen?

WHEA mit Machine Check Exception deutet nämlich in eine ziemlich klare Richtung: CPU. Es könnte eine Unterversorgung bei der Stromversorgung vorliegen, oder das Mainboard stellt eine zu starke LLC ein, die CPU könnte auch einfach defekt sein (nicht unwahrscheinlich bei Zen3 Chiplet CPUs) oder es wird zu starkes OC/UV betrieben. Einige Sachen hast du ja schon durch dein Vorgehen ausgeschlossen (CMOS-Reset, Windows Neuinstallation). Wenn du mit Default-BIOS-Settings schon bei der Windows Installation Neustarts hast, stimmt was mit der Hardware nicht und mein stärkster Guess bleibt eine defekte CPU (auch neue CPUs können defekt sein).

Edit: Ansonsten kann man auch die üblichen Workarounds abklappern. Wenn eines (oder mehrere) dieser Workarounds zum stabilen Betrieb führt, ist die CPU defekt (von Punkt 1 u. 4 mal abgesehen).
  • Idle Power Control: Typical Current Idle
  • Global C-States: disabled
  • DF C-States: disabled
  • PBO: disabled (sollte eigt. nach CMOS Reset eh aus sein)
  • CPB: disabled (CPU boostet dann nur noch bis Basistakt)
  • Curve Optimizer: +20
  • festen Takt/VCore einstellen, z.B. 3GHz @1V
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Firle
darkfight14 schrieb:
Windows neu installiert -> keine Verbesserung (sogar neustarts während der Installation, CMOS Reset hat geholfen)
Für mich spricht das irgendwie dafür, dass Bios und Ram nicht zusammengehen. Was da falsch sein könnte, erst recht noch nach einem Reset, da bin ich aber überfragt.

Und manche Mainboards/Sockel mögen es nicht, wenn man den CPU-Kühler zu dolle festschraubt. Das äußert sich eher in anderen Fehlern, aber würde wie @qiller bemerkt auch in Richtung CPU-Fehler gehen (nur halt nicht als Hardware-Schaden). Kannst du das ausschließen bzw. einfach testweise etwas Anpressdruck rausnehmen?
 
Looniversity schrieb:
Und manche Mainboards/Sockel mögen es nicht, wenn man den CPU-Kühler zu dolle festschraubt.
Wobei das tendenziell eher ein Problem von LGA ist und mir zumindest bei PGA noch nicht vorgekommen ist.

Ich würde noch den Austausch der SSD probieren - neben den Tipps zum Ausschluss der CPU. Weil auch die Festplatte kann durchaus ein Problem sein, wenn sie fehlerhafte Daten produziert.
 
  • Gefällt mir
Reaktionen: Looniversity
WHEA Errors mit Verweis auf die CPU sind bei AMD praktisch immer defekte CPUs oder seltener eine BIOS Version die nicht sauber funktioniert.

Das neueste BIOS ist drauf? Wenn ja, mal eine Version davor versuchen, wenn nein die neueste aufspielen.

Möglicherweise hattest du einfach Pech und die Alte als auch die neue CPU sind defekt. Ich würde die CPU reklamieren dann.

Das System muss ohne irgendwelche Anpassungen im BIOS funktionieren. Tut es das nicht ist was kaputt.
 
  • Gefällt mir
Reaktionen: Firle und qiller
Krik schrieb:
Uff, was bleibt denn dann noch übrig? Sind es immer die gleichen Fehler? Oder haben die sich zwischendurch auch mal geändert? Vielleicht hast du durch den HW-Tausch das ursprüngliche Problem behoben, aber gleichzeitig ein neues ins Haus geholt.
Möglich. Gehe ich aber weniger von aus, da der Fehler schon mit altem Board und CPU auftrat.

qiller schrieb:
War das ein 5800X, der auch definitiv in einem anderen System stabil läuft? Oder ist das ein Neukauf gewesen?
Ich habe den 5800x neugekauft, da ich schon länger einen Neukauf geplant hatte.
Im Bekanntenkreis hat nur einer die CPU aber braucht den PC aktiv zum Arbeiten, sonst hätte ich die sicherlich testen können.

qiller schrieb:
WHEA mit Machine Check Exception deutet nämlich in eine ziemlich klare Richtung: CPU. Es könnte eine Unterversorgung bei der Stromversorgung vorliegen, oder das Mainboard stellt eine zu starke LLC ein, die CPU könnte auch einfach defekt sein (nicht unwahrscheinlich bei Zen3 Chiplet CPUs) oder es wird zu starkes OC/UV betrieben. Einige Sachen hast du ja schon durch dein Vorgehen ausgeschlossen (CMOS-Reset, Windows Neuinstallation). Wenn du mit Default-BIOS-Settings schon bei der Windows Installation Neustarts hast, stimmt was mit der Hardware nicht und mein stärkster Guess bleibt eine defekte CPU (auch neue CPUs können defekt sein).

Edit: Ansonsten kann man auch die üblichen Workarounds abklappern. Wenn eines (oder mehrere) dieser Workarounds zum stabilen Betrieb führt, ist die CPU defekt (von Punkt 1 u. 4 mal abgesehen).
  • Idle Power Control: Typical Current Idle
  • Global C-States: disabled
  • DF C-States: disabled
  • PBO: disabled (sollte eigt. nach CMOS Reset eh aus sein)
  • CPB: disabled (CPU boostet dann nur noch bis Basistakt)
  • Curve Optimizer: +20
  • festen Takt/VCore einstellen, z.B. 3GHz @1V

Das es eine Unterversorgung sein kann, hatte mir ChatGPT auch ausgespuckt. Konnte ich mir aber auch nicht so wirklich vorstellen, dass dieses Verhalten erst beim 2700x aus dem Nichts auftrat und mit dem Wechsel der CPU gleich bleibt.

Also das mit dem CMOS Reset bei der Neuinstallation von Windows hatte ich sowohl mit dem alten als auch mit dem neuen Board machen müssen, damit er ohne Mucken die Installation durchführt.
Im Idle-Betrieb gibt es keine sporadischen Neustarts oder Ausfälle. Ich meine selbst unter Volllast in OCCT oder Prime bleibt das System stabil und gibt nirgends nach.
Cinebech ebenfalls laufen lassen, ging auch ohne Aussetzer durch.
Kann aber natürlich dennoch die CPU sein, die einen von Haus aus weg hat.

Die genannten Punkte werde ich durchgehen.
Also Global C-States und DF C-States deaktivieren, CPB deaktivieren;
Curve Optimizer hatte ich bisher nicht wieder ausgeführt und nach einem Durchlauf sind die Aussetzer schlimmer, das hatte ich gestern nicht mehr auf dem Schirm.
Einen festen Takt hatte ich schon probiert, ohne Erfolg. Aber ich teste das mit deinem Beispiel nochmal.

kachiri schrieb:
Die Festplatte nicht.
Gut das du das erwähnst. Ich hatte die NVME zwischenzeitig wegen Platzmangel getauscht gehabt. Auch zum Zeitpunkt mit dem alten Mainboard, wo die Problematik schon herrschte. Neuste Firmware ist ebenfalls drauf und SanDisk Dashboard sowie CrystalDiskInfo geben mir keine Fehlerwerte aus, die bedenklich sind.

Looniversity schrieb:
Für mich spricht das irgendwie dafür, dass Bios und Ram nicht zusammengehen. Was da falsch sein könnte, erst recht noch nach einem Reset, da bin ich aber überfragt.

Und manche Mainboards/Sockel mögen es nicht, wenn man den CPU-Kühler zu dolle festschraubt. Das äußert sich eher in anderen Fehlern, aber würde wie @qiller bemerkt auch in Richtung CPU-Fehler gehen (nur halt nicht als Hardware-Schaden). Kannst du das ausschließen bzw. einfach testweise etwas Anpressdruck rausnehmen?
Anpressdruck teste ich gleich mal, wobei wie @kachiri schrieb, das eher unüblich für den Sockeltyp ist. Aber einen Versuch ist es natürlich wer.

Mojo1987 schrieb:
WHEA Errors mit Verweis auf die CPU sind bei AMD praktisch immer defekte CPUs oder seltener eine BIOS Version die nicht sauber funktioniert.

Das neueste BIOS ist drauf? Wenn ja, mal eine Version davor versuchen, wenn nein die neueste aufspielen.

Möglicherweise hattest du einfach Pech und die Alte als auch die neue CPU sind defekt. Ich würde die CPU reklamieren dann.

Das System muss ohne irgendwelche Anpassungen im BIOS funktionieren. Tut es das nicht ist was kaputt.
Bios Version ist aktuell 7C56v1K. Also die Version vor der Beta. Ich probiere die vorherige Version und teste die Stabilität im Anschluss.

Wenn alles nichts bringt, werde ich eine RMA veranlassen und die CPU tauschen.

Ergebnisse werde ich später als Edit oder neuen Post nachreichen.
 
  • Gefällt mir
Reaktionen: qiller
Die Fehlermeldung deutet für mich auf eine zu geringe Core-Spannung über den Curve Optimizer hin, allerdings verwirrt mich das im Zusammenhang mit einem 2700X? Ich kenne das nur von 5000er CPUs im Bios, nicht bei 2000er über AMD-Software. Wird hier UV versucht? Falls nicht, könnte man trotzdem die Spannungen mal schrittweise moderat anheben, falls möglich nur bei den betroffenen Cores.
 
So ein Verhalten hatte mein PC vor Jahren gezeigt als die Grafikkarte anfing zu schwächeln. Die Neustarts wurden immer häufiger durchgeführt bis zum Totalausfall.

EDIT: Ich habe überlesen, dass du schon versucht hattest die GPU zu tauschen.
 
Da bin ich wieder.

Ich habe die zuvor genannten Möglichkeiten getestet und folgende Resultate für euch. Vorab genannt ist das Problem weiterhin präsent und manch Ideen haben es eher auch verstärkt.

Wie dem auch sei:

  • Verringerter Anpressdruck (nicht ganz Handfest aber auch nicht so locker, das der Kühler sich verschieben lässt
  • Idle Power Control auf Typical Current Idle gesetzt
  • Global C-States/DF C-States deaktiviert
  • PBO deaktiviert
  • CPB deaktiviert
  • fester Takt auf bspw.: 3GHz
  • vorherige BIOS-Version
Jeder Ansatz ist leider im Sande verlaufen.
Bei jedem Neustart blitzte kurz die Debug LED bei DRAM auf und verschwand sofort und der PC startete durch. Ich meine jetzt nicht das aufleuchten beim Check vor dem eigentlichen Boot sondern recht direkt nachdem alle Bildschirme ausgingen.

Ich habe auch alle WHEA-Logger Einträge seit dem 7.1.2026 durchgeschaut und folgende CPU-APIC-IDs notiert und deren Häufigkeit:
1x ID1
1x ID2
1x ID3
1x ID5
1x ID9
3x ID13
1x ID14

Das sind auch immer die Momente, wo ich das ganze mit Fortnite getestet habe oder versucht habe eine Runde zu spielen.

DarkSoul schrieb:
Die Fehlermeldung deutet für mich auf eine zu geringe Core-Spannung über den Curve Optimizer hin, allerdings verwirrt mich das im Zusammenhang mit einem 2700X? Ich kenne das nur von 5000er CPUs im Bios, nicht bei 2000er über AMD-Software. Wird hier UV versucht? Falls nicht, könnte man trotzdem die Spannungen mal schrittweise moderat anheben, falls möglich nur bei den betroffenen Cores.

Ich habe noch nie UV betrieben, einfach weil mir das nie geglückt ist, um das mal so zu formulieren.
Den Curve Optimizer habe ich erst zuletzt probiert, weil ein Freund vo m Ryzen Master begeistert ist.
Bei mir hat der Curve Optimizer die Neustarts genauso produziert, woraufhin ich den wieder rückgängig bzw. auch deinstalliert und das BIOS resettet hatte. Seit dem ist der nicht mehr auf meinem System und schon gar nicht seit der Neuinstallation von Windows.

Da hier nun schon zwei/drei mal vom Curve Optimizer geschrieben wurde, denke ich mir, dass der wieder installiert werden sollte. Liege ich da richtig?
Oder sollte ich, wenn möglich, im BIOS die Spannungen anpassen?

Chrissssss schrieb:
So ein Verhalten hatte mein PC vor Jahren gezeigt als die Grafikkarte anfing zu schwächeln. Die Neustarts wurden immer häufiger durchgeführt bis zum Totalausfall.

EDIT: Ich habe überlesen, dass du schon versucht hattest die GPU zu tauschen.

Davon hatte ich auch gelesen und habe daher auch letztlich die GPU als erstes getauscht. Nur halt ohne Erfolg.

Wie können wir bzw. ich hier weiter vorgehen?
 
darkfight14 schrieb:
  • Idle Power Control auf Typical Current Idle gesetzt
  • Global C-States/DF C-States deaktiviert
  • PBO deaktiviert
  • CPB deaktiviert
  • fester Takt auf bspw.: 3GHz
  • vorherige BIOS-Version
Jeder Ansatz ist leider im Sande verlaufen.
darkfight14 schrieb:
a hier nun schon zwei/drei mal vom Curve Optimizer geschrieben wurde, denke ich mir, dass der wieder installiert werden sollte. Liege ich da richtig?
Oder sollte ich, wenn möglich, im BIOS die Spannungen anpassen?
Da obiges schon zu keinem Erfolg führte, wird der CO dann wohl auch nicht helfen. Wenn du es aber trotzdem gern noch testen willst (einfach auf AllCore +20 stellen), dann am besten im BIOS einstellen. Kein Ryzen Master o.ä. installieren.

darkfight14 schrieb:
Wie können wir bzw. ich hier weiter vorgehen?
CPU reklamieren.
 
darkfight14 schrieb:
Da hier nun schon zwei/drei mal vom Curve Optimizer geschrieben wurde, denke ich mir, dass der wieder installiert werden sollte. Liege ich da richtig?
Ich würde veruschen erst mal alles zurück auf Standard zu setzen, und danach alle Software runterwerfen, die so was ändern können.
darkfight14 schrieb:
Oder sollte ich, wenn möglich, im BIOS die Spannungen anpassen?
Der erste Schritt sollte sein, erst mal ein CMOS-Clear zu machen, alles auf Standard/Auto zu belassen, das neueste Bios zu flashen (falls notwendig) und dann mal Stabitests zu machen um einzugrenzen, was die Ursache sein kann.

Bei mir z. B. lagen seit dem Wechsel vom 3900X auf 5900X sporadische Programmabstürze an. Dachte erst, das seien eben die betroffenen Spiele selbst, hat sich aber herausgestellt, dass XMP beim 5900X eben so auf "Auto" nicht mehr richtig lief. Aufgefallen ist mir das z. B. mittels OCCT CPU+RAM Tests, da hatten einzelne Cores Fehler geworfen, die nach Umstellung auf JEDEC ganz weg waren.

Bei mir war dann z. B. die Lösung SOC fest auf 1,1 v und den RAM-Widerstand ProcOdt auf z. B. 48 Ohm zu setzen. Danach konnte ich zumindest einen Wert von -15 im Curve Optimizer für alle Cores als stabil wieder mittels OCCT testen (CPU-Test, 5 Sekunden wechselnde Cores, etc). Aber das sollte erst der letzte Schritt sein, wenn alles auf Default/Jedec sauber läuft.

Während dieser Tests immer mit Tools wie HWInfo prüfen, ob Temperaturen zu hoch werden, Spannungen einbrechen, Limits erreicht werden, etc. Wenn nichts davon zutrifft, aber das System dennoch Probleme macht, liegt ein Hardware-Fehler vor, dann CPU mal tauschen, oder RAM.
 
Ich habe erfreuliche Neuigkeiten und bin zugleich Sprachlos.

Ich habe alles unternommen, wie geraten bis auf RMA und habe alle Kerne einem 24h dauertest unterzogen mit CoreCycler und keine Instabilität gehabt.

Ich habe also anschließend wieder ein Runde gestartet, forderte mein Glück heraus und der PC stürtzt ab.

Also bin ich nochmal in mich gegangen, was kann es vielleicht noch sein. Habe noch was von eventuelle Treiberfehlern gelesen. Nun Gut, dann schaue ich welche Treiber nachträglich dazukamen.
Meinem Setup gehört leider auch eine PCIe WLAN KArte an. Und dessen Treiber habe ich gesamt entfernt.
Neue Runde gestartet und es lief. Kein Stottern oder Ausstzen. Gar nichts.

Nochmal CMOS Reset und nochmal getestet. Stabil.
Den vorherigen RAM installiert, gertestet, ebenfalls Stabil.
XMP geladen und nochmal getestet, weiterhin stabil.

Ich sehe das als Errungenschaft und fasse es nicht, das ein "simpler" Treiber für die WLAN Karte hier eventuell die ganze Zeit die Schuld trägt.

Die Tage beobachte ich weiterhin die Stabilität und melde mich nächste Woche zurück.

Also hätte ich mir tatsächlich sämtliche Neuanschaffungen sparen können...
Was solls, dann habe ich nun ein recht aktuelles Setup. Und wenn es stabil bleiben sollte, kann der neue RAM verkauft werden. Bei den Preisen die man aktuell zahlen muss für "gescheiten" RAM...

Ich danke euch allen für eure tatkräftige Unterstützung, konstruktiven Input und weiteren Ideen.

Hoffnungsvoll blicke in die Zukunft!

Bis bald,
Euer Darkfight
 
  • Gefällt mir
Reaktionen: DarkSoul, Looniversity und Chrissssss
darkfight14 schrieb:
Meinem Setup gehört leider auch eine PCIe WLAN KArte an.
Tja, steht halt auch nicht im Startpost. Woher sollen wir das wissen :>. Aber ist eh immer eine gute Idee bei Problemen das System hardware- und softwaremäßig nackig zu machen, um Fehlerquellen besser eingrenzen zu können.
 
Zurück
Oben