Reboot/Crash Odysee CPU defekt?

hansdampf84

Lieutenant
Registriert
März 2008
Beiträge
646
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): Ryzen 7 3700x
  • Arbeitsspeicher (RAM): 32GB Crucial Ballistix 3200
  • Mainboard: MSI B450 Tomahawk MAX
  • Netzteil: Straight Power 11 550W
  • Gehäuse: …
  • Grafikkarte: Sapphire Pulse Radeon 5700xt
  • HDD / SSD: …
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat (Monitormodell, Kühlung usw.):

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Ich habe seit länger Zeit Probleme mit plötzlichen Reboots unter Windows und teilweise auch Linux.

Das Problem äußert sich darin, dass der PC einfach hart rebootet. Es ist unter Last beim zocken passiert, aber auch beim surfen.
Es lässt sich nicht reproduzieren sondern kommt rein zufällig und auch unter Linux die Logs waren nie aussagekräftig.

Lange hatte ich unter Windows keinen Reboot mehr und unter Linux nur bei einem Spiel, was ich auf das Spiel (Darktide) geschoben habe, weil es unter Windows lief.

Jetzt ist es mit zum ersten Mal unter Win 11 während 7Days to Die passiert.


3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Bios Update, Treiber komplett neu installiert (Chipsatz, GPU), Memtest über mehrere Stunden


P.S.: Beachte auch die verschiedenen angepinnten Themen und die Forensuche. Möglicherweise findest du da bereits die Lösung zu deinem Problem.
Nach dem Fehler heute wurde in der Ereignisanzeige der Fehler
Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 14

Mit diesem Fehler hab ich Copilot gefüttert. Dieser meinte entweder RAM oder CPU Fehler am wahrscheinlichsten. Ok, soweit war ich auch schon.

Hab dann nach dem Hinweis Prime mit Small FFTs laufen lassen und nach einiger Zeit hat Worker 7 einen Fehler gemeldet.
FATAL ERROR: Final result was 95B6557E, expected: 8D116786.

Temperatur war laut Ryzen Master die ganze Zeit max. 67°C

Auf dem Screenshot sieht man auch schon den Zustand, nachdem Worker 7 den Fehler gemeldet hat.

Kann ich jetzt davon ausgehen, dass die CPU defekt ist oder sollte ich nochmals weitere Tests laufen lassen?

Ich hoffe das waren genug Infos fürs Erste.
 

Anhänge

  • Screenshot 2025-10-09 001616.jpg
    Screenshot 2025-10-09 001616.jpg
    130,5 KB · Aufrufe: 118
Das kann auch passieren wenn versorgungsspannungen zu weit absacken und das System dadurch in instabilitäten abrutscht.
ist der RAM 2x16 oder 4x8? Falls 2x16 dann in A2/B2 verbaut?
CPU mit undervolting oder komplett stock?
 
Zumindest RAM Takt auf 1.4V als ersten Schritt, das ist nicht gefährlich.
 
  • Gefällt mir
Reaktionen: Hardy_1916
Vielleicht habe ich es übersehen, aber du solltst erst mal ein CMOS Reset durchführen und bloß nichts im BIOS weiter einstellen, insbesondere bevor du, wie hier einige vorschlagen weiter an den Settings rumspiestl und schauen ob das Problem dann noch mit Defaults auftritt. Klingt für mich nach XMP Problem, mit CMOS Reset wird halt mal alles, was im BIOS verstellt sein kann, mal zurückgesetzt. Wenn dann die Probleme weiter existieren, ist vermutlich etwas wirklich defekt. Solange würde ich nicht mal sagen wollen, dass überhaupt ein Defekt vorliegt.
 

Anhänge

  • 1759989602750.png
    1759989602750.png
    121,3 KB · Aufrufe: 41
  • Gefällt mir
Reaktionen: qiller
Jop, falls 4 Module verbaut, mal 2 rausnehmen, CMOS-Reset durchführen, XMP deaktiviert lassen. Memtest durchlaufen lassen. Dann erstmal nur unter Linux testen, weil in Windows könnte es sein, dass irgendwelche AMD Tuningtools aktiv ihre Settings setzen (Ryzen Master oder Adrenaline Treiber können das nämlich).

Wenn du dann immer noch Abstürze hast, könnte man obige Tipps mit Spannung erhöhen, C-States deaktivieren, LLC anpassen etc. probieren. Aber eigentlich deutet dass dann schon auf eine defekte CPU hin.
 
Also es sind 2 RAM Module eingebaut.
CPU ist undervolted, hatte ich zwischenzeitlich auch schon mal deaktiviert.

Ich werde es nochmal rausnehmen und dann nochmal Prime laufen lassen.
Als ersten Schritt
 
So ein Update von mir:

Undervolting (-0,1V) deaktiviert, auf Auto -> Prime Small FFTs 30min stabil
Undervolting wieder auf -0,1 -> zwei Versuche Prime immer wieder Fehler in Worker 7
Undervolting auf -0,05V -> Prime Small FFTs 30min stabil

Ich lass das jetzt mal so und schaue was passiert.
 
hansdampf84 schrieb:
CPU ist undervolted
Ich wollt eigentlich nichts mehr hier schreiben, aber nur nochmal als Hinweis, auch für die Nachwelt, die vlt. ähnliche Problemthreads aufmacht: So eine Info gehört in den Startpost. Ist halt ne ziemliche Zeitverschwendung für die Helfenden und eigentlich sollte das Deaktivieren von UV doch der offensichtlichste erste Schritt sein.
 
  • Gefällt mir
Reaktionen: conf_t
conf_t schrieb:
du solltst erst mal ein CMOS Reset durchführen
Genau deshalb war das meln erster Gedanke und Vorschlag. Viele haben nämlich gar nicht mehr den Überblick was alles verstellt ist oder Rücken damit nicht raus.

Bisher habe ich bisher hier nur 3-4 Mal eine defekte CPU gesehen, alles waren bisher Einstellungen außerhalb der Spezifikation.
 
Das undervolting hatte ich vor längerer zeit schon mal deaktiviert, aber wieder aktiviert, weil ich es als ursache ausgeschlossen hatte.

Da sich die problematik schon länger zieht und nur selten im realbetrieb auftritt, kann ich mich nicht genau erinnern, warum ich es damals ausgeschlossen habe.
 
Wozu bei nem 3700X überhaupt UV einstellen. Das ist eh schon eine eher sparsamere CPU und durch zu viel UV rutscht die CPU nur ins Clockstretching und/oder verliert Single-Core/Thread-Performance.
 
  • Gefällt mir
Reaktionen: conf_t
Hatte ich damals nach dem kauf so eingestellt und auch mit Cinebench verglichen.
Lief auch über 3 Jahre problemlos.
Kann natürlich durch Alterung oder neuere Bios Versionen instabil geworden sein.
 
Kurzes Update:
Auch ohne UV hab ich wieder einen Reboot bekommen.

Schwerwiegender Hardwarefehler.

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 12
 
Und alles andere war auch auf default? Keine custom settings im BIOS? Kein XMP? Dann womöglich wirklich die CPU.
 
  • Gefällt mir
Reaktionen: qiller
XMP war noch an. Ich wollte nicht mehrere Einstellungen parallel ändern zum testen.
 
Wie schon mehrfach hier erwähnt, am besten ein mal komplett zurück auf Default setzen, prüfen ob dann noch stabil ist, dann hast du am ehesten die Antwort auf die Frage, ob die CPU ok ist, solange da noch OC betrieben wird, betreibst du das System halt außerhalb der Specs und da muss es nicht (dauerhaft) stabil laufen.

Deshalb - > CMOS Reset -> Stabil? ja -> kein HW Fehler und langsam Settings wieder hinzunehmen und testen, welches Setting die Instabilität auslöst.
 
  • Gefällt mir
Reaktionen: qiller
Hier ein neues Update von mir, wollte aber zuerst klarstellen, ich hab in der Zwischenzeit keine Änderungen im Bios durchgeführt.
Nur die aktuellen Grafiktreiber habe ich unter Windows installiert.

Hab kein 7Days mehr gespielt dafür Spacemarine 2 und in 20h+ kein Crash, kein Reboot, alles lief problemlos.
Dadurch hab ich die Probleme erstmal mit 7Days in Verbindung gebracht.

Jetzt war ich gerade unter Manjaro und war nur am surfen, keine große Last, plötzlich Reboot.
Im Journal wurde kein Fehler im Moment des Reboots gelogged, aber beim Hochfahren der folgende Fehler angezeigt:

Nov 19 20:12:12 linux kernel: x86/amd: Previous system reset reason [0x08000800]: an uncorrected error caused a data fabric sync flood event
Nov 19 20:12:12 linux kernel: mce: [Hardware Error]: Machine check events logged
Nov 19 20:12:12 linux kernel: [Hardware Error]: System Fatal error.
Nov 19 20:12:12 linux kernel: fbcon: Taking over console
Nov 19 20:12:12 linux kernel: [Hardware Error]: CPU:10 (17:71:0) MC5_STATUS[-|UE|MiscV|AddrV|PCC|TCC|SyndV|-|-|-]: 0xbea0000000000108
Nov 19 20:12:12 linux kernel: [Hardware Error]: Error Addr: 0x00007f9cd2c6be00
Nov 19 20:12:12 linux kernel: [Hardware Error]: IPID: 0x000500b000000000, Syndrome: 0x000000004d000000
Nov 19 20:12:12 linux kernel:
Nov 19 20:12:12 linux kernel: [Hardware Error]: Execution Unit Ext. Error Code: 0
Nov 19 20:12:12 linux kernel: [Hardware Error]: cache level: RESV, tx: GEN, mem-tx: GEN
 
Zurück
Oben