PC rebootet nach unregelmäßig nach Standby

internetfreak

Newbie
Registriert
Juni 2023
Beiträge
5
Hey Leute,

nach langer Zeit hab ich mich auch mal angemeldet, weil ich seit längerem von einem Problem geplagt werde, welches ich derzeit nicht zu lösen vermag und eine Community in einem Discord-Server war auch nicht wirklich hilfreich. Hoffe mal, ich hab das richtige Forum erwischt, ist aber auch nicht so einfach, weil potentiell mehrere Fehlerkandidaten vorhanden.

Jedenfalls, ich würde mal kurz mit den Specs anfangen:

  • CPU: AMD Ryzen 9 5950X @ 65W ECO
  • Mainboard: ASUS ROG STRIX X570-F Gaming
  • RAM: 64GB G.Skill TridentZ RGB 3200 MHz
  • Storage: 2x m.2 NVMe, dazu 2x SATA HDD
  • GPU: Powercolor Radeon 6900XT RedDevil Ultimate
  • Netzteil: Corsair RM1000x
  • Gehäuse: beQuiet Dark Base 700
  • Lüfter: 3x 140mm vorne, 1x 140mm hinten, oben 2x 140mm via AiO für die CPU
  • OS: Windows 11, aktueller GPU-Treiber
Bevor ich dann zum eigentlichen Problem komme, noch eben die Vorgeschichte vom Build: Ich hab 2019 mit einem 3700X angefangen, paar wenige Komponenten wie das Gehäuse oder der RAM sind auch schon von da übernommen. Ich hatte jedoch einfach das Problem, dass der PC regelmäßig instabil lief, für kurze Zeit im Jahr 2020 war er mal als Proxmox-Host verwendet worden und ich durfte das System jeden Tag resetten, weil es sich einfach komplett locked hatte. Auch danach unter Windows immer wieder Probleme, dass er freezed, mit nem BSOD abstürzt etc. Geplagt von den Problemen hab ich dann Anfang 2022 stückweise die Hardware getauscht, beginnend mit der GPU und dazugehörig das Netzteil, hat aber nicht geholfen.
Eines Tages war es dann so, dass der PC wieder mal abgeschmiert ist, einfach komplett ausgegangen und ging aber gar nicht mehr hoch, daraufhin dann das Mobo getauscht - kein Erfolg. Mein Bruder brachte mal die CPU als Kandidat ins Rennen, ich hatte zum Glück nen Server mit AM4-CPU den ich testweise als Spender genutzt hab -> Erfolg, mein 3700X ging wohl offiziell in den Himmel, deswegen wurds dann der 5950X als Nachfolger (AMD hat den 3700X btw auf Garantie anstandslos getauscht).
Dies erklärt dann auch, wieso die Hardware praktisch so zusammengewürfelt aussieht, also ich hab da nicht so viel überlegen können, was jetzt wie zusammenpasst/kompatibel ist. Ich hab die HW auch dann behalten, obwohl das meiste ja fehlerfrei war, wollte nicht unnötig Rücksendungen usw produzieren und hab die alten Teile meiner Schwester vermacht.

Soweit so gut, nach dem Tausch ging es eigentlich mal ne Weile lang gut oder zumindest besser, aber entweder schon auch seit damals oder seit irgendwann hab ich weiterhin Probleme mit dem PC, besser gesagt vor allem seinem Verhalten, wenn ich ihn aus dem Standby aufwecke, z.B. wenn ich aufstehe und den PC dann nutzen will.
Das Problem zeigt sich wie folgt: PC schläft, ich drück ne Taste und er geht an, mit RGB und allem drum und dran. Es sieht auch so aus, als ob was passiert, aber die Monitore bleiben schwarz und dann merke ich, wie das RGB meiner Razer-Tastatur kurz ausgeht und dann wieder neu startet, gefolgt davon, dass der PC dann rebootet. Im Ereignislog von Windows ist nichts zu finden, außer, dass der Reboot unerwartet war, es gibt auch kein Crashdump, das macht es halt so schwer, irgendeine Ursache zu finden. Windows wurde erst vor paar Monaten mal refreshed.
Ich leg den PC normalerweise nur schlafen, weil ich im Laufe einer Session stetig weitere Programme aufmach und selten eigentlich reboote, sofern nicht notwendig und halt ungern immer wieder alles neu öffnen will. Seit der Energiekrise wird es noch wichtiger, weil der PC eigentlich automatisch in Standby gehen sollte, um Strom zu sparen, wenn ich mal länger afk bin.
Allgemein ist es so, dass es sehr unregelmäßig bzw. nach keinem wirklich erkennbaren Muster geschieht, es kann sein, dass ich den PC frisch reboote, der geht in Standby und dann tritt das Problem auf oder es geht tagelang gut, bevor es zu Problemen kommt. Manchmal hab ich das Problem auch mehrfach hintereinander, wenn der PC zwischenzeitlich schläft.

Meine Vermutung für das Problem ist ja mittlerweile, dass die GPU beim Anlauf zu viel Last erzeugt, das Netzteil das nicht packt und z.B. die Spannung auf dem Mainboard abfällt und dort bspw. Bitflips im RAM verursacht. Je nachdem, wie viel und was betroffen ist, wird Windows irgendwann gezwungen, nen Reboot hinzulegen, weil RAM-Inhalt korrupt.
Hab jedoch heute auch folgenden Thread gefunden und das Problem da klingt ziemlich ähnlich zu meinem Problem, was weiter bekräftigt, es könnte das Netzteil sein: https://forums.tomshardware.com/threads/start-after-sleep-get-the-pc-to-reboot.3744462/

Der oben angesprochene Discord-Server hat bisher gemeint, ich soll mal testweise auf Linux wechseln, ob das Problem da auch auftritt, aber das ist für mich aus Gründen der Kompatibilität nicht so einfach möglich, weil ich Hardware/Software hab, die sich unter Linux so nicht ohne Weiteres nutzen lässt und auch wenn es dann nur ein Test wäre, so müsste ich ggf. mehrere Tage auf Linux bleiben, um das Problem sicher verifizieren oder als nicht mehr auftretend klassifizieren zu können und da wäre es doof, wenn ich mich einschränken müsste, da ich kein Ausweichsystem zur Verfügung hab, während mein betroffenes System dann getestet wird. Es hieß weiterhin, die GPU könne ja das System nicht zum rebooten bringen, derjenige, der das sagte, hat auch mit massiv UV nur den Treiber/die Anwendung gecrasht, weil die GPU instabil wurde, aber Windows sei davon bisher nicht betroffen gewesen.
RAM ist definitiv in Ordnung, hab den gegen Ende Februar über drei Tage hinweg permanent memtested, da ich aus persönlichen Gründen eh nicht am PC sein konnte, daher bot sich das dann mal als Langzeittest an.
Ich weiß, AMD hat/hatte ziemlich Probleme mit ihrem Treiber, so war es 2022 ne Zeit lang so, dass ich regelmäßig Treibercrashes hatte, entweder ist dann nur FF14 gecrasht oder der ganze Treiber (Driver Timeout, teilweise mehrfach hintereinander), aber der Treiber selbst scheint stabil, allerdings hab ich trotzdem in unterschiedlichen Situationen mal Drops in den FPS oder Hänger im System, selbst wenn gerade kaum GPU-Last anliegen sollte.

Ich entschuldige mich für die relative Wall of Text, ich hab Probleme damit, dass ich relativ ausufernd werden kann aber gleichzeitig wollte ich auch so viel wie möglich an Details reinpacken und beschreiben, was bisher geschah, um eventuelle Zusammenhänge zu finden, wo das Problem liegen könnte. Problematisch ist allgemein, dass ich wenig Geld zur Verfügung hab, also mal eben ne neue GPU oder so kaufen ist eher unmöglich, zumindest nicht ohne Weiteres.

Ich danke euch für eure Hilfe.
 
Hast du schon das System gecheckt auf corrupted files? :p

https://www.netzwelt.de/anleitung/166183-windows-10-so-behebt-fehler-ueber-sfc-dism.html

(bitte genau lesen was die einzelnen befehle machen und unterscheiden)

Hast du auch schon den Chipsatztreiber mal aktualisiert? Und welchen hast du derzeit drauf? Ist die Installation auch erfolgreich gewesen, siehe success log unter C:\AMD\Chipset_Software\Logs

Welche Razer Synapse Version hast du? Wenn du lange nicht geupdated hast, kann das auch n Problem sein, da oft Fehler korrigiert werden lt. der Changelogs
 
SFC/DISM hab ich schon mehrfach laufen lassen, zumindest SFC hat dabei auch gerne mal Schäden repariert. Hab beides gerade nochmal laufen lassen, wurde nichts an Schäden gefunden.

Grafiktreiber habe ich aktuell die 23.5.1 drauf, sehe gerade, es gibt ne 23.5.2, aber die wurde mir vorhin nicht vorgeschlagen. Als der Fehler nämlich wieder auftrat, war auch mein Grafiktreiber defekt, musste den reinstallieren (hatte den Installer für 23.4 noch auf dem PC) und dann eben ein Update noch hinterhergeschoben. Das passierte in letzter Zeit öfter mal.
Chipsatz hab ich jetzt gerade ganz frisch installieren lassen, damit sollte der dann aktuell sein, also grad den Installer von AMD dafür heruntergeladen. Hier mal die Summary als Quote:

Name : AMD Processor Power Management Support
Version : 8.0.0.13
Install : Success

Name : AMD PCI Device Driver
Version : 1.0.0.90
Install : Success

Name : AMD GPIO Driver
Version : 2.2.0.130
Install : Success

Name : AMD PSP Driver
Version : 5.24.0.0
Install : Success

Name : AMD SMBus Driver
Version : 5.12.0.38
Install : Success

Synapse ist bei 20230502, er zeigt mir nur ein grünes Häkchen, also ist das wohl auch aktuell. Bedingt durch die Neustarts macht Razer sowieso regelmäßig Updates, also die hält sich von selbst aktuell.

Das Problem ist nicht direkt von installierten/laufenden Anwendungen abhängig, hatte es auch schon im "nackten" Windows, d.h. frischer Reboot, dann kurz vom PC weg -> automatischer Standby und Crash, bis auf wenige Sachen hab ich kaum was im Autostart
 
hmmm und in der Ereignisanzeige ist nichts? Du kannst auch die ganzen Daten bei der Ereignisanzeige mal komplett löschen und alles neu aufzeichnen lassen, wenn es bei dir zu voll ist:

einfach per cmd (als admin)

for /F "tokens=*" %1 in ('wevtutil.exe el') DO wevtutil.exe cl "%1"

ausführen, bis es durchgelaufen ist halt warten, dann ist die Ereignisanzeige komplett leer, aber lass die Ereignisanzeige aus während du es durchlkaufen lässt
 
Ich hab regelmäßig nach nem Reboot dann geschaut, aber außer das übliche "Previous shutdown on XX:YY was unexpected" fand sich eigentlich nie ein Hinweis. Hab die Ereignisanzeige mal wie von dir beschrieben gelöscht, jetzt heißt es mal abwarten, bis das Problem auftritt, das kann im schlimmsten Fall auch mal ne Woche dauern.
Hier auch mal wie mein Startup & Recovery eingestellt ist:
1685834805674.png


Hatte auch zuvor schon Minidumps anlegen lassen, aber es erscheint einfach keiner, genauso wie Windows sich ja nicht dran hält, dass es nicht automatisch restarten soll im Fehlerfall. Das spricht dafür, dass es sich um keinen (klassischen) BSOD handelt oder Windows aus anderen Gründen den Dump nicht anfertigen kann
 
Wurde das Ram im Bios mit 2 statt 1 bei der CT( Command Rate) getestet bzw. eingestellt?
Ist das Ram als Set gekauft worden oder später was dazu?
 
CT ist (laut hwinfo) immer noch auf 1, also das hab ich bisher dann nicht umgestellt, kann ich dann bei passender Gelegenheit mal umstellen.
Die Sticks waren ein komplettes Viererkit, sind auch explizit kompatibel mit AMD, wurde mir so von einem Mitarbeiter von G.Skill bestätigt. Bevor der alte 3700X abgeraucht ist, hatten wir den RAM im Verdacht, also wurde der getestet und ich hatte mit Cody von G.Skill Kontakt zwecks eventueller RMA, die es dann doch nicht benötigte. Hab ganz normal das entsprechende XMP-Profil aktiv, kein weiteres Tuning o.ä. vorgenommen, allgemein laufen die Komponenten soweit wie möglich Stock, nur CPU eben auf 65W ECO (auch wegen Leistungsaufnahme, um Strom zu sparen) sowie die GPU auf SILENT-Bios, weil das etwas stabiler scheint als das OC. Gerade letzteres ist eben ja das, weswegen ich nicht weiß, ob es eher Netzteil oder GPU sein könnte, die vielleicht faulty ist und eher instabil läuft, aber das Netzteil ist derzeit einfach kostengünstiger mal eben zu tauschen und zu testen wie ne RMA bei der GPU zumal ich ja eben auch da keinen guten Ersatz hab

EDIT: Grad als Empfehlung diesen Thread bekommen: https://www.computerbase.de/forum/threads/nach-einiger-zeit-ruckeln-games-bis-zum-reboot.2145748/

Ist zwar eher ein Problem, was ja innerhalb von Windows passiert weil die Kiste lange läuft, aber das Kernproblem mit "langer Laufzeit, nur durch Standby unterbrochen" und die dazugehörige Motivation im Sinne von "man will seine Session nicht immer neu aufbauen" sind ja effektiv gleich wie bei mir. Nicht, dass bei mir ebenso auch einfach die SW keine ewigen Standby verträgt, aber andererseits dürfte das dann auch nicht gleich so schnell wieder auftreten, mein Standby-Delay ist z.B. 15 Minuten und es kann sein, dass ich frisch reboote, 15 Minuten nix tue -> Standby und anschließend tritt das Problem auf, also bei mir ist dann ggf. trotzdem noch irgendwas anderes dabei. Ich mein, klar kann ich auch immer herunterfahren, aber das mach ich maximal einmal pro Tag wenn ich schlafen gehe, also kann es zwischenzeitlich trotzdem passieren, dass Standby eintritt und damit das Problem triggert.
 
Zuletzt bearbeitet:
Manuell kann man alle XMP-Werte nachtragen außer eben bei CT dann auf 2 testen.
Das XMP auf Auto trägt halt gern eine 1 ein statt 2, bei 4 Modulen kann das helfen.
 
Unerwarteterweise (mehr oder weniger) ist das Problem heute wieder aufgetreten. Ereignislog wie gehabt leer bis auf die generische Meldung "Windows wurde nicht korrekt heruntergefahren".
Wegen der CommandRate hab ich gelesen, dass die sowieso nicht zählt, sofern GDM an ist, was bei mir der Fall wäre. Ich kann trotzdem testen, ob ne manuelle 2T CT was bringt und dann GDM ausschalten, aber ich vermute mal weniger, dass es der RAM ist, der die Probleme verursacht, sonst müsste ich ja im laufenden Betrieb doch auch mehr Probleme haben oder nicht?
 
Bei der Command Rate sind es die Waitstates die von einem Fehlerdurchlauf auf zwei erhöht werden. Es sind auch 3 möglich glaube ich und es soll zu weniger Abstürzen führen. Mir half das mal bei meine alten System da hatte ich 4 Module aber 2 dazugekauft des selben Rams, allerdings zweiseitiges Ram statt einseitiger Bestückung.
 
Zurück
Oben