Totalabsturz

R.Kante

Lieutenant
Registriert
Feb. 2008
Beiträge
717
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 7 3700X mit dem Boost-Profil des Mainboards
  • Arbeitsspeicher (RAM): G Skill F4-3200C16-16GVK --> 2x16 GB mit A-XMP Profil1 aktiviert (3200 MHz, 16-18-18-38)
  • Mainboard: MSI MPG X570 GAMING PLUS
  • Netzteil: BeQuiet PurePower 11 600W CM
  • Gehäuse: BeQuiet PureBase 500
  • Grafikkarte: Gigabyte RX580 8GB mit einem Accelero Xtreme IV und Standardsettings, allerdings angepasster Lüfterkurve.
  • HDD / SSD: Samsung SSD 970 EVO 1TB (System) + Crucial MX500 500GB (CT500MX500SSD1)
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat(Monitormodell, Kühlung usw.):
    • CPU-Kühler: Arctic Freezer 34 esports Duo
    • OS: Windows 10 Education (Build 19042.1110 - 20H2)
    • Monitor: Lenovo G27q-20 mit Auflösung 2560x1440

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Plötzlicher Totalabsturz des gesamten Rechners. Sound weg, Bild weg, Lüfter aus. Unmittelbarer Start über Power-Schalter möglich.

Interessanterweise sind die beiden einzigen Male die es bisher passiert ist, während des Spielens von AoE2_DE passiert. Vom letzten Absturz vor etwa zwei Tagen bis jetzt gerade, habe ich den Rechner nicht verwendet, konnte also noch keine weiteren Szenarien probieren.

In der Windows Ereignisanzeige ist unmittelbar vor dem manuellen Neustart kein Eintrag zu finden, jedenfalls nicht dort wo ich gesucht habe :) (Ereignisanzeige --> Windows-Protokolle --> System). Konkret heißt das: auf die Ereignis-ID 19 (WindowsUpdateClient) um 21:17:03 Uhr folgt der Absturz ohne Logeintrag und dann um 22:01:56 Uhr desselben Tages der Boot-Vorgang mit der ersten Ereignis-ID 12.

Die Hardware exklusive Peripherie ist zu großen Teilen neu (am 25.6. bestellt, wenige Tage später montiert) mit Ausnahme der CPU und der GPU. Die CPU habe ich zeitgleich mit der restlichen neuen Hardware gebraucht hier auf dem Marktplatz gekauft und sie wurde ursprünglich im Februar 2020 gekauft. Laut Aussage des Verkäufers wurde sie ausschließlich auf Standard-Settings betrieben. Die GPU habe ich vor einigen Jahren ebenfalls gebraucht gekauft. Sie hat im vorherigen Setup des Öfteren zu Treiberabstürzen geführt, habe das bisher auf das damals deutlich schwächere Netzteil geschoben. Im neuen Setup habe ich derlei Probleme jedenfalls bisher nicht.

Beim Aufbau des aktuellen Setups habe ich das Betriebssystem auf der Samsung SSD schlicht übernommen. Treiber aktualisiert, das wars.

Vor dem ersten Absturz habe ich dasselbe und andere Spiele (Bsw. BF4 u. V) recht ausgiebig laufen lassen und keinen solchen Absturz provozieren können.

Ich vermute jedenfalls, dass das Netzteil einen Schaden hat, möchte aber vorher andere Meinungen einholen und ggf. Testmöglichkeiten abklopfen, bevor ich auf Verdacht Hardware über die Garantie/Gewährleistung austausche. Habt ihr eine Richtung in der ich gerade gezielt suchen oder eine Idee mit der ich gezielt testen könnte?

Falls dieses Unterforum der falsche Anlaufpunkt ist, bitte ich bereits jetzt um entsprechende Verschiebung.

Danke!

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
O.g. Boost-Profil des Mainboards deaktiviert. XMP-Profil von 2 auf 1 umgeschaltet.



P.S.: Beachte auch die verschiedenen angepinnten Themen und die Forensuche. Möglicherweise findest du da bereits die Lösung zu deinem Problem.

EDIT vom 24.07.2021:
Lösung! Problem scheint eine deutlich zu warme GPU gewesen zu sein. Erneuerung der Wärmeleitpaste hat Abhilfe geschaffen. Langzeiterprobung steht noch aus.
 
Zuletzt bearbeitet:
Klingt für mich auch stark nach einem Netzteildefekt. Hast Du noch eins da, mit dem Du das mal testen kannst?
 
Ausschalten ist typischerweise eine Notfallmassnahme. Entweder im Netzteil hat etwas ausgelöst (Defekt) oder die CPU ist überhitzt. (Häufigste Ursachen erstmal)
Wie sind denn die Temps?

Kann natürlich auch am GPU Umbau liegen oder am Übertakten. Nimm das mal raus
 
@Skysurfa , ein anderes Netzteil habe ich da, ein Bequiet PurePower11 mit 400W, jenes welches ich im alten Setup verwendet habe. Nen Versuch scheint es wert zu sein.

Habe gerade die Absturz-Situation unter Verwendung von AoE2_DE erneut provozieren können und vorher in HWinfo ein Logfile gestartet.

CPU-Temperatur (Tctl/Tdie) beträgt im Mittel 53,87 °C und Max 60,6 °C
Chipset hat im Mittel 68,91 °C und Max 69,9 °C
GPU liegt bei Mittel 83,45 °C und Max 93 °C

Absturz fand etwa 10 min nach vorherigem restart statt, wovon etwa 9 min geloggt sind. Die GPU-Temperatur ist nicht neu, das war im vorherigen Setup schon ähnlich.

@rg88 , meinst du mit Übertaktung das Boost-Profil für die CPU? Das ist schon raus. Oder das XMP-Profil für den RAM?
 
@R.Kante

Hast Du beim Umbau auch alle Netzteil-Kabel mitgetauscht? Oder die alten eventuell weiterverwendet?

Bitte probiere in der Tat zunächst ein anderes Netzteil aus und tausche unbedingt (!!) alle Kabel in die, die zum Netzteil gehören. Selbst dann, wenn die Netzteile von einem Hersteller sein sollten.
 
Hat zwar nichts mit deinem Problem zu tun aber:
Lässt du die 580 silent laufen oder warum kommt die auf 93°?
In anbetracht eines montierten Accelero Xtreme IV hätte ich da 20° weniger erwartet, selbst unter Volllast.
 
  • Gefällt mir
Reaktionen: rg88
@Dominion , das vorherige Netzteil hat kein CM, deshalb: ja ich habe neue Leitungen verwendet.

Neuer Probelauf bei BF4: Problemlos über 28 min.

CPU Tctl/Tdie: mean 57,30; max 61,5
Chipset: mean 68,81; max 69,8
GPU: mean 84,54; max 91

Kann sicherlich ein glücklicher Zufall sein. Das Netzteil tausche ich dann in Richtung Wochenende und melde mich wieder, wenn ich ein bisschen rumprobiert habe.

@electronish , lasse die Lüfter mit etwa 65% PWM (in etwa 1700 RPM, Max müsste etwa 2200 RPM sein) laufen. Zufrieden stellt mich das zwar nur bedingt, aber so läuft die Karte bereits seit deutlich über einem Jahr.
 
Die CPU kann man ausschließen, RAM passt auch nicht zur Schilderung.
Stell die Lüfter der GPU Mal auf max und teste erneut. Ich finde die Temps der Karte deutlich zu hoch. Meine 580 Nitro+ ist da viel kühler, trotz aktuell miesen Gehäuse und fast keinem Airflow
 
Moin,

hab jetzt das mit dem Netzteiltausch doch erstmal weggelassen und mich der GPU Temperatur angenommen. Kühler ab und siehe da: quasi keine WLP mehr vorhanden, lediglich ein bisschen bröckeliges Zeug was mal WLP war. Mit neuer WLP und einen Frameratenbegrenzer benutzend komme ich auf deutlich entspanntere Temperaturen der GPU.

BF4 nach etwa 30 min: mean 74,25 °C; max 82,0 °C
AoE2_DE nach etwa 15 min: mean 66,12 °C; max 74,0 °C

Seiteninfo: der Takt wurde vorher nicht konstant gehalten, jetzt schon :)

Absturz war nun auch keiner mehr zu verzeichnen, ich warte dann mal ob noch was passiert.

@electronish , Undervolting habe ich jetzt mal in recht kleinen Bereichen probiert, also in Summe 50-60 mV, aber das führt recht unmittelbar zu Treiberabstürzen.
 
  • Gefällt mir
Reaktionen: electronish
Zurück
Oben