Spontane Neustarts (nicht reproduzierbar), aber alle Stresstests bestanden

JunkyardSpecial

Lieutenant
Registriert
Aug. 2007
Beiträge
594
Hallo,

hier steht ein älterer Office-Rechner auf FM2-Basis, der nicht mehr so läuft wie er soll:

A8-6600K [gut belüftet, kein VRM-Throttling, Turbo seit Einbau deaktiviert]
ASRock FM2A75M-DGS
2x 8 GB ADATA DDR3-1333
HD7770 1 GB + AOC Q2577PWQ via DP
Cougar GX-S450 [vor zwei Jahren erneuert]
OCZ Arc 100 120 GB + Samsung HM321HI + 2x optisch

Seit einigen Monaten besteht das Problem, dass der PC unvermittelt neu startet --- ohne offensichtlichen Grund, nicht reproduzierbar, kein Bluescreen, keine auffälligen Einträge in der Ereignisanzeige abgesehen von KernelPower. Manchmal hat man mehrere Wochen Ruhe obwohl der PC täglich genutzt wird, manchmal tritt der Fehler in kurzer Abfolge auf. Wie gesagt spontanes Fehlerbild.

Natürlich habe ich bereits versucht, die Fehlerquelle einzugrenzen, soweit jedoch erfolglos:
  • Temperaturen sind alle völlig unkritisch
  • 3x Memtest über Nacht
  • +0.15 V auf den RAM
  • Prime95, verschiedene Modi, einzeln oder in Kombination mit Furmark/Unigine Valley, jeweils stundenlang. Alles stabil und ohne (Grafik-)fehler. Außerdem mehrmals CineBench
  • Verschiedenste Grafiktreiber von uralt bis aktuell
  • Windows-Neuinstallation
  • Umstieg von FF auf Edge zwecks Hardwarebeschleunigung als mögliche Ursache

Normalerweise würde ich das Netzteil verdächtigen, aber auf der anderen Seite zeigen sich selbst bei maximaler Belastung keinerlei Auffälligkeiten, und es ist weder antik, überlastet noch Billigware. Eventuell, möglicherweise, unter Umständen etc...könnte ein Zusammenhang mit hardwarebeschleunigtem Rendering im Browser bestehen, aber selbst das konnte ich nicht mit Bestimmtheit eingrenzen. Es ist mehr ein Bauchgefühl und ansonsten funktioniert die Radeon anstandslos. Einen Monat Webbrowsing mit CPU-Rendering auf 2K möchte ich den Nutzern selbst zu Testzwecken nicht zumuten...

Hat jemand vielleicht noch eine Idee, bevor ich auf Verdacht ein neues Netzteil bestelle? Momentan sieht's mit der heimischen Ersatzteilversorgung eher mau aus.

Mit freundlichen Grüßen
 
Automatischen Neustart bei Systemfehlern mal deaktivieren
 
ich hatte sowas mal und nach 2-3 wöchiger Suche, lag es an der Steckdose... da war von Malerarbeiten Farbe reingelaufen und hat dafür gesorgt, dass manchmal alle 10 Minuten das Netzteil für Bruchteile von Sekunden keinen Saft mehr bekommem hat, manchmal lief es 5-6 h ...
SOWAS zu finden... das war eeeeeeeeecht übel.
 
Also ich hatte tatsächlich letztens im Bekanntenkreis etwas ähnliches. Der PC startete ab und zu neu aber nie unter volllast, sondern nur auf dem Desktop/Idle. Nach wechsel des Netzteils ist das Problem nun nicht mehr aufgetreten.
Evtl. besteht die Möglichkeit tatsächlich mal ein anderes Netzteil zu probieren?
 
Hätte da auch als erstes auf das Netzteil getippt.
Rest ist zwar auch nicht mehr taufrisch, aber wenn unter Volllast nichts wegbricht dann wird die Hardware noch laufen.
 
Danke für die Antworten!

@Schatho Deaktiviere ich direkt bei jeder Neuinstallation. Leider keinerlei Einträge außer "Das System wurde neu gestartet... etc" von KernelPower. Gibt auch keinen offensichtlichen Zusammenhang mit irgendwelchen Diensten oder Programmen, die kurz vor dem Absturz liefen.
@pvcf Gute Idee! Ich könnte zumindest das Kältegerätkabel austauschen; von denen hat man schließlich genug rumliegen.
@Darklordx Yup, alles im grünen Bereich.
@Logian Leider nein! Deshalb wollte ich um Anregungen bitten, bevor ich mir eins auf Verdacht bestelle.
 
JunkyardSpecial schrieb:
@pvcf Gute Idee! Ich könnte zumindest das Kältegerätkabel austauschen; von denen hat man schließlich genug rumliegen.

also ich habs erst beim aufschrauben der Steckdose in der Wand gesehen... (so verzweifelt muss man erstmal sein :D ), ein anderes Kaltgerätekabel hätte da nix gebracht, da die Farbe quasie innerhalb der Steckdose über die Kontakte geflossen ist und dort getrocknet war.
versuch doch erst einfach mal ne andere Steckdose, um sowas abzufangen ;)
 
Geht leider nicht so einfach. Gebäude aus den späten 50ern mit nur einer Handvoll Steckdosen pro Zimmer, bzw. u.a. nur einer einzigen. Mir ist noch die VCE eingefallen --- ich werde morgen mal HandBrake H.264 auf der GPU ausprobieren und schauen, ob es sich damit reproduzieren lässt. Diese dürfte bei aktivierter Hardwarebeschleunigung im Browser eventuell ein Faktor sein, zumindest auf YT. Davon abgesehen fallen mir keine weiteren Szenarien ein, die ich Software-seitig noch testen könnte...
 
SATA kabel haste schon gecheckt ? Die können gerne mal an den Anschlussstellen brechen und wenn die Systemplatte plötzlich weg ist, kommt auch ein unerwarteter Crash ohne OS log.
 
Nein, bisher lief meine Fehlerbehebung rein auf Softwarebasis. Aber ich werde den PC demnächst mal komplett auseinandernehmen und reinigen, und die SATA-Kabel wie vorgeschlagen wechseln. Im SMART-Log steht aber nichts zu Verbindungsabbrüchen sofern ich mich recht erinnere. Wäre natürlich schön, wenn der Bösewicht am Ende nur ein Wackelkontakt war. ;)
 
Windows freezet sofort wenn die Systemplatte weg ist, da kann nix mehr geloggt werden, da die Platte ja weg ist und das OS abschmiert.
 
Nun ja, eigentlich sollte das SMART-Logbuch unabhängig vom Betriebssystem sein. Und weder in den SMART-Werten der SSD noch HDD wurden Verbindungsabbrüche verzeichnet (...okay, ein einziger in 4 Jahren). Nichtsdestotrotz habe ich die Kiste heute bis auf CPU- und GPU-Kühler komplett zerlegt, gereinigt, wieder zusammengebaut und dabei penibel auf korrekten Sitz aller Stecker geachtet. Und die SATA-Kabel sind auch neu.

Staub war dank der offensichtlich sehr effektiven Filter trotz zweijährigem Dauerbetrieb kaum vorhanden. Den VRM-Bereich des Boards (Vorder- und Rückseite) habe ich genauer in Augenschein genommen und dabei nichts Auffälliges feststellen können.

Mal sehen, wie sich die Sache entwickelt!
 
Zuletzt bearbeitet:
Nun ja, eigentlich sollte das SMART-Logbuch unabhängig vom Betriebssystem sein.

Ach, joar, das hatte ich nicht Bedacht, wobei ich mir auch nicht sicher bin, ob die Platten einen Buffer haben der es ihnen ermöglicht bei Stromausfall zu loggen, ich glaub die loggen wenn das SATA oder IDE kabel wackeln, bin mir da aber absolut nicht Sicher, zumal SATA das HotPlug protokoll beherrscht, und da das ja explizit im BIOS pro Port eingeschaltet werden muss, wirds da eigentlich Kontrolbits geben, die beim SMART loggen berücksichtigt werden müssten, aber genau da fang ich arg an zu Zweifeln, wenn man sieht wie Beliebig manche Smartwerte von jedem Hersteller anders geloggt und interpretiert oder ignoriert werden.
In Windows hab ich schon Logs über Verbindungsabbrüche einer SSD gesehen und so den Kabelbruch des SATA kabels am Stecker gefunden.
Witzigerweise war der Log eintrag aber nicht direkt die Platte, sondern es hat selber mitbekommen, dass es aufgrund unerwarteten Powerverlustes abgeschmiert ist, das hat mich dann später noch die Steckdose checken lassen, da der PC vorher Jahrelang stabil im Nebenzimmer lief...
 
Zuletzt bearbeitet:
Eine Rückmeldung, um die Sache (hoffentlich) abzuschließen. Beim Überfliegen der damaligen Tests war mir aufgefallen, dass das Cougar unterdurchschnittliche Stützzeiten hat, also sogar unterhalb der ATX-Spezifikationen. An der Steckdosensituation lässt sich zwar nichts ändern, aber wir konnten zumindest die Verkabelung erneuern. Eine Steckdosenleiste weniger, die andere (und ziemlich alte) gegen etwas halbwegs Vernünftiges getauscht, alle Kaltegerätkabel gewechselt und ordentlich verlegt. Ein Monat ist zwar noch nicht rum, aber zumindest trat bisher kein plötzlicher Neustart mehr auf. Ist immerhin etwas, oder? Vielleicht bleibt es ja dabei!
 
  • Gefällt mir
Reaktionen: pvcf
Zurück
Oben