Gesucht: Ein Tool welches dauerhaft PC Werte aufzeichnet zur Fehlersuche für PC Abstürze

Damien White

Fleet Admiral
Registriert
Feb. 2009
Beiträge
10.107
Mainboard: MSI B450M MORTAR 7B89-001R
CPU: AMD Ryzen 5 2600 6x 3.40GHz So.AM4 BOX
Grafikkarte: 8GB Asus Radeon RX Vega 64 ROG Strix OC
RAM: 16GB (2x 8192MB) G.Skill Aegis DDR4-3000 DIMM CL16-18-18-38 Dual Kit
Netzteil: 650 Watt be quiet! Straight Power 11 Modular 80+ Gold

Problem:
Mir schmiert in regelmäßigen Abständen der PC ab. Ich habe alles probiert, das man so finden kann, habe zig Stresstests durchlaufen lassen, ohne Ergebnis, und auch sonst kann ich keinen Auslöser feststellen. Es passiert sowohl wenn man spielt, als auch wenn der PC ausschließlich auf dem Desktop ist, manchmal geschieht es wenige Minuten nach dem Einschalten, manchmal läuft der PC auch über Tage völlig stabil. Weder die CPU noch GPU oder RAM sind übertaktet/undervolted, Netzteil reicht auch, insbesondere da es auch im Desktop Modus geschieht.

Ich benötige ein Tool, das im Hintergrund mitläuft und diverse Kennwerte meines PC aufzeichnet, die man nach einem Crash auch abrufen kann, in der Hoffnung, dass man im Anschluss an den Daten sehen kann, was schief gelaufen ist.

Windows selbst ist hier keine Hilfe, die Ereignisanzeige zeigt nur an, dass der PC abgeschmiert ist, jedoch nicht wieso. Insbesondere in der Zeit vor dem Crash hat Windows einfach nichts aufgezeichnet was irgendwie ein Problem sein könnte.

Ich habe mal die Ereignisanzeige angehängt, wo man die Crashes sehen kann.

Falls wer sonst eine Idee haben könnte, wo man in Windows suchen kann oder woran es liegen könnte dann bin ich für jeden Hinweis dankbar.

Besten Dank im Voraus!
 

Anhänge

  • ereignis.png
    ereignis.png
    438,9 KB · Aufrufe: 266
Zuletzt bearbeitet:
Dump File. Musst du halt nur aktivieren. Da steht alles drin und mit BlueScreenviewer kannst du exakt den schuldigen Prozess erkennen. Wird hier jeden Tag erwähnt. Wundert mich, dass du das nicht mitbekommen hast :)
 
  • Gefällt mir
Reaktionen: Slayher666
steht doch da Kernel Power 41 ...

also nicht ordnungsgemäß runtergfeahren ...

Meist das netzteil aber das hast du ja schon bewertet das es ausreicht ... anhand welcher Daten ?
 
  • Gefällt mir
Reaktionen: Slayher666
Sag uns doch einfach mal wie dieses "ausreichende" Netzteil bezeichnet ist...
 
xxMuahdibxx schrieb:
steht doch da Kernel Power 41 ...

also nicht ordnungsgemäß runtergfeahren ...

Meist das netzteil aber das hast du ja schon bewertet das es ausreicht ... anhand welcher Daten ?
Anhand dessen, dass Benchmarks durchlaufen, ohne das etwas geschieht, jedoch anders herum der PC sich auch mal kurz nach dem Booten abschießt, ohne das irgend eine stromlastige Anwendung überhaupt gestartet wurde.

Ich meine, wenn es ausschließlich beim Spielen oder so geschehen würde, dann wäre das Netzteil Verdächtiger Nummer Eins, klar, aber wenn der PC sich im idle Zustand befindet und nicht einmal ein Browser offen ist, dann ist da halt nichts, was ein Netzteil verursachen könnte.

Das nicht ordnungsgemäße Herunterfahren besagt ja nur, dass er abgeschmiert ist.
 
Moin,
Passiert das auch bei nur 1 RAM Riegel?
Lief der PC mal stabil ?
Das Netzteil ist ...?
mfg
 
MadMax 21 schrieb:
Sag uns doch einfach mal wie dieses "ausreichende" Netzteil bezeichnet ist...
Ein "650 Watt be quiet! Straight Power 11 Modular 80+ Gold".
Ergänzung ()

iamcriso schrieb:
Lief der PC mal stabil ?

Der PC läuft so seit Oktober 2018, das Ganze ist zum ersten Mal am 15.09.20 aufgetreten. Also nicht ganz Zwei Jahre nach der "Inbetriebnahme".

EDIT: Habe mal die exakten Bezeichnungen der Komponenten aus dem Lieferschein eingefügt. Braucht ihr auch den Kühler oder die SSD?
 
Zuletzt bearbeitet:
Ok, ist jetzt reine Vermutung aber mEn zickt der Aegis RAM gern mal rum.

Probier mal ne zeitlang nur 1x RAM Modul, noch besser wäre ein anderes RAM paar zum Testen.

Hast du mal den Memtest durchlaufen lassen ?
 
RAM-XMP-Profil ausgewählt?
Hatte ein ähnliches Problem. Bei mir war die Lösung, der Wechsel des XMP-Profils...
 
iamcriso schrieb:
Hast du mal den Memtest durchlaufen lassen ?
Memtest 86, Prime, diverse Grafikbenchmarks.

Jop.
Ergänzung ()

larska schrieb:
RAM-XMP-Profil ausgewählt?
Hatte ein ähnliches Problem. Bei mir war die Lösung, der Wechsel des XMP-Profils...

Ich habe nichts gesondertes irgendwo ausgewählt. Ich wüsste nicht einmal, wo man das wechselt und wenn ja, zu was ^^"
Ergänzung ()

Tamron schrieb:
Ich bin diesem Guide gefolgt:
https://www.digitalcitizen.life/view-contents-dump-file/

Jedoch hat mein PC keinen "minidump" Ordner erstellt und die Suche nach einer .dmp Datei liefert kein sinnvolles Ergebnis. Ich finde da Dateien diverser Programme (GW2, Forza, Chrome etc.), aber nichts, was heute verändert wurde und nichts, was nach einer Datei von Windows aussieht.

Kannst du bitte etwas genauer beschreiben, was du meinst?
 
Zuletzt bearbeitet:
Ich würde erstmal prüfen wie die Karte am Netzteil angeschlossen ist.Auch wenn es schon ne Zeitlang mehr oder minder gelaufen ist. Und zwar mit zwei separaten Kabeln am Netzteil angeschlossen ist.Anhang anzeigen 1014572
Das Straightpower verfügt über zwei 12V Rails für die Grafikkarte, diese können Theoretisch zweimal 264W zusätzlich den 75W vom PCIe Anschluss liefern. Hängt deine Karte, die je nach Modell über 300W verbrauchen, nur an einer dieser beiden Rails sieht es eng aus.

https://www.computerbase.de/2017-08/asus-radeon-rx-vega-64-vorserie-test/3/

Dann würde ich mir diesen Artikel vom Igor Zwecks des Hotspottemparturproblemes unter Last sowie auch durch kurze spikes (Idle) durchlesen.

https://www.igorslab.de/amd-radeon-...d-das-richtige-auftragen-von-waermeleitpaste/
Anhang anzeigen 1014576

Dann das ganze mal gegentesten und messen also Karte neu Verkabeln (falls dem noch nicht so ist) mal die Lüfter der Karte auf 100% stellen bevor man ein Spiel startet. Oder mal Screenshots während eines Games/Benschmarks von GPU-Z.

Ich teste sowas auch gerne mit dem ASUS Realbench/ GPU-Z / HWInfo64. Stresstest vom Realbenech starten und mit GPU-Z HWInfo64 beobachten. Oder sogar ein Logfile mit GPU-Z anlegen lassen.

Anhang anzeigen 1014575

Dejavu
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Volvo480
iamcriso schrieb:
Hast du mal den Memtest durchlaufen lassen ?
Ich lasse gerade zur Sicherheit nochmals die aktuellste Version von Memtest laufen, bisher ist 1/4 Durchgängen vorbei und keine Fehler.

EDIT: Lief komplett durch, keine Fehler.
 

Anhänge

  • IMG_20201224_005340.jpg
    IMG_20201224_005340.jpg
    944,7 KB · Aufrufe: 219
Zuletzt bearbeitet:
Ist gerade wieder geschehen, es lief nur ein Youtube Video (nein, kein 4K@60FPS), keine Spiele o.ä.

iamcriso schrieb:
Moin,
Passiert das auch bei nur 1 RAM Riegel?
Jop, ich werde mal den anderen einsetzen, aber ich bin mir zu 99% sicher, insbesondere da Memtest nichts gefunden hat, dass es nicht am RAM liegt


Viper1982 schrieb:
Ich würde erstmal prüfen wie die Karte am Netzteil angeschlossen ist.Auch wenn es schon ne Zeitlang mehr oder minder gelaufen ist. Und zwar mit zwei separaten Kabeln am Netzteil angeschlossen ist.Anhang anzeigen 1014572
Das Straightpower verfügt über zwei 12V Rails für die Grafikkarte, diese können Theoretisch zweimal 264W zusätzlich den 75W vom PCIe Anschluss liefern. Hängt deine Karte, die je nach Modell über 300W verbrauchen, nur an einer dieser beiden Rails sieht es eng aus.

https://www.computerbase.de/2017-08/asus-radeon-rx-vega-64-vorserie-test/3/

Dann würde ich mir diesen Artikel vom Igor Zwecks des Hotspottemparturproblemes unter Last sowie auch durch kurze spikes (Idle) durchlesen.

https://www.igorslab.de/amd-radeon-...d-das-richtige-auftragen-von-waermeleitpaste/
Anhang anzeigen 1014576

Dann das ganze mal gegentesten und messen also Karte neu Verkabeln (falls dem noch nicht so ist) mal die Lüfter der Karte auf 100% stellen bevor man ein Spiel startet. Oder mal Screenshots während eines Games/Benschmarks von GPU-Z.

Ich teste sowas auch gerne mit dem ASUS Realbench/ GPU-Z / HWInfo64. Stresstest vom Realbenech starten und mit GPU-Z HWInfo64 beobachten. Oder sogar ein Logfile mit GPU-Z anlegen lassen.

Anhang anzeigen 1014575

Dejavu
Ich hatte über Weihnachten nur einen RAM Riegel ausgebaut und die Verkabelung der Karte geprüft, das hat soweit ich das sehen konnte gepasst.

Auch sonst, wie gerade eben, da war nichts, was die Karte auch nur im Ansatz ausgelastet hat.

Hotspottemperaturprobleme werde ich erstmal ganz ans Ende schieben, die Karte o.ä. nehme ich jetzt nicht auf Verdacht auseinander.

Den Stresstest werde ich noch mal versuchen und die Logfile dann hier posten, evtl. erkennt ihr ja was, woran es liegen kann.

Anyway, um auf die eigentliche Frage des Threads zurück zu kommen, gibt es ein Tool, was die ganzen Werte von HWinfo auch automatisch aufzeichnet? Vorzugsweise auf möglichst kleine Zeitwerte. Zumindest in HWinfo selbst kann ich keine derartige Option finden, man muss immer die Aufzeichnung in HWInfo manuell starten.

Mir schwebt da eher was wie ein Ringspeicher vor, der immer im Hintergrund mitläuft und nur 5 Minuten aufzeichnet, dafür allerdings 0.1s Werte oder so.

EDIT: Habe RealBench durchlaufen lassen. Einmal mit 8GB, weil ich dachte es geht um den Grafikspeicher, danach nochmal mit 16GB, da es um RAM ging. Ich habe die Logfiles sowohl von HWInfo als auch GPU-Z beigefügt. Hierbei gab es für mich ein paar Feststellungen:

1.: Der PC hat keinerlei Auffälligkeiten gezeigt, er lief einfach völlig normal vor sich hin.

2.: Die Temperatur ist nicht das Problem. Trotz 100% Auslastung blieb die CPU bei um die 50°C (22-24°C Raumtemp), die Grafikkarte war ebenfalls ruhig und drehte nur gelegentlich auf, weil die Temperatur die 60°C angekratz hatte. Die Hotspottproblematik würde ich also erstmal ganz weit nach hinten schieben.

Wenn noch jemand Ideen für Benchmarks hat, die man durchlaufen lassen sollte, dann immer her damit.
 

Anhänge

  • HWI-8GB.CSV
    1,1 MB · Aufrufe: 200
  • HWI-16GB.CSV
    1 MB · Aufrufe: 200
  • GPU-Z Sensor Log.txt
    1,8 MB · Aufrufe: 206
Zuletzt bearbeitet:
Damien White schrieb:
Hotspottproblematik würde ich also erstmal ganz weit nach hinten schiebe
Hm guck dir mal deinen GPU Load an während des Benchmarks an, die Karte wird sogut wie garnicht belastet. Deshalb wird die auch nicht warm, wenn ich den Benchmark bei mir starte sieht das so aus.


GPUZ.png


""Verkabelung der Karte geprüft, das hat soweit ich das sehen konnte gepasst."" Ist das sowas wie die Temperatur ist im grünen Bereich?

Bei dir hingegen dümpelt die da nur rum und wird nicht ausgelastet ja Realbench wird nicht fortgesetzt aber mein System (3900X/1080ti)wird trotzdem voll ausgelastet (nur um einigen hier schon was vorweg zu nehmen).

Ka was das ist, dann probiere mal den Superposition Benchmark aus oder Zock ne runde und lasse ebenfalls GPU-Z mitlaufen.

https://benchmark.unigine.com/superposition
 
Zuletzt bearbeitet:
.
 
Zuletzt bearbeitet:
Viper1982 schrieb:
Hm guck dir mal deinen GPU Load an während des Benchmarks an, die Karte wird sogut wie garnicht belastet. Deshalb wird die auch nicht warm, wenn ich den Benchmark bei mir starte sieht das so aus.
Ich ging davon aus, dass der von dir genannte Benchmark zum Testen der Karte da war.
Viper1982 schrieb:
""Verkabelung der Karte geprüft, das hat soweit ich das sehen konnte gepasst."" Ist das sowas wie die Temperatur ist im grünen Bereich?
Ein etwas eigenartiger Tonfall, hab ich dir irgendetwas getan oder was? Du hast gesagt ich soll schauen, ob die Karte richtig verkabelt ist und das habe ich getan, was für eine Antwort hast du denn erwartet?
Viper1982 schrieb:
Bei dir hingegen dümpelt die da nur rum und wird nicht ausgelastet ja Realbench wird nicht fortgesetzt aber mein System (3900X/1080ti)wird trotzdem voll ausgelastet (nur um einigen hier schon was vorweg zu nehmen).

Ka was das ist, dann probiere mal den Superposition Benchmark aus oder Zock ne runde und lasse ebenfalls GPU-Z mitlaufen.

https://benchmark.unigine.com/superposition
Habe ich gemacht, der Stresstest ist hinter einer Paywall, deswegen habe ich 2 x 4K und 2 x 8K Benchmarks laufen lassen, mit entweder 6000 oder 2700 Punkten. Im Anschluss habe ich mich für 30 Minuten in das 8K Gameplay gestellt, mit allen Lichtern an, der Gravitation abgestellt und noch den Ventilator und einige andere Gegenstände mit reingeworfen.

Lief ebenfalls stabil.

Ich habe die Logfiles angehängt.
 

Anhänge

  • GPU-Z Sensor Log.txt
    3,6 MB · Aufrufe: 202
  • log3.CSV
    2,2 MB · Aufrufe: 191
Damien White schrieb:
Ich ging davon aus, dass der von dir genannte Benchmark zum Testen der Karte da war.

ist er ja auch nur deine karte sagt .. Mäh interresiert mich nicht.

zur Verkabelung ... wir haben das tollste schon gesehen ... nachdem wir oft nachgefragt haben ... und dann war der Fehler so eindeutig am Ende ...

Daher glauben wir oft erst etwas wenns Bilder davon gibt.
 
Sorry für den Tonfall aber ein Foto als Bestätigung oder Fakt wäre eben besser denn wir sitzen halt auf der anderen Seite des Bildschirmes, deine Hotspottemperatur kratzt ständig an 100Grad schonmal eine, wenn nicht die Baustelle. Und ob dass jetzt 100 oder 106 Grad sind welche ja nicht lange anliegen (.ms) müssen um die Karte bzw. das System zum Absturz zu bringen wurde bei Igor beschrieben.

Denke bevor das nicht behoben ist brauchst erstmal nicht weiter schauen.

Hot.png


Denn das Problem kann auch Im Idle erfolgen wenn die Lüfter zb. stillstehen und die Karte kurzzeitig hochtaktet das kann bei Bowseröffnen etc. sein. Dann halt bitte nochmal die Fotos vom Netzteilanschluss.

Und hier noch der Link eines anderen welcher die gleiche Karte/Problem hatte und nur das Auftragen neuer Wärmeleitpaste war die Lösung des ganzen Problems.

https://www.computerbase.de/forum/threads/asus-rog-strix-rx-vega64-oc-schmiert-ab.1944319/

Genauso sämtlichen VRM Temperaturen liegen bei dir über 100° wo die bei dem Problem im Link oben nur bei 60° liegen. Also da würde ich mal genauer hinschauen, in dem Thread ist auch ein Video der Karte wie und wo was zu machen wäre.

Und deine Karte dreht ja den die Lüfter auch nicht über 50% bei ner Gradzahl an der GPU von 80Grad.Könntest natürlich die Lüfterkurve anpassen und das Problem weiter nach hinten schieben.
 
Zuletzt bearbeitet:
Hallo und guten Morgen.
Habe gesehen das du eine Asus Vega 64 benutzt, und Abstürze hast selbst im Idle. Die Karte, wenn du da nichts modifiziert hast, ist in ihrer Werksausgabe leider Müll.
Selbst wenn du denkst das die Gehäusebelüftung gut ist, ist sie wohl für diese Karte nicht ausreichend.
Ich konnte meine Asus Vega 64 damals nur bändigen indem ich folgende Punkte durchgeführt habe:

Neue und kürzere Schrauben auf der Rückseite um den Anpressdruck zu erhöhen. Die Original schrauben sind sehr weich und reissen schnell ab. Daher lieber Edelstahl nehmen.

Andere WLP nehmen, aber keine MX 4 oder sowas die verflüssigt sehr schnell. Bei der Karte brauchst du etwas mit geringerer Konsistenz. Bei mir hat am besten die Thermal Grizzly Kryonaut gewirkt.

Anderes Wärmeleitpad habe ich nicht genommen da durch Erhöhung des Anpressdrucks das alte ausreicht.

Zum Schluss nochmal den Ghetto Mod durchgeführt um die Karte leise zu bekommen.

Nur zur Info, alle diese Eingriffe haben zur Folge daß du die Garantie verlierst und bitte alles auf eigene Gefahr. Sind doch Recht rabiate Maßnahmen und wenn man so etwas nicht durchgeführt hat sollte man es von jemandem durchführen lassen der das kann.

Aber nur Mal als Info, die Asus Vega 64 ist normal ne Turbine unter Volllast. Wie ist bei dir die Lautstärke ?
 
  • Gefällt mir
Reaktionen: Viper1982
xxMuahdibxx schrieb:
ist er ja auch nur deine karte sagt .. Mäh interresiert mich nicht.
Warum ist das so? Treiberprobleme? Ich habe die aktuellsten, die ich finden konnte.

Viper1982 schrieb:
Sorry für den Tonfall aber ein Foto als Bestätigung oder Fakt wäre eben besser denn wir sitzen halt auf der anderen Seite des Bildschirmes, deine Hotspottemperatur kratzt ständig an 100Grad schonmal eine, wenn nicht die Baustelle. Und ob dass jetzt 100 oder 106 Grad sind welche ja nicht lange anliegen (.ms) müssen um die Karte bzw. das System zum Absturz zu bringen wurde bei Igor beschrieben.

Denke bevor das nicht behoben ist brauchst erstmal nicht weiter schauen.

Anhang anzeigen 1020367

Denn das Problem kann auch Im Idle erfolgen wenn die Lüfter zb. stillstehen und die Karte kurzzeitig hochtaktet das kann bei Bowseröffnen etc. sein. Dann halt bitte nochmal die Fotos vom Netzteilanschluss.

Und hier noch der Link eines anderen welcher die gleiche Karte/Problem hatte und nur das Auftragen neuer Wärmeleitpaste war die Lösung des ganzen Problems.

https://www.computerbase.de/forum/threads/asus-rog-strix-rx-vega64-oc-schmiert-ab.1944319/

Genauso sämtlichen VRM Temperaturen liegen bei dir über 100° wo die bei dem Problem im Link oben nur bei 60° liegen. Also da würde ich mal genauer hinschauen, in dem Thread ist auch ein Video der Karte wie und wo was zu machen wäre.

Und deine Karte dreht ja den die Lüfter auch nicht über 50% bei ner Gradzahl an der GPU von 80Grad.Könntest natürlich die Lüfterkurve anpassen und das Problem weiter nach hinten schieben.
Keine Ahnung, um ehrlich zu sein, die Karte hat bei 100% Auslastung die 80 Grad gehalten, das ist soweit ich sehen konnte die Einstellung um Treiber gewesen.
temp.png

Das ist die Lüfterkurve die im Treiber aufpoppt, wenn man auf Manuell stellt.

Ich habe mal die Lüfter auf 50% Grundlast und 100% Maximal gestellt:
temp2.png


Xoxo1 schrieb:
Hallo und guten Morgen.
Habe gesehen das du eine Asus Vega 64 benutzt, und Abstürze hast selbst im Idle. Die Karte, wenn du da nichts modifiziert hast, ist in ihrer Werksausgabe leider Müll.
Selbst wenn du denkst das die Gehäusebelüftung gut ist, ist sie wohl für diese Karte nicht ausreichend.
Ich konnte meine Asus Vega 64 damals nur bändigen indem ich folgende Punkte durchgeführt habe:

Neue und kürzere Schrauben auf der Rückseite um den Anpressdruck zu erhöhen. Die Original schrauben sind sehr weich und reissen schnell ab. Daher lieber Edelstahl nehmen.

Andere WLP nehmen, aber keine MX 4 oder sowas die verflüssigt sehr schnell. Bei der Karte brauchst du etwas mit geringerer Konsistenz. Bei mir hat am besten die Thermal Grizzly Kryonaut gewirkt.

Anderes Wärmeleitpad habe ich nicht genommen da durch Erhöhung des Anpressdrucks das alte ausreicht.

Zum Schluss nochmal den Ghetto Mod durchgeführt um die Karte leise zu bekommen.

Nur zur Info, alle diese Eingriffe haben zur Folge daß du die Garantie verlierst und bitte alles auf eigene Gefahr. Sind doch Recht rabiate Maßnahmen und wenn man so etwas nicht durchgeführt hat sollte man es von jemandem durchführen lassen der das kann.

Aber nur Mal als Info, die Asus Vega 64 ist normal ne Turbine unter Volllast. Wie ist bei dir die Lautstärke ?
Die Lautstärke ist eher ruhig. Normalerweise läuft keiner der Lüfter und selbst in dem Benchmark sind die Lüfter nur auf maximal 50% gelaufen. Ich kann jetzt zumindest weder zur Leistung noch Lautstärke der Karte etwas negatives sagen. Klar, wenn die Abstürze an ihr liegen, dann ist das ein Negativ Punkt, aber wenn nicht, dann ist die eigentlich über jeden Zweifel erhaben.

Und dann noch die Bilder des Netzteils ...

Wenn ihr darauf was erkennen könnt, dann viel Spaß.
IMG_20210105_155105[1].jpg

IMG_20210105_155121[1].jpg

IMG_20210105_155129[1].jpg

IMG_20210105_155248[1].jpg

IMG_20210105_155620[1].jpg

Die Karte hängt an PCIe-1, was der von NT vorgesehene Anschluss ist. Auch sonst liefert das NT keine Möglichkeiten die Karte falsch zu verbinden, man hätte sie maximal an PCIe-2 anschließen können, das wars dann aber auch.
 
Zurück
Oben