Wiederholte Bluescreen-Abstürze bei hoher Belastung, Video inside (5070 Ti)

bickid

Lt. Junior Grade
Registriert
Mai 2013
Beiträge
454
  • Prozessor (CPU): 9900X
  • Arbeitsspeicher (RAM): 64gb gskill
  • Mainboard: asus rog strix b850-i
  • Netzteil: 850w corsair platinum
  • Gehäuse: terra
  • Grafikkarte: inno3d 5070 ti
  • HDD / SSD: samsng m2 ssd
  • Wird ein sog. "PCIe Riserkabel" genutzt? ja, wurde anfangs ersetzt, lief seitdem problemlos

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Bei hoher Last (ComfyUI, Video-Generierung) jetzt wiederholt bluescreen gehabt. Eben zuletzt blieb der Fehlerbildschirm lang genug stehen, dass ich ihn fimen/fotografieren konnte.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
GPU-Treiber mit DDU deinstalliert und neu installiert; RAM-Speichertest durchgeführt

Hoffe, ihr könnt mir anhand des angehängten videos helfen, danke :(
 

Anhänge

  • IMG_20260307_181352.jpg
    IMG_20260307_181352.jpg
    791,3 KB · Aufrufe: 57
  • VID_20260307_181359.mp4
    6,7 MB
Was verstehst Du unter hoher Last? Leistungsaufnahme? GPU Auslastung? VRAM Nutzung?

Ich hatte zum Schluss mit meiner 1080 Ti ähnliche Probleme bei hoher VRAM Auslastung durch DaVinci und Lightroom. Da war ein VRAM defekt, sobald der gefordert wurde, ist reproduzierbar Grafiktreiber und Programm abgeschmiert, wenn nicht sogar der ganze PC. Hast Du den VRAM auch getestet? Z.B. mit OCCT?
 
Ich würde als Erstes nach den Temperaturen schauen. Hohe Last, also wäre es doch schön, wenn man sehen könnte was das genau bedeutet.
Mit HardwareInfo und oder GPU-Z nachsehen, was genau Sache ist.
Läuft der Afterburner mit?

Und ganz klar, ohne Riserkabel Testen.
 
  • Gefällt mir
Reaktionen: redjack1000
Nscale schrieb:
Was verstehst Du unter hoher Last? Leistungsaufnahme? GPU Auslastung? VRAM Nutzung?

Ich hatte zum Schluss mit meiner 1080 Ti ähnliche Probleme bei hoher VRAM Auslastung durch DaVinci und Lightroom. Da war ein VRAM defekt, sobald der gefordert wurde, ist reproduzierbar Grafiktreiber und Programm abgeschmiert, wenn nicht sogar der ganze PC. Hast Du den VRAM auch getestet? Z.B. mit OCCT?
Hohe last = video-generierung mit comfyui, da liegt die auslastung bei 100%. ich hab im taskmanager mitverfolgt wie der ram immer 'voller' wurde und als er 'voll' war (also alles beansprucht wurde), kam der absturz. Imo ist das problem, dass der ram nicht wieder gelöscht wird.

Aber ich mach mal diesen vram-test.

Ohne riser-kabel kann ich nicht testen, müsste ich den gesamten pc auseinanderbauen, was für mich keine routine ist. Ich könnte die gpu ausbauen un zu testen, ob dann was ist, aber mit der internen gpu kann ich confyui gar nicht verwenden.
 
bickid schrieb:
ich hab im taskmanager mitverfolgt wie der ram immer 'voller' wurde und als er 'voll' war (also alles beansprucht wurde), kam der absturz.
Das Grenzt das Problem ja schon ein. Tritt das nur bei comfyui oder auch bei anderen, VRAM fordernden Programmen auf?
Ich habe keine Erfahrung mit comfyui und wie sich das auf dem Rechner verhält. VRAM overflow wäre durchaus ein Grund für den Absturz vom Grafiktreiber oder der Karte.
 
  • Gefällt mir
Reaktionen: bickid
Gute und schlechte Neuigkeiten:

- mittels des Befehls --cache-none beim Starten von comfyui konnte ich lösen, dass der RAM übervoll wird. Wer sich mit Videogenerierung mit comfyui auskennt, weiß, dass dort in der Regel in zwei Phasen generiert wird: 4 steps high, dann 4 steps low. Vor dem cache-Befehl war der RAM bei ca. 31,3GB belegt. Dann wurden die zweiten 4 steps einach DAZU in den RAM geladen und die 64GB waren aufgebraucht. Jetzt mit dem cache-Befehl entleert er nach den ersten 4 steps und braucht nie mehr als knapp 32GB RAM. Generieren klappt, gut.

- leider: OCCT funktioniert nicht. Das Program stürzt zuverlässig beim startup ab, ich sehe nur den splash creen und windows sagt "keine Rückmeldung". wenn ich den VRAM also anders testen kann, bitte ich um Hilfe.

Davon losgelöst: Ein Bekannter meinte, ein PC würde bei zuviel RAM-Verbrauch keinen Bluescreen bedingen. Insofern hoffe ich, hier hat jemand noch kluge Vorschlöge :(

Achja, Temperaturen-mäßig kann ich nichts Auffälliges feststellen. Glaube 75°C war die Höchsttemperatur.
 
Reden wir den nun vom RAM oder vom VRAM der vollgelaufen ist? Ist ein Unterschied.

Soweit ich weiß hat Nvidia ein eigenes Tool um den VRAM zu prüfen, schau dir das ggf. mal an. Ob der MSI Kombustor noch den VRAM Test hat, weiß ich nicht. Such einfach mal, gibt ja einige Tools und Forks für sowas. Warum OCCT bei Dir nicht funktioniert kann ich Dir leider nicht sagen. Ggf. nicht als Admin ausgeführt?
 
@Nscale Als Admin schon probiert, stürzt genauso ab. Ich hab jetzt mal bei Steam die 3D Mark-Demo runtergeladen, damit sollte man die GPU auch testen können, oder.

Es geht um RAM und VRAM. Im Fall meiner Anwendung von ComfyUI wird die GPU verwendet, sonst quasi nichts. Die schnappt sich aber RAM, wenn der VRAM aufgebraucht ist. Die Frage ist, was den PC zum Abstürzen bringt. In dem Fall ist es passiert, als der RAM voll genutzt wurde bzw. vll überbenutzt wurde, zumindest hab ich es so im Taskmanager live beobachtet. Aber mir wurde gesagt, dass PCs normalerweise nicht durch RAM-Benutzung abstürzen, höchstens langsam werden oder einzelne Programm abstürzen.

Den VRAM will ich testen, um festzustellen, ob ein Problem mit der GPU besteht.
 
Die synthetischen Benchmarks von 3D Mark lasten meines Wissens VRAM nicht voll aus. Oder anders, ich hab das zumindest mit 3D Mark noch nicht hin bekommen.
Und was ist schon normal... Technik kann die wunderlichsten Probleme verursachen. Die Frage, ob das Problem auch bei anderen, VRAM fordernden Programmen auftritt ist noch offen. Was hat der RAM Test denn ausgespuckt? Läuft der RAM im Bios Stock oder im XMP/DOCP/EXPO Profil?
 
@Nscale Der Windows 11-Arbeitsspeichertest hat keine Probleme mit dem RAM festgestellt. Aber ich glaube auch nicht, dass der das Problem ist. Problem ist, dass der RAM voll läuft und dann der PC abstürzt.

3D Mark-Demo bietet leider nur Benchmark an. Ich probier mal mit Furmark 2.0

Expo hab ich an, ja, um den RAM optimal zu nutzen. Das hat auch ein Jahr lang keine Probleme gemacht.
Ergänzung ()

Ergebnis vom Furmark-Test. Sehe ich jetzt nichts Auffälliges. Sonst jemand?
Ergänzung ()

So sieht btw der Task-Manager aus während der Furmark läuft. Alles okay soweit. Ich müsste halt irgendwas testen, was den RAM strapaziert, aber ka, was man da nehmen kann.
Ergänzung ()

Alles scheiße :/

Eben generiere ich was mit ComfyUI, hab im Hintergrund n Youtube-Video laufen. Laut Anzeige ist der RAM längst nicht ausgenutzt, also eigentlich alles okay. Und plötzlich ... crash. Ich hab so einen Crash-Bildschirm noch nie gesehen. Hoffe, hier weiß es jemand ... danke
Ergänzung ()

Hier noch als Video, damit man den schönen Sound hört -_-
 

Anhänge

  • furmarktest01.png
    furmarktest01.png
    62,4 KB · Aufrufe: 28
  • 777777777.png
    777777777.png
    1,2 MB · Aufrufe: 27
  • IMG_20260308_001606.jpg
    IMG_20260308_001606.jpg
    1,4 MB · Aufrufe: 26
  • Vid 20260308 001556.mp4
    1,4 MB
Zuletzt bearbeitet:
Wenn ein Test ohne Riser unerwünscht ist, bitte mal im BIOS auf PCIE 3.0 umstellen und testen. Das Fehlerbild sieht nach einer defekten GPU aus, falls nicht letztens irgendwelche Treiber aktualisiert wurden, aber mit Riser können gekippte Daten ebenso zu Fehlern führen.
 
ich hab jetzt tatsächlich erstmal das BIOS geupdatet. Das war auf Stand Juli 2025. Jetzt ist es auf dem Stand von Februar 2026. Und ich hab jetzt ne gute Stand lang durchgehend mittes ComfyUI Video-clips generiert, auch in höheren Auflösungen, wo die Grafikkarte wirklich voll ausgelastet ist über längere Zeit und ... es ist nichts passiert. Kein Absturz.

Kann das wirklich die Lösung gewesen sein? :/

Ich hatte eigentlich schon damit abgeschlossen, dass ich die GPU morgen ausbaue und einschicke.

Nunja, ich werd's weiter beobachten. Entweder passt es jetzt oder aber die GPU wird beim nächsten Absturz ausgebaut. Soweit jedenfalls danke an alle, die mitgeholfen haben und vll hat ja noch jemand eine Idee, was hier los ist. Danke.
 
bickid schrieb:
Ich hatte eigentlich schon damit abgeschlossen, dass ich die GPU morgen ausbaue und einschicke.
Dann weißt Du aber immer noch nicht, obs einfach am Riserkabel liegt oder am Programm.

bickid schrieb:
Alles okay soweit. Ich müsste halt irgendwas testen, was den RAM strapaziert, aber ka, was man da nehmen kann.
Bezüglich VRAM hatte ich Dir schon den Hinweis zum Nvidia eigenen Tool gegeben. RAM kann man auch mit Memtest prüfen, das über einen Bootstick gestartet wird. Das ist nochmal ne gute Ecke härter als das Windowseigene Boardmittel. Braucht entsprechend aber auch seine Zeit.

bickid schrieb:
Kann das wirklich die Lösung gewesen sein? :/
Kann? Ja. Hast du geprüft ob nach dem Biosupdate alle Einstellungen übernommen wurden? Ist in den RAM Optionen das EXPO Profil geladen?
 
  • Gefällt mir
Reaktionen: bickid
Nscale schrieb:
Dann weißt Du aber immer noch nicht, obs einfach am Riserkabel liegt oder am Programm.

Das Riser-Kabel war damals, as ich den PC gebaut hab, defekt. Dann hat mir Fracta ein neues geschickt und damit war alles ok. Seitdem hat sich nichts geändert. Afaik würde das auch nicht zu sochen Abstürzen, sondern anderen Artefakten führen und die hab ich nicht. Aber ich kann es nicht testen. Oder was würde denn ein Setzen auf 3.0 verändern?
Nscale schrieb:
Bezüglich VRAM hatte ich Dir schon den Hinweis zum Nvidia eigenen Tool gegeben. RAM kann man auch mit Memtest prüfen, das über einen Bootstick gestartet wird. Das ist nochmal ne gute Ecke härter als das Windowseigene Boardmittel. Braucht entsprechend aber auch seine Zeit.
Ja, danke, das mach ich dann, wenn es jetzt nochmal zum Absturz kommt. Immerhin noch ein Ansatz. Aber falls es jetzt stabil läuft, lass ich alles wie's ist.
Nscale schrieb:
Kann? Ja. Hast du geprüft ob nach dem Biosupdate alle Einstellungen übernommen wurden? Ist in den RAM Optionen das EXPO Profil geladen?
EXPO hab ich nach dem BIOS-Update als erstes wieder aktiviert, war nach dem Update deaktiviert.
 
Oh mann ...

Jetzt hab ich wieder den Fehler, dass der GPU-Lüfter au maximal läuft, obwohl kein Programm irgendwas macht. HDInfo zeigt nur die Temperatur an, nicht aber die Umdrehungsgeschwindigkeit des Lüfters. Und dann ist der PC abgestürzt und danach war wieder Ruhe. was ist da los ...
 
auf den bildern sieht man ja bildfehler, oder? das ist doch dann eine defekte gpu m.m.n.
hast du eine andere / ältere zum gegentesten?

es kann natürlich auch immer am programm selbst liegen und nicht an der hardware. evtl mal ne ältere version des programms testen? evtl. mal von nem usb stick linux / ubuntu booten und da den workflow starten (wenns das programm auch für linux gibt).

und ein test OHNE riser kabel wäre auch ein versuch wert finde ich. man liest viel über diese kabel
 
  • Gefällt mir
Reaktionen: bickid
@Don_Tralle Ich hab jetzt vorhin folgendes getan nach chatgpt:

  • pci link speed von auto auf gen3 gesetzt
  • expo deaktiviert
  • ASPM deaktiviert

Danach hab ich 4 comfyui-videos generiert, und bis eben ne halbe stunde cyberpunk 2077 gespielt, mit path tracing und allem. alles ohne Probleme. kann das immer noch ein hardware-fehler sein? ich installier jetzt noch hogwarts legacy, weil das imo grafisch noch mehr reinhaut, aber wenn das auch klappt, hat wohl eine der 3 obigen einstellungen was gebracht. Einschätzungen?
 
Zurück
Oben