Temporär behobene Abstürze mit RTX 5060 Ti

SpeedKill08

Ensign
Registriert
März 2015
Beiträge
160
Mahlzeit zusammen,

vor wenigen Tagen hab ich mir als Ersatz für eine PS5 einen kleinen Rechner für mein 4k-Samsung Fernseher zusammengebaut.
Hier die Specs:
CPU: AMD Ryzen 7 7700 (Takt ist stock, kein OC)
Mainboard: Gigabyte B650I AX
CPU-Kühler: Noctua NH-L12Sx77
RAM: Corsair Vengeance DIMM Kit 32GB, DDR5-6000, CL36-44-44-96 (nutze XMP-Profil)
GPU: ASUS Dual GeForce RTX 5060 Ti OC, DUAL-RTX5060TI-O16G
SSD: 1 TB Samsung SSD 990 EVO Plus, M.2
Case: Fractal Design Mood
Netzteil: Seasonic FOCUS SGX 650 W
OS: Windows 11 Pro
Treiber, BIOS, OS alles up to date.

Mein Problem ist, dass das komplette System vollkommen willkürlich im Idle nach dem Start des Rechners, nach einigen Minuten normaler Desktop/Browser-Nutzung oder direkt nach einer Last wie Benchmark oder Spiel crashed und neustartet. Fehlermeldung laut Ereignisanzeige:
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x00000116 (0xffffb90211f0a010, 0xfffff801be236af0, 0xffffffffc000009a, 0x0000000000000004). Ein volles Abbild wurde gespeichert in: C:\WINDOWS\Minidump\062225-11218-01.dmp. Berichts-ID: 99c5b4ba-fdea-4e2c-b8f9-c461cebdcc98.

Unter Last, egal ob diverse Benchmarks, Stresstests oder mehrere Stunden langes Zocken führen nicht zu Abstürzen. Da läuft das System stabil und ohne Probleme. Sämtliche Temperaturen und Auslastungen unter Last sind nach meinem Ermessen auch ok.

Jetzt habe ich die letzten Tage diverse Quellen im Internet recherchiert, zig Workarounds probiert, andere Treiberversionen probiert und sämtliche Verbindungen im Rechner gecheckt, aber bisher gab es nur einen Tipp, der zumindest seitdem Einstellen nicht mehr zu einem Absturz geführt hat:
Im Nvidia-Control-Panel habe ich den Power Management Mode von Normal auf Maximum Performance gestellt.

Hat jemand eine Idee, was das Problem sein könnte und ob der gefundene Workaround sinnvoll ist?

Grüße <3
 
RAM-Takt testweise auf 5200 stellen.
 
@Drewkev:
Zu hohe Temperaturen hatte ich auch erst im Verdacht, aber unter Last überschreiten weder CPU noch GPU die 80°C-Marke. Ist nicht optimal, aber ich nutze nur Luftkühlung und gestern und Samstag wars echt warm. :D

Dagegen spricht irgendwie auch, dass es bislang in Last-Szenarien niemals zu diesen Crashes kam. Das passierte ausschließlich im Idle bzw. nach dem Beenden von Spielen/Benchmarks.

Die dmp-Datei kann ich später gern zur Verfügung stellen.
 
Ich halte auch den Arbeitsspeicher für möglich, würde aber eher auf die Nvidia Treiber tippen, der Fehlerbeschreibung nach. Die haben in den vergangenen Wochen für viel Aufsehen und Probleme gesorgt. Auch der Fehlercode 0x00000116 ist ein Indiz für Probleme mit der GPU.
 
  • Gefällt mir
Reaktionen: aklaa und SpeedKill08
Zuletzt bearbeitet:
SpeedKill08 schrieb:
(nutze XMP-Profil)
Hat der RAM kein EXPO?
Wenn ja, dann mal auf EXPO umstellen. Sonst mal ohne XMP probieren.

BIOS ist aktuell?

Ansonsten das übliche durchchecken.
Also alle Hardwaregeräte auf Firmwareupdates und Treiberupdates überprüfen. SSD, BIOS, USB-Controller, GPU, ...
 
Im Windows-Energiesparplan das Energiesparen für PCIe-Geräte deaktivieren und testen.
 
Hab nun erstmal die Einstellung im Nvidia Control Panel zurückgesetzt und hab beim RAM von XMP auf EXPO gewechselt (aber die Geschwindigkeit erstmal unverändert gelassen).

Bisher läufts stabil. Mal heute weiter beobachten.
 
Hast du 2 Monitore?
Laufen während der Abstürze Browser mit Videos (Möglicherweise auch im Hintergrund) ?
Läuft während der Abstürze MSI Aftrerburner? Falls ja, mit Lüfterkurve?
 
Kleines Update:
Das reine Wechseln des RAM-Profils hat nichts gebracht. Werde bei Gelegenheit mal den RAM Takt wie empfohlen manuell auf 5200 herabsetzen.

@Knito
Nein, an dem Rechner ist nur der Samsung-Fernseher angeschlossen. Während der Abstürze lief noch nie ein Video. Im Hintergrund läuft GPU Tweak 3. Abstürze treten im Stock und OC-Profil auf.

Nochmal zur Klarstellung, hier die Szenarien, in denen es sporadisch zu den Crashes kommt:
  • System wechselt von Last-Szenario auf Idle (nach dem Beenden eines Spiels oder Benchmark)
  • kurz nach Start des Systems
  • Random im normalen Desktop-Betrieb
Ergänzung ()

Drewkev schrieb:
Hier ein kleiner Auszug schonmal. Hatte das noch in meiner History:

VIDEO_TDR_FAILURE (116) Attempt to reset the display driver and recover from timeout failed.
Arguments:
Arg1: ffffc383b987c010, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff8058c65aae0, The pointer into responsible device driver module (e.g. owner tag).
Arg3: ffffffffc000009a, Optional error code (NTSTATUS) of the last failed operation.
Arg4: 0000000000000004, Optional internal context dependent data.
 
Zuletzt bearbeitet:
VIDEO_TDR_FAILURE (116) Attempt to reset the display driver and recover from timeout failed.
Ich tippe immer noch auf die Graka, deren Treiber oder das nicht aktualisierte BIOS der Karte (falls nicht schon geschehen). Recover from timeout failed sagt eigentlich schon ganz deutlich was Phase ist.
 
  • Gefällt mir
Reaktionen: LukS
Habe auch mit Timeouts zu tun (aber nur im Browser; unter Last komplett stabil; Hardwarebeschleunigung im Browser deaktiviert -> keine Probleme mehr), aber nicht so krass wie dein Fall.
Vielleicht gibt dir mein Thread noch weitere Hinweise/Ideen: https://www.computerbase.de/forum/t...n-reset-tdr-occurred-im-idle-browser.2237955/

Auch ein Austausch der GPU würde ich in Erwägung ziehen (vor allem wenn du noch im Rückgabezeitraum bist), da das nach meiner Recherche in vielen Fällen geholfen hat (nicht bei allen!).

Aber es sei gesagt: dein Fehlerbild ist anders als meins, deswegen muss meine Recherche nicht auf dein Problem passen (tut es auch nicht direkt, da dein System komplett abstürzt).

Hast du denn weitere Einträge in der Ereignisanzeige?
Wie oft tritt der Fehler denn überhaupt auf? Ist er reproduzierbar?
GPU läuft über PCIe 4.0?
KEIN GPU-Riser im Einsatz?
 
@Wo bin ich hier
  • das Mainboard supported nur bis PCIe 4.0
  • wegen dem Gehäuse ist die Grafikkarte mittels Riser am Mainboard angeschlossen. Dad ist das originale von Fractal Design, was dem Case beilag (bzw. verbaut war). Das ist laut deren Spezifikationen auch kompatibel mit PCIe 4.0
  • die Ereignisanzeige gibt sonst keine nützlichen Infos her, nur den im Eingangspost zitierten Fehler.
  • Reproduzierbar: so semi. Am ehesten lässt sich der Fehler triggern, indem man Last aufs System gibt und dann nach beliebiger Zeit zurück in den Idle wechselt- aber auch dann passiert das nicht immer. Die Crashes nach dem Boot und Anmeldung bzw. im Desktop-Betrieb scheinen mir random zu sein (der Fehler in der Ereignisanzeige ist aber der gleiche)

Mich macht es halt fuchsig, dass das System unter Last egal wie lang wie gewünscht performt und es zu keinen Abstürzen kommt.
Ich habe ja bereits einen Workaround via Nvidia Control Panel gefunden (siehe Eingangspost). Aber es erscheint mir komisch, den Power Management Mode anzupassen - bzw. ich würde das Fehlverhalten gern nachvollziehen können, auch um Zweifel die GPU zu reklamieren.
 
SpeedKill08 schrieb:
wegen dem Gehäuse ist die Grafikkarte mittels Riser am Mainboard angeschlossen. Dad ist das originale von Fractal Design, was dem Case beilag (bzw. verbaut war). Das ist laut deren Spezifikationen auch kompatibel mit PCIe 4.0
Ah, das ergibt Sinn. War mir nicht bewusst, dass das "Fractal Design Mood" solch ein Spezialcase ist.
Ist trotzdem ein häufiger Problemverursacher, auch wenn es "kompatibel" ist.
Würde das ganze außerhalb vom Gehäuse aufbauen und testen. Nur so wirst du Probleme damit ausschließen können.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: coxon und LukS
Zurück
Oben