5070 TI Blackscreen / Reset TDR occurred im Idle/Browser

Wo bin ich hier

Lt. Commander
🎅Rätsel-Elite ’24
Registriert
Juni 2018
Beiträge
1.209
Hallo zusammen,

ich bräuchte mal wieder ein wenig seelischen Beistand. Nachdem meine "5070 TI MSI Vanguard" ratterte (hier zu lesen/hören) und durch eine (weitaus leisere) "5070 TI ASUS TUF" getauscht wurde, hat diese aber anscheinend Stabilitätsprobleme im Idle.

Es äußer sicht dadurch, dass im Firefox beim Laden eines Videos (Youtube oder mp4) das komplette Bild für 5 Sekunden einfriert und danach das Bild schwarz wird (bzw. gar kein Signal mehr von der GPU kommt). Das Ganze ist auch recht zufällig. Zwei Tage lief alles ok und jetzt direkt beim Öffnen eines Videos ist es wieder passiert. Insgesamt bisher 5x aufgetreten in 7 Tagen. Zu dem Zeitpunkt hilft auch kein Treiberreset (via Win+Strg+Umschalt+B) und auch ein anderer DisplayPort-Anschluss liefert nichts.
Tendenz also eher Richtung: kalter Zustand, von Idle zu kurzer Last, ggf spinnt irgendein Energiesparkram.

Unter Last läuft alles ohne Probleme. Jegliche Tools wie Prime95/Furmark/OCCT/MemTest zeigen keine Auffälligkeiten.
Kein OC auf der GPU / kein MSI Afterburner o.Ä. läuft mit.
Passiert in Treiberversionen 572.83 und 576.02 (sauber mit DDU installiert).
Anderer DisplayPort-Anschluss ändert nichts am Verhalten.

In der Ereignisanzeige gibt es zu dem Zeitpunkt drei Einträge:
\Device\00000097
CMDre 00000003 00000200 00001000 00000005 0000002d
\Device\00000097
Resetting TDR occurred on GPUID:100
\Device\00000097
Reset TDR occurred on GPUID:100
1745342237328.png


Habe die GPU mal aus- und wieder eingebaut, aber hat auch nichts gebracht.
Als Workaround könnte man vermutlich den Energieverwaltungsmodus im Treiber auf "Maximale Leistung bevorzugen" stellen, aber eine Lösung ist das nicht.
Habe mir folgenden gesamten Thread (https://www.overclock.net/threads/massive-rtx-4090-problems-driver-or-hardware.1801381/) durchgelesen und mein Fazit lautet: wenn die GPU im Idle instabil ist, ist das Ding i.d.R. defekt.

Ich bin also wieder zu 90% dabei einen erneuten Widerruf zu tätigen und es dann mit der dritten 5070 TI zu versuchen, aber es ist echt lästig. Vermutlich wirds aber wieder eine 5070 TI TUF.

Vielleicht hat noch jemand eine brilliante Idee?

Specs: 9800x3d, 5070 TI ASUS TUF OC, 64gb 6000 CL30, 2TB 990 pro, ASUS b850-e gaming wifi (neuestes BIOS), asus pg279q 2560x1440 @144hz und G-Sync aktiv, win 11 pro (Schnellstart deaktiviert)

Wann ich die GPU eingebaut habe, seht ihr hier :heul: :
1745342405088.png


Gruß
Wo bin ich hier
 
Netzteil ist welches? An der CPU irgendwas optimiert? Die Probleme müssen nicht zwangsweise bei der GPU liegen.
 
  • Gefällt mir
Reaktionen: Sinatra81
Probier im Firefox mal die Hardwarebeschleunigung zu deaktivieren. Vielleicht gibt es hier im Zusammenspiel ein Problem.
 
  • Gefällt mir
Reaktionen: kachiri
Wo bin ich hier schrieb:
Passiert in Treiberversionen 572.83 und 576.02 (sauber mit DDU installiert).
Anderer DisplayPort-Anschluss ändert nichts am Verhalten.
hatte ich bei versch. Treiberversionen...bei mir geht die 572.85, die 576.02 und 576.15 bringen den Fehler.
Versuch mal 572.42...
Leider ne absilute Katastrophe was Nvidia da grad abliefert
 
  • Gefällt mir
Reaktionen: CMDCake
kachiri schrieb:
Netzteil ist welches?
NZXT C Series C850 Gold 850W ATX 3.1
kachiri schrieb:
An der CPU irgendwas optimiert?
Nein, BIOS Standardsettings.
Schatho schrieb:
Probier im Firefox mal die Hardwarebeschleunigung zu deaktivieren. Vielleicht gibt es hier im Zusammenspiel ein Problem.
Würde vermutlich funktionieren. Aber das ist wieder einer dieser Workarounds, der einen möglichen "Defekt" nur versteckt anstatt ihn zu beheben. Möchte gerne irgendwie die Gewissheit haben, dass die GPU hardwareseitig in Ordnung ist.
Azghul0815 schrieb:
Versuch mal 572.42...
Probiere ich mal.
Azghul0815 schrieb:
Leider ne absilute Katastrophe was Nvidia da grad abliefert
Ohja!
 
Diese Art Treiberprobleme der neuen 5000er Serie sind doch inzwischen bekannt. Theoretisch sollte der neueste Hotfix-Treiber das lösen, ansonsten soll tatsächlich die 572.42 noch mit am besten funktionieren.

Ich würde empfehlen den Treiber mit DDU zu entfernen um sicher zu gehen das wirklich entsprechende Reste weg sind. Bei dem was NV gerade macht ist das vermutlich keine schlechte Idee.
 
Anhand deiner obigen Screenshots knallt immer wieder der nvlddmkm.sys Fehler rein.

Ich hatte so etwas mal mit meiner alten 4070 ti und da lag der Fehler daran, dass diese nvlddmkm.sys 2x im System war und das System sich wohl nicht entscheiden konnte, welche nun die Richtige ist.
Einmal eine alte Version und einmal aktuell.
Durch probieren fand ich heraus, dass Windows-Update bei einer cleanen Neuinstall, nach DDU, einen älteren Treiber automatisch installierte, den aber das Nvidia Setup aus unerklärlichen Gründen nicht vollständig ersetzte. Hier betraf es die nvlddmkm.sys.

Also nochmal allesamt DDU runter gehauen, Internet gekappt, Neustart und aktuellen Treiber drauf. Danach Internet wieder aktiviert und nach einer Suche fand ich die nvlddmkm.sys nur noch einmal und der fehler-Spuk war vorbei.

Suche mal bei dir nach dieser Datei und wenn sie doppelt auf c liegt, einfach alles ich mal runter mit DDU und ohne internet den Treiber installieren.

Seither installiere in die GPU-Treiber immer ohne Internet und nutze zudem über das Setup "benutzerdefiniert" und dort " Neuinstallation" und hatte keine Probleme mehr. Auch nicht mit meiner aktuellen asus tuf 5070 ti oc.

PS man kann natürlich auch die Treiber-Inatall von Windows-Update deaktivieren aber das wollte ich wieder nicht.
 
Azghul0815 schrieb:
Versuch mal 572.42...
Mojo1987 schrieb:
soll tatsächlich die 572.42 noch
Die Version lässt er mich nicht installieren. Erst mit 572.47 kam der Support für 5070TI, welche ich nun installiert habe.
Mojo1987 schrieb:
Diese Art Treiberprobleme der neuen 5000er Serie sind doch inzwischen bekannt.
Ich bin da eigentlich informiert, aber diese Art der Probleme wie ich sie habe, habe ich noch nicht wirklich gesehen. Gamers Nexus sagt darüber auch nichts: youtube.com/watch?v=NTXoUsdSAnA

Und dieser Thread macht mich halt stutzig, ob die GPU nicht generell ein wenig instabil ist:
https://www.overclock.net/threads/massive-rtx-4090-problems-driver-or-hardware.1801381/
z.B.
1745346157629.png

1745346636511.png

inge70 schrieb:
Seither installiere in die GPU-Treiber immer ohne Internet und nutze zudem über das Setup "benutzerdefiniert" und dort " Neuinstallation" und hatte keine Probleme mehr.
Du hattest mir den Tipp bereits an anderer Stelle gegeben. Diesen habe ich befolgt (und befolge immer noch), aber hat leider nicht geholfen. Keine doppelten nvlddmkm.sys, DDU komplett offline.

---

Habe noch 1 Woche Zeit bis zum Widerruf. Ich werde noch ein paar Tage mit Version 572.47 beobachten wie es sich verhält. Aktuell bin ich wenig optimistisch. Zwei Wochen Widerrufsfrist ist auch ziemlicher Quark bei Problemen, die möglicherweise alle paar Tage mal auftauchen...
 
Zuletzt bearbeitet:
Wo bin ich hier schrieb:
Du hattest mir den Tipp bereits an anderer Stelle gegeben. Diesen habe ich befolgt (und befolge immer noch), aber hat leider nicht geholfen. Keine doppelten nvlddmkm.sys, DDU komplett offline.
Ah ok. Sorry für den Doppel-Tipp. ;)
 
Das Problem ist halt wirklich, dass das nicht zwingend an der Karte liegen muss. Ich hatte letztes Jahr eine ähnliche Symptomatik mit einer 4070 Super FE. Unter Last absolut keine Probleme. Im Idle Blackscreens und Abstürze. Mal regelmäßig, mal weniger regelmäßig. Ein Muster konnte ich nicht erkennen.
Am Ende war der Verursacher mein Mainboard (ROG Strix B550-I Gaming), welches mit den RTX 40er Karten aus welchen Gründen auch immer ein Problem hatte.. Dazu gibt es auch einige Threads im Netz. Die Lösung war damals, die Karte in den Hochleistungsmodus zu zwingen.
Oder halt das Mainboard zu wechseln. ASUS hat, wenn man noch innerhalb der Garantie war, die Boards getauscht. Anfänglich gegen das X570-I Gegenstück, später dann gegen eine gefixte B550-Variante)


Da die Vanguard lief, würde ich das hier jetzt vielleicht ausschließen. Oder eben auch nicht.
 
  • Gefällt mir
Reaktionen: Wo bin ich hier
kachiri schrieb:
dass das nicht zwingend an der Karte liegen muss
Ja, aber laut dem Thread schafft eine neue Karte i.d.R. Abhilfe. Ich kann das Problem nur halbwegs ausschließen, wenn ich sie austausche. Aber ja, es kann letztendlich auch am Mainboard liegen.
https://www.overclock.net/threads/massive-rtx-4090-problems-driver-or-hardware.1801381/
kachiri schrieb:
Da die Vanguard lief, würde ich das hier jetzt vielleicht ausschließen
Ja, die lief fast 3 Wochen ohne solche Probleme. Zur Not kaufe ich mir die wieder und hoffe auf anständige Lüfter...
 
Wo bin ich hier schrieb:
@inge70 bist du eigentlich auch primär mit dem Firefox unterwegs? Win 11?
Ja :)
Firefox (aktuelle Version)
Windows 11 24H2 (26100.3775)
 
Ich lese gerade das Changelog vom neuen Hotfix-Treiber.
Der folgende Punkt könnte in meine Richtung gehen, aber nicht sicher. Wie versteht ihr den folgenden Punkt? Kann man zu dem Punkt irgendwie mehr Details einsehen?

[RTX 50 series] Lower idle GPU clock speeds after updating to GRD 576.02 [5232414]

Für mich klingt es so als wären die Idle Clock Speed zu niedrig bei v576.02 und das wurde jetzt gefixt.
ODER eben, dass die Idle Clock Speeds jetzt verringert wurden, weil sie vorher zu hoch waren?!

Ich bleib vorerst noch beim 572.47. Wenn das Problem wieder auftritt, dann probiere ich mal den neuen Hotfix.
 
Seit Installation von v572.47 absolut stabil bei mir (bei ~6h Nutzungszeit pro Tag und vorrangiger Browsernutzung zum triggern des Problems). Damit schließe ich einen Hardwaredefekt aus und behalte nun (für mich) überraschenderweise doch die GPU. Wenn es wirklich einen Defekt gibt, gibt es ja immer noch die Gewährleistung.

Ich hätte niemals gedacht, dass hier der Treiber doch noch am Ende schuld sein könnte. Einen neuen Treiber werde ich erst wieder anfassen, wenn Nvidia ihren Mist auf die Reihe bekommen hat.

1745760424156.png
 
Ich habe in den letzten 24 Stunden sage und schreibe 48 Tausend Fehler in der Windows Ereignisanzeige bezüglich nvlddmkm.
48777 um genau zu sein.
Alle lautet:
Die Beschreibung für die Ereignis-ID "14" aus der Quelle "nvlddmkm" wurde nicht gefunden. Entweder ist die Komponente, die dieses Ereignis auslöst, nicht auf dem lokalen Computer installiert, oder die Installation ist beschädigt. Sie können die Komponente auf dem lokalen Computer installieren oder reparieren.

Der Windows Kreis hatte sich entweder beim Herunterfahren oder beim Neustarten endlos gedreht bis ich einfach den Netztstecker gezogen habe.

48 Tausend Mal innerhalb von 24 Stunden.

Habe eine 5060 Ti mit 16GB Vram, aber Nvidia hat die Karte gar nicht bei ihren Treibern gelistet.Habe dann den von der Nvidia 5070 Ti ausgewählt.
Studio Treiber Version 576.02

Da ich die Karte per EGPU über Oculink betreibe habe ich Angst das es mir mein ganzes System kaputt macht wenn es 48 Tausend Mal einen Fehlerbericht in die Ereignisanzeige hinein schreibt.
Hätte ich den Netztstecker nicht gezogen wären da wohl schon eine Million Einträge drinn.

Weiß jemand Rat ?
 
Olandos schrieb:
Weiß jemand Rat ?
1. Am besten einen eigenen Thread erstellen, da dein Problem nichts mit dem Thema hier zu tun hat.
2. Game Ready Driver probieren und sauber mit DDU installieren. Schnellstart deaktivieren. Kein Energiesparmodus in Windows verwenden. Sonstige unnötige Software wegschmeißen bzw Autostart aufräumen. PCIe Version heruntersetzen.
3. Selbst wenn da eine Milliarde Einträge drin sind, wird es dein System nicht kaputt machen. Es sind einfach nur Daten, die auf die Festplatte geschrieben werden. Problem ist eher, dass es bei dir nicht aufhört (es scheint aus irgendeinem Grund in einer Endlosschleife zu stecken).
 
  • Gefällt mir
Reaktionen: Azghul0815
Ich habe den Studio Treiber genommen weil ich die eigentlich nur für Ki gekauft habe.
Daher auch als EGPU über Oculink.
Will ich also immer nur anstecken wenn ich Ki betreibe und sonst muss die nicht die ganze Zeit angeklemmt sein und unnötig Strom verbrauchen.
Merkwürdig ist das Nvidia die Karte nicht einmal bei der Treibersuche gelistet hat.
Habe durch den Netzstecker ziehen natürlich auch kritische Fehler nun im System.
 
Wo bin ich hier schrieb:
Seit Installation von v572.47 absolut stabil bei mir
Tja, nach nun 3 Wochen ist es soeben wieder passiert (beim Laden eines Videos im Firefox aufgehangen; wieder eher kalter Zustand):
1746952803930.png


1746952818969.png


Ich lass mal Firefox vorerst auf der iGPU laufen.
1746952879369.png


Bald Upgrade ich von meinem ASUS PG279Q auf ein LG C4 42". Vielleicht bringt das genug "Grundlast" auf die GPU, damit sie keine Faxen mehr macht. Seltsam ist aber, dass es mit dem älteren Treiber so viel seltener passiert - also scheint zum großen Teil treiberabhängig sein?
Wenn das Problem in den kommenden Monaten bestehen bleibt (mit hoffentlich allgemein stabileren Nvidia Treibern), dann mach ich von der Gewährleistung gebrauch.

Für das Mainboard gibts auch ein neues BIOS (v1028). Wenn ich die kommenden Wochen nichts Negatives darüber lese, dann installiere ich das auch mal:
https://rog.asus.com/de/motherboards/rog-strix/rog-strix-b850-e-gaming-wifi/helpdesk_bios/

Edit: ich habe nun in Firefox die Hardwarebeschleunigung deaktiviert, da die iGPU langsamer als die CPU ist...
 
Zuletzt bearbeitet:
Zurück
Oben