Spielabstürzte und Grafiktreiber Fehlermeldung (RTX 2080)

LpSoulJah

Cadet 2nd Year
Registriert
Nov. 2020
Beiträge
17
Hallo Zusamman

seit ein paar Tagen stürzten bei mir alle Games nach ein paar Minuten Spielzeit ab. Im Eventlog wird mir nur folgende Warnung angezeigt:

Der Anzeigetreiber "nvlddmkm" reagiert nicht mehr und wurde wiederhergestellt.

Mehr Details unten

1. aktuelle Hardware:

  • Prozessor (CPU): i9-9900k (Nur Standard Turbo auf 5GHz aktiviert)
  • Arbeitsspeicher (RAM): 2x16 GB DDR4-3200 G.Skill RipJaws V
  • Mainboard: ASUS ROG Strix Z390-I Gaming (neustes BIOS update)
  • Netzteil: be quiet! Straight Power 11 750W
  • Gehäuse: Custome
  • Grafikkarte: MSI RTX 2080 Gaming X Trio (mit EK-Waterblock und Riser-Kabel angebunden, nur Werkseitiges OC aktiv)
  • HDD / SSD: Samsung M.2 SSD 970 PRO 1TB
  • Monitor: Acer Predator X34P (mit G-Sync)
  • Kühlung: Custome Waterloop (560 Radiator, EK-DDC Pump - GPU und CPU mittels EK-Waterblöcken)
  • Betriebssystem: Windows 10 Pro 20H2 (Build 19042.685)

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden(zusätzliche Bilder könnten z.b. hilfreich sein):

Der Fehler hat von jetzt auf nachher angefangen, ohne wirklichen Änderungen am System. Das einzige was ich beobachten konnte ist das Windows den "Intel Grafik Kontrollraum" installiert hatte.

Der selbe Fehler ist vor ca. 1 Jahr bereits schon einmal aufgetreten und hat sich nach einiger Zeit von alleine gelöst (mit der Zeit müssen die neueren Treiber von Nvidia und Windows vermutlich geholfen haben)

Mittels reduzierten "Power Limit" im MSI Afterburner stürzt der Treiber nur noch selten ab


3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
  • Alle Treiber aktualisiert
  • Bios Update überprüft (bereits aktuell)
  • Grafiktreiber mittel DDU mehrfach deinstalliert und die letzten 3 Versionen geprüft
  • Überprüft ob PCI Express dauerhaft aktiv ist (Power Options Windows 10)
  • RAM Test via Windows 10 (alles OK)
  • "Time before it Resets" in der Registry des Treibers erhöht (TdrDelay = 20 - per DWORD(64-bit))
  • "Intel Grafik Kontrollraum deinstalliert"
  • Im Bios so gut es geht die Intel GPU deaktiviert
  • G-Sync deaktiviert
  • Alle Overlayer Programme wie Discrod, Windows X-Box, etc. deaktiviert
Damals hat mir geholfen das Powerlimit Im Afterburner zu reduzieren, was diesmal auch funktioniert, allerdings diesmal deutlich drastischer und mit dem neuen Nvidia Treiber sogar noch einmal tiefer (derzeit auf 73%)

Folgende Ursachen könnte ich mir auf die Schnelle vorstellen, weiss allerdings nicht wie ich es am besten abklären kann:
  • Spannungswandler, RAM, etc. auf der Grafikkarte werden zu heiss (es ist ein EK-Waterblock drauf)
    Dagegen spricht, dass der Kühlkörper so bereits seit mehreren Monaten drauf ist und es nicht Probleme gab.
    Die GPU kommt unter vollast selbst mit leisen Lüftersetting gerade einmal auf 70°
  • Netzteil Defekt, liefert zu wenig Strom
    Auch hier wieder, es wurde nichts verändert und die 750 Watt sind mehr als ausreichend für das Setting
  • Treiberprobleme: irgendetwas stimmt mit den aktuellen Treiber nicht, ein Zusammenspiel zwischen Windows, Nvidia und Bios

Freue mich über jede Hilfe, Danke


Update: neue Schritte welche ich unternommen habe ergänzt
 
Zuletzt bearbeitet:
Meine erste Vermutung war als ich es las , das Risee-Kabel. Kannst du es irgendwo auch ohne testen ?
 
Das Problem hatte ich Ende November und hab das Riser-Kabel nun durch ein sehr teures aber extrem robustes Kabel von Themaltake ersetzt

Ich bekomme am WE ein Ersatzkabel und probiere es.
 
Zuletzt bearbeitet:
Eben das neue Riser Kabel probiert ...leider genau das gleiche Verhalten 😩

Hat jemand eine Idee woran es liegen könnte?
 
Hat keiner eine Idee 😶

Leider vermehren sich die Abstürze immer weiter.
Heute habe ich noch etwas mit dem Afterburner rumgespielt um sie etwas stabiler zu bekommen und ggf. herauszufinden woran es liegen könnten.

Ich kann das Verhalten nicht deuten.

Am stabilsten läuft sie (stürzt aber immer noch nach ca. 20 min ab) wenn ich das PowerLimit reduziere. Zunächst lief sie gut auf 80 %, dann eine Woche später musste ich auf 70% runter gehen und heute musste ich auf das minimum 50 % runter um überhaupt noch spielen zu können.

Wenn ich anstelle des PowerLimits die Taktrate reduziere scheint mir das Verhalten purer Zufall. bei -300 Mhz läuft sie stabil, ich taste mich nach oben -200, -150 und bei -125 crashed sie wieder. Wenn ich dann zurück auf -200 gehe, crashed wieder und bei -300 dann plötzlich auch.

Der Speichertakt verändert garnichts.

Wenn ich das PowerLimit mittlerweile über 85% stürzt der ganze Rechner mit folgenden Fehlermeldungen ab:

"Der Dienst "cplspcon" wurde mit folgendem Fehler beendet:
Unbekannter Fehler"

Kritisch, Ereignis 41 Kernel-Power
"Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde"


Was meint ihr? Kann ich sicher sein, das es ein HW Defekt ist?
 
Zuletzt bearbeitet:
Ich habe ähnliche Fehler und ein seltsames Verhalten des PCs seit zwei Monaten oder so.

9700K auf MSI Gaming Pro Carbon Z390 mit MSI Gaming Z 2070 und 2x 8192MB Corsair Vengeance RGB PRO 3200 CL16. Also ziemlich ähnlich alles.

Ist bei dir auch die Bootzeit des Systems auf einmal doppelt so lang, oder bootet er sogar zweimal hintereinander oder ist das Aufwachen aus dem Standby auch so lahm geworden?

Das spricht bei mir ganz klar gegen ein Afterburner Problem, obwohl ich die gleichen Ergeignisse wie du bekomme ( cplspcon, Ererignis 41, grafiktreiber ageschmiert)

Ich hab nen Ram drin, der laut QVL voll kompatibel ist, der läuft im XMP Profil mit dem er verkauft wurde.
Der Prozessor ist leicht übertaktet, BIOS ist ziemlich frisch. Alle diese Einstellungen wurden aber nicht angefasst bevor das System angefangen hat sich so komisch zu verhalten, deshalb bin ich noch nicht zurück auf Stock, das werde ich jetzt aber am WE mal austesten.

Aber Grafikkarte ist glaube ich nur eine Folgefehler, mit aktuellen Treibern ist die Situation aber noch schlimmer. ich bin zurück auf den 457.51 und da geht es einigermaßen.

Jetzt gerade eben hab ich zum ersten ma den cplspcon mitten im Windows bekommen, Bluescreen und weg war er.

Ich tendiere Richtung RAM, CPU oder Mainboard, so einfach kann man da ja leider nichts diagnostizieren.
Ich meine mal irgendwo zum Ererignis 41 gelesen zu haben, dass hier unter umständen ein Chipsatztreiber Probleme machen kann wenn der nicht sauber installiert wurde. Finde die Seite aber grad nicht mehr.
 
cottec schrieb:
Ist bei dir auch die Bootzeit des Systems auf einmal doppelt so lang, oder bootet er sogar zweimal hintereinander oder ist das Aufwachen aus dem Standby auch so lahm geworden?
Bei mir sind die Bootzeiten eigentlich normal, habe den Fehler gerade herausgefunden. Es ist/war die Kühlung. habe einen EK Waterblock auf der Karte. Scheinbar kühlt er nicht richtig, die GPU Werte sind zwar mehr als super aber ich vermute die Spannungswandler und der Speicher haben ein Hitze Problem

Hat jemand eine Ahnung was genau der Fehler am Waterblock sein kann?


cottec schrieb:
Ich meine mal irgendwo zum Ererignis 41 gelesen zu haben, dass hier unter umständen ein Chipsatztreiber Probleme machen kann wenn der nicht sauber installiert wurde. Finde die Seite aber grad nicht mehr.

So etwas ähnliches habe ich auch gelesen und den Rechner damals komplett neu aufgesetzt und dabei natürlich auch den aktuellsten Chipsatz verwendet. Da es bei mir an einer anderen Ursache lag, ist das wenig repräsentativ.
 
wärmeleitpaste auf alles drauf (auch auf die pads) und den abdruck prüfen, anders wirst du es nicht herauskriegen
 
Habs nicht ganz rauslesen können. Habt ihr nur mit einem neuen Riser-Kabel probiert oder auch mal ganz ohne Riser-Kabel?

Bei mir lag es tatsächlich am Riser-Kabel (alte GPU) egal welches ich nutze. Ich weiß schwer mit einer WaKü aber, versuch mach Kluch :)
 
installier dir mal "WhoCrashed" ich hab da z.b. nen alten NVME treiber gefunden an dem es liegen könnte.
 
Also ein Bekannter hat anscheindend ein ähnliches Problem mit seiner 2060 Super und erst war es sporadisch und mittlerweile stürzt sein System entweder komplett ab oder es ging teils mit Windows Fehlermeldung bzgl. Grafiktreiber raus (er berichtete auch, das seine Grafikkarte kurzzeitig im Hardwaremanager weg war und wieder installiert wurde). Jegliches 3D Anwendung führt mittlerweile sofort zum Crash.

Da ich Anfang Januar auch nach Grakas geschaut hab, ist mir ein Ebay Kleinanzeigen-Nutzer in Erinnerung geblieben, der eine neue/neuwertige defekte RTx 20xx verkaufen wollte, weil er auch bei jeder 3D Anwendung crashes hatte.
Jetzt habe ich vorhin noch einen Nutzer gefunden der jegliche 2060er Modelle im defekten Zustand sucht.. ich schrieb ihn an und bekam folgende Antwort:

"die 2060er sind nicht speziell anfällig für Defekte. Lediglich die ersten 2060er, 2070er und 2080er hatten bestimmten Micron-Speicher verbaut, der einen Produktionsfehler hatte, der erst nach paar Jahren auftritt. Dabei stirbt meist ein Speicherchip und der müsste ersetzt werden. Wenn man da einen neuen Speicher auflötet, funktionieren die Karten trotzdem nicht, da der alte Speicher aus einer schlechten Charge kommt. Da bleibt nur die Option den gesamten Speicher zu ersetzten. Bei einer 2060 sind es dann eben nur 6 Chips = 70€. Bei 2070ern sind es logischerweise 8. Ich such einfach nach 2060ern, da der potentielle Verlust geringer ist. Auch die Super-Karten können mal einen defekten Speicher aufweisen, auch wenn der von Samsung ist. Ist seltener, aber passiert auch"

Eine interessante Äußerung. Und wenn man sich den Grafikkartenmarkt anschaut, wird er immer schlimmer... alles 300% teurer, wenn überhaupt noch lieferbar. Preise gehen weiter steil, auch für ältere Modelle.
 
Zuletzt bearbeitet:
Zurück
Oben