NVIDIA 4080 Super in neuem System - nvlddmkm Fehler und Hänger im idle

Bladerider73

Cadet 3rd Year
Registriert
Okt. 2009
Beiträge
55
1. Nenne uns bitte deine aktuelle Hardware:
  • Prozessor (CPU): Ryzen 7 7800X3D
  • Arbeitsspeicher (RAM): 32GB (2x 16GB) G.Skill Flare EXPO X5 schwarz DDR5-6000 DIMM
  • Mainboard: MSI Tomahawk WIFI AMD B650 So.AM5 DDR5 ATX Retail
  • Netzteil: 850 Watt be quiet! Straight Power 12 Modular 80+ Platinum
  • Gehäuse: be quiet! SHADOW BASE 800 DX
  • Grafikkarte: 16GB MSI GeForce RTX 4080 SUPER Ventus 3X OC Aktiv PCIe 4.0 x16
  • HDD / SSD: 2TB Lexar NM790 M.2 2280 PCIe 4.0 x4 3D-NAND TLC
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat(Monitormodell, Kühlung usw.): Samsung LU28E590DS/EN
  • Wird ein sog. "PCIe Riserkabel" genutzt? Nein

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Im Desktop-Betrieb (Browser, Outlook, YouTube Video) hängt das System ab und zu, der Bildschirm zeigt entweder merkwürde Farben an oder wird ein paar Sekunden schwarz, bevor dann die Lüfter der GraKa aufheulen und es geht weiter. Im Ereignisprotokoll habe ich dann einige nvlddmkm Fehler. Unter Last in Spielen keine Probleme!
Das komplette System (Win 11, Updates aktuell) ist erst etwas über eine Woche alt.
Es ist ohne GraKa aufgesetzt worden, dann ist erst meine Asus 1070 eingbaut worden und ich hatte null Probleme.
Freitag kam dann mein 4080 Super, am Freitag auch null Probleme. Samstag eingeschaltet, auf dem Desktop gearbeitet und dann begannen die Fehler.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
  • Kabel und GraKa überprüft und neu gesteckt
  • Treiber mit DDU deinstalliert und verschiedene Versionen getestet (nur Treiber) 551.31, 551.52, 551.61
  • in der NVIDIA Systemsteuerung unter 3D-Einstellungen verwalten -> Energieverwaltungsmodus auf "maximale Leistung bevorzugen" gestellt. (siehe Screenshot)
    • dann sind die Probleme verschwunden!
    • ich würde natürlich gerne das Energie sparen nutzen (derzeit läuft die GPU permanent auf max. Takt
    • ich würde gerne bei der teuren Hardware auschließen das etwas defekt ist
    • google / Forum habe ich ausschweifend befragt, daher hatte ich auch den Tipp mit dem Energiesparmodus


P.S.: Beachte auch die verschiedenen angepinnten Themen und die Forensuche. Möglicherweise findest du da bereits die Lösung zu deinem Problem.
 

Anhänge

  • 2024-03-04 09_55_24-NVIDIA Systemsteuerung.jpg
    2024-03-04 09_55_24-NVIDIA Systemsteuerung.jpg
    157,8 KB · Aufrufe: 264
Bladerider73 schrieb:
Es ist ohne GraKa aufgesetzt worden, dann ist erst meine Asus 1070 eingbaut worden und ich hatte null Probleme.
Freitag kam dann mein 4080 Super, am Freitag auch null Probleme. Samstag eingeschaltet, auf dem Desktop gearbeitet und dann begannen die Fehler.
Das könnte die Probleme verursachen. Ich würde Windows nochmal frisch mit der neuen Grafikkarte installieren.
 
ein ähnliches Problem mit "nvlddmkm" hatte ich auch mal.

Dabei fand ich heraus, dass die "nvlddmkm.sys" 2x im System vorhanden war.

Einmal durch meine treiberinstall und einmal durch Windows-Update.
Windows-Update hat mir ständig eine Version 528,24 installiert, obwohl ich aber selbst einen aktuelleren installiert hatte.
Warum das passierte, ist mir bis heute unverständlich.

Ich installiere nunmehr die Nvidia Treiber als Admin (Rechtsklick auf die .exe und als Administrator ausführen" gewählt) und benutzerdefiniert (hier wähle ich Neuinstallation aus) und seither kam der Fehler "nvlddmkm" nicht mehr.
Installiere ich den Nvidia-Treiber auf "normalem" Wege, haut mir Windows-Update während dessen noch den genannten alten Treiber mit rein. Echt nervig sowas. Neuinstall von Windows brachte dabei nie Besserung. Nur die Install als Admin (wobei ich Admin bin).

Prüfe also im Explorer mal über die Suche nach "nvlddmkm" ob die .sys mehrmals vorhanden ist. Falls ja, lösche die ältere davon und teste erneut.
 
  • Gefällt mir
Reaktionen: Bladerider73 und Winston90
Das Problem wie von @inge70 beschrieben hatte ich zwar noch nie, könnte aber auch möglich sein, bitte prüfen.
Falls das nichts bringt würde ich jedenfalls Bios Update durchführen (falls nicht aktuell) und danach unbedingt Factory Reset und dann Expo/rBAR wieder aktivieren!
Auch die Chipset Treiber prüfen ob die aktuell sind.
 
inge70 schrieb:
Prüfe also im Explorer mal über die Suche nach "nvlddmkm" ob die .sys mehrmals vorhanden ist. Falls ja, lösche die ältere davon und teste erneut.
Davon habe ich nur eine.
Ergänzung ()

PeacemakerAT schrieb:
würde ich jedenfalls Bios Update durchführen (falls nicht aktuell) und danach unbedingt Factory Reset und dann Expo/rBAR wieder aktivieren!
Auch die Chipset Treiber prüfen ob die aktuell sind.
BIOS-Update hatte ich noch vor OS-Installation durchgeführt. Chipset-Treiber (und alle anderen) sind auch die neuesten.
 
Und auch hier wieder: Auch bei einem Herstellerinternen Wechsel würde ich persönlich immer vor dem Wechsel den Treiber deinstallieren und nachdem Wechsel neu installieren. Der Aufwand ist derart gering und es hat ja auch seinen Grund, warum der Installationsassistent die verbaute Hardware prüft.

Ist natürlich nicht auszuschließen, dass die Probleme woanders liegen. Zum Beispiel, dass die Grafikkarte einfach einen weg hat.

Nutzt du das 12VHPWR-Kabel vom Netzteil oder den Adapter?
 
  • Gefällt mir
Reaktionen: NerdmitHerz, DannyA4 und Bladerider73
NameHere schrieb:
Ich würde Windows nochmal frisch mit der neuen Grafikkarte installieren.
Das würde ich als allerletzte Option ziehen wollen. Habe die letzten Tage damit verbracht alles frisch und neu aufzusetzen. Da sind viele Stunden Arbeit reingeflossen...
 
  • Gefällt mir
Reaktionen: frames p. joule
Würde 2 Dinge probieren:

1. Testweise mal im UEFI auf die PCIe Gen3 runterschalten
2. die alte 1070 nochmal einbauen

Ich würde mal nicht ausschließen, dass die Graka defekt ist. Die meisten Defekte treten direkt am Anfang oder erst wieder nach einer längeren Nutzungszeit auf.
Ergänzung ()

Bladerider73 schrieb:
Das würde ich als allerletzte Option ziehen wollen. Habe die letzten Tage damit verbracht alles frisch und neu aufzusetzen. Da sind viele Stunden Arbeit reingeflossen...
Für sowas immer alte SSDs aufheben. Aber wenn du eh schon ein recht frisches Windows hast, wird es daran kaum liegen.
 
  • Gefällt mir
Reaktionen: Bladerider73
kachiri schrieb:
Nutzt du das 12VHPWR-Kabel vom Netzteil oder den Adapter?
12VHPWR-Kabel vom Netzteil.
Netzteil sollte ja keine Rolle spielen, da es mehr als ausreichend sein sollte und unter Last gibt es null Probleme.
(lasse mich aber immer gerne vom gegenteil überzeugen - ist nur meine Einschätzung)
Hab ja im Eingangspost beschrieben, dass ich die Treiber immer mit DDU (im abgesicherten Modus) entfernt habe und dann die neuen installiert.
 
Bladerider73 schrieb:
Das würde ich als allerletzte Option ziehen wollen. Habe die letzten Tage damit verbracht alles frisch und neu aufzusetzen. Da sind viele Stunden Arbeit reingeflossen...
Man kann ich auch einfach mal in inplace Upgrade zur "Reparatur" drüberbügeln. Dauert vielleicht 45 min und vielleicht ist der Fehler weg.
Besser alles alles neu und einen Versuch wert.
 
Läuft die Karte Stock oder hast du "rumgefuchtelt". UV, OC, .... oder ähnliches? Gibt es ein Muster bei den Abstürzen?

Sind halt augenscheinlich Treiberabstürze, die entweder durch die Software, die gerade verwendet wird, getriggert wird oder halt durch instabile Settings, soweit vorgenommen.
Ein Ansatz könnte sein, die GPU-Hardwarebeschleunigung des Browser mal zu deaktivieren. Wobei ich das Problem eher von AMD-Karten kenne, die zeitweise Probleme damit hatten.
 
  • Gefällt mir
Reaktionen: Bladerider73
qiller schrieb:
Für sowas immer alte SSDs aufheben. Aber wenn du eh schon ein recht frisches Windows hast, wird es daran kaum liegen.
Hab ja noch meinen alten PC, aber natürlich inzwischen alles rübergezogen, auch lizenztechnisch.
Hab ja den neuen PC komplett neu aufgebaut und nach bestem Wissen neu aufgesetzt, inkl. BIOS, Treiber, etc.
Ergänzung ()

kachiri schrieb:
Läuft die Karte Stock oder hast du "rumgefuchtelt". UV, OC, .... oder ähnliches? Gibt es ein Muster bei den Abstürzen?
Alles Stock, nur den RAM mit AMD Expo auf 6000, aber auch schon einige Speichertests ohne Fehler laufen lassen...

Muster: So lange auf dem Desktop werkeln, bis offensichtlich die GraKa ausm idle erwacht (meine Vermutung).
 
RAM das ist oft das problem bei amd Systemen da expo sowie xmp nie garantiert sind zumal der r7 7800x3d gar nicht davon profitiert. Prüfen lässt sich das per jedec norm starten (ddr5 4800)
Das es keine Probleme mit ner gtx1070 gab könnte an der Auslastung liegen
Dazu eines directx funktioniert so das die Daten von der HDD SSd in den ram geladen werden das ist in der Regel ein frame mit zusätzlichen daten diese werden in die gpu kopiert das maximum was die rtx4080 hat sind 16gb wenn ein dram defekt ist bzw die timings nicht stimmen gibt es Fehler und es kommt zu nen Treiberabsturz
Da aber ecc ram verwendet wird fällt das erst spät auf.
Prüfen kann man das mit memtest86 v10 per usb stick je ram einzeln testen da muss pass stehen bei expo sowie xmp Profil
Agesa updates verbessern die ram Kompatibilität der letzte Fehler quelle wäre eine defekte gpu.
Das zeigt sich aber in pixelfehler (einzelne pixel da wo diese nicht sein sollen) bis Bildfehler (streifen im Bild Aussetzende Texturen)
Ein zu knappes Netzteil kann auch ein Grund sein da diese die Lastspitzen nicht halten kann (ripple zu stark) ist aber bei dem Fehlerbild unwahrscheinlich.
 
  • Gefällt mir
Reaktionen: Bladerider73
Bladerider73 schrieb:
BIOS-Update hatte ich noch vor OS-Installation durchgeführt.
Und auch brav den Factory Reset gemacht?
 
  • Gefällt mir
Reaktionen: Bladerider73
Öhm, nein. Ist das notwendig? War ja gerade aus der Verpackung und dann neues BIOS geladen.
 
bei ram ist immer ein wenig Glück dabei abhilfe zeigt sich bei der qvl liste beim mainbaord Hersteller oder gerpfüt von gskill ram auf deren webseite mit der cpu und mainboard kombi. Andere ram hersteller bieten das nicht an.
jedec läuft immer das aber ist offiziell ddr5 4166 bis ddr5 5200 mehr wurde bisher nicht spezifiziert
Ein neues uefi muss load defaults geladen werden. Das ist je nach mainboard anders gelöst
 
Hatte diese Probleme mit der 4090 auch.
Bei bestimmten Spielen allerdings nur, die nichtmal viel Last angelegt haben, konkret Need for Speed Heat (was eigentlich nur der Kurze spielt :D )

Bin dann auf den Treiber 537 zurück und habe mein RAM OC zurück genommen.
Seitdem ist Ruhe. Glaube ich :)

Zudem scheint HDR bei einigen Spielen Probleme zu machen.

Ein guter Indikator für ein stabiles System ist der Timespy / Timespy Extreme. Der ist sensibel.
Bei Spielen: Need for Speed, Cyberpunk, RDR2 oder Witcher 3
 
Also wenn hier noch nicht ohne geladenes EXPO Profil getestet wurde, sollte das auf jeden Fall nachgeholt werden. Dachte das ist mittlerweile Standard bei einer Fehleranalyse^^.
 
Zurück
Oben