Blackscreen mit RTX5090 schon bei geringer Leistung; PCIe Lane Errors

Sodian

Cadet 1st Year
Registriert
Jan. 2026
Beiträge
9
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): 9800X3D
  • Arbeitsspeicher (RAM): CORSAIR Vengeance DDR5 64GB (2x32GB)
  • Mainboard: ASRock B850 Steel Legend WiFi
  • Netzteil: Corsair RMx SHIFT Series RM1200x 1200W ATX 3.1
  • Gehäuse: Fractal Design Define 7 Black Solid
  • Grafikkarte: GIGABYTE GeForce RTX 5090 GAMING OC 32G
  • HDD / SSD: Samsung SSD 9100 PRO 4TB; Samsung SSD 990 PRO 4TB
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat (Monitormodell, Kühlung usw.): Samsung G9 und andere optional
  • Wird ein sog. "PCIe Riserkabel" genutzt? nein
  • Kein OC

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
PC ist ein Eigenbau, dualboot Winn11 und fedora. Läuft seit etwa 6 Monaten keine Graphic Probleme bisher.
Seit einigen Tagen Blackscreen für ca 1 sec. kurz nach Start in Windows manchmal auch zweimal oder gar nicht. Nach Start eines nicht leistungshungrigen Spiels (z.B. wer's kennt offline Challenge von https://www.esports.happytec.at/) Blackscreen Ton läuft noch einige Zeit. dann automatischer reboot. Ich habe dann einen zweiten Monitor auf die onboard Graphic angeschlossen. Darauf HWInfo laufen gelassen. Ich bekomme bald nach Windows start folgendes in HWInfo:

Reciever Error steigt unregelmäßig nach 2 min ca.8000 4 min 30800
RecoverCount etwa gleich 8000
PCIe Lane o - 15 Errors 255 Durchschnitt 237
sonst keine Unregelmäßigkeiten auch bei den Spannungen nicht.

Nach dem oben beschriebenen Blackscreen am "Nvidia Monitor" bei geringer Last friert das Bild am "MB-Monitor" die eingefrorenen Zahlen zeigen weiter nichts auffälliges außer den oben genannten Fehler Counter. Nach vielleicht 1 min. Screen kurz auch hier black dann die Anzeige Video_TDR_Failure (0x116). Danach automatischer reboot. Manchmal auch nicht erfogreich. Und ein Reboot über den "reset Knopf" am Gehäuse ist erforderlich.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Deinstallation des Nvidia Treibers während boot auf onboard Graphic ohne Monitor an der RTX und Neuinstallation des aktuellen Treibers ( 591.74 ) Windows und linux / Fedora aktuell.

GraphicKarte vom Mainboard getrennt Kontakte optich kontrolliert und wieder eingesteckt, Stromstecker optisch geprüft, keine Auffälligkeiten. Fehlerbild hat sich dadurch nicht verändert.


Ich vermute ein HW - Problem. Wie kann ich erkennen, wo das Problem liegt ( GraphicKarte oder Mainboard, ev. auch Netzteil )


P.S.: Beachte auch die verschiedenen angepinnten Themen und die Forensuche. Möglicherweise findest du da bereits die Lösung zu deinem Problem.
 
Zuletzt bearbeitet:
Soweit ich weiß sind die betroffenen CPUs sind nicht langsam sondern sehr plötzlich gestorben. Aber es ist absolut sinnvoll, die GPU in einem anderen System zu testen.
 
  • Gefällt mir
Reaktionen: maggotno999 und Sodian
Firmware der NVMes ist aktuell? Mainboard-Bios ist auch aktuell? Vielleicht mal die PCIeGen im Bios fest auf 4 einstellen und testen.
 
  • Gefällt mir
Reaktionen: Sodian
Danke für die Tips! Ich werd mal testen und dann berichten. Ein anderes System steht mir leider nicht zur Verfügung. Und der zweite PCIe Steckplatz liegt bei diesem Board ganz unten, da passt die 3 Slot tiefe Karte nicht hinein. NVMes sollten aktuell sein. Das prüfe ich nochmal. Dann werde ich auf Gen4 stellen. Das Bios ist nicht aktuell. Ich vermeide das update immer solange nichts dazu nötigt. Aber vielleicht ist's das ja jetzt.
 
Riserkabel ist nicht verbaut, hab auch keines zum testen am anderen PCIe Steckplatz. Die Fehlerquelle gibt's wenigstens nicht. Die nächsten Schritte sind jetzt FW der SSD's checken und updaten falss nötig. Dann mit GEn 4 testen. Dann bios updaten udn hoffen das dann der Fehler weg ist.

HW Kauf ist noch ein paar Schritte entfernt. Die HW ist ja grad mal 6,5 Monate alt. Da wär ja noch Garantie drauf.
Noch eine Frage damit ich's richtig verstehe:
Mit Firmware der NVMe's ist ja wohl die FW der SSD's gemeint, oder gibt's da noch was, das ich nicht kenne?
 
@Sodian My bad, im Thread durcheinander gekommen auf dem Handy. Oben ignoieren
Ergänzung ()

Sodian schrieb:
Und der zweite PCIe Steckplatz liegt bei diesem Board ganz unten, da passt die 3 Slot tiefe Karte nicht hinein.
Doch, wenn du das Mainboard ausbaust. Anders geht es halt nicht
 
  • Gefällt mir
Reaktionen: Sodian
Ja hast natürlich recht. MB ausbauen und frei liegend geht das natürlich.

Ich find die Einstellung zum downgraden auf Gen4 im Bios nicht. Bios ist auf Vers. 3.20. (aktuell wäre 4.03).
Dann wär der nächste Schritt doch BIOS Upgrade.
 
Danke! PBS war das Stichwort für mich. Ist halt sehr tief verschachtelt gestaltet. Aber jetzt gefunden. Ich teste gleich mit Gen4.
Ergänzung ()

Mit Gen4: Blackscreen hab ich mit dem oben erwähnten "low GPU load" Spiel jetzt keinen bekommen.
HWInfo zählt aber die gleichen Fehler wie oben, jedoch langsamer, gefühlt mit halber Geschwindigkeit. Jetzt zeigen sich auch Unterschiede bei den PCIe Lanes, 4 ist deutlich besser als die anderen. Kann ich daraus etwas schliessen? Vielleicht doch ein Kontaktproblem? Die Karte ist jetzt insgesamt genau zweimal eingesteckt. Abnutzung kanns nicht sein. Optisch wie schon geschrieben, nichts auffälliges.
Hast Du Vorschläge für den nächsten Schritt?
 
Zuletzt bearbeitet:
Die Errors sagen nur, dass sich der Bus neu konfiguriert hat (Also sein Speed geändert wurde).
Nicht WARUM.
Es ist ganz normal, dass da Errors erscheinen, z.b. wenn Du Surfst und die GPU ihren Lastzustand von Idle in Lower 3D oder 3D ändert und wieder zurück. Das produziert jedes mal einen der Errors, die Du siehst, ist aber ganz normales Verhalten und kein Fehler. Da muss man differenzieren.

Wenn Du sagst, Du zockst etwas, das keine Leistung fordert, und die Graka dabei ständing zwischen den Leistungsmodi hin und her springt, dann siehst Du lustig die Zahlen steigen. Einfach nur weil die Graka ihren Leistungsmodus ändert. Auch das ist kein Fehler an sich.

Ich würde am liebsten den HWInfo-Leuten in den Arsch treten für diesen Counter, weil die Leute halt immer "Error" sehen, aber nicht schauen, was diese Counter eigentlich sagen.

Auf der anderen Seite KANN es natürlich einen Hinweis drauf sein, dass die Karte nicht richtig im Slot steckt, die Pins im Slot verdreckt sind und keinen richtigen Kontakt haben und deshalb Fehler erzeugen, oder dass die CPU nicht richtig im Slot liegt und dort die Pins für den PCIe-Controller nicht richtig kontakt haben.

Die Frage ist halt: Warum sollte das erst nach XXX Wochen in Betrieb auftreten?
Und warum zieht es das ganze System mit in den Abgrund.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Blackman2106, Sodian und Azghul0815
Na gut, ich nehm die Erklärung gerne an. Wie ja auch schon geschrieben. Blackscreen hab ich jetzt mal keinen bekommen. Als Ergänzung: Diese "Errors-Counter" zählen auch hoch wenn ich nach Win Start auf der Arbeitsoberfläche bleibe und ausser eben HWInfo betrachte sonst keine Aktion setze.
Allerdings bin ich sicher das ich die - weil ja rot angezeigten "Errors" - im HWInfo früher nie gesehen habe. Da habe ich dieses Tool oft mitlaufen lassen, weil ich nach dem Zusammenbau des Rechners die Temperaturen kontrollieren wollte.
Mir ist auch klar, dass Gen4 statt Gen5 nur eine sehr geringe Leistungseinbuße bringen wird. Wär aber trotzdem interessant, zu verstehen, wieso das Problem jetzt nach etwa 6 Monaten Betrieb entstanden ist. Wie beschrieben, begann das mit 0 bis 2 kurzen Blackscreens nach win11 start (nach login auf der Arbeitsoberfläche. Zwei Wochen später traten die Blackscreens jetzt inklusive autoreboot dann auch bei Spielen auf. Ist also irgendein progressives Ding.

Ich werd das jetzt mal weiter beobachten. Ordentlich Last auf die Graphik zu bekommen ist ja einfach. MSFS 2024 mit Pimax Crystal Super ringt jede Karte nieder. Aber ich hab das mit den Einstellungen so gelöst, dass ich selten über 70% GPU load (Nvidia overlay oder Pimax utility als Anzeige dazu) komme.
 
Sind auch erst in einer neueren Version von HWInfo hinzugekommen.
Das könnte erklären, warum Du sie früher nie gesehen hast.

Aber wenn Du natürlich schon ewig diese Version benutzt, dann erklärt es das nicht.
 
  • Gefällt mir
Reaktionen: Sodian und Azghul0815
HisN schrieb:
Wenn Du sagst, Du zockst etwas, das keine Leistung fordert, und die Graka dabei ständing zwischen den Leistungsmodi hin und her springt, dann siehst Du lustig die Zahlen steigen. Einfach nur weil die Graka ihren Leistungsmodus ändert. Auch das ist kein Fehler an sich.
Danke.
Ist mir per se erst jetzt aufgefallen. Wieder was gelernt
 
  • Gefällt mir
Reaktionen: HisN und Sodian
HisN schrieb:
Sind auch erst in einer neueren Version von HWInfo hinzugekommen.
Das könnte erklären, warum Du sie früher nie gesehen hast.

Aber wenn Du natürlich schon ewig diese Version benutzt, dann erklärt es das nicht.
Da hab ich sicher schon mal eine neue Version installiert. Und als schwarze Zahlen sind die mir vermutlich nicht aufgefallen, damals hab ich ja auch kein Problem versucht zu analysieren. Danke für Deine Erläuterungen!
 
Nach nun einigen Tagen kann ich sagen, dass das Problem mit den Blackscreens inkl autoreboot durch das Stellen der Schnittstelle auf Gen4 nicht mehr auftritt. Übrig geblieben ist ein sporadischer knapp 1 sec. dauernder schwarzer Bildschirm kurz nach dem einloggen in Win11 auf dem Desktop. Dies tritt nicht bei jedem Win Start auf. Vermutlich ist da ein anderer Grund dahinter.
Interessant wäre für mich aber dann trotzdem, wieso das obige Problem jetzt nach 6 Monaten reibungslosen Betrieb plötzlich aufgetreten ist. Wenn da jemand einen Hinweis hätte, wäre ich dankbar.

Jedenfalls danke an alle die mir mit ihren Beiträgen bei der Lösung - wenn's auch nur ein "workaround" ist - geholfen haben!
 
  • Gefällt mir
Reaktionen: Sodian
Zurück
Oben