RX 7900XTX Nitro + WHEA Fehler und zufällige Neustarts

Lerinol72

Cadet 3rd Year
Registriert
Okt. 2023
Beiträge
44
1. Hardware-Informationen

• Prozessor (CPU): 9 5900x

• Arbeitsspeicher (RAM): Corsair Vengeance 4000 MHz (4 x 8GB)

• Mainboard: MSI MPG x570s

• Netzteil: BeQuiet Straight Power 11 1000W

• Grafikkarte: 7900XTX Nitro+ (vorher 6900XT)

• Speicher: Samsung 980 Pro und 870 QVO





2. Problem-Beschreibung

Nach der Aufrüstung meines PCs mit der neuen GPU treten sporadische Neustarts auf. Der Bildschirm wird plötzlich schwarz, der PC fährt nicht korrekt herunter, sondern startet direkt neu.


Die Neustarts treten nur auf, wenn der PC vorher unter Last war, dann stürztet er nach dem Beenden dieser im Leerlauf oftmals ne Stunde später ab. Wenn ich den PC im idle betreibe, funktioniert er problemlos…


Die ersten Tage nach dem GPU-Einbau verliefen fehlerfrei. Auffällig war jedoch eine Häufung von WHEA-Fehlern während der GPU-Übertaktung, die nach etwa 30 Minuten zuverlässig zu einem Neustart führten.

Nach dem Deaktivieren des OC traten die Neustarts seltener, aber weiterhin unregelmäßig auf und vorallem nicht reproduzierbar …


Hinweis: Bei vielen waren die WHEA-Fehler nach dem Wechsel auf eine neue GPU Treiberbedingt bzw. auch durch eine defekte Grafikarte, sprich das Problem war mit einer NVDIA-Karte bei vielen weg….



Ein paar genauere Infos zu den Fehlern:


In Bluescreen Viewer:


Nichts!

Im Ereignisprotokoll:

05.03.2025 23:40:31
Das System wurde zuvor am ‎05.‎03.‎2025 um 23:16:47 unerwartet heruntergefahren.


05.03.2025 23:40:26
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.


06.03.2025 00:39:03
Schwerwiegender Hardwarefehler. [WHEA-Fehler-ID: 18]

Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 22 —>( Diese Zahl variiert und ist immer anders!)

Die Detailansicht dieses Eintrags beinhaltet weitere Informationen.


06.03.2025 00:39:24
Gemeldet von Komponente: Prozessorkern [WHEA-Fehler-ID: 18]
Fehlerquelle: Machine Check Exception
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 5 —>( Hier steht sehr häufig eine 0)


06.03.2025 00:47:26
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.


06.03.2025 00:47:31
Das System wurde zuvor am ‎06.‎03.‎2025 um 00:44:58 unerwartet heruntergefahren.



3. Bereits unternommene Schritte

1. Treiber und Software:

• Grafiktreiber-Entfernung: Deinstallation der Grafiktreiber mit Display Driver Uninstaller (DDU).

• AMD-ONLY-Treiber: Installation nur der offiziellen AMD-Treiber ohne Zusatzsoftware.

• Windows zurückgesetzt: Durchführung eines System-Resets.


2. Hardware-Überprüfung:

• Kabelverbindungen: Kontrolle aller internen Kabel auf festen Sitz und Schäden.

• GPU an drei separate Kabel angeschlossen und die CPU am zwei

• Arbeitsspeicher-Test: Durchführung eines Memtest86 zur Fehlerüberprüfung des RAMs.

• CMOS-Reset: Rücksetzen des BIOS auf Standardeinstellungen.


3. BIOS- und Übertaktungseinstellungen:

• Übertaktung deaktiviert: Deaktivierung von PBO und CPO.

• Curve Optimizer: Einstellung auf +15.

• C-States deaktiviert: Deaktivierung für Kerne und Infinity Fabric.

• Fixierte VCore/Taktfrequenz: VCore auf 1,25 V und Taktfrequenz auf 4 GHz festgelegt.


4. Komponenten-Tests:

• GPU- und Netzteil-Tests: Belastungstests über mehrere Stunden ohne Fehler.

• Netzteil-Wechsel: Test mit einem BeQuiet 850W Netzteil.

• XMP-Profil deaktiviert: RAM im Dual-Channel-Modus ohne XMP-Profil betrieben. Memtest86 ganze Nacht laufen lassen, ohne Probleme.

• RAM auf 3200 und 1600FLCK laufen lassen mit manuellen Timings.


5. Speicheranalyse:

• Festplattenprüfung: Analyse mit CrystalDiskInfo auf mögliche Fehler.


6. Temperaturüberwachung:

• Monitoring: Überwachung der Temperaturen mit HWINFO.





Schonmal Danke für Vorschläge, wie ich das System bzw. die GPU stabil bekomme. ;)
 
Zuletzt bearbeitet:
Kann es sein, dass die 7900XT mit installiertem Treiber ohne Adrenalin einwandfrei läuft? Ich hatte schon sehr ähnliche Fälle bei einer 7800XT und bei einer 7900XTX, diese Karten liefen mit installiertem Treiber ohne Adrenalin einwandfrei und mit Adrenalin nicht mehr. Diese Karten gingen in die Reklamation.
 
  • Gefällt mir
Reaktionen: Azghul0815
Hm das liest sich alles sehr merkwürdig könnte die Karte sein aber auch Netzteil wenn falsch abgeklemmt oder der ram, weil 4 Module mit 4000mhz ist schon arg hoch, kann auch sein das der speichercontroller da aussteigt.
 
GOOFY71 schrieb:
Kann es sein, dass die 7900XT mit installiertem Treiber ohne Adrenalin einwandfrei läuft?
Ja genau, also mit den AMD-Drivers-Only-Packet konnte ich ohne Probleme die Karte betreiben.
Ergänzung ()

LadykillerTHG schrieb:
Hm das liest sich alles sehr merkwürdig könnte die Karte sein aber auch Netzteil wenn falsch abgeklemmt oder der ram, weil 4 Module mit 4000mhz ist schon arg hoch, kann auch sein das der speichercontroller da aussteigt.

Den RAM konnte ich durchs austauschen der Komponenten und paar Änderungen im BIOS (XMP, geringerer Takt, erhöhte Spannung, etc. ) bereits ausschließen. Das Netzteil wurde zudem auch bereits getauscht mit einem 850W, was die Probleme auch nicht behob.

Angeschlossen ist die GPU über 3 separate Y-Kabel.
 
  • Gefällt mir
Reaktionen: Azghul0815
Der Ram ist auf 4000 übertaktet?

Wenn ja, stell den mal auf 3200 oder so.

Adrenalin hat bei mir ziemlich allergisch auf Ram Übertaktung reagiert.
 
Lerinol72 schrieb:
Ja genau, also mit den AMD-Drivers-Only-Packet konnte ich ohne Probleme die Karte betreiben.
Schade, aber das ist ein Garantiefall.
 
RAM mal bei 3000mhz oder darunter laufen lassen, ich wette der speichercontroller schmiert da ab
 
Lerinol72 schrieb:
Die 7900XTX Nitro+ habe ich gerade wegen ihrer beworbenen Übertaktbarkeit und dem starken Kühlsystem gewählt.

Die Karte hat bereits ein Werks OC und ist schon ziemlich am Limit.

Ich habe die selbe Karte und habe auch keine vernüftigen Ergebnisse dauerhaft stabil zusammengebracht.
OC macht generell bei AMD Karten keinen Spaß.
 
Moment y Kabel? Die haben doch 3 mal 8 Pin direkt vom Netzteil, man braucht da kein y kabel
 
Azghul0815 schrieb:
Ohne OC stabil?
Wie läuft der RAM? Rennt der auf 4000mt/S?

Weiß ich Frage, WHEA 19 ist doch eigentlich ein CPU Fehler.

Edit: Spannung Spitzen der 7900er vielleicht?

Ohne OC völlig stabil, RAM läuft im XMP auf 4000Mhz und 1800 FLCK. Das Problem tritt auch beim deaktivieren des XMP auf.
Die Spannung habe ich jetzt nicht im Blick gehabt, daneben hat die Karte jedoch nie mehr als 467 Watt gezogen und das recht konstant.
Ergänzung ()

LadykillerTHG schrieb:
Moment y Kabel? Die haben doch 3 mal 8 Pin direkt vom Netzteil, man braucht da kein y kabel
Also drei Y-Kabel waren halt im Netzteil mitgeliefert. Es sind 2 * 8 Pin pro Kabel, aber ich habe auch vom 750W Netzteil der selben Baureihe die einzelnen 8 Pin Kabel probiert, mit dem selben Fehler…
 
Normalerweise würde nur der Treiber abschmieren. Habe mal nach \Driver\WUDFRd gegoogelt und wie es aussieht geht es um die Chipsatz Treiber.

Ich würde das Bios aktualisieren, aktuelle Chipsatztreiber installieren und nochmal probieren.
 
Hm ok hat sich konisch gelesen aber 1800mhz Folk sind es nicht bei 4000mhz sondern 2000mhz und das ist eigentlich schon über der Grenze des 5900er weil die machen bei 1900mjz dicht. Dazu noch 4 Module da sin eigentlich kaum mehr als 3200mhz dann noch drin ich wette es liegt an ram.
 
  • Gefällt mir
Reaktionen: Azghul0815 und Knobi Wahn
jo0 schrieb:
Normalerweise würde nur der Treiber abschmieren. Habe mal nach \Driver\WUDFRd gegoogelt und wie es aussieht geht es um die Chipsatz Treiber.

Ich würde das Bios aktualisieren und aktuelle Chipsatztreiber installieren und nochmal probieren.
Wurde beides bereits gemacht. BIOS und Chipsatz sind beide aktuell, zudem sind die Chipsatztreiber einmal über AMD und MSI runtergeladen worden.
 
4 Ram Sticks mit 4000MT/s auf AM4 stabil? Kann das kaum glauben.
 
  • Gefällt mir
Reaktionen: Schildbrecher, Beneee, BeezleBug und 2 andere
LadykillerTHG schrieb:
Hm ok hat sich konisch gelesen aber 1800mhz Folk sind es nicht bei 4000mhz sondern 2000mhz und das ist eigentlich schon über der Grenze des 5900er weil die machen bei 1900mjz dicht. Dazu noch 4 Module da sin eigentlich kaum mehr als 3200mhz dann noch drin ich wette es liegt an ram.

Aber wenn ich diesen im Dual Channel betreibe auf 2133mhz und das Problme dennoch auftritt, kann es doch unmöglich der RAM sein oder?
Ergänzung ()

GOOFY71 schrieb:
Kann es sein, dass die 7900XT mit installiertem Treiber ohne Adrenalin einwandfrei läuft? Ich hatte schon sehr ähnliche Fälle bei einer 7800XT und bei einer 7900XTX, diese Karten liefen mit installiertem Treiber ohne Adrenalin einwandfrei und mit Adrenalin nicht mehr. Diese Karten gingen in die Reklamation.
Ja genau so ist es! Aber ohne Adrenalin kann ich die Karte ja nicht übertakten und ich denke MSI Afterburner ist da nicht die beste Lösung….
 
Lerinol72 schrieb:
Bereits eine leichte Anhebung des Powerlimits kann dazu führen, dass der PC nach stundenlangem, problemlosen Betrieb unter Vollast und in Games – meist nach ein paar Minuten dann im anschließenden Desktop-Betrieb – plötzlich neu startet.

Die Intervalle variieren von Minuten bis Stunden. Im Standardmodus treten keine Probleme auf.
Dann lass doch das OC? Scheint als ob die Karte es nicht packt, plötzliche neustarts haben manchmal oder auch oft was mit dem Netzteil zu tun.
 
  • Gefällt mir
Reaktionen: Schildbrecher
Doch kann sein weil bei 4 Modulen muss mehr Spannung her. Teste mal mit 2 Modulen bei 2133mhz wenns dann geht weißt du was es ist
 
Lerinol72 schrieb:
was die Probleme auch nicht behob.
Wenn du noch in der Umtauschfrist bist, würde ich die Karte an deiner Stelle wieder wegschicken. Ich hatte das Problem zweimal, die Fehler waren nicht reproduzierbar. Mit anderen Karten liefen diese Systeme alle einwandfrei...
 
GOOFY71 schrieb:
Wenn du noch in der Umtauschfrist bist, würde ich die Karte an deiner Stelle wieder wegschicken. Ich hatte das Problem zweimal, die Fehler waren nicht reproduzierbar.

Das selbe dachte ich anfangs auch, bis ich dann die GPU im Standartmodus laufen lies und die Probleme nicht mehr auftraten.

Denn WHEA-19 spricht eher für einen CPU-Defekt…

Sobald ich die Katze im vollen OC Betriebe, jedes Mal nach 20-30 Minuten Absturz…

Bei mäßigem OC nach paar Stunden erst.
 
Zurück
Oben