Ryzen 5900X WHEA Uncorrectable Error

Kha'ak

Lt. Junior Grade
Registriert
Juni 2007
Beiträge
458
Gelöst: Corsair Force MP600 1TB NVME SSD ist defekt

1. Nenne uns bitte deine aktuelle Hardware:

(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): …AMD Ryzen 5900X (Lief 2,5 Jahre mit PBO Curve negativ 10 , Temps nie über 80°C)
  • Arbeitsspeicher (RAM): …2x16GB GSkill TridentZ Neo 3600/16-16-19-39 (XMP1 Profil)
  • Mainboard: …Gigabyte X-570 Aorus Pro (Rev1.0) | BIOS F34/F36
  • Netzteil: …BeQuiet StraightPower Platinum 850W (550W Modell als Test)
  • Gehäuse: …Corsair Carbide 300R
  • Grafikkarte: …AMD Radeon 6900XT (FE)
  • Soundkarte: Auzentech X-Fi Forte (Pci-e)
  • HDD / SSD: … System NVMe: 1TB Corsair Force MP600 || 2TB Gigabyte Aorus NVMe || diverse SATA SSDs: Samsung 840/860
  • Windows 10 Pro 22H2

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
"WHEA Uncorrectable Error" seit gestern
  • Trat zum ersten mal im Idle gestern auf.
  • Danach nur noch während des Bootens von Win10 vor dem Login
- Es wurden keine MiniDump Files des WHEA erstellt
  • PC Reset-Knopf lässt danach den PC direkt in das BIOS fahren nur um danach keine Festplatte mehr zu erkennen, gar keine
  • macht man das zu oft hintereinander resettet sich das BIOS
  • macht man es noch öfter friert der POST Screen ein und man kommt nicht in das BIOS
  • Kodensatoren entladen bzw. BIOS mit Jumper resetten stellt normales POST verhalten wiederher
(Update 1:
Auch einmal vor zwei Monaten nach Installation des KB5025221, durch Systemwiederherstellungspunkt damals "behoben")

Update 2:
Sobald PCIe Slot auf Gen3 oder 4 steht, wird die komplette MP600 von z.B. geklontem Windows auf die SATA 840Pro oder per HirensBootCD nicht vollständig erkannt.
Die Hardware wird erkannt aber nicht die Formatierung und Inhalt der Partitionen.

Update 3:
Mit PCIe Slot auf Gen2 nun auch WHEAs im MP600 Windows UND zweite M2 NVMe Gigabyte Aorus 2TB sporadisch nicht mehr erkannt.
Windows 10 per USB Boot Stick NICHT auf MP600 installierbar.
Update 4:
Die Corsair MP600 1TB NVMe SSD scheint defekt zu sein.
Das geklonte Windows funktioniert tadellos auf der Aorus 2TB NVMe SSD samt PCIe Gen4 und allen CPU Optionen im BIOS, quasi Stand wie vor dem WHEA Problem.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
...
TL:DR was aktuell im BIOS eingestellt ist womit das System aktuell stabil läuft:: (NVME "nur" mit 1550MB/s)
a) PCIe Slot Gen auf 2 (nicht der X16 Slot der GPU, der läuft mit Gen 4)
- Mit Gen 3 oder 4 (nun auch mit GEN2 sporadisch) wird der WHEA Fehler spätestens 10 Sekunden nach Win Login getriggert, meist vorher
- Es äußert sich mit Mauszeigerruckeln, ausfallen der USB Geräte, nach 10 Sekunden kommt der WHEA
b) AMD Cool&Quiet incl. C-States deaktiviert
c) CPB aktiviert und PBO auf -10 (hat keine Auswirkungen soweit)

Nach Eingrenzung der Fehlerursachen könnte es Folgendes sein:
CPU, Board, MP600 SSD

Unternommene Schritte, die nichts gebracht haben:
  • BIOS Reset, Optimized Defaults, BIOS Update von F34 auf F36, BIOS CMOS Batterie getauscht
  • Alle Platten/Soundkarten bis auf das Notwendigste entfernt
  • Netzteil getauscht
  • GPU getauscht
  • System Mp600 SSD Solo im anderen M2 Slot (via X570) betrieben
  • RAM mit Memtest86 und in den unterschiedlichsten Kominationen und einzeln gesteckt
  • Im abgesicherten Modus bzw. vor dem Laden des abges. Modus trat WHEA auch auf.
  • Auch während Win Reparaturoptionen SFC, Chkdsk, usw.
  • AMD Chipsatztreiber aktualisiert
  • AMD GPU Treiber komplett mit DDU und AMD Cleaner deinstalliert
  • Im BIOS PBO, CPB, COOL&Quiet, C-States, SMT auf AUS (bevor "PCIe Gen2" Parameter verstellt wurde)

Da kein DUMP File erzeugt wurde ist die Analyse nicht leicht:
a) Wenn es die CPU ist, sie hat noch rund 6 Monate AMD Garantie.
Wer garantiert, dass man nicht wieder so ein Problem bekommt. (etliche Foren durchstöbert)
b) Dann bleibt nur noch auf Verdacht tauschen?
- PS: Das Klonen der System SSD mit z.b. Hirens-Boot-CD Tools schlug fehlt, da die Platte während des Prozesses verschwunden ist ( PCie Gen=Auto im BIOS, müsste es nochmal mit Gen=2 prüfen, -> hat funktioniert )

Danke im Voraus für eure Tipps, laut diverser inkl. diesem Forum sieht es wohl eher nach einem CPU Symptom aus.
Wobei der PCIe Parameter auf Gen 2 die CPU, Board und SSD Controller betrifft. Es ist zum verzweifeln.
 

Anhänge

  • 20230509_185413.jpg
    20230509_185413.jpg
    1,3 MB · Aufrufe: 94
  • 20230509_185619.jpg
    20230509_185619.jpg
    795,3 KB · Aufrufe: 93
Zuletzt bearbeitet:
Restart001 schrieb:
Empfehle mal das.

Danke.
Schon getan, ist das erste was nach der Win Install damals deaktiviert wurde und zur Sicherheit nun nochmal mit powercfg /hibernate off.
 
Ansonsten mal den Ram auf 3200Mhz laufen lassen. Mein 5900X war auch so eine extreme Zicke was schnelleren Ram anging.
Ich hatte den WHEA Fehler am Anfang auch, hab dann auf 3200Mhz Ram gewechselt und der Fehler war nie wieder gesehen.
 
CPU Tauschen, mein 5800x3d hat sich ähnlich verabschiedet. Wenn du noch Garantie hast RMA Ticket bei AMD eröffnen!
Grüße
 
Daggy820 schrieb:
Ansonsten mal den Ram auf 3200Mhz laufen lassen. ....
Selbst auf Standardprofil 2133Mhz kackt er ab, was ja der BIOS Standardparameter ist.
 
Oh, dann würde ich mal die CPU tauschen wenn man sieht was du schon alles unternommen hast.
 
  • Gefällt mir
Reaktionen: Azghul0815
OCMC schrieb:
CPU Tauschen, mein 5800x3d hat sich ähnlich verabschiedet. ....
Oha, beim 5800x3D auch? Mit dem hätte ich noch geliebäugelt, da der 5900X für mein Profil zu Overkill ist.
 
Dann ist's wohl gut das er jetzt muckt und du die Garantie nutzen.
 
Mein x3d ging nach ca. 4 Monaten kaputt.
Mit ähnlichen Fehlerbild und auch WHEA Fehler. Hatte sporadische Neustarts bei unterschiedlichen Lasten. Nach CPU Tausch lief wieder alles normal.
Die Fehlersuche hat mich fast in den Wahnsinn getrieben 😉.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Kha'ak
Kha'ak schrieb:
Arbeitsspeicher (RAM): …2x16GB GSkill TridentZ Neo 3600/16-16-19-39 (XMP1 Profil)
Hab das selbe Kit, XMP läuft bei mir auch nicht ohne Whea. Betreibe das Kit daher einfach mit Standard Jedec. ggf. geht 3200 mhz mit xmp
 
  • Gefällt mir
Reaktionen: Kha'ak
Standard JEDEC wäre wirklich ein bisschen hart, auch wegen Performanceverlust.
 
arvan schrieb:
Standard JEDEC wäre wirklich ein bisschen hart, auch wegen Performanceverlust.
Merkste beim zocken in der Regel eh nicht, zumindest bei hoher Auflösung

War mir jetzt zu aufwendig 3200 mhz mit xmp auf Stabilität zu testen. Garantiert sind nämlich nur 3200 MHZ cl22 von AMD....
 
OCMC schrieb:
CPU Tauschen, mein 5800x3d hat sich ähnlich verabschiedet. Wenn du noch Garantie hast RMA Ticket bei AMD eröffnen!
Grüße
Wenn ich so einen mumpitz lese, die CPU ist das was am allerwenigsten irgendwo abraucht. Hier wird mit sicherheit irgendwo anders das problem liegen bzw. gelegen haben.
 
Mich irritiert hier, dass die SSD zwischendurch aussteigt. Hast du schon ohne versucht zu booten?
Ansonsten liegt es bei den Ryzen und WHEA Fehlern gerne an der CPU.
 
DaLexy schrieb:
Wenn ich so einen mumpitz lese, die CPU ist das was am allerwenigsten irgendwo abraucht. Hier wird mit sicherheit irgendwo anders das problem liegen bzw. gelegen haben.
Sorry, aber mumpitz ist das noch lange nicht. es kommt selten vor, aber passiert.
ich kenne mittlerweile auch 3 im Bekanntenkreis bei denen eine CPU aus der 5000er Reihe defekt war.
 
  • Gefällt mir
Reaktionen: OCMC
Definier defekt ? Es kann sein das der Speichercontroller evtl. mit vollbestückung oder hohen Mhz nicht klarkommt aber das die CPU selber defekt ist im sinne von heute auf morgen irgendwelche zicken macht ist hokus pokus. Eine CPU ist robust und klein, wenn da irgendwas kaputt geht dann eher an falsch eingestellten settings oder unsachgemäße behandlung wie OC. Es kann auch an einem Windowsupdate liegen der zur inkompatiblität führt/settings durcheinander bringt.

Frag mal Systemadmins von richtig großen Netzwerken wie oft die ne CPU wechseln weil die einfach kaputt geht, wenn du den gefunden hast der dir das bestätigt sag mir bescheid.

@Kha'ak
Check mal deine SSDs durch und wenn die in ordnung sein sollten würde ich mal ne neuinstallation von Windows wagen, sollte das Problem bestehen bleiben würde ich den schuldigen woanders suchen als bei der CPU, eher RAM oder Mainboard. Du sagtest ja selber das ein Windowsbackup das problem verschwinden lies, daher gehe ich davon aus das entweder das Windows oder die SSD nicht ganz korrekt arbeiten.
 
Zuletzt bearbeitet:
Defekt heisst, reproduzierbare WHEA 19 Fehler immer auf den selben Kernen
Bei mir 0 und 1, also physischer Kern 0 bei Lastwechseln unter BIOS defaults Werten. Also sobald das Game oder Cinebench beendet wurde, der PC in den Idle ging usw.

Mit Erhöhung der VCore Spannung via Offset wurde es weniger, trat aber immernoch auf.
Neue CPU rein, alle Probleme weg.

Muss hier nicht sein, aber der TE hat geschrieben, kommt auch bei 2133 Memory Takt vor.
 
Und der "defekt" bestand von anfang an oder kam der auch aus heiterem himmel ?
Ich sage dir das es kein defekt war, ich brauch bei mir nur ein setting ändern und kann dann auch mit WHEA fehlern um mich werfen, deswegen ist meine CPU nicht defekt.
Was natürlich sein kann ist das deine besagte CPU evtl. mit den standardsettings nicht klar kam und da wie man so schön sagt eine "Zicke" hat, gibt schließlich Mainboards wie Sand am Meer (übertrieben) die alle eine andere Hardware/Software mitsich bringen.
Das die neue CPU dann ohne probleme lief, zeigt nur das diese damit nicht so zickt. Ist dasselbe wie das manche Ryzen 1900 Infinity locker mitmachen wobei andere sagen "Nö" und bleiben bei 1800, ist die CPU nun deswegen defekt ?

Bis das Silizium verreckt bei vorgeschriebenen settings (wenn überhaupt), verrecken dir die anderen komponenten 3 mal vorher. Desweiteren kannst du dir sicher sein das die Hersteller ihre Chips einmal ordentlich durchtesten bevor die eingepackt werden und die packen dir mit sicherheit keinen kaputten Chip ein.
 
Zurück
Oben