WHEA_UNCORRECTABLE_ERROR

K.o

Cadet 2nd Year
Registriert
März 2019
Beiträge
25
1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): AMD Ryzen 9 3900x
  • Arbeitsspeicher (RAM): G.Skill Trident Z rgb 4x16gb
  • Mainboard: Rog Strix 570-E
  • Netzteil: Rog Strix Thor 850W
  • Gehäuse: Asus Rog Helius
  • Grafikkarte: Rtx 2080Ti MSI x Trio
  • HDD / SSD: PNY 1tb

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):

Seit Tagen bekomme ich diesen Bluescreen mit der Fehlermeldung WHEA_UNCORRECTABLE_ERROR. Erst trat es unter starker Auslastung des PCs aus ( Spielen/Animationen ). Mittlerweile taucht es nachdem booten nach einigen Minuten auf.
Ich ging von einer defekten SSD aus, da ich manchmal nachdem Neustart immer ins Bios gekommen bin und diesen nicht mehr verlassen konnte. Die SSD mit Windows drauf, wurde mir auch nicht mehr im Bios angezeigt.
Ich habe ChatGPT benutzt, um eventuell so zu einer Lösung zu kommen, aber bis jetzt war nichts erfolgreich.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Alle Schritte die ich bis jetzt mit ChatGPT durchgegangen bin :

Nach WHEA Logger ID18 suchen -> nicht vorhanden
Minidumps -> nicht vorhanden
Zuverlässigkeitsverlauf -> PC wurde nicht korrekt heruntergefahren
Im abgesicherten Modus starten -> lief stabiler
Nvidia Treiber komplett deinstallieren und neu aufsetzen-> ging nicht da bsod
Windows update -> bsod
Bios Resettet
SSD CrystalDiskInfo ( hieß die glaub ich ) Resultat -> gut 54%, keine kritischen Fehler
PCI 16_1 modul -> von auto auf gen3

Alle RAMS einzeln testen. Bei 3 RAMS kam es unter Auslastung zu keinem bsod, bei einem schon -> den RAM Riegel zur Seite gelegt.
Fälschlicherweise habe ich diese Experimente im Slot B2 versucht und nicht A2 ( hab es verwechselt).

RAMS auf A2 und B2 slot getestet, versucht den Nvidia Treiber zu installieren, aber bsod.
Mit einem RAM konnte ich den neuen Treiber der Nvidia installieren, jedoch tritt jetzt wieder nach ein paar Minuten bsod auf. Ich weiß nicht, ob es mit dem installieren des graka Treibers in Zusammenhang steht.

RAM slot A2 getestet -> bsod

Ich versuche windows update zu installieren -> bsod

ChatGPT geht davon aus, dass entweder die CPU oder das Mainboard defekt sein könnte.

Ich werde nochmal, wenn ich Zeit habe, alle RAMS nochmal einzeln, in jedem Slot testen.

PS: Ich habe gerade keinen funktionierenden USB Sticker um einen MemTest86 durchzuführen, daher benutze ich gerade die Windows Speicherdiagnose und teste jeden einzelnen RAM.

Was denkt ihr zu der Situation?

Freue mich über jede Hilfe
 
Zuletzt bearbeitet:
Mit welcher Frequenz läuft der RAM?
 
  • Gefällt mir
Reaktionen: herrStreusalz
WHEA ist bei AMD praktisch immer eine defekte CPU. Seltener sind UEFI Bugs das Problem, bei der ausgereiften Plattform eher unwahrscheinlich.
 
  • Gefällt mir
Reaktionen: xXDariusXx, cosmo45, inge70 und eine weitere Person
Was bei solchen Sachen immer wieder mal gerne hilft. Ich weiß zwar nicht wieso oder warum, aber es hilft.

CPU Aus-/Einbauen (sichtprüfung der Pins)
RAM Aus-/Einbauen (RAM-Pins mit ISOPropanol reinigen)
Grafikkarte Aus-/Einbauen
Alle Stromstecker abziehen und frisch draufstecken
CLR-CMOS und alles auf Standard-Werte testen.
 
Hast Du zufällig PBO an und/oder Dich am Curve Optimizer versucht?
 
Ist das BIOS aktuell? Habe dazu keine Info gesehen
 
Versuche mal die C-States im Bios zu deaktivieren, falls es bei der ZEN-Generation sowas gibt. Bei meinem 9500X hat es daran gelegen, hatte ein ähnliches Fehlerbild.
 
K.o schrieb:

Das ist wirklich sehr wenig. Ich würde mal eine andere SSD testen. Vielleicht kannst du mal einen Screenshot von CrystalDiskInfo hochladen?
 
  • Gefällt mir
Reaktionen: xXDariusXx
Klingt für mich sehr Nach CPU -- RAM zusammenspiel wie schon gefragt wurde auf welcher Frequenz läuft der RAM? Irgendwelche OC versuche unternommen? das System stürzt bereits mit einem Riegel auf A2 bei last ab?
 
Mojo1987 schrieb:
WHEA ist bei AMD praktisch immer eine defekte CPU.
Da geh ich mit.
WHEA 18 ist oft die defekte CPU und en Fehler der, meiner Erfahrung nach, vor allem beim Lastwechsel/Idle auftritt.
WHEA 19 sind korrigierbare Fehler die auf ein Problem mit RAM/Speichercontroller (in der CPU) hindeuten.

Das ganze Deaktivieren von Cstates usw. kann hefen (eben keine Lastwechsel mehr) ist aber halt nur Symptom-Verschleierung.
 
  • Gefällt mir
Reaktionen: xXDariusXx, qiller und Mojo1987
K.o schrieb:
Seit Tagen bekomme ich diesen Bluescreen mit der Fehlermeldung WHEA_UNCORRECTABLE_ERROR.

Wenn das frueher nicht da war und jetzt da ist, spricht das fuer einen Hardware-Defekt, vor allem weil es zuerst unter den einen Umstaenden aufgetreten ist und jetzt auch unter anderen.

Der Blue Screen erzaehlt vieeleicht noch, welche Komponente betroffen ist, die ist vermutlich die defekte. Screenshot bzw Foto koennte uns helfen, Dir zu helfen.

Nur so zum Vergleich:

Code:
[29493442.020907] mce: [Hardware Error]: Machine check events logged
[29493442.020915] [Hardware Error]: Corrected error, no action required.
[29493442.020918] [Hardware Error]: CPU:0 (19:21:0) MC27_STATUS[-|CE|MiscV|-|-|-|SyndV|-|-|-]: 0x982000000002080b
[29493442.020927] [Hardware Error]: IPID: 0x0001002e00000500, Syndrome: 0x000000005a020001
[29493442.020932] [Hardware Error]: Power, Interrupts, etc. Ext. Error Code: 2, Link Error.
[29493442.020936] [Hardware Error]: cache level: L3/GEN, mem/io: IO, mem-tx: GEN, part-proc: SRC (no timeout)

Hier sieht man, wie ein korrigierter Fehler unter Linux gelogt wird; ich interpretiere das einmal als Fehler im L3 cache, aber ich kann mich auch irren.
 
Naja, es ist ja scheinbar nicht mal bestätigt, welcher WHEA Code-ID vorliegt. Nach 18 wurde aktiv gesucht und nichts gefunden. Ich wäre da noch nicht zu voreilig.
 
  • Gefällt mir
Reaktionen: Azghul0815
@Azghul0815 wo ist hier im Thread ein Dumpfile? Ich sehe hier keines vom TE.
 
  • Gefällt mir
Reaktionen: conf_t
Alles klar.
 
Sapphire Forum
Zurück
Oben