Ryzen 5800X WHEA-Logger Prozessor-APIC-ID: 0 Core Performance Boost Neustart

Don R. Wetter

Newbie
Registriert
März 2023
Beiträge
5
1. aktuelle Hardware:
  • Prozessor (CPU): Ryzen 7 5800X
  • Arbeitsspeicher (RAM): G.Skill RipJaws 4 mit 2400 MHz (2 x F4-2400C15-8GRR, 2 x FA-3000C15-8GRK)
  • Mainboard: ASUS ROG STRIX B550-F Gaming
  • Netzteil: Corsair RM850e
  • Grafikkarte: AMD XFX Redeon RX 6800 QICKSILVER319
  • NVMe WD Black/Crucial
  • Kühlung: be quiet! Silent Loop 1 280mm
  • OS: Windows 10 Pro
  • Monitor: 2 x MSI Optix MAG27CQ-7015
2. Das Problem.
Hallo, ich habe vor kurzen ein neues System zusammengebaut (Config ist oben zu sehen) welches regelmäßig im Betrieb zufällig neu startet. Die Neustarts geschehen im Idle oder auch während des Spielens, da gibt es kein erkennbares Muster. Der PC geht plötzlich aus und startet sofort neu.

3. unternommene Schritte, um das Problem zu lösen + mögliche Lösung
Um das Netzteil aus Ursache ausschließen zu können habe ich das System Testweise mit meinem alten be Quit Netzteil getestet, selbes Ergebnis. Um die Grafikkarte als Ursache ausschließen zu können habe ich testweise meine alte GTX 1080 eingebaut, selbes Ergebnis. Temperaturen sind auch alle normal. Windows 10 scheidet auch als Ursache aus, eine Neuinstallation auf einer anderen NVMe SSD brachte nämlich keine Besserung. Bei der Windows internen Speicherdiagnose (mdsched) werden für den Ram keine Fehler ermittelt. Dieser lief davor auch in der gleichen Konstellation mehrere Jahre ohne Probleme mit einem i7 7700K und der GTX 1080. Es bleiben also noch das Mainboard und die CPU als Ursache, vielleicht aber passt auch der RAM einfach nicht mit dem System zusammen. Wenn nur jeweils zwei der gleichen Module getestet werden ändert sich auch nichts. Da im Windows System-Log häufig die Warnung "WHEA-Logger" mit der Ereignis-18 auftaucht und folgendem Text:

Behobener Hardwarefehler.
Gemeldet von Komponente: Prozessorkern
Fehlerquelle: Unknown Error Source
Fehlertyp: Cache Hierarchy Error
Prozessor-APIC-ID: 0

habe ich die CPU in Verdacht. Andere nicht normale System-Logs sind "Kritisch" von Kernel-Power. Da bei diesem Fehler jedoch folgender Text steht:
Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.

habe ich die Starke Vermutung das der Fehler aus dem eigentlichen Fehler resultiert. Denn im Bios ist der automatische Start nach dem unterbrechen und erneuten Verbinden bei Stromausfall deaktiviert (Stromunterbrechungen scheiden somit aus), bleiben noch "nicht mehr reagiert" und "abgestürzt" übrig. Da jedoch vor dem plötzlichen Neustart keinerlei Veränderung bzw. keine freezes zu bemerken sind gehe ich vom Absturz aus. Aufgrund der WHEA-Logger Warnung habe ich diverse Einstellungen im Bios ausprobiert (z.B. C-State, CPB, PBO).

Nach Tagen des Testen habe ich folgende Erkenntnis erhalten:
Sobald CPO (Core Performance Boost) von "Auto" auf "deaktiviert" gesetzt wird bleiben die Neustarts aus, auch gibt es keine WHEA-Logger Warnungen im System-Log von Windows. Also wird es zu 99% an CPB liegen.

Da jedoch CPO ab Werk eigentlich laufen sollte ist das für mich keine befriedigende Lösung. Laut Spezifikation sollen so bis zu 4.7 GHz erreicht werden. Wenn CPO deaktiviert ist bleibt maximal 3.8 GHz übrig. Da im WHEA-Logger jedes mal als Ursprung "Prozessor-APIC-ID: 0" gemeldet wird habe ich das Gefühl das bei der CPU der 0 (bzw. erster Kern) defekt oder ähnliches ist.

Das Mainboard hat das neuste Bios installiert (Version 3002, Release am 14.03.2023), aber auch mit der Version davor ging es nicht. Die Treiber wurden mit der AMD Chipset-Software aktualisiert. Eigentlich sollte es also laufen, jedoch scheint da irgendwo etwas nicht zu passen. Es wurden bisher keinerlei Spannungen oder ähnliches mittel Bios/Uefi oder anderen Programmen geändert, es läuft alles wie es Standardmäßig eingestellt war.

Hat da noch jemand Lösungsvorschläge welche auch ohne CPO Deaktivierung funktionieren oder hat die CPU einfach einen weg und sollte ausgetauscht werden? Oder ist der Fehler bei dem RAM bzw. Mainboard zu suchen?
 
Ich weiß nicht, wie du auf die Idee kommst, die RAM auszuschließen, nur weil er vorher in gleicher Konfiguration im alten System problemlos funktioniert hat. Da bringt auch erstmal der interne Test nichts.
Teste den RAM einfach mal einzeln. Also nur mit einen DIMM oder von mir aus erstmal nur mit einem belegten Channel.
 
Don R. Wetter schrieb:
Hat da noch jemand Lösungsvorschläge welche auch ohne CPO Deaktivierung funktionieren oder hat die CPU einfach einen weg und sollte ausgetauscht werden? Oder ist der Fehler bei dem RAM bzw. Mainboard zu suchen?
BIOS-Update machen und danach unbedingt das BIOS resetten!, dann Memtest86 machen.
Wenn dabei keine Fehler gefunden werden und das Problem immer noch auftritt, dann ist die CPU defekt.
Kann vorkommen.
 
  • Gefällt mir
Reaktionen: Baal Netbeck und kachiri
Hi, ich hatte sowas selber mal bei einem 5800X, war defekt bzw. DefektOnArrival.
Weils mich interessiert, wo hast du den her?
Meiner wurde von amazon geliefert und wieder zurückgeschickt. Vielleicht ist das defekte Teil immer noch im Umlauf.

Du hast zwar den Fehler gefunden, aber du solltest keine Kompromisse bei neuer Hardware eingehen.
 
Robert. schrieb:
Hi, ich hatte sowas selber mal bei einem 5800X, war defekt bzw. DefektOnArrival.
Weils mich interessiert, wo hast du den her?
Meiner wurde von amazon geliefert und wieder zurückgeschickt. Vielleicht ist das defekte Teil immer noch im Umlauf.
Von Mindfactory, sollte nicht dein alter sein :D
 
Ich würde den Ram auch nicht per se ausschließen. Vollbestückung mit dazu noch unterschiedlichen Modulen ist alles andere als der Optimalfall. Wie ist der Ram im Bios denn konfiguriert? Hast du ein XMP Profil geladen? Es ist durchaus denkbar, dass das geladene Profil nicht mit beiden Modul-Arten kompatibel ist. Teste das ganze doch mal mit nur 2 Modulen identischen Typs und dann am besten erst mal mit Jedec Profil. Wenn das problemlos läuft, ist es klar, dass es am Ram lag.

Dazu der Hinweis: Ram ist gerade spottbillig. Kauf dir doch ein neues Kit mit 2 identischen Riegeln, zB. 2x16 GB mit 3600 MHz Cl 16 - damit dürftest du auch nochmal etwas an Performance gewinnen!
 
  • Gefällt mir
Reaktionen: kachiri
kachiri schrieb:
Ich weiß nicht, wie du auf die Idee kommst, die RAM auszuschließen, nur weil er vorher in gleicher Konfiguration im alten System problemlos funktioniert hat. Da bringt auch erstmal der interne Test nichts.
Teste den RAM einfach mal einzeln. Also nur mit einen DIMM oder von mir aus erstmal nur mit einem belegten Channel.
Hatte ich nicht komplett ausgeschlossen.
vielleicht aber passt auch der RAM einfach nicht mit dem System zusammen.
Wollte den Ram aber am Wochenende nochmals durchtesten, ein Riegel hat bereits Passmark Memtest86 fehlerfrei durchlaufen.
Ergänzung ()

@rg88 Werde es morgen mal resetten und dann testen.

@blalaber Hatte auch schon überlegt neuen zu kaufen. Aber auch bei den beiden FA-3000C15 Modulen auf 3000 MHz ändert sich nichts. Werde mich da morgen Nachmittag aber dransetzen.
Ergänzung ()

@All
Ich kaufe morgen einfach 32 GB Corsair Vengeance 3200 bei Cyberport (angeblich in allen drei Geschäften in Berlin erhältlich), mal sehen ob es dann läuft. Zur Not kann der ja wieder zurückgegeben werden.
 
Zuletzt bearbeitet:
Moin, das aktuelle BIOS ist 3002. Habe das gleiche Board. Aufspielen und einstellen nach dem Reset.

Gruß
Holzinternet
 
Don R. Wetter schrieb:
"WHEA-Logger" mit der Ereignis-18

Bei dem Fehler in Kombination mit dem 5800x hilft nur zuverlässig die CPU austauschen. (so nervig es auch ist)

Halbgare Lösungen bringen dich da auf Dauer nicht weiter. Selbst wenn du einen 'anderen Schuldigen' ausmachen kannst, und der Fehler verschwindet, kann er bei der jetzigen CPU bei einem Hardware-Tausch gleich wieder auftreten.

Und da das System noch neu ist, am besten < 14 Tage, CPU zurücksenden und Ersatz anfordern. Je länger du damit wartest, desto komplizierter wird der Umtausch.

Nachtrag: Zu "Ryzen WHEA 18 error" gibt es massig Leute mit dem Problem im Netz.
 
Cache hierachy Errors Krieg ich bei meinem 5800x3d, wenn ich ihm mittels pbo zu viel Spannung entziehe. Ab all core -25 erscheinen sie im Teillast Bereich, wenn nur ein oder zwei Kerne etwas ausgelastet werden. Z.b beim Farming Sim 22 im 64fps Limit.

Ich tippe Mal, dass aus welchen Gründen auch immer deine CPU beim boosten zu wenig oder zu instabile Spannung erhält.
Das kann eine Defekte CPU sein, aber auch vom BIOS her stammen. Vielleicht hat es aber auch mit der Loadline calibration zu tun.
 
  • Gefällt mir
Reaktionen: 4BitDitherBayer
Die WHEA Fehler können auch vom RAM kommen aber daher kenne ich sowas erst ab 3800 MT/s aufwärts.

Ich halte es für wahrscheinlcher, dass du eine defekte CPU erwischt hast.
Das kommt selten vor, aber es kommt in letzter Zeit zumindest ab und zu vor und scheint mir bei dir auch der Fall zu sein.

Man kann die Stromsparmechanismen deaktivieren...Lastwechsel mit Heruntertakten sind wohl öfter der Auslöser für die Neustarts auch im Idle und so kann man das nochmal stabilisieren.
Aber das ist ja keine Lösung! Lass die CPU Tauschen und gut.
 
  • Gefällt mir
Reaktionen: 4BitDitherBayer
Moin, der Prozessor hat ne Macke. Mein X3D hat sich auch so verabschiedet, genau das gleiche Fehlerbild. Hab gerade ne RMA bei AMD laufen. Hatte auch erst alles mögliche im Verdacht. Dann CPU getauscht und der Fehler war behoben, keine Reboots mehr.
Grüße
 
ColdGlow schrieb:
Nimm mal die F4-3000C15-8GRK Kits raus und dann wird es wieder laufen ;) Da bin ich mir schon fast ziemlich sicher :p
Ändert nichts.

Holzinternet schrieb:
Moin, das aktuelle BIOS ist 3002. Habe das gleiche Board. Aufspielen und einstellen nach dem Reset.
Die Version ist bereits installiert.

Habe heute nochmal anderen Ram gekauft, gleiches Fehlerbild. Bleiben noch Mainboard und CPU als Ursache. Ein Bios CMOS-Reset hat auch nicht geholfen.
Werde die CPU tauschen, hoffe dann ist es behoben. Werde euch dann berichten ob es geholfen hat.
 
  • Gefällt mir
Reaktionen: Holzinternet, blalaber und Baal Netbeck
floh667 schrieb:
Cache hierachy Errors Krieg ich bei meinem 5800x3d, wenn ich ihm mittels pbo zu viel Spannung entziehe. Ab all core -25 erscheinen sie im Teillast Bereich, wenn nur ein oder zwei Kerne etwas ausgelastet werden. Z.b beim Farming Sim 22 im 64fps Limit.

Ich tippe Mal, dass aus welchen Gründen auch immer deine CPU beim boosten zu wenig oder zu instabile Spannung erhält.
Das kann eine Defekte CPU sein, aber auch vom BIOS her stammen. Vielleicht hat es aber auch mit der Loadline calibration zu tun.
Genau so wird es sein sein CPU-Kern 0 bekommt Zuwenig Spannung u. Schmiert ab. Also entweder im CO mein Core 0 um 2 Stufen nach oben gehen oder der CPU generell einen positiven Spannungs Offset geben.

Am besten verlinkst du mal ein HWInfo Bild damit man sehen kann wie deine Spannungen so sind.

Baal Netbeck schrieb:
Die WHEA Fehler können auch vom RAM kommen aber daher kenne ich sowas erst ab 3800 MT/s aufwärts.

Ich halte es für wahrscheinlcher, dass du eine defekte CPU erwischt hast.
Das kommt selten vor, aber es kommt in letzter Zeit zumindest ab und zu vor und scheint mir bei dir auch der Fall zu sein.

Man kann die Stromsparmechanismen deaktivieren...Lastwechsel mit Heruntertakten sind wohl öfter der Auslöser für die Neustarts auch im Idle und so kann man das nochmal stabilisieren.
Aber das ist ja keine Lösung! Lass die CPU Tauschen und gut.
Generell geb ich dir recht aber da bei ihm immer nur Kern 0 abschmiert glaub ich eher weniger an ein Ram Problem denn das würde ja dann alle Kerne random betreffen.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
Hast du einen zusätzlichen USB Frontanschluss am MB angeschlossen?
Bei mir war dieser ein Grund für Instabilität und whea Fehler. Asus TUF gaming b550m Plus WiFi mit 5800x3d.
Wenn ja Stöpsel das Teil Mal ab und beobachte ob es besser wird.
 
Hast du einen zusätzlichen USB Frontanschluss am MB angeschlossen?

Hatte ich immer dran.
Ergänzung ()

Hatte am 24.03. die CPU an den Händler zurückgesendet und bereits am 31.03. eine Ersatz-CPU erhalten. Die neue auch am 31.03. direkt eingebaut und seitdem keinerlei Fehlverhalten, auch ist der Ereignis-Log komplett frei von WHEA-Errors oder anderen nicht normalen Fehlern. Denke da hatte AMD/TSMC einen fehlerhaften Prozessor produziert. Der neue ist Stepping 2, ich meine der erste wäre Stepping 0 gewesen (aber nicht zu 100% sicher). Hoffe mal das bleibt auch in der Zukunft fehlerfrei.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Petr88, Baal Netbeck und Topse
Hi zusammen,
ich hatte bei meinem Ryzen 5 5600X auch seit mehreren Wochen wie aus dem nichts dieses Verhalten. Neustart und danach auch den Cache Hierarchy Error in der Ereignisanzeige. Wirklich jeden Tag zwischen 1 und 3 Reboots, teilweise im Idle, teilweise beim Spielen.
Was bei mir im Endeffekt die Lösung war, war das Deaktivieren von SVM im Bios (hatte das in einem Forum wo gelesen). Seitdem habe ich seit Tagen keine Reboots oder Fehlermeldungen mehr.
Vielleicht hilft diese Info ja jemandem weiter, ist ja wohl ein bekanntes Problem.
 
Zurück
Oben