5900x570 Unify - WHEA 18 mit CPB auto

staxx6

Cadet 1st Year
Registriert
Sep. 2020
Beiträge
10
Hallo,

seit ca ~3 Wochen hab ich mir einen komplett neuen Rechner zusammen gebaut, siehe weiter unten für die Liste. Seitdem bin ich von BSODs geplagt und erhalte Neustarts, namentlich WHEA-Logger 18. Paar genauere Infos gibt es im Anhang, für mehr, einfach fragen. Fehler tritt hauptsächlich bei Spielen auf, nicht idle - allerdings Spiele ich momentan auch fast nur damit, dank der neuen GPU. ;) Ansonsten tritt es vielleicht nach 10 Minuten auf oder nach einer Stunde.

Die drei Wochen hab ich bisschen rumprobiert und konnte es auf die "CPB-Core Performance Boost" Einstellung fest nageln. Ist dies ausgeschaltet hab ich keine Probleme mehr und das System lief eine Woche. XMP-Profil läuft und hab keine weitere Einstellungen vorgenommen. PBO ist auch eingeschaltet - aber bei PBO aus und CPB an stürzt es auch ab. Hab irgendwo aufgeschnappt, dass LLC helfen könnte, bei mir leider nicht (bis Mode 8 probiert)... Das Ding ist jetzt nur dass er nicht mehr als den basis Takt von 3600 mhz hoch fährt, ohne CPB.

Arbeitsspeicher schließe ich aus, da es ohne CPB durch läuft. Selbst mit CPB lief memtest die Nacht mit 7-8 std durch mit 0 Fehler.
Netzteil dürfte wohl ausreichen. Temperatur liegt bei maximal ~85°C unter voll Last (bei den Spielen wird das kaum erreicht), idle ~37°, gefühlt zu hoch aber noch kein Grund abzuschalten, währe dann evtl. ein anderes Thema.

Ich gehe also stark von einem Mainboard-Problem aus. Aktuelle wird die Version: "7C35vA82(Beta version) - SAM update" benutzt. Es haben wohl viele Probleme damit aber dass CPB ausschalten hilft hab ich kaum gelesen, finde den Beitrag nicht mal mehr auf die Schnelle.

Große Frage ist jetzt ob es am BIOS liegt und einfach warte bis zum nächsten oder doch ein Hardware-Problem, vielleicht habt ihr mehr Ideen. Alte Teile kann ich zum testen nicht tauschen, dafür ist mein alter Rechner einfach zu antik (i5-3570, NT BeQuiet aber weiteres unbekannt - kein Aufkleber/Nummer, GTX 770)

Infos
CPU: AMD 5900X
MB: MSI X570 Unify - 7C35vA82(Beta version)
RAM: 2x16GB G.Skill Trident Z Neo DDR4-3600 16-16-16-36
GPU: EVGA RTX 3080 FTW3 Ultra (kein OC)
NT: Enermax Revolution D.F. 750 W

Windows up to date sowie der Chipset driver. Power plan auf balanced und high performance ausprobiert.
 

Anhänge

  • infos.png
    infos.png
    185,8 KB · Aufrufe: 322
Zuletzt bearbeitet:
Welche Einstellungen bietet dein Board bei CPB?
 
therealcola schrieb:
Zu viel Overclock zu wenig Spannung angelegt
Hätte ich auch darauf getippt. Ich hab aber nicht viel Ahnung von OC und die standard-out of box Einstellungen sollten doch genügen?

Robo32 schrieb:
Welche Einstellungen bietet dein Board bei CPB?
CPB selbst nur auto / disabled
 

Anhänge

  • MSI_SnapShot.jpg
    MSI_SnapShot.jpg
    175,3 KB · Aufrufe: 314
Mir ist mein System gestern nach stundenlang Cyberpunk 2077 zocken auch 1x abgeschmiert mit Whea error 18 cache hierachy Ereignis. Wohlgemerkt 1x mal in der Woche sonst lief alles Stabil auch Memtest.

Ich betreibe aber 1900 infinity clock mit 3800 MHZ Ram Takt also an der Kotzgrenze.

In meinem Fall habe ich jetzt zusätzlich nochmal die Spannungen alle um 0,025v erhöht.

VSOC -> 1,0825V
CLDO VDDP -> 1,025V
VDDG IOD -> 1,025V
VDDG CCD -> 1,025V

Nur Memtest durchlaufen ist jedenfalls keine Garantie für ein Stabiles System...

Ansonsten bin ich nicht abgeneigt zuzustimmen , das die derzeitigen Agesa Versionen für die Ryzen 5000 Serie immernoch Fehler aufweisen könnten, Beta ist halt beta.

AMD will ja in diesem Monat noch verbesserte Versionen raushauen da hilft nur abwarten oder sein System auf Stock Werte betreiben , also vor allem ram takt 3200 mhz
 
Zuletzt bearbeitet:
Ich beteilige mich mal in diesem Thread auch wenn ich ein anderes Board benutze (Gigabyte X570 Aorus Pro Rev. 1.2). Ich habe die gleichen Fehler und auch bei mir ist CPB die Option die wenn ausgeschaltet das System stabil laufen lässt. Ich habe jetzt aktuell händisch übertaktet, sodass 2 Kerne mit 4,6 GHz laufen und die anderen 10 mit den Standard 3,7 GHz. Das ist stabil und von der Performance her zumindest für den Moment akzeptabel.

Ich hoffe aktuell auch, dass neue BIOS/AGESA Versionen das Problem in den Griff bekommen, ansonsten hilft wohl nur RMA (wobei dann die Frage ist ob Mainboard oder CPU). Leider alles nicht so einfach wie gehofft mit den neuen Komponenten.
 
Mein Bruder und ich (identisches System) haben identische WHEA Erros bei beiden Systemen.

Ich hoffe, dass ein BIOS Update in den nächsten Tagen/Wochen kommt.

Erste mal seit 10 Jahren wieder AMD und schon wieder bin ich sehr enttäuscht davon.

2000€ bezahlt für ein instabiles System ohne OC oder ähnliches. Alles Stock. Apropos "Stock".... ich bin stocksauer.

Ich war noch am Überlegen ob 10850K oder 5900x :(. Wohl wieder aufs falscher Pferd gesetzt.

Ich gebe AMD bis Januar Zeit, danach bekommen die das System um die Ohren gehauen.
 
  • Gefällt mir
Reaktionen: -Legend-Storm-
Bekomme ich das richtig mit, das fast alle mit den Fehlern ein MSI bzw Gigabyte Board haben?
 
@TE

mal bitte ältere Bios Versionen probieren (ab 5000er Ryzen kompatibilität)
schon merkwürdig, hatte selbst nen 5800x verbaut und keine WHEA Log Fehler und auch keine Neustarts. Nur eben Framedrops in einem Maingame...
 
@Hektor26

Nein, es sind alle Mainboardhersteller betroffen.
Ich habe eine ASUS-Board und den gleichen Käse.

Ich konnte es mit deaktivierten Global C-States umgehen.
Sind die Global C-States aktiv, sind die Fehler reproduzierbar.
 
Ich hab noch ein Originalverpackten 5900x mit einem Asus Board hier liegen, B550xe und wenn ich das alles lese bekomme ich Bauchschmerzen, warte nur noch auf die 980pro 1tb und habe angst anzufangen mit aufbau.

PS. sind das den jetzt Cpu defekte oder liegts am Bios
 
Deswegen kaufe ich nie Hardware, die erst kurz auf dem Markt ist. Lieber ein paar Monate Zeit verstreichen lassen, dann sinken Fehler und Preise. Ich mache nie wieder den Beta-Tester, für keinen Hersteller.
 
  • Gefällt mir
Reaktionen: PusteBlume0815
Hektor26 schrieb:
sind das den jetzt Cpu defekte oder liegts am Bios

Ist bisher nicht klar zu erkennen.
Es gibt einige die eine neue CPU getestet und keine Probleme mehr haben, es gibt aber auch Leute die 3 Prozessoren (hauptsächlich 5900X und 5950X) getestet haben und alle machen Probleme. (Mainboards wurden mit Zen2 getestet und sind ok)

therealcola schrieb:
Zu viel Overclock zu wenig Spannung angelegt

Zu pauschal...

Auf Default-Einstellungen der gleiche Fehler.
Anderes Mobo, RAM, Netzteil, SSD etc. der gleiche Fehler.
Alle Bios-Versionen / neues Agesa -> der gleiche Fehler.
Zweite oder gar dritte Zen3-CPU getestet -> der gleiche Fehler. (Im freien Handel gekauft - RMA´s die direkt über AMD getätigt wurden, laufen bisher komischerweise stabil) Ein Schelm wer...ihr wisst schon.
Zen2 läuft (wobei auch Zen2-Nutzer von Problemen mit neuem Bios berichten - mit altem Bios laufen die Systeme wieder stabil)

In diversen Foren (hier auf CB mittlerweile auch " Vermeer-t " / Igor´s Lab / ASUS ROG / Hardwareluxx / Reddit usw) unzählige Zen 3 Nutzer, die das gleiche Problem haben.
Von anderen Leuten, die den ganzen Tag scheinbar nur lustige Katzenbilder und Youporn gucken, wird das Problem nicht wahrgenommen, relativiert, geleugnet.
Angeblich unabhängige Redakteure halten sich vermutlich still, weil sie es sich mit AMD nicht verscherzen wollen.
Wie bei Nvidia und Hardware Unboxed. Da gab es zumindest eine beleidigte Hass-Mail die der Betroffene als Beleg veröffentlichen konnte.
In Zukunft lässt man die Leute einfach kommentarlos verhungern. Keine Test-Samples mehr etc.

Warum haben dann aber nicht alle das Problem - bei anderen läuft es doch:

Einige melden erst nach Wochen Probleme, da die Systeme bisher stabil liefen und nun plötzlich, ohne Änderung am System, die gleichen Fehler auftreten.
Nutzer bemerken einen spontanen Neustart nicht immer gleich, da sie nicht durchgehend am PC sitzen und es erst feststellen wenn sie die Ereignissanzeige durchstöbern. Dann kommt der Satz " Bin nun doch davon betroffen " (Alles schon gelesen)
Weil einige Prozessoren vermutlich aufgrund ihrer schlechten elektrischen Güte aus dem Raster fallen / nicht die Spezifikationen einhalten -> im Grunde Ausschuss verkauft wurde.
Weil sie alles verticken was sich halbwegs booten lässt. Sollen doch die Mobo-Hersteller zusehen wie sie es gefixt kriegen... (den schwarzen Peter zuschieben)

Einige hören scheinbar tatsächlich zum ersten mal von diesen Problemen.
Das Thema wird aber an anderen Stellen von vielen Betroffen seit Wochen durchgekaut. Ist also nicht neu und vor allem - viel weiter verbreitet - als manch einer vermutet / zugeben will.
 
Zuletzt bearbeitet:
Im Ordner C:/Windows/Minidump
befinden sich die Informationen zum blue screen.
Die letzten fünf Files auf den Desktop kopieren.
Mit rar oder zip verpacken.
Hier im Forum hoch laden.
 
Harter Tobak wenn man das so liest ... betrifft also nur 5900x & 5950?
 
Zuletzt bearbeitet:
BassCatBall schrieb:
Von anderen Leuten, die den ganzen Tag scheinbar nur lustige Katzenbilder und Youporn gucken, wird das Problem nicht wahrgenommen, relativiert, geleugnet.
Schrieb BassCatBall, welcher als Forum-Name nen Katze involviert und als Avatarbild ebenso. :evillol: Die Bösen Katzenliebhaber!!!
 
BassCatBall schrieb:
Weil einige Prozessoren vermutlich aufgrund ihrer schlechten elektrischen Güte aus dem Raster fallen / nicht die Spezifikationen einhalten -> im Grunde Ausschuss verkauft wurde.
Weil sie alles verticken was sich halbwegs booten lässt.
Krude und eine völlig haltlose Aussage die jeder belegbaren Grundlage fehlt.

Sry aber das ist einfach nur Bullshit

Bei reddit sind es 32, bei overlock sind es 13 Beiträge. Sucht man im Netz, gab es schon früher WHEA Error Meldungen.

Was ist überhaupt WHEA?

Windows Hardware Error Architecture (WHEA) is an operating system hardware error handling mechanism introduced with Windows Vista and Windows Server 2008 as a successor to Machine Check Architecture (MCA) on previous versions of Windows.[1] The architecture consists of several software components that interact with the hardware and firmware of a given platform to handle and notify regarding hardware error conditions.[2] Collectively, these components provide: a generic means of discovering errors, a common error report format for those errors, a way of preserving error records, and an error event model based up on Event Tracing for Windows (ETW).[3]

WHEA "builds on the PCI Express Advanced Reporting to provide more detailed information about system errors and a common reporting structure."[4]

WHEA allows third-party software to interact with the operating system and react to certain hardware events. For example, when a new CPU is added to a running system—a Windows Server feature known as Dynamic Hardware Partitioning—the hardware error component stack is notified when a new processor is installed.[5]

Linux supports the ACPI Platform Error Interface (APEI) which is introduced in ACPI 5.0.[6]
https://en.wikipedia.org/wiki/Windows_Hardware_Error_Architecture

WHEA ist NICHT CPU spezifisch!



Ein älteres Beispiel

https://h30434.www3.hp.com/t5/Noteb...ecovery/WHEA-UNCORRECTABLE-ERROR/td-p/7056869
https://superuser.com/questions/1162992/whea-uncorrectable-error-what-now
https://support.hpe.com/hpesc/public/docDisplay?docId=emr_na-c03282091

Zudem. Ein Fehler muss nicht zwingend problematisch sein... Habt ihr mal eure Event Logs von Windows angeschaut? Tausende von Einträgen... aber darüber redet ihr nicht....


Dies ist zum Beispiel von einen vorgestern frisch aufgesetzten System, welche nur Treiber installiert hat 20H2.

Unbenannt.JPG


x470 und 3700X
 
Harsiesis schrieb:
Habt ihr mal eure Event Logs von Windows angeschaut? Tausende von Einträgen... aber darüber redet ihr nicht....

Hab ich doch erwähnt:

BassCatBall schrieb:
Nutzer bemerken einen spontanen Neustart nicht immer gleich, da sie nicht durchgehend am PC sitzen und es erst feststellen wenn sie die Ereignissanzeige durchstöbern. Dann kommt der Satz " Bin nun doch davon betroffen " (Alles schon gelesen)

Dein Screen ist " Bullshit "
Wieviele Einträge hast Du unter " Kritisch " ?
NULL !
Ich hatte genügend Fehler unter " Kritisch ". (Kernel)

Was hängst Du Dich eigentlich so an WHEA auf und ignorierst alles andere?
 
BassCatBall schrieb:
Hab ich doch erwähnt:



Dein Screen ist " Bullshit "
Wieviele Einträge hast Du unter " Kritisch " ?
NULL !
Ich hatte genügend Fehler unter " Kritisch ". (Kernel)

Was hängst Du Dich eigentlich so an WHEA auf und ignorierst alles andere?
Du spamst überall das WHEA zeugs rum.

Mit dem Screenshot zeige ich, dass selbst ein frisch installiertes Windows Fehler produziert - und das in Massen....

Hier meines. Das Windows ist Jahre alt. Nie neu installiert

1608500410460.png


Uhhhhh ein WHEA... Trotzdem ist das System nicht wegen dem gecrasht. Und ja, ich merke und sehe ob das System neu gestartet wenn er 24h läuft.
 
Zurück
Oben