WHEA ID1 i5 Gigabyte B760 DS3H DDR4

Eiskratzer

Newbie
Registriert
Jan. 2024
Beiträge
5
Hallo liebe Leute.

Habe mich eben hier erst registriert, hoffe dass ich euch alles relevante mitliefere.
Falls nicht verzeiht mir bitte, ich liefere dann gerne nach was fehlt.

Ich bin kein völliger Noob und habe schon ein paar PCs in meinem Leben zusammengebaut und kenne deshalb einige der Probleme die bei so etwas auftreten können. Aber in diesem Fall bin ich ratlos und auch das Web konnte mich nur in etwa die Richtung, aber nicht zum Ziel bringen.

Bis auf die Grafikkarte und das Gehäuse sind alle Bauteile vor rund 2 Monaten neu gekauft worden. Meine Frau konnte den Rechner rund 4 Wochen ganz normal nutzen und ihre Spiele spielen. Nach etwa einem Monat kam aber der erste BSOD und seit rund 2 Wochen startet er unregelmässig und nicht reproduzierbar unvermittelt neu.

Problem:
  • PC stürtzt unvermittelt ab, friert ein und startet nach 2-3 Sekunden neu. (BSOD habe ich nur 1x gesehen)
  • Fehler tritt unabhängig von Last oder Nutzung auf, auch wenn er eine Weile vor sich hinidlet startet er immer wieder mal neu. Kann 3 mal am Tag sein oder auch mal 2 Tage nicht.
  • Ereignisanzeige zeigt WHEA-Logger Ereignis ID1

Hardware:
  • Board: GIGABYTE B760 DS3H DDR4
  • CPU: intel i5 13400
  • CPU Kühler: Noctua NH-U12S redux, mit 2 Lüftern
  • RAM: 2x Mushkin Proline DIMM 16GB, DDR4-3200
  • Grafikkarte: GeForce GTX1070 von evga (soll später irgendwann mal ersetzt werden, wenn sie für meine Frau nicht mehr ausreicht oder irgendwann den Geist aufgibt)
  • Netzteil: be quiet! Pure Power 12 M 850W ATX 3.0
  • Festplatte: Samsung SSD 990 PRO 1TB, M.2
  • Datengrab: 1,5 TB SATA HDD (ST31500341AS)
  • Gehäuse ist ein älterer Midi-Tower der mit jeweils einem 120er vorne und hinten be- und entlüftet wird.
  • alles mit Standardeinstellungen, kein OC oder OV
  • kabellose Logitech Maus M705
  • Logitech G213 Tastatur
  • installiert ist Windows 10 Pro 22H2, alle Updates (ausser dem fehlschlagenden WinRE)

Was ich bisher versucht/gemacht habe:
  • BIOS aktualisiert F6 auf F8 (21.12.2023)
  • Chipsatztreiber usw erneut installiert, auch nVidia Treiber aktualisiert
  • sämtliche Kabel und gesteckte Komponenten gecheckt, sitzt alles korrekt
  • RAM Riegel jeweils einzeln getestet, keine Fehler gefunden
  • CPU mit Intel Tool in Version 4.1.9.41 getestet, angeblich OK
  • diverse Stresstests mit FurMark und HeavyLoad, sowohl einzeln auch CPU, GPU und RAM gleichzeitig. Keine Fehler oder merkwürdiges Verhalten. CPU-Temperatur pendelt dabei um 58°C, GPU-Temperatur um 68°C.


Nachdem er vorhin nochmal ohne Aufforderung neu gestartet hat:
- C:\Windows\LiveKernelReports\WHEA\WHEA-20240119-0902.dmp mit WinDbg geöffnet:


6: kd> !analyze -v ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* WHEA_UNCORRECTABLE_ERROR (124) A fatal hardware error has occurred. Parameter 1 identifies the type of error source that reported the error. Parameter 2 holds the address of the nt!_WHEA_ERROR_RECORD structure that describes the error condition. Try !errrec Address of the nt!_WHEA_ERROR_RECORD structure to get more details. Arguments: Arg1: 0000000000000007, BOOT Error Arg2: ffffa38ca16cb150, Address of the nt!_WHEA_ERROR_RECORD structure. Arg3: 0000000000000000 Arg4: 0000000000000000 Debugging Details: ------------------ KEY_VALUES_STRING: 1 Key : Analysis.CPU.mSec Value: 1687 Key : Analysis.Elapsed.mSec Value: 1729 Key : Analysis.IO.Other.Mb Value: 0 Key : Analysis.IO.Read.Mb Value: 0 Key : Analysis.IO.Write.Mb Value: 0 Key : Analysis.Init.CPU.mSec Value: 280 Key : Analysis.Init.Elapsed.mSec Value: 31419 Key : Analysis.Memory.CommitPeak.Mb Value: 81 Key : Bugcheck.Code.LegacyAPI Value: 0x124 Key : Dump.Attributes.AsUlong Value: 18 Key : Dump.Attributes.KernelGeneratedTriageDump Value: 1 Key : Failure.Bucket Value: LKD_0x124_7_GenuineIntel__UNKNOWN_IMAGE_GenuineIntel.sys Key : Failure.Hash Value: {5ea80f6a-69bf-5d6f-8fd2-cd87deb91a03} BUGCHECK_CODE: 124 BUGCHECK_P1: 7 BUGCHECK_P2: ffffa38ca16cb150 BUGCHECK_P3: 0 BUGCHECK_P4: 0 FILE_IN_CAB: WHEA-20240119-0902.dmp DUMP_FILE_ATTRIBUTES: 0x18 Kernel Generated Triage Dump Live Generated Dump PROCESS_NAME: smss.exe STACK_TEXT: ffff8605`c115a0d0 fffff802`42d6095f : ffffa38c`a16cb130 00000000`00000000 ffffa38c`a16cb150 00000000`00000022 : nt!LkmdTelCreateReport+0x139 ffff8605`c115a610 fffff802`42d60856 : ffffa38c`a16cb130 fffff802`00000000 00000009`00000000 00000009`c637f700 : nt!WheapReportLiveDump+0x7b ffff8605`c115a650 fffff802`42bd3e7d : 00000000`00000001 ffff8605`c115aac0 00000009`c637f700 00000000`00000260 : nt!WheapReportDeferredLiveDumps+0x7a ffff8605`c115a680 fffff802`42a883f7 : 00000000`00000000 ffffa38c`a5a23530 00000000`00000103 00000000`00000000 : nt!WheaCrashDumpInitializationComplete+0x59 ffff8605`c115a6b0 fffff802`42811235 : ffffa38c`a7520000 ffffa38c`a7659600 ffff8605`c115aac0 ffffa38c`00000000 : nt!NtSetSystemInformation+0x1f7 ffff8605`c115aa40 00007ffe`aa190554 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiSystemServiceCopyEnd+0x25 00000009`c637f6a8 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : 0x00007ffe`aa190554 MODULE_NAME: GenuineIntel IMAGE_NAME: GenuineIntel.sys STACK_COMMAND: .cxr; .ecxr ; kb FAILURE_BUCKET_ID: LKD_0x124_7_GenuineIntel__UNKNOWN_IMAGE_GenuineIntel.sys OSPLATFORM_TYPE: x64 OSNAME: Windows 10 FAILURE_ID_HASH: {5ea80f6a-69bf-5d6f-8fd2-cd87deb91a03} Followup: MachineOwner --------- 6: kd> !errrec ffffa38ca16cb150 =============================================================================== Common Platform Error Record @ ffffa38ca16cb150 ------------------------------------------------------------------------------- Record Id : 01da4aade4dfc34b Severity : Fatal (1) Length : 3552 Creator : Microsoft Notify Type : BOOT Error Record Timestamp : 1/19/2024 8:02:50 (UTC) Flags : 0x00000002 PreviousError =============================================================================== Section 0 : Firmware Error Record Reference ------------------------------------------------------------------------------- Descriptor @ ffffa38ca16cb1d0 Section @ ffffa38ca16cb2a8 Offset : 344 Length : 2592 Flags : 0x00000000 Severity : Fatal =============================================================================== Section 1 : Firmware Error Record Reference ------------------------------------------------------------------------------- Descriptor @ ffffa38ca16cb218 Section @ ffffa38ca16cbcc8 Offset : 2936 Length : 544 Flags : 0x00000000 Severity : Fatal =============================================================================== Section 2 : Firmware Error Record Reference ------------------------------------------------------------------------------- Descriptor @ ffffa38ca16cb260 Section @ ffffa38ca16cbee8 Offset : 3480 Length : 72 Flags : 0x00000000 Severity : Fatal


In C:\Windows\Minidump\ ist das neueste vom 17.01.: 011724-5953-01.dmp

Nur kann ich mit all diesen Angaben nicht wirklich etwas anfangen, deshalb hoffe ich, dass jemand von euch es kann und mir auf die Sprünge hilft, was in der Kiste schief läuft und ob nzw wie man es gerade biegen kann.

1x Minidump und 1x WHEA Dump habe ich angehangen.


Besten Dank schonmal
 

Anhänge

  • Dumps.zip
    335,9 KB · Aufrufe: 35
Naja, die Kontakte am Board sitzen richtig. Der Button reagiert normal und zuverlässig, wüsste jetzt nicht wie ich den darüber hinaus noch testen kann.
 
VDroop.
CPU bekommt unter (Teil)-Last zu wenig Saft.
Sowas können Furmark & CO nicht abbilden.

LLC CPU anpassen.

Vdroop verursacht einen Abfall der CPU Spannung, wenn die Last steigt. Das System schafft es dann nicht, die gesetzten Core-Spannung (vCore) zu halten, welche benötigt wird, um das System stabil zu halten. Unter hoher Last fällt die CPU-Versorgungsspannung, was zu Crashes und Bluescreens führt.
 
Ich weiss, war viel Text von mir, aber
Eiskratzer schrieb:
Fehler tritt unabhängig von Last oder Nutzung auf, auch wenn er eine Weile vor sich hinidlet

Eiskratzer schrieb:
diverse Stresstests mit FurMark und HeavyLoad, sowohl einzeln auch CPU, GPU und RAM gleichzeitig. Keine Fehler oder merkwürdiges Verhalten
 
Eiskratzer schrieb:
wüsste jetzt nicht wie ich den darüber hinaus noch testen kann.
RESET_SW am Frontpanel vom Mainboard abstecken, vielleicht sogar POWER_SW und erstmal überbrücken.

Da wäre halt gut zu wissen wie genau der Neustart aussieht, gibt ja mehrere (unterschiedliche).
 
Drewkev schrieb:
...und erstmal überbrücken...
Oh, ok, ja, das wäre eine Möglichkeit.
Aber will ich die Pins wirklich mit einem Schraubendreher überbrücken?
Die brauchen doch nur kurz Kontakt, also keinen Jumper?
 
MB ist halt nen Billigboard, die oberen Spannungswandler haben keinen Kühlkörper. Aber da du ja schreibst, dass das Problem auch im Idle passieren kann und du schon fast alles mal getestet hattest, würde ich mal das NT noch in den Raum schmeißen.

Ansonsten analytisch vorgehen, Minimalkonfiguration mit frischem Windows bauen. Grafikkarte, RGB-Software und anderer Klimbim brauchst z.B. nicht, wenn der Fehler auch im Idle oder beim Browsen auftreten kann. Dann hast du da nen NT, MB, CPU, RAM, SSD, Maus+Tastatur und an einem von denen wird dein Problem liegen. Software/Treiber hast du mit dem frischen Windows schon ausgeschlossen.

Tritt der Fehler selbst mit Minimalkonfig und frischem Windows auf, tippe ich mal auf ein Problem mit der CPU bzw. der Spannungsversorgung der CPU. WHEA 124 ist eigt. recht typisch bei sowas. Das betrifft vor allem auch die Lastwechsel, Wechsel in höhere C-States etc.

Was man dann testen könnte, wäre eine manuell festgelegte Taktfrequenz bei fester Spannung (z.B. 4GHz @1.2V) und komplett deaktivierten C-States und sonstigen Energiespareinstellungen im UEFI. Dann hat man diese Spannungswechsel nicht.

Edit: Feste Taktfrequenzen und Spannungen müssen natürlich für P- und E-Cores gesondert festgelegt werden.
 
Zuletzt bearbeitet:
Also erstmal danke für eure Hilfe (und ein paar nützliche Denkanstösse für eventuelle zukünftige Hürden die übersprungen werden wollen), aber das Problem war dann doch ganz anderer Art und hatte rein gar nichts mit der Hardware zu tun.

Die Gute hatte Kaspersky auf dem Rechner und nicht richtig deinstalliert.
Hab das Removaltool drüber laufen lassen und seit dem läuft alles wieder so wie es soll.
Keine Freezes, keine Neustarts, keine Fehlermeldungen im Protokoll.

Also machts gut und danke für den Fisch
 
Eiskratzer schrieb:
WHEA_UNCORRECTABLE_ERROR (124) A fatal hardware error has occurred.
Ich würd mich nicht zu früh freuen. Dass Kaspersky (oder Reste von Kaspersky) WHEA 124 hervorruft, les ich grad zum ersten Mal. Aber gut, wenns läuft, umso besser.
 
Zurück
Oben