Ryzen 5900X, Rechner geht aus

sebastian_uniq

Cadet 1st Year
Registriert
Nov. 2020
Beiträge
13
Hallo Community, ich brauche eure Hilfe!

Erst das System:
  • Ryzen 9 5900X @ Stock - kein OC!
  • Artic Liquid Freezer II 360 als Wakü für die CPU
  • MSI MPG X570 GAMING PRO CARBON WIFI - 7B93v1B1(Beta version) 2020-11-16 (aktuellstes)
  • BeQuiet Pure Power 11 CM 700W
  • 2 * 16 GB G.Skill Trident Z Neo Ram - 3600MHZ XMP Profil ist geladen - Ram steht in der QVL des Mainboards
  • Nvidia RTX 2080 TI (Hab ich seit 2018, restliche Komponenten sind neu)
  • AMD Chipset Software 2.10.13.408 (auch aktuellstes)
  • Windows 10 20H2 aktuellste Patches
Jetzt das Problem:
Mein Rechner startet 1 bis 2 mal am Tag einfach neu (~ 8h Laufzeit pro Tag), manchmal bleibt es auch zwei Tage ruhig. Im Ereignismanager kann ich das "Problem" bis zum Fehler WHEA-Logger Ereignis-ID 18 zurückführen:
  • Gemeldet von Komponente: Prozessorkern
  • Fehlerquelle: Machine Check Exception
  • Fehlertyp: Cache Hierarchy Error
  • Prozessor-APIC-ID: 8
Im Internet steht dazu, dass das auf eine defekte CPU hinweisen kann, das Netzteil zu schwach ist (Spannungsspitzen), oder die Treiber (Bios, AMD Chipset, Windows..) schuld sind.
Das Netzteil habe ich getestet, in dem ich die Grafikkarte(GPU Dauerbench) und CPU(Prime95) auf 100 % Auslastung geschickt habe für etwas über eine Stunde. ~450W habe ich mit dem Stromzähler gemessen. Die 700W sollten also reichen, oder? Selbst Spannungsspitzen sollte es abfangen, oder? (Netzteil ist Multirail 12v1 / 30A u. 12v2 36A Schiene)
Jemand schrieb, dass evtl. die Energieoptionen von Windows schuld sind, Ausbalanciert und Höchstleistung habe ich probiert, Problem bleibt.
Ich habe sogar zwei frühere Biospatches getestet, gleiches Problem.
Mir macht das Problem von Tag zu Tag halt mehr Kopfschmerzen.
Der "Absturz" des Systems passiert leider unreproduzierbar.
Einmal hatte ich einen innerhalb von 5 Minuten nach einem frischen Windows Start.

Jetzt kommt ein weiteres(?) Problem dazu. Bei jedem zweiten / dritten Crash informiert mich das BIOS beim Starten, dass die CPU zu heiß ist. Schlauch, Radiator und Kühler angefasst, alles lauwarm. Von unten und vorn wird angesaugt und nach hinten und oben rausgepustet. Nach direktem Start vom Crash ins BIOS, stand jetzt beim letzten Mal die Temperatur der CPU bei 75°C und dann wird es komisch! Ich kann zusehen wie die Temperatur im BIOS stetig steigt. Im Sekundentakt und 2°C Schritten geht die Temperatur bis 95°C hoch und dann geht der Rechner aus und bleibt aus. Dann warte ich 2 bis 3 Minuten, starte Windows und HWInfo sagt, dass die CPU 30°C im Idle hat... . Das kann niemals ein Auslesefehler sein, ist das Mainboard also einfach nur schlecht, oder vielleicht sogar defekt?
Ich habe testweise Prime95 etwas über eine Stunde laufen lassen, 100 % Auslastung, kein Problem, ~4,65Ghz Allcore, 78°C Maximum. Ich habe auch den Kühler ein zweites mal montiert und komplett neue Paste aufgetragen und trotzdem kommt das "Hitzeproblem".
Über Rivatuner hab ich auch ein OSD laufen und selbst in Cyberpunk bleibt die CPU bei entspannten 60-75°C.

Ich weiß nicht weiter. Woran kann es denn noch liegen? Hat jemand ähnliche Probleme?
Ich spiele 5 Stunden am Stück Cyberpunk und habe null Probleme.
Dann spiele ich eine Stunde Phasmophobia mit Freunden und der Rechner startet zwei mal neu.

Vielen Dank schon mal für alle die sich den langen Text angetan haben!
Ich hoffe ihr habt noch ein paar Ideen die ich probieren kann.

Grüße Sebastian
 
Hallo, die Pumpe ist bei PWM am Mainboard angesteckt. HWMonitor zeigt unter Fans zwei Werte an. Einmal Pump (~1700Rpm) und einmal Sys fan 2(~750Rpm). Ich denke, dass der erste Wert für die Pumpe zählt und der zweite für den kleinen Lüfter auf der AIO. Überwacht hatte ich das nur über HWMonitor und bisher stann da nie 0RPM oder ähnliches. Habe leider kein zweiten Kühler zum Testen.
 
Hallo, ich habe hier noch ein BeQuiet 750W Power Zone liegen.
Hat 5 Jahre lang im alten Rechner gearbeitet.
Also könnten Spannungsspitzen das Problem sein, weil die einzelnen 12V Schienen zu wenig Ampere haben?
Im Internet finde ich leider nichts dazu, wie stark eine einzelne 12V Schiene sein muss für ein 5900X. Aber dann werde ich das auf alle Fälle als nächstes testen.
 
sebastian_uniq schrieb:
Also könnten Spannungsspitzen das Problem sein, weil die einzelnen 12V Schienen zu wenig Ampere haben?
Netzteile können eine Menge Defekte haben, die Wahrscheinlichkeit steigt mit dem Alter.
Aber als Laie nicht diagnostizierbar, das könnte evtl. Igor mit Profi Equipment.

Habe letztens auch erst ein kleines beQuiet tauschen müssen aufgrund Idle-Abstürzen.
 
Das Pure Power 11 habe ich erst vor einem Monat gekauft.
Das werde ich morgen mit dem Power Zone 750W auswechseln.

Das würde dann aber nicht die seltsamen Temperaturen nach einem Neustart erklären, oder?
Im Bios liegt doch keine so hohe Spannung an der CPU, dass die auf >95°C geht.
Das müsste doch ratzfatz abkühlen.
 
Das müssten bei HWMonitor doch MOS und CHIPSET sein, oder? Spiele gerade Genshin Impact und so sehen sie aus:
CPU_Temp.png
 
Prüf mal im BIOS gegen, 1v auf der 5v Leitung sieht komisch aus ;)

Und den RAM auf 3200 begrenzen, alles darüber ist oc.
 
firexs schrieb:
Prüf mal im BIOS gegen, 1v auf der 5v Leitung sieht komisch aus
Oder aber:
Multimeter auf V=/DC stellen, schwarzes Kabel des Multimeters an schwarzes Kabel eines Molex Steckers des Netzteils halten und rotes Kabel an rotes Kabel
 
Was hast du für ein Gehäuse?
Deine Temps in Prime sind ziemlich hoch. Bei mir komme ich mit dem gleichen Board und einem 5950X + Noctua D15s nie auf >65 Grad.

Und Volllast auf allen Kernen ist unproblematisch! Problematisch ist die Auslastung auf 1-4 Kernen. D.h. in Spielen oder anderen weniger anspruchsvollen Szenarien kann die CPU deutlich heißer werden.

Starte doch mal Prime mit 3 Threads und schaue, ob deine Config die Temperaturen von 90 Grad (bei mir der Worst Case) überhaupt halten kann. Ich vermute nicht.

Hängt deine Lüfterkurve an der CPU Temp? Am Sockel oder an einem anderen Sensor wäre fatal.
 
Also im Bios zeigt er die 5V richtig an. Konnte das aber nur über den Hardwaremonitor des BIOS sehen.
Weiß nicht warum das HWMonitor falsch ausliest.

Beim RAM habe ich nur das XMP Profil geladen. Der wird ja von G.Skill so verkauft - Mindfactory Link
Aber ich kann den testweise auch ohne XMP laufen lassen. Ohne läuft er mit 2133MHZ.

Selbst wenn die Pumpe ausfällt und das Wasser im Schlauch steht, sollte der Schlauch doch fühlbar warm sein, ist er aber nie. Und dann müsste doch der Rechner sehr viel öfter unter Last crashen. Weil im Idle Zustand oder wenn Firefox / Youtube läuft die Last bei "Passivkühlung" nie so hoch wäre, dass die CPU Temp auf über 95°C schnellt.

Die ansteigende BIOS Temperatur halte ich für einen Auslesefehler. Denn die extra Popup Nachricht vom Bios "CPU Temperatur 95°C" kommt schon direkt beim Start und ein paar mal während ich im BIOS bin. Auch wenn es dann trotzdem ~10 Sekunden dauert, bis das System wieder ausgeht.

Vielleicht sind das auch zwei unterschiedliche Probleme die aufeinander treffen.

Aber ersteinmal werde ich das Netzteil tauschen und den Ram auf 2133MHZ setzen.
Danke bis hierher!
Ergänzung ()

Prime Test mit 3 Threads mache ich morgen. Ich hab das Kabel der Pumpe an den Mainboard Steckplatz gesteckt an dem Pump_Fan1 steht. Es gibt noch einen CPU_Fan Steckplatz, aber laut der Aussage vom Moderator des Artic Youtube Channels spielt das keine Rolle, da beide PWM unterstützen. Im Bios ist auch PWM ausgewählt und das Default Preset geladen. Es gibt noch eine "Smart Kurve" die ich laden kann. Ansonsten wüsste ich nicht wie ich sowas umändern könnte. Die Pumpe selber hat auch einen Sensor und regelt die Umdrehungen alleine.

EDIT: Das Gehäuse ist ein LC-POWER 978BG Tank-Buster mit Sichtfenster.
 
Zuletzt bearbeitet:
nimm anstatt HWMonitor besser HWInfo, das taugt mehr.
 
Hallo Community,

ich habe jetzt mittles HWInfo alle 2 Sekunden die Temperatur mitloggen lassen. Nebenbei lief Prime95 für eine Stunde mit 3 Threads und Small FFT's als Option und ich habe dazu Minecraft (Single Threaded Game) angemacht.
Die Temperatur stieg bis zuletzt auf 89°C (Tctl/Tdie), wobei die CPU CCD1 auch manchmal die 90°C angezeigt hat. Das ist viel zu hoch, oder?

Verwundert hat mich während des Test's, dass der Takt der Kerne nie über 4,625Ghz ging.
Ist das vielleicht ein Auslesefehler, weil der Takt zu kurz anlag um richtig ausgelesen zu werden? Falls nicht, würde die Temperatur bei 4,8Ghz - 4,9Ghz noch einmal viel höher liegen.

Ich habe dann Ryzen Master geöffnet um mir dort die Taktfrequenz anzeigen zu lassen, war aber der gleiche Takt.
Was ich erstaunlich fand war, dass das Tool mir anzeigt, dass die Temperatur der CPU auf 90°C begrenzt ist.
Das System wäre also jeden Moment ausgestiegen.

Die Schläuche sind nicht warm geworden (gut, die sind super isoliert). Die Luft, die die Lüfter durch den Radiator drücken ist auch kühl. Bei der Temperatur müsste die Pumpe auf 100% / 2000RPM laufen und damit hörbar sein, aber nichts da. Ich spüre auch keine Vibration wenn ich die Schläuche anfasse.
Im Bios habe ich auch heute gesehen, dass das PWM auf die CPU Temperatur eingstellt ist, so soll es ja sein.

Es deutet also alles auf eine defekte Pumpe hin. Ein Hoher Boost Takt in Single Threaded Anwendungen (Minecraft / Phasmophobia / CSGO), lassen das System crashen. Ich kontaktiere jetzt Arctic deswegen.

Klingt das für euch plausibel?

Grüße Sebastian

EDIT: Macht es sinn, die AIO umzutauschen, oder sollte ich lieber einen anderen Hersteller probieren?
 
sebastian_uniq schrieb:
ich habe jetzt mittles HWInfo alle 2 Sekunden die Temperatur mitloggen lassen. Nebenbei lief Prime95 für eine Stunde mit 3 Threads und Small FFT's als Option und ich habe dazu Minecraft (Single Threaded Game) angemacht.
Die Temperatur stieg bis zuletzt auf 89°C (Tctl/Tdie), wobei die CPU CCD1 auch manchmal die 90°C angezeigt hat. Das ist viel zu hoch, oder?

Das ist doch Prima - d.h. dein Rechner kann mit der Temperatur im Worst-Case umgehen und überhitzt nicht (>95°)! Das ist ja genau das, was wir herausfinden wollten. Die 90° habe ich auch mit drei Threads und sind wohl unvermeidbar.
Also scheint deine Kühlung an sich zu funktionieren

Jetzt stellt sich nur noch die Frage, wieso dein Rechner manchmal bereits im BIOS trotzdem anzeigt, dass er überhitzt. Komisch. Eine spontane Antwort habe ich auch nicht. Ich hätte erwartet, dass er bei dem Test mit 3 Threads sofort über die Max-Temperatur schießt und aussteigt. Ist er aber nicht.

till69 schrieb:
Wie wäre es hiermit? Leise und sorgenfrei ;)
Leider ist das nicht so. Habe den D15S drauf und trotzdem schießen die Temperaturen in bestimmten Szenarien nach oben und (schlimmer) bei geringerer Auslastung gibt es immer wieder Spitzen um die 65°-70°. Auch eine AIO hilft hier nicht weiter.
Darum geht es auch genau in dem Heise-Artikel (Einleitung reicht): https://www.heise.de/ratgeber/AMD-R...-wird-die-CPU-leiser-und-kuehler-4985805.html
 
  • Gefällt mir
Reaktionen: Volvo480
Zurück
Oben