Neuer Rechner rebootet unter Last

martman

Cadet 1st Year
Dabei seit
Dez. 2018
Beiträge
9
Moin,

mein über Ostern neu zusammengebauter Rechner rebootet nach einiger Zeit (10 bis 20 Minuten) unter hoher Last (Spiele - z.B. Borderlands 3, Divinity original Sin 2, Anno 1800). Spiele mit niedriger Last (Civ 6, Rise of the Tomb Raider) laufen diese Zeit Problemlos durch.

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden(zusätzliche Bilder könnten z.b. hilfreich sein):

Unter hoher Last auf die Grafikkarte (aufwändige Spiele) rebootet der Rechner nach einiger Zeit (anfangs 5 Minuten, mittlerweile ca. 10 bis 20 Minuten).
Ram- und CPU Stresstests liefen immer Problemlos durch. Grafikkartentests liefen mit neuem Netzteil und Anpassung der Spannung der RAM-Riegel auch länger (z.B. Anno 1800 DX11 Benchmark, das ich immer als Test genommen hatte, da er hier anfangs immer abstürzte).
Ereignisanzeige gibt einen kritischen Kernel-Power Fehler mit der ID 41 raus. Ab und zu auch einen WHEA-Fehler (ID 11 und 18), wenn der Rechner vorm Absturz in einem Bluescreen hängen geblieben ist (Fehlercode: WHEA_uncorretable_Error).


3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Alle Treiber sind aktualisiert (mit DriverEasy kontrolliert).
Alle bekannten Prozeduren zu dem Fehler oben wurden durchgeführt (Windows-Speichertest, Win Neuinstallation, Festplattencheck (checkdisk)).
Bios ist auf neuester Version (A64).
Aufgrund des Verdachtes zu geringer Leistung wurde das Netzteil getauscht, was etwas Verbesserung (Abstürze kamen etwas später) brachte.
Spannung des RAM im BIOS angepasst an die von MSI vorgegebenen Werte (von Auto (=1,2 V) auf 1,35V). Dies brachte in Kombination mit dem Abschalten des Neustarts nach Abstürzen bisher die größte Verbesserung, ich konnte 20 Minuten Borderlands spielen, bevor das System wieder abstürzte.
Das Diagnosetool OCCT lieferte vor dem Netzteiltausch einen Crash beim Test der Grafikkarte. CPU, Ram und GPU-Speichertests liefen ohne Probleme durch. Nach dem Tausch des Netzteiles und der Erhöhen der Spannung beim RAM lief auch der Grafikkartentest 12 Minuten durch. Ein längerer Test folgt, sobald ich dafür Zeit habe.

Ich habe keine Ahnung, was man noch machen könnte, um das Problem einzugrenzen, bzw. welches der Bauteile ich als defekt zurückschicken kann.... ich hoffe hier hat jemand eine Idee.

viele Grüße
 

Questionmark

Commander
Dabei seit
Feb. 2015
Beiträge
2.380
1. Driver Easy bitte weglassen
2. Evtl. mal kein BQ Netzteil nutzen, ich habe hier in der letzten Woche 3 BQ Netzteile von Kunden getauscht, die obwohl neu genau die selben Symptome zeigten, ich habe den Kunden dann Chieftec Netzteile verbaut
und das Problem war behoben, scheint also tatsächlich irgendetwas nicht zu stimmen.
3. Lies mal den Hersteller der Speicherchips aus, Micron wäre ideal, Samsung geht, Hynix ist nicht zu empfehlen, in seltenen Fällen können auch diese Reboots verursachen.
 

Deathangel008

Grauer Jedi
Dabei seit
Jan. 2014
Beiträge
60.947
wer dreht den leuten immer die System Power 9 mit 600W/700W an? hängt die graka beim SP11 an 12V3 und 12V4 (siehe handbuch)?
 

Zwisch

Lt. Junior Grade
Dabei seit
Jan. 2019
Beiträge
377
WHEA und Ryzen 5000 ist doch eine bekanntere Problematik, die durch neuere Agesa Versionen (neues BIOS) gelöst werden soll.

Aber mal als Vorschlag: RAM mal auf 2133 eine Zeit lang laufen lassen, und gucken, wie sich das System dann verhält. (14CL bei 3200 halt auch kein Massen RAM)
 

T3mp3sT1187

Commander
Dabei seit
Jan. 2011
Beiträge
2.254
WHEA 18 ist in der Regel ein Problem von inkorrekter VDDG CCD... ich kann sie mit meinem 5950X darüber reproduzieren... Beim Laden von XMP/DOCP setzt das Board eine beliebige Spannung, die nicht unbedingt funktionieren muss...
 

Kryss

Lt. Commander
Dabei seit
Sep. 2018
Beiträge
1.486
Es schadet auch sicher nicht, die Grafikkarte zu undervolten (und sei es nur testweise...). Zur Fehlerbegrenzung.

vg Chris
 

Keine Geduld!

Captain
Dabei seit
Aug. 2010
Beiträge
3.382
1. Generell, der Boxed Kühler ist nicht der Beste. Aber das wird Dir der kommende Sommer

noch demonstrieren. ;)

2. Gebe dem Ram mal 1.36V. (keine Angst - da passiert dem RAM nix) und der CPU auch etwas mehr zumuten.

Am besten Step by Step. Fange am besten bei 1.35V. - 1.36/1.37 usw. an. ABER nochmals! Step by Step. Denn

da kommt dann der Boxed Kühler ins Spiel.

3. Lass diesen unsinnigen "DriverEasy" sein.

Und wie hoch sind die Temps der GraKa und der CPU beim zocken?
 
Zuletzt bearbeitet:

martman

Cadet 1st Year
Ersteller dieses Themas
Dabei seit
Dez. 2018
Beiträge
9
Moin,

danke schonmal für die vielen hilfreichen Antworten!
Ich fasse mal für mich zusammen:
1. Schrittweise die Spannung am RAM bis max. 1,37V erhöhen und jedesmal schauen, ob der Fehler noch auftritt.
2. Wenn 1 nichts hilft, auf ein anderes Netzteil ausweichen (siehe unten).
3. Auf jeden Fall nen neuen CPU-Lüfter besorgen.

1. Driver Easy bitte weglassen
2. Evtl. mal kein BQ Netzteil nutzen, ich habe hier in der letzten Woche 3 BQ Netzteile von Kunden getauscht, die obwohl neu genau die selben Symptome zeigten, ich habe den Kunden dann Chieftec Netzteile verbaut
und das Problem war behoben, scheint also tatsächlich irgendetwas nicht zu stimmen.
3. Lies mal den Hersteller der Speicherchips aus, Micron wäre ideal, Samsung geht, Hynix ist nicht zu empfehlen, in seltenen Fällen können auch diese Reboots verursachen.

1. alles klar, danke für den Hinweis. Hatte das aufgrund eines Tipps genutzt, den ich gefunden hatte.
2. kannst Du ein bestimmtes empfehlen? Nicht dass ich nochmal auf die Nase fliege... und reichen dann 700W für das System, oder sollte ich lieber mehr nehmen? Die in Leserartikel zum Gaming-PC hier im Forum haben mir alle scheinbar etwas wenig Leistung...
3. Wie macht man das (ist mein erster selbst gebauter Rechner seit 20 Jahren...) ? Den RAM hatte ich aus irgendnem Thread hier als Empfehlung rausgezogen, da es meine erste Wahl zu dem Zeitpunkt nicht gab, als ich den Rechner bestellt hatte. Würde es sich lohnen, auf anderen Ram umzusteigen?

wer dreht den leuten immer die System Power 9 mit 600W/700W an? hängt die graka beim SP11 an 12V3 und 12V4 (siehe handbuch)?

Ja, das ist genau so verkabelt (ich behaupte einfach mal, ich hab das so gemacht weils im Handbuch steht... Danke für den Hinweis!).

WHEA und Ryzen 5000 ist doch eine bekanntere Problematik, die durch neuere Agesa Versionen (neues BIOS) gelöst werden soll.

Aber mal als Vorschlag: RAM mal auf 2133 eine Zeit lang laufen lassen, und gucken, wie sich das System dann verhält. (14CL bei 3200 halt auch kein Massen RAM)

BIOS ist die aktuellste Version. RAM läuft bei 2400 MHz (Standardeinstellung im BIOS). Wie oben geschrieben, der stammt aus ner Empfehlung. Wenn der eher nicht gut ist, muss anderer rein.

WHEA 18 ist in der Regel ein Problem von inkorrekter VDDG CCD... ich kann sie mit meinem 5950X darüber reproduzieren... Beim Laden von XMP/DOCP setzt das Board eine beliebige Spannung, die nicht unbedingt funktionieren muss...
Ok, danke. Die anderen RAM-Spannungen habe ich auf Automatik belassen, da ich mich damit überhaupt nicht auskenne. Finde ich irgendwo die empfohlenen Werte?

1. Generell, der Boxed Kühler ist nicht der Beste. Aber das wird Dir der kommende Sommer

noch demonstrieren. ;)

2. Gebe dem Ram mal 1.36V. (keine Angst - da passiert dem RAM nix) und der CPU auch etwas mehr zumuten.

Am besten Step by Step. Fange am besten bei 1.35V. - 1.36/1.37 usw. an. ABER nochmals! Step by Step. Denn

da kommt dann der Boxed Kühler ins Spiel.

3. Lass diesen unsinnigen "DriverEasy" sein.

Und wie hoch sind die Temps der GraKa und der CPU beim zocken?

Siehe meine Eingangsbemerkungen. Danke für die Tipps.
Temperaturen: CPU war in nem Stresstest mal bei 88°C, Hotspot der Graka ähnlich unter Vollast (soweit ich das beobachten konnte). CPU-Kühler kommt also als nächstes mit in den Warenkorb.

Ich Danke euch allen schonmal herzlich!
 

Questionmark

Commander
Dabei seit
Feb. 2015
Beiträge
2.380
Als Netzteil Chieftec Polaris Gold oder Seasonic Focus Gold, etwas preiswerter, nicht goldzertifiziert aber superzuverlässig die CTG Serie von Chieftec (die Dinger gehen einfach nicht kaputt).
 

martman

Cadet 1st Year
Ersteller dieses Themas
Dabei seit
Dez. 2018
Beiträge
9
1. Generell, der Boxed Kühler ist nicht der Beste. Aber das wird Dir der kommende Sommer

noch demonstrieren. ;)

2. Gebe dem Ram mal 1.36V. (keine Angst - da passiert dem RAM nix) und der CPU auch etwas mehr zumuten.

Am besten Step by Step. Fange am besten bei 1.35V. - 1.36/1.37 usw. an. ABER nochmals! Step by Step. Denn

da kommt dann der Boxed Kühler ins Spiel.

3. Lass diesen unsinnigen "DriverEasy" sein.

Und wie hoch sind die Temps der GraKa und der CPU beim zocken?

So, auch bei 1,36V und 1,37V leider wieder die Reboots. Im Monitor von HWMonitor hab ich aber gesehen, dass diese Spannungen fast nie erreich wurden, die blieb immer knapp drunter. Ist das normal?

Nochmal zu den Fehlermeldungen in der Ereignisanzeige: der WHEA-Logger Fehler #18 kommt nur etwa bei jedem zweiten Mal, der Kernel-Power 41 Fehler als kritischer Fehler immer.

Also doch noch ein neues Netzteil? Mit 750W?

viele Grüße
 

Kryss

Lt. Commander
Dabei seit
Sep. 2018
Beiträge
1.486
Probier vorher mal das undervolting der gpu... Du solltest imo Fehlerquellen ausschließen oder du kaufst dich zu Tode...

Vg Chris
 

martman

Cadet 1st Year
Ersteller dieses Themas
Dabei seit
Dez. 2018
Beiträge
9
Probier vorher mal das undervolting der gpu... Du solltest imo Fehlerquellen ausschließen oder du kaufst dich zu Tode...

Vg Chris

Danke für den Hinweis. Gibt es irgendwo eine Anleitung dafür? Ich kenne mich damit überhaupt nicht aus, und weiß nicht wo ich da was einstellen muss, und vor allem was mir die Ergebnisse des testes dann sagen sollen.

viele Grüße
 

Kryss

Lt. Commander
Dabei seit
Sep. 2018
Beiträge
1.486
https://www.youtube.com/results?search_query=6700+xt+undervolt

Naja wenn du dann keine Reboots mehr hast, weil die GPU weniger Watt und Lastspitzen erzeugt, weisst du sicher, dass es nicht an der CPU liegt und dann kannst dir immer noch ein neues Netzteil überlegen.
Wenn es trotz undervolting der GPU immer noch Reboots gibt, kann man sich die CPU genauer ansehen. So würde ich zumindest vorgehen. Aber ich bin auch ein Fan vom Undervolting (der GPUs), weil es imo einfach sinnvoll ist.

vg Chris
 

martman

Cadet 1st Year
Ersteller dieses Themas
Dabei seit
Dez. 2018
Beiträge
9
Moin,

auch mit der Option 'Automatisch' -> 'Energiesenkung GPU' auf 1150mV im Leistungsmenü der Radeon-Software treten die Abstürze auf. Es hat vorhin allerdings ca. 2 Minuten länger gedauert, als ohne die Einstellung. Bei einem der Abstürze hat die Ereignisanzeige noch folgenden, neuen Fehler ausgespuckt:
Ereignis-ID: 1001, Ebene: Fehler
Der Computer wurde nach einem schwerwiegenden Fehler neu gestartet. Der Fehlercode war: 0x00000124 (0x0000000000000000, 0xffffe18c5ffb4028, 0x00000000bc000800, 0x0000000001010135). Ein volles Abbild wurde gespeichert in: C:\WINDOWS\MEMORY.DMP. Berichts-ID: 8c14fa5f-1075-45d6-8c51-a763031c7eb4.

Kann damit jemand was anfangen?

Also ist doch die CPU das Problem? Alle Stresstests der CPU liefen Problemlos durch (Prime95 sogar ne Stunde ohne murren).

Ich hänge mal 2 Bilder mit Metrik-Daten von den beiden Abstürzen mit aktivierter Energiesenkung an. Vielleicht erkennt da jemand was drauf, ich leider nicht.

Langsam nervt das einfach nur noch...

viele Grüße
 

Anhänge

  • 2021-04-09 10.30.27.jpg
    2021-04-09 10.30.27.jpg
    1,9 MB · Aufrufe: 16
  • 2021-04-09 12.14.56.jpg
    2021-04-09 12.14.56.jpg
    1,5 MB · Aufrufe: 17

T3mp3sT1187

Commander
Dabei seit
Jan. 2011
Beiträge
2.254
Alles zu RAM OC auf AMD findest du entweder hier im Forum oder auf dem Ryzen RAM OC Discord...
 

martman

Cadet 1st Year
Ersteller dieses Themas
Dabei seit
Dez. 2018
Beiträge
9
Ich hab gestern noch mit diesem occt - tool einen power-Belastungstest gemacht, bei dem cpu und Grakaprozessor maximal belastet werden. Komischerweise lief der durch, bis die cpu an die Hitzegrenze kam (ja, neuer lüfter, ich weiß). Also stürzt der Rechner nur dann ab, wenn die gpu unter Last 3D-Berechnungen durchführt. Für mich deutet das auf einen Defekt in der graka hin...
Ich bekomme am Dienstag noch ein 800W corsair Netzteil von nem Arbeitskollegen ausgeliehen, das ich dann mal testen werde...

Viele Grüße
 

Kryss

Lt. Commander
Dabei seit
Sep. 2018
Beiträge
1.486
Nun, ich kenne dein GPU Modell nicht explizit, weil ich nie so ne Graka besessen habe... Meine letzten vier Karten waren alle von Team Grün.
Das mal vorab... Gibt hier aber sicher Leute, die sich mit deinem Modell besser auskennen.

auch mit der Option 'Automatisch' -> 'Energiesenkung GPU' auf 1150mV im Leistungsmenü der Radeon-Software treten die Abstürze auf. Es hat vorhin allerdings ca. 2 Minuten länger gedauert

Bei NVidia spricht man bei so Volt-Bereichen nicht wirklich von Undervolting. Hier spielt sich das im Bereich von 0.7x bis 0.9x Volt ab. Mit deinen 1.150 Volt war das kein spürbares Undervolting, sondern da hat dir eher die "Energiesenkung"-Automatik geholfen.

Ich würde das undervolting nochmal versuchen. Dazu mach dir HWInfo auf und GPUZ und beobachte die PerfCap-Reasons und die gezogenen Watt der GPU.
Bei meiner RTX 3080 z.B., die zieht Stock über 320 Watt unter Last. Mit Undervolting verliert die 5% Leistung und verbraucht 180 bis 220 Watt. Das ist Undervolting. BTW habe ich ein 650 Watt Netzteil. HW siehe Signatur...

vg Chris
 

martman

Cadet 1st Year
Ersteller dieses Themas
Dabei seit
Dez. 2018
Beiträge
9
Kurze Rückmeldung: mit einem 800W Corsair-Netzteil hält der Rechner bis zu ner halben Stunde durch, die Abstürze bleiben. Ebenfalls mit einem 750 Chieftech Polaris, hier allerdings nach ca. 15 Minuten.

Die Einzelteile gehen jetzt also erstmal zurück an den Händler, ich bin mit meinem Latein am Ende...

Danke nochmal an alle, die hier wertvolle Hilfen gegeben haben!
 
Top