Willkürliche Neustarts, memtest86 zeigt Fehler auf allen Riegeln immer auf gleichen Kernen. CPU defekt?

Newby-TV

Cadet 2nd Year
Registriert
Nov. 2021
Beiträge
22
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]

1. Nenne uns bitte deine aktuelle Hardware:
(Bitte tatsächlich hier auflisten und nicht auf Signatur verweisen, da diese von einigen nicht gesehen wird und Hardware sich ändert)
  • Prozessor (CPU): Ryzen 3900x
  • Arbeitsspeicher (RAM): 4x 16GB Corsair Vengeance RGB Pro 3200
  • Mainboard: MSI Meg 570 ace
  • Netzteil: 750 Watt corsair
  • Gehäuse: Corsair crystal 680x
  • Grafikkarte: Msi 3080 suprim x
  • HDD / SSD: m2 samsung Evo 970 1tb, 2x 1gb ssd
  • Weitere Hardware, die offensichtlich mit dem Problem zu tun hat(Monitormodell, Kühlung usw.): aoi corsair CPU Kühler

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein): Rechner startete erstmals vor 2 Wochen bei New World in WQHD und Max. Settings ab. Lief seit Anschaffung bis dahin komplett stabil. In den letzten 2 Wochen fing das System dann an willkürlich Neustarts zu machen. Dabei spielte die Auslastung keine Rolle. Er lief mal 6 Stunden am Stück bei anspruchsvollen games, als auch im homeoffice. Immer häufiger traten Neustarts auf. Mittlerweile läuft das System keine 5 min mehr, sobald einmal im Windows angekommen. Zum Neustart: Bild wird schwarz, kein Bluescreen und er fährt erneut hoch. Windows Ereignisprotokoll zeichnet nicht auf bis auf, dass das System unerwartet heruntergefahren wurde. Ab und an konnte das System zudem schwerwiegende Fehler auf Ebene des Prozessorkerns beheben lt. Ereignisprotokoll.
...

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
BIOS geupdatet, alle Treiber aktualisiert, Rechner entstaubt und Kabel geprüft. Windows 10 Pro zurückgesetzt (war zuvor auf Nov. Update). Windows neu installiert, auf Windows 11 geupdatet. Alles ohne Erfolg.

Memtest86 zuerst auf xmp1 Profil laufen lassen mit allen Riegeln =keine Fehler.
Test ohne Xmp mit jeden Riegel einzelnd gemacht und jeder hatte auf den gleichen CPU Kernen (6, 8, 10) schwischen 50 bis 80 Fehler. Mit 2 Riegeln mit aktiven XMP, der aktuell noch läuft, sind auf den gleichen Kernen auch bereits erste Fehler ersichtlich. Benchmarks kann ich aktuell nicht mehr machen im Windows.

Hat jemand bereits einen konkreten Verdacht? Ich vermute aktuell primär die CPU, gefolgt vom Board oder der Speicher. Danke vorab für eure Einschätzung. Bilder aus memtest kann ich nachreichen.
P.S.: Beachte auch die verschiedenen angepinnten Themen und die Forensuche. Möglicherweise findest du da bereits die Lösung zu deinem Problem.
 

Anhänge

  • Innenleben Rechner.jpg
    Innenleben Rechner.jpg
    2,6 MB · Aufrufe: 346
  • Riegel 1 & 4 XMP aktiv.jpg
    Riegel 1 & 4 XMP aktiv.jpg
    569,1 KB · Aufrufe: 378
  • Riegel 1.jpg
    Riegel 1.jpg
    434 KB · Aufrufe: 325
  • Riegel 2.jpg
    Riegel 2.jpg
    415,7 KB · Aufrufe: 263
  • Riegel 4.jpg
    Riegel 4.jpg
    385,1 KB · Aufrufe: 268
  • Riegel 3.jpg
    Riegel 3.jpg
    442 KB · Aufrufe: 280
Zuletzt bearbeitet:
Hi

CMOS Reset machen , und Mal jeden Riegel einzeln , auch in jeder Bank Testen.

Eins habe ich nur nicht ganz verstanden !

Memtest86 zuerst auf xmp1 Profil laufen lassen mit allen Riegeln =keine Fehler.

Mit 2 Riegeln mit aktiven XMP, der aktuell noch läuft, sind auf den gleichen Kernen auch bereits erste Fehler ersichtlich.

🤔

Ah 4x OK , erhöhe Mal die DRAM Voltage , Vollbestückung benötigt evtl. Immer etwas mehr Spannung.
Stell Mal zum Testen 1,40v ein.


Mfg.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Grugeschu
Der Memtest testet den Arbeitsspeicher nicht die CPU. Wenn da Fehler angezeigt werden dann ist der Arbeitsspeicher defekt.

Wenn ein Rechner einfach so ausgeht, ohne Dein Zutun, ohne Fehlermeldung und ohne blue screen dann liegt es allermeistens am Netzteil. deshalb rate ich es mit einem anderen Netzteil zu versuchen.
 
Uff, dann Teste ich ja die Ganze nächste Woche :D. Aber gut, kann zumindest mal heute Nacht damit starten. Als erstes hatte ich Memtest mit aktivierten XMP1 Profil im Bios laufen gehabt und keine Fehler wurden bei Verwendung aller Riegel gefunden. Darauf hin gelesen, man solle ohne aktive XMP Einstellungen die Riegel einzelnd testen. Folgend einzelnd die Riegel auf dem zweiten Ram-Slot durchlaufen lassen (Ist lt. Handbuch der erste) und jeder Riegel hatte Fehler. Darauf hin XMP wieder aktiviert und die beiden Riegel mit den wenigsten Fehlern aktuell im Test, da ich sicherstellen wollte, ob ich generell bei aktiven XMP keine Fehler bekomme. Hab ich falsch gedacht ;). Ergänze ebend noch die Bilder im Hauptpost.
 
-.-
 
Zuletzt bearbeitet: (Hier stand Mist, nicht weit genug gelesen v.v)
Drewkev schrieb:
Hi,

gibt es bei der Windows Ereignisanzeige eine ID?
Nein, Fehlercodes wurden nicht übermittelt. Lediglichen Nullen geschrieben.
Ergänzung ()

Gelbsucht schrieb:
Sry, hab den ersten Text über mein Tablet geschrieben und jetzt erst übern Laptop die Bilder nachträglich hochgeladen. Also mit memtest 9.3 ist der Test i.O?
 
Ja, hab meinen Fehler schon erkannt als ich das Bild dann gesehen hab. Danke.
 
Ich nutze zum RAM/Memory-Controller/CPU checken meist Prime95 im Standard-Test (Blend oder wie der heißt).
Würde es damit mal probieren, indem du das Bios auf default setzt, alle Einstellungen ausser dem XMP setzt und dann jeden Riegel einzeln durchprobierst. Wenn Fehler da sind zeigen die sich meist in der ersten Sekunden bis Minuten. Falls sich nichts tut einfach ca. eine halbe Stunde laufen lassen. Wenn bis dahin nichts passiert ist, tut sich auch in 99% der Fälle nichts mehr. Wenn die Module mit DDR4-2133 laufen, dann das ganze parallel probieren. Dann die Riegel einzeln mit XMP.
 
Ich denke deine GFX hat dein NT zu Tode gelutscht;)
Versuche, wenn es geht, erstmal vom Freund etc. ein "besseres" Netzteil zu testen.

lg
 
janer77 schrieb:
Ich nutze zum RAM/Memory-Controller/CPU checken meist Prime95 im Standard-Test (Blend oder wie der heißt).
Würde es damit mal probieren, indem du das Bios auf default setzt, alle Einstellungen ausser dem XMP setzt und dann jeden Riegel einzeln durchprobierst. Wenn Fehler da sind zeigen die sich meist in der ersten Sekunden bis Minuten. Falls sich nichts tut einfach ca. eine halbe Stunde laufen lassen. Wenn bis dahin nichts passiert ist, tut sich auch in 99% der Fälle nichts mehr. Wenn die Module mit DDR4-2133 laufen, dann das ganze parallel probieren. Dann die Riegel einzeln mit XMP
Alle Tests im Windows kann ich aktuell knicken. System startet nach wenigen Sekunden bis Minuten im Windows neu.
iceshield schrieb:
Ich denke deine GFX hat dein NT zu Tode gelutscht;)
Versuche, wenn es geht, erstmal vom Freund etc. ein "besseres" Netzteil zu testen.

lg
Mit leihen wird nichts im Freundeskreis. Da wird niemand ein NT mit 750+ Watt liegen haben. Also können die Fehler im Windows (Schwerwige CPU-Fehler) und die Fehler am Arbeitsspeicher auch in Verbindung mit einer kaputten Stromversorgung in Verbindung stehen?

Bei den aktuellen Marktpreisen bin ich noch ehr gewillt ein neues NT zu beschaffen als die 1,5 Jahre alte CPU oder Board neu zu kaufen, die immer noch fast genau so viel kosten.
 
Newby-TV schrieb:
Als erstes hatte ich Memtest mit aktivierten XMP1 Profil im Bios laufen gehabt und keine Fehler wurden bei Verwendung aller Riegel gefunden. Darauf hin gelesen, man solle ohne aktive XMP Einstellungen die Riegel einzelnd testen. Folgend einzelnd die Riegel auf dem zweiten Ram-Slot durchlaufen lassen (Ist lt. Handbuch der erste) und jeder Riegel hatte Fehler.
Der RAM scheint ok zu sein, wenn Memtest86 keine Fehler zeigte mit allen Modulen installiert.
Die Fehler beim Einzel Test in Slot "A2" müssen keine echten Fehler sein, wenn diese nur in:
"Test 13 (Hammer Test)" erscheinen, sondern das liegt am SPD der Module und kann hier je nachdem passieren.
Wenn Memtest86 mit allen Modulen zusammen fehlerfrei durchläuft, kannst du den RAM soweit ausschließen.
Stören dich diese Fehler mit nur einem Modul, versuch ein BIOS Update (improve ram compatibility)
oder kauf dir andere Module. Welche, schau in Foren, welche RAMs andere nutzen bei deinem System.
RAM Module mit Memtest86 einzel zu testen empfiehlt sich nicht,
zumal man in der Regel eh das Kit einsenden muss im Garantiefall.

Hier noch was zum Test 13 (Hammer Test).
Im Netz ist einiges zu finden diesbezüglich:

"Errors in Test 13 (Row Hammer)"


(PassMark Forum)
 
Zuletzt bearbeitet:
Nickel schrieb:
Der RAM scheint ok zu sein, wenn Memtest86 keine Fehler zeigte mit allen Modulen installiert.
Die Fehler beim Einzel Test in Slot "A2" müssen keine echten Fehler sein, wenn diese nur in:
"Test 13 (Hammer Test)" erscheinen, sondern das liegt am SPD der Module und kann hier je nachdem passieren.
Wenn Memtest86 mit allen Modulen zusammen fehlerfrei durchläuft, kannst du den RAM soweit ausschließen.
Stören dich diese Fehler mit nur einem Modul, versuch ein BIOS Update (improve ram compatibility)
oder kauf dir andere Module. Welche, schau in Foren, welche RAMs andere nutzen bei deinem System.
RAM Module mit Memtest86 einzel zu testen empfiehlt sich nicht,
zumal man in der Regel eh das Kit einsenden muss im Garantiefall.

Hier noch was zum Test 13 (Hammer Test).
Im Netz ist einiges zu finden diesbezüglich:

"Errors in Test 13 (Row Hammer)"


(PassMark Forum)
Im Einzeltest traten die Fehler auch u.a. bei Test 7,8 und 9 auf. Aktuell läuft Memtest ohne aktivem XMP mit allen Riegeln. Mit XMP (erster Test) war ja noch alles fehlerfrei. Heute Abend teste ich das System dann mit Prime95 in Ubuntu.
 
Newby-TV schrieb:
m Einzeltest traten die Fehler auch u.a. bei Test 7,8 und 9 auf.
Dann vergiss das oben, denn dies bezieht sich alles nur auf Test 13 (Bild 3 #1 ).
Ansonten, ist das eher unglaublich - alle Module, keine Fehler, aber Einzel.
 
Nickel schrieb:
Dann vergiss das oben, denn dies bezieht sich alles nur auf Test 13 (Bild 3 #1 ).
Ansonten, ist das eher unglaublich - alle Module, keine Fehler, aber Einzel.
Mich verwirrt es auch maximal. Mal schauen wie der aktuelle Test ausfällt (bin noch auf der Arbeit).
Aber eine fehlerhafte Spannungsversorgung verursacht nicht solche Fehler oder ggf. auch deaktiviertes XMP oder?
 
Newby-TV schrieb:
Aber eine fehlerhafte Spannungsversorgung verursacht nicht solche Fehler oder ggf. auch deaktiviertes XMP oder?


Eigtl. nicht, denn eher das XMP bringt Fehler weil das OC ist.
Und im XMP ist auch die Spannung (VDimm) für's OC (3200er DDR4) hinterlegt,
was in der Regel 1.35V sind.
Ohne XMP, also beim SPD (Jedec) ist der DDR4 Standard 1.20V
und das schaffen in der Regel auch alle Module locker - DDR4 2133/2400MHz @1.20V.
Kannst aber mal probieren, wenn du einzel testest, ohne XMP,
hier dann manuell die VDimm des XMP 1.35V zu geben,
weil ohne XMP ist diese 1.2V, weil das SPD muss JEDEC Konform sein (@1.20V)
 
Zurück
Oben