System friert ein - einige Symptome, schwierige Interpretation

Shor

Commander
Registriert
Jan. 2005
Beiträge
2.368
Moin!

Ein Kumpel von mir hat folgendes System:

  • ASUS X99-S (90MB0KH0-M0EAY0)
  • Intel Core i7-5820K, 6x 3.30GHz, mit Noctua NH-D15
  • Crucial Ballistix Sport DIMM Kit 32GB, DDR4-2400, CL16-16-16 (BLS4C8G4D240FSA/BLS4K8G4D240FSA); also vier 8GB Riegel
  • Gainward GeForce GTX 1660 Super Ghost
  • Sea Sonic Platinum Series 760W ATX 2.3 (SS-760XP2)
  • Windows 10 Prof. 64
Er hat es von mir. Sowohl ich als auch er haben damit immer Spiele gespielt; ging alles immer reibungslos – auch im CPU-Limit. Die CPU lief immer auf 4,1 GHz stabil in Prime (Blend). Gestern hat er ein neues Spiel ausprobiert und das ist nach einiger Zeit eingefroren; bzw. der ganze PC, sodass man nur noch einen Hardreset machen konnte. Anschließend ist das System auch einmal im Anmeldebildschirm von Windows eingefroren. Was sich aber aktuell die ganze Zeit zeigt, ist, dass Prime nicht mehr stabil läuft – nach wenigen Sekunden (drei bis 15) friert das System, genau wie bei dem Spiel, ein. Ein Runtertakten auf den normalen Takt von 3,3 GHz schafft keine Abhilfe.

Nun haben wir zwar einige Dinge ausprobiert, aber sind nicht richtig schlau geworden. Zum Beispiel haben wir probiert, die CPU mit möglichst wenig RAM-Belastung zu stressen und den RAM mit möglichst wenig CPU-Belastung – um herauszufinden, ob bei einem von beiden der Hund begraben liegt. Ich hab mal gelernt, dass man solche Tests am besten außerhalb von Windows macht. Daher haben wir zunächst mal die aktuelle Version 8.4 von MemTest86 auf einen USB-Stick gepackt und gebootet.

Tatsächlich ist MemTest86 dann direkt beim ersten Durchlauf bei Test 7 eingefroren. Als ich gegoogelt habe, was das bedeutet, hab ich gelesen, dass man besser die Riegel einzeln testet. Dummerweise sind einige der Riegel durch den CPU-Kühler verbaut und nicht herausnehmbar, ohne dass man den Kühler mit ausbaut – und das kann/will mein Kumpel gerade nicht alleine (und er wohnt leider weiter weg). Wir dachten aber zunächst, dass nur zwei Riegel verbaut sind und er hat einen rausgenommen und MemTest nochmal durchlaufen lassen: Ergebnis: Alle Passes ohne Fehler durchlaufen. Wir dachten dann, wir hätten Glück gehabt und tatsächlich den einen defekten von vier Riegel(n) erwischt beim Rausnehmen. Ein anschließender Prime-Test unter Windows hat uns aber eines Besseren belehrt: direkt wieder Freeze.

Wenn also nicht zufällig mehrere Riegel kaputt sind, liegt es entweder nicht am RAM oder die fehlerfreien Passes haben nicht korrekt alle Riegel getestet. Ich komme darauf, weil bei den drei verbauten 8GB Riegeln sowohl im BIOS als auch außerhalb von Windows bei MemTest und innerhalb von Windows unter „System“ sowie im Ressourcen-Monitor (Task-Manager) eine Gesamtkapazität von nur 19,9/20GB erkannt wurde (statt 24GB). Bei vier verbauten Riegeln werden 27,9/28GB (statt 32GB) angezeigt. Wie kann es sein, dass immer 4 GB fehlen? Liegt da vielleicht der Hund begraben und einer der nicht erreichbaren Riegel (wir konnten nur zwei einzeln rausnehmen zum Testen) oder der Speichercontroller ist insofern defekt, als dass von diesem nicht mehr die volle Kapazität zur Verfügung steht und irgendwie auch diese Freezes verursacht werden? Oder gibt es sowas nicht? Nur CPU-Z zeigt übrigens immer die erwartete Kapazität an - warum auch immer. Mein Kumpel ist sich im Übrigen auch sicher, dass mindestens unter „System“ in Windows sonst auch immer 32GB standen bei vier Riegeln und nicht, wie jetzt, 27,9/28 GB.

Wir haben uns dann mangels weiterer Testideen erst mal auf die CPU konzentriert. Dazu haben wir UBCD runtergeladen und Mersenne Prime V28.5 gestartet. Schon beim ersten Test, der nur sehr wenig RAM mit einbezieht (sich also auf die CPU konzentriert), gibt es nach wenigen Sekunden einen Freeze – reproduzierbar. Das hatte meinen Verdacht dann wieder eher auf die CPU gelenkt. Aber um den Verdacht jetzt wirklich zu erhärten, müsste ich verstehen, was das mit den seltsamen RAM-Kapazitäten auf sich hat bzw. ob das anderweitig erklärbar und harmlos ist. Was können wir noch machen, um bestenfalls einen Beweis für oder gegen einen Defekt der CPU oder eins RAM-Riegels zu bekommen; abgesehen von Trial und Error durch Austausch der CPU oder der zwei weiteren verbauten Riegel (was wie gesagt leider erstmal nicht möglich ist ohne größeren Aufwand)?

Eine Sache ist uns noch aufgefallen. Sowohl HWMonitor als auch HWiNFO zeigen eine auffällig hohe Temperatur an, die meiner Meinung nach damals, als ich das System an ihn übergeben hatte, noch nicht da war. Der Wert pendelt zwischen 98 und 105 Grad Celsius im IDLE und heißt in HWiNFO Temp3 (geführt unter ASUS X99-S Nuvoton NCTT6791D) und in HWMonitor TMPIN5 (wobei es einen weiteren TMPIN5 gibt, der nur rund 30 Grad zeigt). Wenn ich danach google, finde ich in erster Linie Vermutungen, dass es sich um einen Auslesefehler handelt. Sieht das jemand anders? Die übrigen Temperaturen jedenfalls sind auch kurz vorm Absturz des Prime-Blends im grünen Bereich.

PS: Wir haben jetzt gerade noch mal die Windows-Speicherdiagnose gestartet; die lief ohne Fehler durch bzw. meldet Windows beim anschließenden Neustart, dass keine Speicherprobleme gefunden wurden. Aber ich halte es für möglich, dass hier - wie auch bei MemTest - nicht die volle Kapazität getestet wurde.

PPS: Ich hab natürlich auch das Netzteil auf dem Schirm – das ließe sich jedenfalls wohl am einfachsten mal Trial and Error mäßig austauschen; auch durch meinen Kumpel selbst. Aber ich wollte erst mal abwarten, was ihr sagt.

PPPS: Das BIOS wurde nicht geupdated seit der Übergabe damals. Auch sonst hat er, sagt er, nichts verändert - er hat ihn ganz normal benutzt und administrativ quasi nichts gemacht.

PPPS: Tatsächlich wir der eine 8GB Riegel nur noch als 4GB erkannt. Jetzt ist die Frage, ob das was mit dem Freezes zu tun hat.

1594479778486.png



Danke im Voraus!
 
Zuletzt bearbeitet:
Moin, wie neu ist die WLP? Ggf. diese erneuern.

P.S. Sonst müssen die Riegel wirklich einzeln getestet werden.
 
Zuletzt bearbeitet von einem Moderator:
Als ersten Schritt würde ich einmal im UEFI/BIOS die Standard Einstellungen laden (nicht nur hhf. einzelne Faktoren stellen).
Und, was ist mit dem Riegel in B1 los, da der nur 4GB zeigt?
 
  • Gefällt mir
Reaktionen: thompson004
Shor schrieb:
...
Crucial Ballistix Sport DIMM Kit 32GB, DDR4-2400, CL16-16-16 (BLS4C8G4D240FSA/BLS4K8G4D240FSA); also vier 8GB Riegel
...
nach wenigen Sekunden (drei bis 15) friert das System ein
...
Tatsächlich wir der eine 8GB Riegel nur noch als 4GB erkannt. Jetzt ist die Frage, ob das was mit dem Freezes zu .

Zur Frage: JA

4GB.JPG
Der muss getauscht werden...
 
Danke für eure Antworten.

@shadowrid0r: Kannst du etwas mehr dazu sagen, wie die Freezes mit der verminderten Kapazität zusammenhängen deiner Meinung nach? Oder ist das eher ein Bauchgefühl (das ich ja auch habe)? Und zum Pfeil: Ich hab das Foto gemacht, um genau das zu zeigen, ja. Falls du denkst, dass ich übersehen habe, dass da 4GB steht. :D
 
Dann nimm doch den besagten Riegel einfach mal raus und teste wie sich das System dann verhält.
Wenn weg, dann ist der Grund gefunden.
Oder RAM mal alle raus und dann wieder rein und schauen ob das BIOS dann jeweils die 8 GB pro Riegel erkennt.
 
@Shor
Also ein Quad Channel Speichercontroller technisch zu erklären spreng den Rahmen hier. Aber das ist zwingend notwendig das sich alle Module technisch mit identischen Daten im System anmelden. Da fehlen ja nun diverse Adressen und Adressbereiche. Der muss also so einfrieren... Mit der angezeigten Bestückung ist ´einfrieren´ quasi das Normal. Der Controller kann das nicht einfach überspringen oder auslassen. Bei X99 läuft so Bestückt die normale Quad Channel Ansteuerung der Speicherzellen ab. Die aber nun fehlen.

Bei X99-S muss der Defekte und ein Weiterer raus. Dann geht evtl. noch Dual Channel. Mal in Handbuch schauen welche Slots zwingend Bestückt sein müssen.
recommend.JPG
 
Zuletzt bearbeitet:
Es könnte auch sein, dass hier Kontaktprobleme vorliegen, so dass manche Testtools es einmal so, das andere mal eben anders interpretieren. Schau vlt auch einmal genau die Kontakze an - am Riegel und im Slot (sofern das machbar ist; vielleicht mit kleinem Spiegel).
 
  • Gefällt mir
Reaktionen: shadowrid0r
Das Problem ist wohl der Kühler, der dann raus muss, für den PC-Eigner. Der kein ´Schrauber´ ist...
Tot-geglaubte leben (oft) länger mit Kontakt-Spray... :daumen:
 
Zurück
Oben