TR2990WX / 128Gb Ram - Kein Boot mehr mit Riegel in B1

Sithys

Captain Pro
Registriert
Dez. 2010
Beiträge
3.484
Moin zusammen,
wie sagt man so schön: Man soll den Tag nicht vor dem Abend loben. Ich hatte ja wie in dem verlinkten Beitrag erwähnt ein RAM Upgrade von 64 auf 128Gb durchgeführt und seitdem die Büchse ordentlich befeuert. Heute liefen den ganzen Tag Tests und Builds und die ganzen VMs, ohne Probleme.

Jetzt bin ich nach Hause gegurkt, bastel von Zuhause an dem Build-Script rum und hab die Kerne sowie den RAM für eine VM erhöht. Von 32 Kernen und 70Gb ram auf 46 Kerne und 82Gb Ram. Danach den Build gestartet und nur noch SIGSEV Segmentation Fault errors bekommen. Hab erst gedacht, dass sei ein schlechter Scherz und dann fix eine Debian VM mit Memtest86 aufgesetzt. Der lief gut 'ne halbe Stunde, dann ist der ganze Host (Proxmox) gecrasht.

Also wieder ins Büro... jetzt hock ich hier mit einem Kollegen. Wir haben jetzt auf dem Mainboard den Fehlercode C5 gehabt und daraufhin mal gegoogelt (im Handbuch ist der Fehlercode natürlich nicht beschrieben...). Scheint also was mit dem RAM zu sein. Wir haben daraufhin angefangen, Riegel für Riegel zu ziehen und wieder gebootet. Das Ergebnis des Tests: Sobald ein Riegel im Slot DIMM_B1 steckt, bootet die Kiste nicht mehr.

Ich frag mich natürlich, wie das sein kann. Hab etliche PCs zusammengebaut und dabei auch gut aufgepasst, mein Kollege meinte, dass ich eventuell zu viel Druck ausgeübt hätte, beim Einbau des Riegels. Ich kanns natürlich nicht 100%ig ausschließen, aber ich war (wie immer) sehr behutsam. Keine Ahnung, war der 300te Ram-Riegel den ich gestckt habe.

Von Euch sowas schon mal jemand gehabt? Noch andere Ideen? Die Kiste fährt so hoch, wenn wir den DIMM_B1 Slot nicht belegen. Sobald wir einen Riegel reinstecken (egal welchen), kein Boot.

Anbei ein Screenshot von Proxmox und ein Bild aus der Kiste.

PS: Den CPU-Lüfter hab ich natürlich nur fürs Foto abmontiert, der ist sonst dort wo er hingehört :-).
 

Anhänge

  • cb1.jpeg
    cb1.jpeg
    175,3 KB · Aufrufe: 406
  • cb2.jpeg
    cb2.jpeg
    161,6 KB · Aufrufe: 394
Sind alle Pins in Ordnung auf dem CPU-/RAM-Sockel?

Kannst du ggf. die Spannung leicht erhöhen?

/Edit

Ist der leere 6-Pin Stromstecker beim oberen RAM-Slot für PCIe?
 
  • Gefällt mir
Reaktionen: Transistor 22 und Ned Flanders
Das muss nicht direkt etwas mit dem Slot zu tun haben. Von den Epyc-Prozessoren ist auch bekannt, dass wenn die CPU nicht korrekt sitzt Dimm-Bänke ausfallen können. Haben aber auch 8 Kanäle...
Könnte jedoch auch am Takt liegen (mehr belegte Slots -> weniger Takt (offiziell zumin.)).
 
  • Gefällt mir
Reaktionen: Transistor 22 und Ned Flanders
Strange... Angeblich soll es ja manchmal kontakt probleme geben bei den riesen CPU Packages auf LGA Sockeln. Das kann natürlich auch ein Prob auf einem RAM Slot verursachen. Vieleicht nochmal CPU aus und wieder einbauen.
 
  • Gefällt mir
Reaktionen: proud2b
Laut BIOS liefen die Riegel alle mit 2933Mhz, wie gesagt auch stabil die letzten zwei Tage mit Testen rauf und runter. Ich wunder mich einfach, dass von jetzt auf gleich im laufenden Betrieb alles in die Buchse geht. Das Ding hat keiner auch nur einen Millimeter bewegt, der Serverraum ist ja zu.
 
CPU neu montieren, ist nen bekanntes Problem bei so großen Sockeln, TR4/SP3/S3647
 
Würde auch erstmal CPU neu einsetzen. Zu viel Druck macht den Slot aber nicht kaputt. Da müsstest du schon wirklich übertrieben haben.
Schau dir ansonsten mal die RAM Slots an. Hatte bei einem meiner Boards vor Jahren einen Kontakt nach innen verbogen. Sah man fast gar nicht. Erst bei genauem Hinsehen war der kleine goldene Pin auf den Boden der RAM Schiene zu erkennen. Konnte den zum Glück zurück in die Fassung an der Seite biegen. Der lief auch erst noch.
 
Kurzes Zwischenfazit: Da ist so verdammt viel Wärmleitpaste drauf... ich hatte den bei MF montieren lassen, der wahnsinn. Erstmal reinigen jetzt ... dann gehts weiter.
Ergänzung ()

Kann man das erkennen? Die CPU ist irgendwie verfärbt... hab ich so noch nicht gesehen, das ist aber normal, oder? :freaky:

Ich hoffe man kann das erkennen, unten...
 

Anhänge

  • Screenshot_10.png
    Screenshot_10.png
    251,3 KB · Aufrufe: 325
  • Gefällt mir
Reaktionen: ZeroCoolRiddler und Ned Flanders
Sieht nach Fingerabdrücken aus.
Nichts beunruhigendes.

Reinigen und wieder einbauen.
 
Fingerabdrücke? Auf den Pins? ... Oha, also mit Alkohol jetzt da ran?
 
Ja

Kurz drüberwischen und schauen ob es verschwindet.
Nicht gleich die ganze CPU schwemmen.

Der Sockel ist sauber und alle PIns o.k.?
 
  • Gefällt mir
Reaktionen: Sithys
Wenn ich das in dem verlinkten Thread richtig gesehen habe, läuft der RAM zwar mit 2933MHz, aber bei nur 1,2v. Das kann auch eine Fehlerquelle sein. 1,35v würde ich mal gegentesten.
 
  • Gefällt mir
Reaktionen: Sithys und Ned Flanders
Alle Pins sehen gut aus, die Verfärbungen auf der CPU verschwinden aber nicht.
 
Bau sie erstmal wieder ein bevor du Dir den Kopf über den Farbton zerbrichst.
 
  • Gefällt mir
Reaktionen: Sithys
Ich kann mir nur vorstellen das jemand mit Schweißfingern die CPU angefasst hat.
Das könnte leichte Oxidation sein.

Nicht schön, aber erstmal nicht bedenklich.

Bau sie wieder lt. Anleitung ein.
Es gibt auch YT Videos dazu.
 
  • Gefällt mir
Reaktionen: ZeroCoolRiddler
Bauen gerade wieder zusammen. Melde mich gleich. Danke für die ganze Hilfe 💪🏻
 
  • Gefällt mir
Reaktionen: Ned Flanders
Deswegen lässt man sich sowas von einem IT Haus zusammen bauen.
 
Pfuscher gibt es überall.
Am besten ist, man baut es selbst mit Ruhe zusammen.
 
  • Gefällt mir
Reaktionen: Transistor 22, Sithys und ZeroCoolRiddler
Aber nicht wenn man Angestellter ist und sich den Pc selbst zusammen baut.
 
Hattest du gelesen, dass Mindfactory den zusammengebaut hat? ^^
Ergänzung ()

Also das sind G.Skill RipJaws CL14 3200Mhz mit Samsung Chip. Jetzt bootet der PC mit allen Bänken wieder. Soll ich trotzdem auf 1.35V erhöhen, wenn ja, wo im BIOS geht das? DRAM Voltage hab ich gefunden aber was davon muss angepasst werden?
 
Zuletzt bearbeitet:
Zurück
Oben