PC stürzt ab / System unter Last instabil (CPU defekt?)

Silver Server schrieb:
Wenn er da mit keinen Fehler zeigt, dann nimm doch diesen Arbeitsspeicher.

Hab ich doch schon getestet und hier schon zig mal geschrieben. Sorry, aber liest Du mein Beiträge nicht? :-/
 
Ich habe eben festgestellt, dass beide RAM Sets (meine G.Skill und die Corsair des Schwagers) nicht in der Kompatibilitätsliste des Mainboards aufgeführt sind. Ich bestelle mir jetzt mal neuen (kompatiblen) RAM und teste erneut. Es bleibt also weiter spannend...
 
MountWalker schrieb:
Bei der Ersatz-CPU dann auch gleich mit XMP-Profil den Speichercontroller übertaktet?

Nein. Da alle drei RAM Sets sogar auf Stock (2133 MHz) instabil waren, habe ich OC gar nicht erst probiert. Ich habe jetzt neuen RAM bestellt (32 GB 3600 CL16, 2x 16GB Riegel). Wird auf der G.Skill Website und Pangoly explizit als kompatibel geführt. Sollte Ende der Woche ankommen. Vielleicht war es einfach nur Glück, dass der nicht-kompatible RAM mit 16 GB auf 4233 stabil lief. Wenn der neue RAM funktioniert, hab ich mit dem teuren 4400er Set für 450€ einen ziemlichen Fehlkauf gemacht. Aber gut....selbst Schuld. Ich sehe es als Lehrgeld. Ich halte Euch auf dem Laufenden.
 
Wenn ich das hier lese frage ich mich ernsthaft ob dieses Forum irgendwie n RAM Fetisch hat.
Bei mir wurde damals auch immer nur RAM RAM RAM gesagt (Millionen Tests gemacht). Dabei bestanden die Fehler sogar noch nachdem ich neue RAM gekauft und getauscht habe.
So wie der OP hier die Komponenten gewechselt hast (RAM/Mainboard/CPU) ist es doch völlig abstrus immer noch irgendwelche weiteren RAM-Tests zu fordern. Oder hier wird einfach nicht gelesen und immer die gleichen Ratschläge wiederholt?
Es sind ganz EINDEUTIG nicht die RAM! Und offenbar auch nicht das Mainboard wenn's mit dem nagelneuen Teil auch nicht läuft.
 
  • Gefällt mir
Reaktionen: Corbana01
So…neuer RAM ist da. Laut Pangoly und der G.Skill Website zu 100% kompatibel. Aber Prime95 führt immer noch zum Crash. Selber Fehler, ebenfalls nach ca. 10min. Mit XMP, ohne XMP, mit Turbo Boost, ohne Turbo Boost. Alle Treiber und BIOS sind aktuell.

Morgen geht der PC in die Werkstatt. Ich hab kein Bock mehr auf den Müll. Koste es was es wolle. Sonst kaufe ich halt einen neuen Rechner, ist mir langsam egal. Ich brauch den PC für die Arbeit.
 
Zuletzt bearbeitet:
OlafOlafson schrieb:
Nachdem ich jetzt einige Tage ohne Probleme am PC arbeiten konnte (leider nur auf "Stock", daher relativ langsam...), habe ich heute mit OCCT die Stabilität getestet (CPU-Test, Datensatz: groß, Modus: Extrem, Belastungsart: Variabel). Da auch hier alles im grünen Bereich war, habe ich langsam mit der CPU & RAM Übertaktung angefangen und bis 5 Ghz (CPU) und 3600 MHz (RAM) gab es auch hier im Dauer-Test (1 Std) keinerlei Probleme. Auch Lightroom und mein Videoschnittprogramm liefen stabil.
Beim Übertakten können Komponenten kaputt gehen. Eventuell hat das beide CPUs geschädigt (evtl Speichercontroller durch RAM OC über 3600 GHz.) Das ist dann ein dauerhafter Fehler.
 
PhenomIIenal schrieb:
Beim Übertakten können Komponenten kaputt gehen. Eventuell hat das beide CPUs geschädigt (evtl Speichercontroller durch RAM OC über 3600 GHz.) Das ist dann ein dauerhafter Fehler.

Wie ich drei Beiträge weiter oben schon geschrieben habe: Beim zweiten Mainboard und der zweiten CPU habe ich weder den RAM, noch die CPU übertaktet. Alles nur auf Stock.
 
Also, eben wieder getestet:

Cinebench R23 läuft stabil mit 3600 CL 16 und 5 GHz CPU OC. Spannung und Temperaturen passen.

Aida64Extreme lief jetzt auch eine Stunde ohne Probleme. Wurde zwar ein bisschen warm, aber ist alles noch im Rahmen.

OCCT läuft auch fehlerfrei.

Bisher ist Prime95 das einzige Sorgenkind. Da wird beim Start des Stresstests auch angezeigt, dass die Tests für i3, i5 und i7 optimiert sind. Vielleicht hat einfach Prime95 irgend ein Problem mit i9…

Heute Abend streame ich mal noch zum Test 3-4 Std und rendere danach Bilder über Nacht. Wenn es dann stabil ist, werde ich Prime95 einfach runterwerfen und ignorieren.
 
Wenn Prime95-Code einen Speicherfehler auf i9 verursacht und das architekturbedingt passiert, wäre das eine Sicherheitslücke im Prozessor - Sprungvorhersage irrt sich und wird falsch korrigiert oder sowas. Prime95 ist halt deshalb für Stabilitätstests so gut, weil es bei einem einzigen Bitflip austeigt. Vielleicht hast du auch einen Hobbyfunker als Nachbarn der Richtfunkexperimente durch deinen Rechnerplatz macht und dadurch Bitflips verursacht. Ein Bitflip beim Bilder rendern muss nicht gleich etwas abstürzen lassen, das Problem ist dann weniger sichtbar, aber noch vorhanden. Vielleicht wird irgendwas auf dem Mainboard nach ein paar Stunden zu heiß.
 
Der Rechner ist mittlerweile praktisch tot. Als ich eben BFV starten wollte, kam sofort der Bluescreen. Direkt nach dem neu Booten hängt jetzt alles extrem. Nicht mal mehr die Maus lässt sich flüssig bewegen. Obwohl alles immer noch auf Stock ist und frisch installiert ist. Ich habe jetzt alles ausgesteckt und morgen früh geht es in eine 100km entfernte aber besonders gute PC-Werkstatt. Natürlich gebe ich den Feedback, was das Problem war…insofern sie den Fehler überhaupt finden.
Ergänzung ()

MountWalker schrieb:
Vielleicht wird irgendwas auf dem Mainboard nach ein paar Stunden zu heiß.

Kann ich ausschließen. Überwache ich ja durchgehend mit HWMonitor. Prime95 stürzt bereits auf Stock und einem „frisch gestarteten“ PC mit sehr niedrigen Temperaturen ab.
 
Zuletzt bearbeitet:
Mit HW-Monitor kannst du gar nichts ausschließen, weil beispielsweise in keinem, der MOSFETs ein Temperatursensor steckt. In HWMonitor siehst du die Temps der Sensoren in GPU, CPU, Prozessorsockel und noch zwei, vielleicht drei Sensoren, die irgendwo auf dem Mainboard hängen. Wenn davon überhaupt irgendwas akkurat ist, dann nur die CPU- und GPU-Temps, welche für Stabilität aber irrelevant sind, weil beide Thermal-Throttle anwenden, wenns ihnen zu warm wird, sodass diese beiden nicht instabil werden. Mit "irgendwas auf dem Mainboard" meine ich ausdrücklich nicht die CPU oder GPU.

P.S.
Netzteildefekt ist auch möglich, aber kann auch ein überhitzter MOSFET gewesen sein oder irgendwas anderes auf dem Mainboard.
 
MountWalker schrieb:
Netzteildefekt ist auch möglich, aber kann auch ein überhitzter MOSFET gewesen sein oder irgendwas anderes auf dem Mainboard.

Mainboard und Netzteil habe ich doch beide schon letzte Woche ausgetauscht, jedoch ohne Besserung.

Wie gesagt: Ich habe ALLE Bauteile bereits ausgetauscht oder ausgebaut.

Komplett ausgetauscht (gegen neue Teile):
  • CPU
  • Mainboard
  • Gehäuse
  • Netzteil
  • RAM

Ausgebaut (um es als Fehlerquelle ausschließen zu können):
  • Alle Festplatten (und auch zwischendrin durchgewechselt, zB Windows mal auf der SSD statt NVME installiert)
  • Grafikkarte

Das einzige Bauteil im ganzen PC, das ich bislang weder ausgetauscht oder ausgebaut habe, ist der CPU-Kühler. ALLES andere wurde schon gegen neue (=nagelneue) Teile ausgetauscht oder ausgebaut.
 
Ja, deswegen denke ich auch über Temperaturen von Mainboardbauteilen nach, weil du ja alles ausgetauscht hast. Der CPU-Kühler ist nicht das Problem, Intel CPUs werden seit über zehn Jahren so gebaut, dass nichts instabil, sondern nur erbrechend lahm wird, wenn die Kühlung plötzlich ausfällt. Irgendwelche Maimboard-Teile wie beispielsweise die MOSFETs haben solche Sicherheitsfunktionen aber nicht. Dann wäre ein Temperaturanstieg der Innenluft im Gehäuse über die Lastsunden in Kombination mit MOSFETs die durch das Mainboard-Design dann vielleicht schon an der Grenze entworfen sind, vielleicht das Problem.
 
MountWalker schrieb:
Ja, deswegen denke ich auch über Temperaturen von Mainboardbauteilen nach, weil du ja alles ausgetauscht hast. Der CPU-Kühler ist nicht das Problem, Intel CPUs werden seit über zehn Jahren so gebaut, dass nichts instabil, sondern nur erbrechend lahm wird, wenn die Kühlung plötzlich ausfällt. Irgendwelche Maimboard-Teile wie beispielsweise die MOSFETs haben solche Sicherheitsfunktionen aber nicht. Dann wäre ein Temperaturanstieg der Innenluft im Gehäuse über die Lastsunden in Kombination mit MOSFETs die durch das Mainboard-Design dann vielleicht schon an der Grenze entworfen sind, vielleicht das Problem.

Das würde aber nur Sinn machen, wenn das ganze System überhaupt heiß wird. Tut es aber nicht. Beide Mainboards habe ich mit Standard-Takt von 3,6 GHz getestet. Das neue sogar ausschließlich mit 3,6 GHz, ohne TurboBoost, ohne OC.

Da kann mein fetter Noctua D15S mit Conductonaut Flüssigmetall nur müde drüber lächeln. Und GPU wird bei Prime95 ja gar nicht belastet. Der Airflow im Gehäuse ist sehr gut und ich teste im kühlen Büro mit Klimaanlage. Die Bedingungen könnten nicht besser sein. Überhitzung ist es also sicherlich nicht. Und wie schon mehrfach geschrieben: Es lief doch vorher alles einwandfrei. Und trotz Hardware/Mainboard Austausch tritt es weiterhin auf.

Jetzt lassen wir uns morgen mal überraschen, was die Werkstatt sagt.
 
Zuletzt bearbeitet:
Dein CPU Kühler kühlt die CPU und die kann nicht instabil durch Überhitzen werden. Zum dritten mal: "Irgendwas auf dem Mainboard"
 
MountWalker schrieb:
Dein CPU Kühler kühlt die CPU und die kann nicht instabil durch Überhitzen werden. Zum dritten mal: "Irgendwas auf dem Mainboard"

Also bitte….Dann erzähl mir doch mal im Detail, wie „irgendwas“ durch Überhitzung auf einem nagelneuen Mainboard kaputt gehen soll, wenn es gar keine heißen Bauteile / Hitzequellen gibt? Und dann müssten ja beide Mainboards unabhängig voneinander durch die selbe Ursache gegrillt worden sein.
 
OlafOlafson schrieb:
Wie ich drei Beiträge weiter oben schon geschrieben habe: Beim zweiten Mainboard und der zweiten CPU habe ich weder den RAM, noch die CPU übertaktet. Alles nur auf Stock.
Vielleicht hast du Pech und beide CPUs haben einen weg. Wie ich das gelesen hatte, war die 2. CPU nicht neu, sondern von deinem Schwager. Vielleicht kann er mit seinem PC mal Prime laufen lassen um zu checken, ob an der CPU was faul ist.
 
PhenomIIenal schrieb:
Vielleicht hast du Pech und beide CPUs haben einen weg. Wie ich das gelesen hatte, war die 2. CPU nicht neu, sondern von deinem Schwager. Vielleicht kann er mit seinem PC mal Prime laufen lassen um zu checken, ob an der CPU was faul ist.

Sorry, da hatte ich mich vertippt. Nur der Corsair RAM war von meinem Schwager. Die Ersatz-CPU und das Ersatz-Mainboard hatte ich neu besorgt und nach wenigen Tests wieder zurückgeschickt, da der Fehler ja, entgegen der Vermutungen, nicht dort lag. Netzteil und Gehäuse sind neu und behalte ich auch. Beim nagelneuen vierten RAM Set (3600 CL 16) kommt es darauf an, was die Werkstatt heute sagt. Vielleicht bringen die meinen “alten“ 4400 CL 16, bei dem der Fehler ja offensichtlich ebenfalls nicht liegt, stabil zum laufen, was er vorher ja schon getan hat, bevor die Probleme anfingen. Sonst müsste ich den praktisch neuen 4400er mit Wertverlust wieder verkaufen, weil er knapp über der Widerrufsfrist ist…

Naja, jetzt mal schauen. Um 10:00 Uhr ist der Termin.
 
Zuletzt bearbeitet:
OlafOlafson schrieb:
….Dann erzähl mir doch mal im Detail, wie „irgendwas“ durch Überhitzung ...
Beispiel Nr. 1: CPUs werden durch eine 12-V-Leitung (Stecker in Nähe des Sockels) durch Strom versorgt, werden aber mit nur irgendwas um 1 V betrieben. Die Spannung muss also von 12 V auf 1 V umgewandelt werden. Das macht ein Spannungsregelungssystem, bei dem eine Phase grob vereinfacht aus Spule, Kondensator und MOSFETs, letztere sind Transistoren also Schalter, wechselweise Spule/Kondensator läd oder entläd, dafür schalöten die Transistoren hin und her. Diese Transistoren verbrauchen, alsop wandeln in Wärme um, als Faustregel 10% soviel wie die CPU. Bei einer CPU die auf Vollauslastung irgendwas um die 150 oder 160 W verbrät (auch wenn bei "TDP" 90 oder so steht) macht das 15-16 W Wärmeerzeugung in den MOSFETs. Diese Wärme muss an die Gehäuseluft abgegeben werden und dafür spielen dann auch wieder verschiedene Dinge eine Rolle:
1. Die Anzahl der Phasen und die Qualität der Transistoren. Auf je mehr Phasen diese Spannungswandlung verteilt wird, desto besser die Wärmeabgabe (weil mehr Oberfläche!) - mit sehr vielen Phasen braucht man nichtmal Kühler auf den MOSFETs
2. Größe der Kühler, falls die Anzahl der Phasen nicht zur Leistung des Prozesors passt - die Kühler auf den MOSFETs, nicht auf der CPU!!!
3. Ist der Luftdurchsatz im Gehäuse nicht hoch genug, wird die Gehäuseinnenluft mit zunehmender Betriebszeit immer höher. Ein bisschen höher wird sie auch mit ausreichender Durchlüftung. Hardwaretestseiten testen Mainboards in der Regel in offenen Testgestellen ohne Gehäuse, sodass bei solchen Tests eine zu knappe Kühlng der heiß werdenden Mainboardkomponenten nicht auffällt.

Spannungswandlung findet nicht nur für den Prozessor statt. RAM-Module werden (noch) aus der 3.3 V Leitung gespeist, aber mit 1,2 V betrieben - wird genauso gewandelt wie bei der CPU, ist nur nicht so viel, deshalb meistens uninteressant. Und nicht nur die Transistorchips der Spannungswandlung, sondern alle Transistorchips auf Mainboard, Grafikkarte, Soundkarte erzeugen Wärme, die abgeführt werden muss. Bei deiner Rechnerplattform gibt es zum Glück keine Northbridge mehr, sodass man diese Sorge los ist. Alles, was Wärmeverluste hat, trägt zur Gesamtwärmeleistung des Systems bei, die erstmal in der Gehäuseluft ist und zu schlechterer Wärmeabfuhr bei allen anderen Chips führt, wenn der Luftdurchzug im Gehäuse nicht groß genug ist.
 
Zurück
Oben