i7 Instabilität bei zu hoher Last

  • Ersteller Ersteller mkayaba
  • Erstellt am Erstellt am
M

mkayaba

Gast
Guten Abend,

ich konnte leider noch nichts passendes zu meinem Problem finden, deswegen mach ich mal einen Thread auf :P

Es geht um folgendes: Vor einigen Monaten habe ich mir dieses System usammengebaut: http://www.sysprofile.de/id91770

Bis vor wenigen Wochen lief alles soweit ganz gut. Nun habe ich folgendes Problem:
Wenn die CPU Auslastung auf 100% ansteigt stürzen die Programme, welche diese Auslastung verursachen (3DMark06, Cinebench R10, Cinebench 2003, Burn In Test), ab (Temperaturen bleiben alle im grünen Bereich). SuperPi läuft jedoch fehlerfrei durch (8M), zumindest bei einer Instanz, welche ja auch nur einen Kern beansprucht (mit mehreren habe ich es noch nicht probiert). Unter Windows Vista hat sich ab und an auch der ganze Rechner mit einem Neustart verabschiedet.

Da auf den Vista Bluescreens einmal etwas von falschen Treibern oder einer vollen Festplatte stand, habe ich die Festplatten mit Burn In Test geprüft und das lief fehlerfrei ab. Nur beim CPU Test ist er abgestürzt.
Danach habe ich die Treiber geupdated, aber es wurde nicht besser.

Mittlerweile habe ich komplett formatiert und Windows XP SP3 auf dem Rechner installiert, mit den aktuellsten Treibern. Die Probleme bestehen jedoch weiterhin.

Liege ich richtig in der Annahme, dass die CPU eine kleine Macke haben könnte? Oder gibt es noch einen anderen Verursacher für dieses Problem?


MfG
 
Versuch mal ein BIOS update. Musst du mal beim hersteller auf der supportseite schauen


LG

hier stand müll xD


schau trotzdem mal ob der kühler richtig sitz.. vieleivht ist ein pin ruasgerutscht oder anderes
 
Zuletzt bearbeitet:
Versuch mal SP2 zu installieren bei Vista
 
Zuletzt bearbeitet:
ich glaube kaum, dass ein Bios-Update hier hilft. Immerhin lief das System einwahnfrei.

So wie du es beschreibst, kann es wirklich an der CPU liegen. Zusätzlich würde mir noch das Mainboard einfallen, und dann natürlich der RAM. Versuch mal nacheinander jeden RAM Riegel zu entfernen und lasse Prime95 auf In-Place large FFT (oder so...) durchlaufen...1-2 Stunden sollten genügen.
Grundsätzlich gilt, wenn sich das System seltsam verhält, kann der RAM immer Schuld sein, hier läuft halt alles zusammen. Und diesen kann man durch herausnehmen einzelner Riegel leicht testen. Vergiss zudem nicht, unterschiedliche Bänke zu testen, hier könnte auch ein "leicht zu findender" Fehler liegen.

Software-Fehler kann man schon fast ausschließen, da du den gleichen Fehler unter XP wie Vista hast. Welche Windows-Versionen waren es, vermutlich 32bit?

Interessant wäre noch der Fehlercode des Vista-Bluescreens und worauf der Pointer zeigt. So konnte ich damals meinen Bluescreen (fehlerhafter standard Vista-Treiber fürs Netzwerk) beseitigen.

Marc
 
QPI zu hoch ?
 
Tippe auf die CPU. Was sagt prime95? Fehler beim Origninaltakt -> CPU defekt.

Zur Vorsicht auch mal andere PSU testen (Deine ist mehr als ausreichend, ich möchte darauf hinaus, einen Defekt bei höherer Auslastung auszuschließen).

Das System von allem trennen, was verzichtbar ist (Soundkarte, Erweiterungskarten, ect). Nur EINEN RAM-Riegel installieren. RAM-Slots und -module tauschen.

Besteht das Problem weiterhin? Wenn nein: Bei welchem Punkt funktionierte es plötzlich?

MfG,
Dominion1.
 
Hui, eine Menge Fragen. Werde mal nacheinander alle beantworten :)

Versuch mal ein BIOS update. Musst du mal beim hersteller auf der supportseite schauen
also die express hilfe

hier das neueste bios ziehen

das F7 ist dreck ...
Hatte ich vergessen zu erwaehnen, hatte das F5 drauf und als die Probleme auftraten hab ich auf das F7 (welches im Moment die aktuellste nicht-Beta Version ist) geupdated

Versuch mal SP2 zu installieren bei Vista
Ahhh! Das fehlt nur in meinem sysProfile, ich hatte SP2 drauf :P

Interessant wäre noch der Fehlercode des Vista-Bluescreens und worauf der Pointer zeigt. So konnte ich damals meinen Bluescreen (fehlerhafter standard Vista-Treiber fürs Netzwerk) beseitigen.
Naja, der Vista Bluescreen wird sich im Moment schlecht rekonstruieren lassen, da ich ja nun XP drauf habe... Allerdings hatte ich da vorhin auch einen Bluescreen. Mehr als irql_not_less_or_equal konnte ich allerdings nicht lesen.

Welche Windows-Versionen waren es, vermutlich 32bit?
Ja, sowohl Vista als auch XP sind 32-Bit Versionen.

Ich weiß nicht, nutze die Standardeinstellungen im BIOS, habe lediglich HyperThreading deaktiviert.

Tippe auf die CPU. Was sagt prime95? Fehler beim Origninaltakt -> CPU defekt.
Habe Prime95 noch nicht laufen lassen.

Zur Vorsicht auch mal andere PSU testen (Deine ist mehr als ausreichend, ich möchte darauf hinaus, einen Defekt bei höherer Auslastung auszuschließen).
Mit einer anderen PSU sieht es eher schlecht aus, da ich an keine weiter rankomme. Ich kann aber einen Leistungsmesser in die Steckdose stecken und schauen was mehr Strom zieht, CPU auf 100% oder anspruchsvolle 3D Anwendungen. Angenommen bei voller Auslastung der CPU ist der Gesamtverbrauch geringer und es stürzt trotzdem ab, so wäre das NT wohl ausgeschlossen.
Aber mal angenommen es wäre defekt, sollte sich dann nicht jedes mal der gesamte Rechner abschalten anstatt dass nur ein Programm abstürzt?


Ich werde dann morgen mal nach dem Kühler schauen, ob dieser noch ordnungsgemäß sitzt (sollte er eigentlich, da die Temperaturen nicht höher als 65°C gehen). Dann schau ich nochmal die Einstellungen im BIOS durch und danach werde ich mir mal Prime95 vornehmen. Dazu werde mir auchmal die Leistungsaufnahme ansehen.


Vielen Dank für die Antworten bisher :)
In diesem Sinne wünsche ich euch eine gute Nacht :)
 
Ein Leistungsmessgerät wird Dir vorliegend leider nicht viel weiter helfen.

Ich halte dies zwar für eher unwahrscheinlich, doch es wäre denkbar, dass Deine PSU bei hoher Auslastung aufgrund eines Defektes die Leistung nicht stabil bereitstellt.

Hast Du keinen Kumpel, dessen PSU Du mal testweise anschließen könntest? (Du müsstest sie nicht einmal ausbauen.) Alternativ schau mal in einem PC-Laden vorbei und vereinbare mit dem Inhaber günstige Konditionen, damit er Dir vor Ort mal eine PSU zur Verfügung stellt (für 5 € konnte ich bei meinem Händler solange testen, wie ich wollte - als einmal die PSU der Grund allen Übels war, wurden mir die 5€ sogar angerechnet, da ich die PSU gleich mitnahm).


Bitte halte uns weiterhin auf dem Laufenden... .

MfG,
Dominion1.
 
Hallo,

also ich habe vorhin als erstes mal im BIOS geschaut und habe die Einstellungen mit denen auf diesem Bild hier verglichen. Die Spannungen stehen alle auf Auto (da trau ich mich auch nicht wirklich was zu ändern). Der QPI Link Speed stand auch auf Auto (und war durch dieses auf X36 eingestellt, wie man ja in der Zeile darunter erkennen kann), habe ihn trotzdem mal manuell auf X36 eingestellt und neugestartet.

Ich ließ Prime95 mit small FFTs 2 Zyklen durchlaufen (wenn es zu dem Fehler kam war die CPU Auslastung nur wenige Sekunden auf 100%, deswegen dachte ich der kurze Test sollte anfangs genügen). Keine Probleme.
Danach ließ ich Cinebench R10 laufen und sah zum ersten mal überhaupt wie das fertig gerenderte Bild aussieht.

Soweit so gut, habe dann zur Gegenprobe den QPI Link Speed wieder auf Auto gesetzt. Die 3 Tests in Prime95 liefen 2 Zyklen stabil durch. 3DMark 06 lief ohne Probleme durch und beim Burn In Test liefen der CPU und RAM Test (mit 100% Auslastung) 15 Minuten durch.

Aus welchen Gründen auch immer funktioniert es im Moment. Der einzigste Unterschied zu gestern Abend z.B. ist, dass es im Moment kühler in meinem Zimmer hier ist. Die Temperaturen, die ich auslesen kann sind und waren aber alle in Ordnung. Nur die Northbridge scheint keinen Temperatursensor zu haben, da war der Passivkühler gestrn Abend auch gut warm. Nach den Tests heute war der Kühler allerdings auch recht warm.
Und am Netzteil ist auch kein Sensor, wie es da mit der Wärmeentwicklung aussieht weiß ich nicht. Vielleicht wird dieses ja zu warm?

Auf jeden Fall werde ich das Ganze weiter beobachten, denn so richtig glauben kann ich es nicht, dass es jetzt laufen sollte. Denn immerhin ist der QPI Link Speed ja wieder auf Auto und somit fahre ich die gleichen Einstellungen wie die letzten Wochen auch. Allerdings hab ich in dieser Zeit auch nicht jeden Tag versucht auf Teufel komm raus Benchmarks fehlerfrei laufen zu lassen. Verwunderlich ist nur, dass jedes mal, wenn ich es versuchte, eben dieser Fehler auftrat...


MfG
 
Bei prime95 hast Du darauf geachtet, dass auch alle acht virtuellen Cores (8 Threads) belastet werden?

Wenn ja, wird ein Defekt Deiner CPU sehr unwahrscheinlich.

Teste die RAM-Module einzeln und in verschiedenen Slots, sobald der Fehler wieder auftritt. Teste die RAMs mal mit memtest.

MfG,
Dominion1.
 
Hallo,

habe ja Hyperthreading deaktiviert, insofern wurden nur die 4 physikalischen Cores belastet.
Bis jetzt funktioniert noch alles, Cinebench hat wieder mal geklappt.
Dennoch werde ich dann MemTest auch mal laufen lassen.


MfG
 
Hast Du HT deaktiviert, BEVOR die Probleme auftraten oder erst DANACH?

MfG,
Dominion1.
 
Hallo,

ich habe HyperThreading schon einige Tage nach dem Zusammenbau deaktiviert. Die Probleme traten also erst Monate später auf.

Habe eben, als ich den Rechner einschaltete, nochmals Cinebench laufen lassen -> Absturz des Programmes. (Und hier ist es nicht warm, um mal die Außentemperatur auszuschließen)

Danach habe ich memtest laufen lassen. Hier das Ergebnis...
Bei 160 Fehlern habe ich dann aufgehört... Am Anfang lief es für 1-2 Minuten gut, danach traten die Fehler immer schneller auf. (Also ich hatte nur 3 Instanzen von memtest laufen, auf dem Bild sind 2 Screenshots von diesen 3 Instanzen zu sehen. Ich merke nur gerade dass der untere Teil zeitlich vor dem oberen geschehen ist :P)

dominion1: Meinst du es könnte etwas bringen die Sticks untereinander mal zu tauschen? Wieviel Sinn hat es die Sticks einzeln zu testen? Weil laut der Aussage auf der memtest Homepage hat mein RAM einen Schuss weg, demnach würde im Falle eines Umtausches das ganze Kit getauscht werden.


MfG
 
Hallo,

ich habe nun mal ein paar Sachen getestet:

1. Habe den 3. RAM-Riegel entfernt, so dass ich quasi nur noch 2GB hatte --> Rechner lief stabil (memtest bis 300% laufen lassen, volle RAM Ausnutzung)

2. Habe dann den herausgenommenen 3. Riegel mit dem noch auf dem Board vorhandenen 2. Riegel getauscht --> Rechner lief stabil (memtest bis 100% laufen lassen, volle RAM Ausnutzung)

3. Habe danach wieder alle Riegel eingesetzt und den 2. und 3. auch getauscht gelassen --> lief anfangs stabil 1,5 Tage durch. Einen Tag später traten wieder Probleme auf...

4. Habe jetzt im Moment wieder einen Riegel herausgenommen und werde die ganze Sache mal mit 2GB mehrere Tage beobachten.

Der Fehler scheint also wirklich nur ab und zu aufzutreten, wobei die Außentemperatur vernachlässigt werden kann...


MfG
 
Grüße,

mittlerweile kann ich sagen, dass mein Rechner mit 2GB RAM im Dual-Channel stabil läuft. Dabei ist es auch egal welchen der 3 Riegel ich herausnehme.

Sobald ich jedoch den 3. Riegel wieder einsetze läuft der Rechner ohne Probleme 1 1/2 Tage durch. Nach einem Reboot jedoch treten wieder die Probleme auf...

Könnte man denn die Riegel in die RAM-Slots 0, 2, 4 stecken? Weil im Handbuch ja für 3 Riegel nur die Slots 1, 3, 5 angegeben sind... Denn vielleicht ist ja Slot 5 defekt? Bleibt dennoch die Frage warum es manchmal geht und manchmal nicht...

Weiß noch jemand Rat? Wäre für jede Hilfe dankbar :)


MfG
 
Das übliche wenn der Speicher nicht will: Speichercontroller mit mehr Spannung versorgen.

Also im Bios QPI-Spannung und IOH-Spannung leicht anziehen. Im Notfall den Speicher mit etwas mehr Saft versorgen.
 
Zurück
Oben