Bluescreens, CPU oder Mainboard Fehler/Defekt?

g.s.

Cadet 4th Year
Registriert
Jan. 2009
Beiträge
82
Mein neues System macht Probleme, es lief jetzt 1.5 Monate ohne Probleme hat aber in der letzten Woche dreimal Bluescreens produziert. 2 mal beim Zocken (0x0000050, 0x0000101) und einmal beim Scandurchlauf mit MSE (0x0000124).

Habe darauhin einige Tests durchgeführt um die Ursache zu lokalisieren:
IBT ohne Probleme
IPDT ohne Probleme
PC Check V6 ohne Probleme
Windows Speicherdiagnose ohne Probleme

Seltsamer ist das Verhalten bei folgenden Tests:
Prime95 Fehler immer beim 50k test 29. Testdurchlauf, sonst läuft es 24h stabil nur beim 50k test steigt er aus.
Memtest86 v4.20 da wirft er ab 44% (Test7) endlos Fehler. Habe dann die beiden Ram Module einzeln in allen Bänken getestet, auch wieder mit dem selben Ergebnis, Fehler ab 44% (Test7). Hatte dabei zwischenzeitlich auch mal die GPU entfernt und die IGP verwendet aber selbes Ergebnis. Mittlerweile ist es so das Memtest mit beiden Modulen noch nicht mal mehr startet, es kommt sofort ein Reboot. Dabei ist es egal ob XMP aktiviert ist oder ich die RAMs auf 1333 laufen lasse.
Die beiden Speicherriegel konnte ich im PC eines Freundes testen, laufen dort fehlerfrei mehrere Durchgänge Memtest durch. Liefen bei mir als das System neu war auch ohne Fehler mehrere Durchgänge. Leider habe ich niemanden im Bekanntenkreis der ein S.1155 System hat um die restlichen Komponenten zu testen.
GPU, Netzteil, HD und SSD laufen auf meinem alten S.775 (Q6700 @ 3000mhz) ohne Probleme, bleiben eigentlich nur noch MB oder CPU übrig.

Die Bluescreens lassen sich nicht reproduzieren, und der Rechner lief jetzt wieder einige Tage ohne Bluescreens. Darum hier meine Frage wie finde ich heraus wo der Fehler liegt?
In der Ereignisanzeige habe ich als Warnung WHEA Logger ID19.

Das System:
3570k (@stock), Ga-z77x-d3h, 8gb Corsair Vengeance Low Profile CML8GX3M2A1866C9B, ASUS GTX670-DC2T-2GD5, Be-Quiet E9 400w, Samsung 830 SSD, Hitachi Deskstar 5K3000 2000GB HDS5C3020ALA632
 
Du bist also noch mitten in der Garantiezeit , dann tausch das Board aus.
 
Ja, Garantie ist vorhanden, nur dumm wenn nicht das Board sondern die CPU einen weg hat, ich weiß nicht ob mir dann Kosten entstehen wenn ich ein funktionnierendes Board eintausche.
 
Hast du mal probiert, ob die Fehler mit nem Livebetriebssystem auch auftreten? Eventuell liegts ja sogar am OS (oder irgendeinem treiber). Wenn du Memtest im Boot-modus gestartet hast, vergiss meine Anmerkung :)
 
Ja, ich habe Memtest im Bootmodus gestartet, auch von verschiedenen Medien (Memtest Iso von CD, Kubuntu CD, Gparted von USB). Darum schließe ich ein Windows Problem aus.
 
In deinem Fall würde ich persönlich, auch wenn es noch nie vorgekommen ist, eher die CPU verdächtigen, gerade weil der Speichercontroller in der CPU integriert ist. Ist das MB-BIOS aktuell?
 
Bios ist das letzte aktuelle: F16 (es gibt noch ein neueres Beta), das hatte ich direkt am Anfang geflasht. Da der Fehler ja am Anfang nicht vorkam, gehe ich mal davon aus das das Bios nicht der Übeltäter ist.
Ich habe im Vorfeld auch schon rum gegoogelt und im Zusammenhang mit dem WHEA logger ID19 mehrere Einträge gefunden die auf defekten L2 Cache hinweisen, allerdings bei AMD CPUs. Das Intel Processor Diagnostic Tool sagt ja es ist alles in Ordnung, aber leider ist der Fehler nicht wirklich reproduzierbar und scheint nur bei stärkerer/dauerhafter Belastung aufzutreten und IPDT rennt ja in wenigen Sekunden die einzelnen Tests durch. Ich persönlich würde auch eher auf CPU tippen (wegen integriertem Speicherkontroller), wenn auch sehr selten und unwarscheinlich, nur leider fehlt halt ein genauer Hinweis/Testergebnis.
 
tja, kann vom Mainboard oder CPU Defekt ausgehen, beides untereinander kann ich persönlich nicht ausschließen.
Ergänzung ()

g.s. schrieb:
ASUS GTX670-DC2T-2GD5, Be-Quiet E9 400w

sehr gewagt ;) ich hatte schon mit nem 450 Watt Cougar mit der Non-Top Karte erhebliche Probleme, kann echt auch am Netzteil liegen.
 
Zuletzt bearbeitet von einem Moderator:
Netzteil kann man ausschließen, da die Fehler ja auch auftreten wenn ich nur die IGP benutze (GPU war ja schon testweise ausgebaut), bzw. Bluescreens ja auch auftraten während die 670gtx im Desktop Modus war. Außerdem lief das Netzteil mehrere Wochen auch auf meinem alten System zusammen mit der 670gtx problemlos und das verbraucht ca. 55watt mehr (das war schon eher gewagt ;) ).

Meiner Meinung nach ist das Netzteil für das jetzige System genau richtig dimensioniert (Netzteildimensionierung ist ja fast schon Glaubensfrage), das System zieht nicht mal ganze 300watt aus der Steckdose bei Benchmarks (Prime95+div.Spielebenchmarks), diesen Wert erreiche ich im Normalbetrieb nie. Da beim Spielen die CPU und GPU (FPS Limiter an) beide mit nur ca. 60% ausgelastet sind.
 
Stopfehler 0x050: PAGE_FAULT_IN_NONPAGED_AREA
Mögliche Ursache:

1. Fehlerhafter RAM (Speicher).
2. Fehlerhafter RAM-Komponenten z. B. L2-Cache oder Video-RAM.
3. NTFS-Dateisystem beschädigt.
3. Entsprechende Dienste laufen nicht.
4. Auch eine Anti-Virus Software (Echtzeitschutz) kann diesen Fehler verursachen.

Stopfehler 0x0124: 124 ist CPU-Spannung oder RAM-Controller-Spannung.
The OverClockers BSOD code list

BSOD codes for overclocking
0x101 = increase vcore
0x124 = increase/decrease QPI/VTT first, if not increase/decrease vcore...have to test to see which one it is
on i7 45nm, usually means too little VVT/QPI for the speed of Uncore
on i7 32nm SB, usually means too little vCore
0x0A = unstable RAM/IMC, increase QPI first, if that doesn't work increase vcore
0x1A = Memory management error. It usually means a bad stick of Ram. Test with Memtest or whatever you prefer. Try raising your Ram voltage
0x1E = increase vcore
0x3B = increase vcore
0x3D = increase vcore
0xD1 = QPI/VTT, increase/decrease as necessary, can also be unstable Ram, raise Ram voltage
0x9C = QPI/VTT most likely, but increasing vcore has helped in some instances
0x50 = RAM timings/Frequency or uncore multi unstable, increase RAM voltage or adjust QPI/VTT, or lower uncore if you're higher than 2x
0x109 = Not enough or too Much memory voltage
0x116 = Low IOH (NB) voltage, GPU issue (most common when running multi-GPU/overclocking GPU)
0x7E = Corrupted OS file, possibly from overclocking. Run sfc /scannow and chkdsk /r

Im BIOS ggf. die Spannung mal korrigieren. ;)

Und ... ähm ... just my two cents ... 400W erachte ich für zu wenig. Spannungsspitzen, wie sie auch, oder gerade beim, booten auftreten, bringen ein solches NT schon an den Rand des Machbaren. 480W dürften es schon sein. Warum, wieso, weshalb ... das wird hier sehr gut beschrieben.
 
@Keres

danke, für die kompetente Unterstützung, er will mir ja nicht glauben schenken :freaky:
 
Wirst wohl nicht darum herumkommen, ein anderes Mainboard und eine andere CPU zu testen. Erst dann kann man sehen, ob eins von beiden die Schuld an den Bluescreens trägt.

Zum Netzteil:

Computerbase selbst verwendet in ihrem CPU-Testsystem genau dasselbe Netzteil, ein be quiet! Straight Power E9 mit 400W! Damit wird eine GTX 680, sowie alle CPUs, auch die ganzen AMDs, die teilweise um einiges mehr Strom ziehen, als die Intels, befeuert. Haben die also auch ein total unterdimensioniertes Netzteil verbaut und keine Ahnung?

Zitat aus dem Text zum Testsystem:
[...] Ein „80 Plus Gold“-Netzteil von be quiet! mit einem Wirkungsgrad jenseits der 90 Prozent sorgt mit maximal 400 Watt für genügend Leistung in allen Bereichen [...]

Also ich glaube ebenfalls nicht, dass es am Netzteil liegt. Jedenfalls liegt es nicht daran, dass es zu wenig Leistung bringt oder Spannungsspitzen nicht verkraftet. Wenn überhaupt, dann funktioniert es einfach nicht mehr korrekt.
 
Ich tippe auf defektes Mainboard. Kalte Lötstelle oder CPU Sockel Defekt. Schonmal den LGA Sockel und die CPU mit Lupe in Augenschein genommen ? CPU erneut einsockeln kann evtl. auch helfen. CPU (IMC) defekt halte ich für unwahrscheinlich, kann aber auch sein.
 
Bevor das ganze hier in eine Diskussion über Netzteildimensionierung ausartet.
Der einzig reproduzierbare Fehler im Moment ist das Verhalten in Prime/Memtest, d.h. Memtest startet nicht wenn beide Module gesteckt sind und wenn nur ein Modul gesteckt ist (egal welches Modul in welchem Slot) werden mir ab 44% Millionen Fehler angezeigt, obwohl beide Module in anderem Rechner einwandfrei Memtest durchlaufen. Diesen Test habe ich auch mit ausgebauter 670gtx gemacht, bei gleichem Verhalten, und das Netzteil sollte ja 3570k mit integierter Grafik locker schaffen.

@Keres: Das mit der Ram Controller Spannung ist ein guter Ansatz, das werde ich mal austesten.

@all: Falls jemand aus dem Kreis Aachen Lust hat eine Cpu zu testen bitte bei mir melden. :)
 
Welche Spannungen fährst Du denn im Detail ?
 
@DigitalIllusion: Auf jeden Fall einen Versuch wert, werde ich am Wochenende mal probieren, da habe ich dann auch Zugriff auf den Weltbesten Kalte Lötstellenfinder.
 
Ich möchte gerne wissen, welche Spannungen Du fährst. Es interessiert mich neben Deinem Problem sehr.
 
Ich habe die Bordspannungen alle auf die vorgegebenen Werte (auf Normal) gefixt, bis auf die Vcore, die steht auf Auto, da das Board auf Normal etliches an Vcore draufpackt und wenn ich die Vcore bei 1.18 fixe dann greifen nicht mehr alle Stromsparfunktionen (d.h. die Vcore wird im Idle nicht mehr abgesenkt).
 
Zuletzt bearbeitet:
Vielleicht bist Du bereit, alle Spannungen zu nennen ? Es interessiert mich...

VCore und Temperaturen der Kerne unter CPU-Z und CoreTemp im Idle und unter Custom 8K in Place bei Prime95 nach 25 Minuten ?

Offset - welcher ?
DRAM Spannung ? DRAM Timings ? DRAM Frequenz ?
Load Line Calibration ?
VTT/IMC Spannung ?
PCH Spannung ?
PLL Spannung ?

Könntest Du diese Dinge bitte posten ?
 
Natürlich bin ich bereit die zu posten, mußte aber erstmal ins Bios nachschauen.

Idle: Vcore 0,78-0.86v Kerntemps zwischen 13-18c
Prime: Vcore 1.152v Kerntemps zwischen 51-58c

Kein Offset (funkioniert nur auf Stellung Normal)
Dram 1.5v 9-10-9-27 tRc48 Command Rate 2T
LLC steht auf Auto
Vtt 1.05v
IMC 0.925v
PLL 1.8v
PCH nicht vorhanden

Falls das hilft, ich hatte während des Testens auch nochmal die Optimized Defaults geladen (da ist dann im Prinzip alles auf Auto) was aber auch nichts gebracht hat.
 
Zurück
Oben