ASRock Z77 Extreme4 - Fehler bei PCI bzw. Southbridge

slawaweis

Cadet 4th Year
Registriert
Aug. 2007
Beiträge
109
Hallo,

ich habe ein Problem mit meinem PC, bei dem ich nicht weiterkomme. Meine Konfiguration ist:

- ASRock Z77 Extreme4
- Intel i7-3770K
- 2x8GB RAM von Corsair
- 400W Netzteil von be quiet!

Den PC habe ich im Oktober 2012 selber zusammengebaut und er lief 4 Jahre ohne Probleme. Übertaktet habe ich nie. Auf eine gute Kühlung habe ich von Anfang an geachtet und immer gemessen. Auch heute melden die Sensoren gute Werte in Sachen Temperatur. Doch Anfang des Jahres fing es mit Abstürzen und Bluescreens an. Habe mir damals nicht viele Gedanken darum gemacht, es war vielleicht 1x die Woche. Doch im Laufe des Jahres wurde es immer schlimmer und inzwischen bin ich froh, wenn ich einen Tag ohne Abstürze überstehe. Seit kurzem geht der Schlafmodus nicht mehr. Der Rechner schaltet sich nicht ab, obwohl keine Aktivität mehr stattfindet und auch auf Festplatten nicht mehr zugegriffen wird. Wenn ich dann den Rechner hart abschalte und starte, ist es wie ein Bluescreen. Weiterhin stürzen Programme willkürlich ab, ohne eine Benachrichtigung. Die sind einfach weg. Vollkommen egal welches Programm oder wann.

Natürlich habe ich an den RAM gedacht und diesen mit MemTest86 7.4 über USB-Stick getestet. Der gab mir einige Fehler aus. Das merkwürdige war, bei jedem Test waren vollkommen andere Speicherzellen betroffen, nie wurde dieselbe Speicherzelle zweimal gemeldet (sehe Anhang). Um es besser nachzuvollziehen, habe ich alles Mögliche vom Mainboard abgekoppelt und das minimalste System gestartet: Mainboard, CPU, RAM, Tastatur und Monitor am Mainboard. Jetzt meldete MemTest86 keinen einzigen Fehler. Ich habe die Tests mehrmals wiederholt, in mehreren Durchgängen. Dazwischen habe ich den Rechner abgeschaltet und sogar den Stecker gezogen. Kein einziger Fehler. Auch beim Ankoppeln aller Festplatten und USB-Geräte blieb es so. Alles was noch nicht dran war, waren die PCI-Karten.

Hier fängt das Problem an. Ich habe 3 PCI Karten: Grafikkarte, Soundkarte und SATA-Controller. Wenn ich irgendeine davon in das Mainboard stecke und MemTest86 ausführe, meldet das Programm Fehler. Dabei spielt es keine Rolle welche PCI-Karte, wie viele davon oder welcher passender Steckplatz. Ich glaube, ich habe alle Kombinationen ausprobiert. Wenn eine PCI-Karte drin ist, meldet MemTest86 Fehler.

Ich habe das Mainboard auf mögliche Beschädigungen untersucht. Optisch ist nichts zu entdecken, auch lagen keine abgebrochenen Teile herum. Ich hatte das BIOS 2.90P von 2017 drauf, habe es auf 2.90 von 2013 runtergesetzt. Das selber Problem, nur war jetzt ein anderer Speicherbereich betroffen. Bei 2.90P fingen die problematischen Speicherzellen mit "3F" an, mit 2.90 fangen sie mit "40" an. Weiterhin ist allen Fehlermeldungen gemeinsam, dass der geschriebene und gelesene Wert sich an zweiter Stelle von Links unterscheidet, und zwar nur um ein Bit (sehe Anhang). Weiterhin werden alle Fehlermeldungen von Kern 0 verursacht, obwohl alle Kerne im Einsatz sind. Aber ohne die PCI-Karten läuft jeder Test ohne Probleme durch.

Jetzt weiß ich nicht, wie ich weiter vorgehen soll, um das Problem zu identifizieren. Dass alle meine PCI-Karten auf dieselbe Art defekt sind, glaube ich nicht. Ich vermute, es liegt am Mainboard, doch wie finde ich heraus, woran es liegt? Oder wie könnte ich es beheben? Alles was ich jetzt noch machen kann ist zu versuchen für ein paar Tage ohne die PCI-Karten zu arbeiten und zu sehen, ob es die Quelle der Abstürze ist. Das ist aber nicht ganz so einfach, deshalb frage ich lieber vorher hier nach, wie man die Sache mit Fehlermeldungen von MemTest86 lösen könnte.
 

Anhänge

  • 001.jpg
    001.jpg
    128,8 KB · Aufrufe: 569
  • 002.jpg
    002.jpg
    191,3 KB · Aufrufe: 543
  • 003.jpg
    003.jpg
    177 KB · Aufrufe: 511
  • 004.jpg
    004.jpg
    168,3 KB · Aufrufe: 489
Hallo, allem Anschein nach, will hier allen nicht viel einfallen.

Ich versuche mal zu "Antworten", hier die Frage *g*... Wie alt ist das Netzteil ? Baujahr etc.
 
So leid es mir tut, aber das haben die Asrock Bretter gerne für Sockel 1155. Gerade in diesem Zeitraum habe ich viele Gaming PCs gebaut, von den 6 Asrock Boards (innerhalb von 2 Jahren gekauft) haben ganze 3 Stück, innerhalb von max. 3 Jahren den Betrieb vom PCIEx16 ganz auf gegeben. Über die anderen Ports weiß ich nicht so recht Bescheid weil nix drin war. Bei einem Kumpel war es auch so, zuerst Fehler, dann mehr Fehler, danach Totalausfall.
Mit den anderen Asrock Brettern die ich für diesen Sockel verbaut habe komme ich bei Asrock auf eine Ausfallquote von über 50% innerhalb von 3 Jahren. Zu der Ausfallquote zähle ich auch Teildefekte. Bei meinem Z77 Extrem6 funktionieren nicht mehr:
1 USB3 intern
1 PWM Fan Header
1 SATA Port (der zudem noch 2 Platten geschrottet hat, zum Glück war die 2. uralt)
1 E-SATA Port
Muss bei dir vielleicht nicht so sein, aber ich denke du kannst dich von deinem Board verabschieden.
 
Danke an Alle für die Antworten. Das Netzteil ist "be quiet! Straight Power E9 400W", Oktober 2012 gekauft, Baujahr frühestens 2011. Mit "PCI" meinte ich eigentlich einen Mix aus verschiedenen Größen, darunter "PCIe 3.0 x16", "PCIe 2.0 x1" und "PCI". Damit konnte ich alle Steckplätze ausprobieren, immer mit demselben Ergebnis.

Wenn sich das Mainboard verabschieden sollte, wäre das sehr schade. Das Problem taucht bis jetzt nur bei PCI*-Steckplätzen auf. Andere Geräte/Komponenten funktionieren ohne Probleme und ich nutze fast jeden Steckplatz auf dem Mainboard, außer COM-Port und den OnBoard Grafik-/Soundkarten. Wenn sich aber weitere Geräte/Anschlüsse verabschieden, dann hole ich mir ein neues Mainboard.

Ist ASRock für die Zukunft empfehlenswert, oder sollte ich mich bei anderen Herstellern umschauen? Hatte bis jetzt Asus, MSI und Gigabyte gehabt, ohne Probleme. Die damit gebauten Rechner laufen immer noch.
 
Warum sollte ASrock Boards nicht empfehlenswert sein für die Zukunft.
Probleme kann man auch mit Asus, MSI, .. Boards bekommen.
Ich hab das ASrock Z77 Extreme4 hier auch noch am laufen seit 2013 und
es tut immer noch sein Dienst ohne Probleme, übertaktet.
Ich nutze aber keine PCI-Karte mehr, hatte aber 3 Jahre eine X-Fi Soundkarte (PCI) verbaut, auch keine Probleme.
Der ASrock Support soll gut sein und das Support-Forum ist auch ok.
Ein Ersatz Z77 EXT4 würdest du finden bei Ebay, aber unter 110-120€ ist es nicht zu haben dort.
 
Jo, wird das Mainboard sein. An deiner stelle würde ich Upgraden auf z.B. einen Ryzen 5. Wenn du jetzt ein gebrauchtes Board kaufst, weißt du auch nicht wie lange es hält.
 
So, habe die letzte Woche experimentiert. Ich habe die Fehlerquelle gefunden (es ist nicht das Mainboard) und kann diese inzwischen auch umgehen, so dass der Speicher keine Fehler mehr erzeugt. Der Grund ist ein RAM-Riegel, aber kaputt ist der auch nicht. Es ist kompliziert. Alles der Reihe nach.

Der Computer hatte wieder die vollständige Ausstattung, d.h. alle PCI*-Karten waren drin. Ich habe viel mit MemTest getestet und den Fehlerbereich im Speicher isoliert. Der gesamte testbare Speicher (16GB) laut MemTest ist von 0x000000000 bis 0x43F600000, der fehlerhafte Bereich liegt in 0x400000000 bis 0x410000000. Die anderen Bereiche konnte ich nach mehreren Testsreihen ausschließen. Nach MemTest liegt der fehlerhafte Bereich übrigens im "freiem Speicher". Auf diesen Bereich habe ich dann intensive Tests laufen lassen, in der Hoffnung, dass sich was ändert. Ist nicht passiert. Ich habe mich gewundert, wieso nur der erste Kern (Core 0) des Prozessors die Fehler verursachte. Also habe ich in MemTest nur einen Kern eingestellt. Es lief fehlerfrei durch, mehrmals. Danach habe ich alle Kerne, auch Core 0, einzeln durchgetestet, auf den gesamten testbaren Speicher. Kein einziger Fehler! Als nächstes habe ich im BIOS den PC auf einen Kern gestellt und einen Tag mit dem Computer so gearbeitet. Natürlich merkt man, wenn da nur ein Kern läuft und manche Programme starten erst gar nicht. Aber ich hatte keine Abstürze und keine Fehlermeldungen. Normallerweise merke ich sowas schnell, da in Chrome reihenweise Tabs abstürzen.

Als nächstes habe ich zu der Kompatibilität meiner CPU und RAMs gegoogelt. Es gibt tatsächlich solche Fehler, welche sogar Intel kennt:

https://communities.intel.com/thread/30930

Der erste Post beschreibt sehr gut das Problem, welches ich habe. Wieder alle Kerne eingeschaltet und die RAM-Einstellungen im BIOS angesehen. Die habe ich nie per Hand verändert. Gewundert hat mich, dass der RAM mit 1.585v betrieben wird, "Auto" Einstellung im BIOS. Habe das auf gut Glück verändert. 1.5v oder 1.4v haben noch mehr Fehler produziert, als vorhin. Also habe ich angefangen die Zahl schrittweise zu erhöhen. Die Fehler im MemTest wurden weniger. Bei 1.800v, das maximale was mir der BIOS erlaubte, kam ich an den Punkt, wo es nur noch 0 bis 2 Fehler gab. D.h. manche Testdurchläufe von MemTest (mit mehreren Durchgängen) haben gar keinen Fehler ergeben, andere nur einen oder zwei. Damit habe ich wieder einen Tag erfolgreich gearbeitet, diesmal mit allen Kernen. Danach den BIOS wieder auf die Auto-Einstellungen gesetzt. Übrigens hatte der BIOS 2.90 von 2013 mehr Fehler produziert als 2.90P von 2017. Also habe ich weiter nur noch mit 2.90P gearbeitet.

Den ganzen letzten Sonntag habe ich damit verbracht die einzelnen RAM-Riegel zu testen. Jeder einzelne Riegel wurde in jedem Slot des Mainboards getestet, um gleich auch das Mainboard zu überprüfen. Kein einziger Fehler. Auch beide Riegel zusammen in Single-Channel haben keine Fehler produziert. Die Fehler in MemTest tauchen nur dann auf, wenn beide RAM-Riegel im Dual-Channel mit Multi-Core CPU laufen. Dabei ist es egal, welcher Riegel in welchem Slot steckt. Übrigens, laut Corsair ist jeder Riegel, der einzeln alle Tests besteht, voll funktionstüchtig und kein Reklamationsgrund.

Ich habe mir von einem Bekannten zwei RAM-Riegel mit exakt derselben Modelnummer, wie meine, ausgeliehen. Nennen wir diese B1 und B2. Nach seiner Aussage waren die kaputt. Diese habe ich auch einzeln getestet. Einer war tatsächlich kaputt. Der Computer startete und auch MemTest lief durch, zeigte aber mehrere hunderttausend Fehler an. Der zweite Riegel (B2) war fehlerfrei. Jetzt habe ich einen meiner Riegel (A1, A2) mit diesem kombiniert: A1+B2. Leider Fehlermeldungen. Anderer Riegel: A2+B2. Keine Fehler, in mehreren Durchläufen! Mit Dual-Channel und Multi-Core CPU.

Jetzt wollte ich es endgültig wissen und habe noch den Riegel A1 dazugetan: (A2+B2)+A1. A2 und B2 laufen, laut BIOS, im Dual-Channel, A1 ist das dritte Rad. Keine Fehler! Habe es die ganze Nacht lang durchtesten lassen.

Woran es liegt, kann ich nicht sagen. Hat was mit der Kompatibilität des Intel Prozessors und des RAMs zu tun. Eigentlich sind diese kompatibel, aber diese besondere Kombination von Umständen, Dual-Channel und Multi-Core, führt zu Fehlern. Theoretisch wäre es auch möglich, dass ein Update irgendeines Programms (z.B. von Intel), mir im Hintergrund auch den Mikrocode der Hardware aktualisiert hat. Leider habe ich den RAM gleich nach dem Kauf nicht getestet, so habe ich auch keine Vergleichswerte. Werde es jetzt einmal im Monat testen, wie lange es fehlerfrei bleibt.

Die Sache mit dem Ruhemodus hatte übrigens andere Ursachen, das war der Soundkartentreiber. Nach einem der Abstürze wurde die Soundkarte (X-Fi XtremeMusic) nicht mehr erkannt. Geholfen hat nur die Karte aus dem Rechner rauszunehmen und wieder einzusetzen. Dabei habe ich gleich noch die Treiber aktualisiert. Die Folge war, dass wenn irgendein Media Player auf Pause stand, der Rechner sich nicht mehr schlafen gelegt hat. Wenn man auf Stop gedrückt oder die Soundkarte deaktiviert hat, fährt der Rechner normal in den Ruhemodus. Muss mich dann wohl später mit den kreativen Creative Treibern auseinandersetzen.
 
Zuletzt bearbeitet:
Zurück
Oben