Mainboard oder CPU defekt?

Emkay64

Cadet 4th Year
Registriert
Okt. 2015
Beiträge
104
[GELÖST] Mainboard oder CPU defekt?

Mahlzeit

Folgendes:

Ich hab mir letztes Jahr ein neues Skylake System zusammengestellt

Core i5 6600k
ASRock Z170 Extreme4
16GB (4x4 Kit) 2400 MHz Avexir Core Series RAM
Sapphire Radeon 380X Nitro
Die CPU habe ich delidded, die WLP ersetzt und mit Heatspreader (nicht verklebt) wieder montiert

Bis hierhin alles super. Hab n schickes schnelles System fürs zocken. OC der CPU war auch kein Thema, 4.0 GHz ohne overvolting, bis 4.4 mit +50mv. Mehr habe ich garnicht versucht da ich im Moment nur nen arctic freezer 7 pro drauf habe. Die meiste Zeit über habe ich die CPU aber stock betrieben. Undervolting funktionierte auch sehr schön, Stock 3.5 GHz ohne Turbo lief mit 1.0V stabil.

Vor ein paar Monaten fing es dann an dass das System sporadisch in Cities Skylines mit nem "a clock interrupt was not recieved bla bla" bluescreen abstürzte. Dachte mir: OK, ist ein CPU intensives Spiel, ich sollte meinen OC wohl mal etwas zurücknehmen. Also von 4.4GHz zurück auf 4.2. Das funktionierte dann einige Zeit bis sich die Abstürze wieder häuften. Hinzu kam dann immer mal wieder der "machine check exception 0x9c" bluescreen. Das wiederholte sich ein paar mal bis mir diese ständigen Abstürze selbst unter den normalen 3.5 GHz und deaktiviertem turbo begegneten. Lustigerweise lief prime95 stabil stundenlang durch, aber so simple Aufgaben wie einen neuen Tab in Firefox zu öffnen ließen das System reproduzierbar abstürzen. CMOS Reset brachte keine Verbesserung.

Per Zufall bin ich dann mithilfe von CPU-Z drauf gekommen dass die CPU zwar die C-states wechselt, die Spannung (Stand auf Auto) aber oft bei 0.8V stehen blieb. Durch manuelles setzen von 1.2V im UEFI ließ sich das System nun zumindest bei standarttakt wieder halbwegs stabil betreiben. Aber jeder Versuch an den OC Einstellungen etwas zu ändern ließen den Rechner noch während des bootens in den Bluescreen laufen. 4.0 Ghz wollten nichtmal mit 1.35V (+150mv) starten.

Mittlerweile läuft der Rechner nurnoch mit 3.5 GHz, deaktiviertem turbo, komplett deaktivierten C-States, einer manuell gesetzten Spannung von 1.3V und trotzdem begegnen mit beide genannten Bluescreens immer mal wieder sporadisch sowohl in Spielen als auch auf dem Desktop. Nach einem CMOS Reset mit standarteinstellungen und alles auf "auto" bootet das System nicht mehr. Ausserdem zeigt mein Mainboard seit diese Bluescreens angefangen haben den Debug-Code AA während des laufenden Betriebes an. Vorher liefen die Codes durch und nach Code 99 schaltete die Anzeige ab. Eine Google Suche dazu brachte aber nur hervor dass man diesen Code laut ASRock ignorieren könnte. Den RAM und die Grafikkarte kann ich als Fehlerquelle ausschliessen, selbst mit nur einem einzelnen 4GB Riegel bei 2133 MHz und ohne Grafikkarte verhält sich der Rechner identisch. Die Temperaturen sind auch kein Faktor, heisser als 65°C wird die CPU nicht, und die Abstürze finden auch bei niedrigen Temperaturen statt...

Die Frage die sich mir jetzt stellt ist - Wie finde ich heraus ob das Mainboard einen Defekt hat oder die CPU? Ich habe kein Geld um mir Ersatzhardware zu Testzwecken zu kaufen und kenne sonst niemanden der ein Skylake System besitzt in dem ich meine CPU testen könnte. Das Mainboard hat noch Garantie, die CPU nach dem Delidden natürlich nicht mehr...

Peace
TK
 
Zuletzt bearbeitet:
Einfachste Methode: Mainboard zwecks Prüfung auf Garantie / Gewährleistung bei deinem Händler abgeben und in den sauren Apfel beißen, daß du ein paar Wochen keinen Rechner hast.
 
ist das bios von deinem board aktuell? wenn ja, bitte reset es komplett (außerdem ist cpu-z kein zuverlässiges tool um die spannungen anzeigen zu lassen)
 
Uefi ist aktuell, mehrere Resets haben wie schon beschrieben nicht geholfen. Aber es hat sich was neues ergeben. Eben, 5 Minuten nachdem ich hier schrieb ist der Rechner wieder abgestürzt, hat kurz ein Bild voller Artefakte gezeigt und ist dann ausgegangen. Nun bleibt er schon vor dem POST stehen mit dem Debug Code 00, was wohl laut Asrock auf eine fehlende CPU deuten soll. Ohne CPU läuft das Board allerdings nicht mal an, was es normalerweise tun sollte. Das CPU-Z nicht zum auslesen von verlässlichen Spannungen geeignet ist ist klar, aber das UEFI hat mir ja bestätigt dass die "auto" Spannungen viel zu niedrig waren. Anyway, ne andere Möglichkeit als mit Board und CPU zum nächsten PC-Service zu laufen und beides testen zu lassen bleibt mir wohl nicht mehr...
 
So, gibt ein Update. Der PC Laden wollte 40 für die Diagnose. Stattdessen hat mir ein anderer Mitarbeiter mir ein kleines H110 mainboard mit dem Versprechen dass ich es morgen einfach wieder umtauschen kann verkauft. Ich kenn den VK schon, sehr kulant und freundlich. Mit diesem Mainboard gerät das System während des POST in einen Bootloop. Ich habe es genau 1x ins BIOS geschafft und konnte dort alles einstellen. CPU wurde ordnungsgemäß erkannt und alles sah soweit ganz gut aus. Danach habe ich den POST allerdings nie wieder gesehen. Der Mitarbeiter des Ladens spekulierte noch auf ein evtl. defektes Netzteil. Symptomatik ist nun also folgende

ASRock Z170 Extreme4 - Fehlercode 00, nichts passiert ausser dass die Lüfter anlaufen.

Gigabyte H110M DS2 - Bootloop vor/während des POST, 1x erfolgreich erkannt.

CMOS Reset macht keinen Unterschied. Das Netzteil ist ein XFX TS 550 Bronze (Seasonic) und beim erneuten starten während des Loops klickt es leise. Wie hoch liegt die Wahrscheinlichkeit dass eine defekte CPU noch POST Grafiken anzeigen und einen sogar ins BIOS lassen kann wo sie locker 5 Minuten ohne Ausfall arbeitete?

Peace
TK
 
Zuletzt bearbeitet:
Dann mache den RAM Test mit Memtest86 oder Memtest86+, denn korrupte Dateien und Abstürze sind typische Zeichen für RAM Fehler. Teste alle Riegel so wie sie eingebaut sind, ändere da nichts und lass auch die BIOS Einstellungen so wie sie unter Windows betrieben werden, genau so müssen sie ja auch fehlerfrei laufen. Wenn es keine Fehler gibt, warte 6 PASS ob es so bleibt und wenn es Fehler gibt, teste zuerst mit den Standardeinstellungen neu, sollte übertaktet worden sein und danach teste die Riegel einzeln um zu sehen ob einer defekt ist oder ggf. eine andere Ursache vorliegt warum die möglicherweise auch fehlerfreien Riegel nicht fehlerfrei zusammenarbeiten wollen.

Dein Test mit nur einem RAM Riegel besagt ja nicht viel, vielleicht war es gerade der der einen Defekt hat und ja, RAM kann auch erst mit der Zeit Defekte bekommen.
 
Ich habe natürlich nicht nur einen Riegel getestet sondern alle 4 einzeln und auch mal in verschiedenen Bänken. Einen hab ich durch Memtest86 laufen lassen und 1x alle 4 zusammen. Und das alle 4 Riegel gleichzeitig den selben Fehler aufweisen halte ich für unwahrscheinlich. Aber ließ bitte noch mal meinen letzten Post, ich kann nichts mehr mit Memtest testen da 1 Board die CPU nicht erkennt und das andere vor dem POST bootloopt. Das zweite Board loopt dabei sogar wenn garkein RAM verbaut ist. Die Frage ist wie warscheinlich eine vermeintlich defekte CPU auf einem zweiten Board erst noch Lebenszeichen von sich geben kann wie sie es tat...

Aber ich trag heute das ganze System zum PC Laden, die sollen halt alle Teile 1x einzeln durchchecken und mir sagen welches Teil da nun den Dienst quittiert hat...

Edit: Es war wirklich die CPU defekt. Und laut einiger Recherche ist das bei 6600/6700k garnicht mal so extrem selten, gibt einige Einträge von Besitzern deren CPUs ähnliche Fehler aufwiesen. Machine_check_exception 124 oder 0x9c abwechselnd mit "clock_watchdog_timeout" oder eben "clock interrupt was not received on the secondary processor" bluescreens. Der Unterschied war dass ich meine CPU bis zum Totalausfall weiterbetrieben habe (RMA dank Köpfen unmöglich) und den Fehler durch das Bios immer wieder für eine gewisse Zeit "unterdrücken" konnte...

Peace
TK
 
Zuletzt bearbeitet:
Zurück
Oben