MB scheint Wackelkontakt zu haben

Pyrukar

Commodore
Registriert
Jan. 2013
Beiträge
4.175
hallo,

ich habe ein System, das ziemlich genau 2 Jahre (gerade aus der Gewährleistung raus) alt ist und letztes Wochenende lief es dann nicht mehr rund: Beim ersten einschalten nach mehreren Wochen startete das System problemlos, stürzte dann aber nach ca 2 Minuten ab. Beim nächsten versuch stürzte es bereits wärend des Windows7 Startscreen ab. beim 3. Mal kam ich noch gerade ins Bios um eine coretemp von 30°C festzustellen. danach startete das System nichtmehr wirklich ( 2 umdrehungen der Systemlüfter und schluss war).

Daraufhin habe ich das System soweit wie möglich abgespeckt um Fehlerquellen auszuschließen. Also nur noch CPU + Kühler, PSU und RAM und natürlich das MB. Kein Effekt. Auch mit nur 1 Ramriegel und in den 2 verschiedenen Ramslots war keine Änderung herbeizuführen.
Die entsprechenden Komponenten sind:
ASRock H87M-ITX Intel H87 So.1150 Dual Channel DDR3 Mini-ITX
Intel Core i5 4570S 4x 2.90GHz So.1150 BOX
8GB (2x 4096MB) Corsair Vengeance LP blau DDR3-1600 DIMM CL9-9-9-24 Dual Kit
400 Watt be quiet! System Power 7 Bulk Non-Modular 80+ Bronze

Daraufhin habe ich entschlossen am vergangenen Wochenende weitere Tests durzuführen wobei ich die PSU und den RAM komplett auszutauschen (von meinem anderen PC kompatibel). Jetzt stellte sich jedoch heraus, dass das System unter selben Voraussetzungen der Woche zuvor wieder Problemlos lief (USB UBUNTU). Ich habe dann MEMTEST86 durchlaufen lassen wobei dies ohne Befund durchgelaufen ist. Somit kann ich eigentlich einen Fehlerhaften RAM auschließen kann. Einzig auffällig und deshalb das MB im verdacht: Die RAM Riegel sind definitv auf 1600 mhz ausgelegt takten laut MB jedoch nur auf 1333 mhz. durchaus Möglich, dass ich in der Auslegung einen grundsätzlichen Fehler gemacht habe und auch das Regulär nicht über 1333 mhz geht. MEMTEST86 hat jedoch auch den Prozessor falsch angezeigt ( I7 32nm fertigung) = beides Falsch. wobei ich hier nicht sagen kann ob das Programm das einfach falsch gemacht hat oder das MB die falschen Daten übermittelt hat.

Meine Frage ist jetzt, wie das sein kann, dass der PC am einen Tag problemlos bootet und am Anderen wie oben beschrieben massive Aussetzter hat. Welche Fehlerquellen kann das haben? Welche kann ich noch ausschließen? gibt es möglichkeiten auf LINUX das MB zu diagnostizieren? (Linux deshalb, weil irgendwas mir bei den Festplatten aus/anstöpseln den MBR zerschossen hat und ich wahrscheinlich windows neu istallieren muss.)

gruß

Pyrukar
 
1. Punkt ... ich habe Memtest86 benutzt ... Versionsnummer ?

2. Knoppix Live CD/DVD hat viele Tools zum Testen von Hardware drauf
 
Aus dem Bauch heraus würde ich bei dem Fehlerbild erstmal aufs Netzteil tippen.

Empfohlenes Vorgehen:

1. MBR reparieren oder wenn nix hilft, Windows aufsetzen
2. Systemauslastungstest mit Prime95 + Furmark, um maximalen Stromverbrauch und Hitze zu erzeugen
3. Temps und Stromverbrauch messen, schauen ob das Netzteil aufgibt
4. Falls der Rechner ausgeht, mit dem angesprochenen 2. Netzteil testen.
5. Falls doch ein Hitzeproblem: Kühler, WLP checken.

€dit: Zu den Auslesebugs - ganz normal bei Memtest, auf die angezeigten Hardwarewerte kann man nichts geben.
 
Pyrukar schrieb:
Ich habe dann MEMTEST86 durchlaufen lassen wobei dies ohne Befund durchgelaufen ist.

Wie lange hast du es denn laufen lassen? Man sollte es normalerweise mindestens 6 komplette Passes durchlaufen lassen, weil Speicherfehler wohl häufig erst nach einigen Durchläufen auftreten.

Pyrukar schrieb:
Die RAM Riegel sind definitv auf 1600 mhz ausgelegt takten laut MB jedoch nur auf 1333 mhz.
Das ist durchaus normal, dass das Mainboard auf eine langsamere Standard-Einstellung geht, und man die schnelleren 1600 MHz für den RAM erst von Hand einstellen muss. Wenn der RAM aber für 1600 MHz ausgelegt ist, dann muss er mit 1333 MHz umso stabiler laufen - das kann also eigentlich nicht der Fehler sein.

Falls der RAM schon ausgiebig getestet wurde (also wie gesagt mind. 6 Passes in memtest) dann würde ich auch als nächstes mal auf Netzteil oder auch auf falsch aufgesetzten CPU Kühler tippen. Wobei die coretemp ja anscheinend nur 30°C vor dem einen Absturz war, also eher doch nicht der Kühler.
Ist denn eine automatische Abschaltung beim Versagen des CPU-Lüfters eingestellt? Vielleicht übermittelt der Lüfter ja manchmal keine Drehzahl und das Mainboard denkt, der Lüfter sei ausgefallen?

Aber das andere Netzteil würde ich als Nächstes testen - du besitzt ja offensichtlich ein anderes NT, dann ist das ja kein Problem.
 
Jupp, agreement mit Benjamin Franklin ( ;) ) in bezug auf den Bauchtip und MemTest86...

aber hier würde ich erstmals das Netzteil tauschen und dann erneut testen.
 
Hmm also

die genaue version von memtest weis ich z.z nicht aber es war bei der gestern heruntergeladenen ubuntuversion mit dabei.

knoppix werde ich mir gerne mal anschauen,

Was das Netzteil angeht: es würde mich wundern, da er gestern auch mit GPU (Radeon HD 6570) problemlos gelaufen ist während er letzte Woche auch ohne GPU keine 2sec mehr angelaufen ist. Ein cpu hitzeproblem halte ich auch für fraglich da der CPU kühler tendenziell überdimensioniert ist und ich nach Erstmontage vor 2 jahren einen außführlichen Stresstest gemacht habe bei dem keine temp über 55°C nach 30min prime und furmark. btw der psu lüfter läuft problemlos.

Ein strommessgerät besitze ich leider nicht.

Mein problem ist gerade die reproduzierbarkeit des fehlers
 
Zuletzt bearbeitet:
Hatte mal einen Fall, wo das NT ohne Probleme lief (auf einem 2 CPU Mainboard), solange die 2te CPU nicht im Mainboard verbaut war...

in anderen Worten, trotzdem mal tauschen und/oder auf das Problem warten und dann tauschen...

PS: manchmal lassen sich Fehler nicht reproduzieren...
 
Pyrukar schrieb:
Beim ersten einschalten nach mehreren Wochen startete das System problemlos, stürzte dann aber nach ca 2 Minuten ab. Beim nächsten versuch stürzte es bereits wärend des Windows7 Startscreen ab. beim 3. Mal kam ich noch gerade ins Bios um eine coretemp von 30°C festzustellen. danach startete das System nichtmehr wirklich ( 2 umdrehungen der Systemlüfter und schluss war).

Was heisst denn für dich "stürzte ab" ?
Das ist sehr wichtig dass du das präzise beschreibst, denn anhand dessen kann man den Fehler i.d.R. recht deutlich eingrenzen.
Eine brauchbare Fehlerbeschreibung wäre "PC schaltete sich aus und lies sich nicht wieder neu starten bis ich das Netzteil an und wieder aus geschaltet hatte" oder "der PC hing mit einem schwarzen Bildschirm ein und lies sich nicht ausschalten außer am Netzteil" oder "der PC startete einfach neu".

Wenn der PC z.B. ganz aus geht dann list es i.d.R. ein thermisches Problem oder ein Problem mit der Stromversorgung.
 
hmmm

das problem ist, das der andere PC mehr als 400W NT benötigt und hat und der genannte Fehlerhafte PC ist normalerweise an einem anderen Ort. Zumal die verkabelung bei beiden nicht ganz trivial ist (da verhältnismäßig kleine gehäuse) Gibt es eine Möglichkeit das netzteil auf wackelkontakte/fehler verlässlich zu prüfen? Einen kompletten Austausch des NT würde ich ungere auf verdacht ausführen. Ich wollte eigentlich nur mal die 2 MB stecker anders anschließen aber dann ist es ja schon wieder gelaufen.
Ergänzung ()

h00bi schrieb:
Was heisst denn für dich "stürzte ab" ?
Das ist sehr wichtig dass du das präzise beschreibst, denn anhand dessen kann man den Fehler i.d.R. recht deutlich eingrenzen.
Eine brauchbare Fehlerbeschreibung wäre "PC schaltete sich aus und lies sich nicht wieder neu starten bis ich das Netzteil an und wieder aus geschaltet hatte" oder "der PC hing mit einem schwarzen Bildschirm ein und lies sich nicht ausschalten außer am Netzteil" oder "der PC startete einfach neu".

Wenn der PC z.B. ganz aus geht dann list es i.d.R. ein thermisches Problem oder ein Problem mit der Stromversorgung.

Er ist ohne weiteres Ausgegangen und hat automatisch versucht neu zu starten bis man ihm den saft abgedreht hat. ich bin mir nicht sicher aber ich glaube die funktion boot on power nicht aktiviert zu haben ( bevor das die nächste frage wird). ein Termisches Problem kann ich mir nicht erklären wo dort die sprunghaftigkeit herkommen sollte. Wenn ein Teil überhitzt sollte es dies doch ohne änderungen eigentlich immer machen oder? Zumal die GPU ausgebaut und die CPU Temp laut MB Fühler ca 8°C über der Raumtemp lag (lehrlauf/Bios) ähnliche Temperaturen wurden für die MB Temp angezeigt. Was ich nochmal überprüfen könnte, ist ob die Schutzfunktion bei Ausfall des CPU Lüfters aktiviert ist. denn die angezeigten Drehzahlen waren etwas abnormal ( sprunghaft zwischen 800 und 2000 rpm ohne dass ein unterschied zu hören war)
Btw. die Raumtemp war bei Versuch 2 wo er wieder problemlos gelaufen ist etwas ( ca 2°C) höher als beim auftreten des fehlers.
 
Ja, wenn der PC aus geht und dann in eine on/off Schleife dann ist ein thermisches Problem ausgeschlossen.
Das Netzteil allerdings ebenso.

Das klingt dann für mich schon eher nach Board.
Hast du den RAM vor dem Test mal umgesteckt? Könnte auch ein Kontaktproblem gewesen sein. Puste den PC mal ordentlich mit Druckluft durch und beobachte ob der Fehler nochmal auftritt. Aber ein Defekt am Board ist wahrscheinlicher.
 
Mit dem Ram habe ich schon alle erdenklichen Tests gemacht. Das Board hat 2 Steckplätze und ich habe 2 Rigel ergo es gibt nur eine sehr begrenzte Anzahl an Kombinationen und ich bin der meinung Alle möglichkeiten durchprobiert zu haben.
Es gibt ja nur folgende kombinationen
R= RAM
S= Steckplatz

Standard definiere ich R1 in S1 und R2 in S2

R1 in S1
R1 in S2

R2 in S1
R2 in S2

R1 in S2 und R2 in S1

Vor einer Woche hat sich das System von all diesen Kombinationen nicht beeindrucken lassen und Gestern ist es zumindest unter Linux anstandslos gelaufen. (Da ich nichtsmehr geändert habe sind die Ramriegel noch immer vertauscht zum Ausgangswert (letzte Kombi)

Zum Thema Druckluft bin ich mir nicht sicher, wo ich sowas herbekomme ... man sollte aber vll anmerken, dass das System, obwohl es schon 2 Jahre alt ist über den Daumen keine 500 betriebstunden auf dem Buckel hat und komplett mit Staubfiltern ausgestattet ist. Dementsprechend wenig Staub befindet sich im Gehäuse und ich hoffe nicht, dass minimal staub schon zum problem wird.
 
Das Netzteil allerdings ebenso.
das kann ich so nicht unterschreiben... ;)
Hab das schon bei Seasonic, Targa, und Enermax NT ähnliche Symptome gesehen.
Verursacht durch eine fehlerhaftes "power_good" Signal, oder kalte Lötstellen, etc.

Daher kann man das nie ausschließen...
 
also was würdet ihr mir empfehlen zu tun/testen?

muss ich wirklich die ganze verkabelung meines Funktionierenden PCs rausnehmen um das alternative Netzteil zu testen ? wenn Ja was genau soll ich Testen?

Gibt es in Knoppix wirklich möglichkeiten das MB zu testen? ich habe bei meiner kurzen google recherche nur den Hot CPU Tester Pro gefunden der scheinbar MB und Chipsatz überprüft :) das wiederrum läuft anscheinend nur auf Windoof für das ich gerade erstmal wieder das MBR reparieren muss :( gibts das auch für Linux?

gruß

Pyrukar
 
Nein, du musst die Verkabelung nicht rausnehmen, kannst ja eins von nem Freund leihen oder ein anderes kaufen...

was du dann testen sollst: Na ja, ob sich der PC genauso verhält wie mit dem alten NT...

MBR reparatur: nix einfacheres, Win7/8/10 DVD einlegen und "Startprobleme Beheben" ausführen....
 
ich belebe mal diesen Beitrag:

ich habe inzwischen das MBR problem gelöst, mein bios meinte lediglich von der falschen windoofpartition booten zu wollen. dann habe ich jetzt mit Hot CPU Tester Pro(Lite Edition) 4.4.1 einen 6h diagnosetest gemacht ohne erkenntnisse *ich hänge das Diagnoseergebnis dennoch an, vielleicht findet von euch einer einen hinweis*

da der PC für diese Diagnose 6h im 100% betrieb gelaufen ist, kann ich es mir fast nicht vorstellen, dass er Stromprobleme hat, denn jetzt hatte ich die Graka drann (natürlich hatte ich nebenher nicht furmark laufen aber ich habs ja damals auch ohne graka und hdds nicht zum laufen gebracht) Wenn ihr keine andere Idee habt werde ich heute abend Furmark und Prime95 auf den PC loslassen :) wenn es NT probleme gibt sollten sie dann ja auffallen :) hitzeprobleme erwarte ich nicht, da die core Temp während der Diagnose heute nacht laut speedfan auch nicht über 45°C gestiegen ist ...

ein weiteres Indiez das mir gestern beim starten des Tests aufgefallen ist: einer der Gehäuselüfter ist nicht anstandslos losgelaufen und schien beim ersten booten keinen strom zu bekommen :( nach dem Reboot lief er dann problemlos. Kann das sein, dass das MB den strom zwar vom NT bekommt aber nicht immer überall hin weiterleitet?

ich kann den fehler leider immer noch nicht reproduzieren :(

gruß

Pyrukar
 
Zurück
Oben