Systeminstabilität durch Festplatte/SSD?

Dust Signs

Cadet 2nd Year
Registriert
Sep. 2005
Beiträge
26
Hallo!

Ich habe seit ca. drei Monaten einen neuen Rechner, den ich hauptsächlich zur Videoverarbeitung, -filterung und -kodierung nutze, d.h. in dem sich viele Platten und eine relativ starke CPU befinden. Eigentlich bin ich mit dem System ganz zufrieden - wären da nicht die sporadischen und nicht eingrenzbaren Abstürze. Die Symptome sind immer gleich: zuerst friert das System für ca. 5 Sekunden komplett ein, sodass sich nicht einmal mehr die Maus bewegen lässt, dann kann man noch für ca. 10 Sekunden etwas tun, bevor dann für ca. 20 Sekunden alle Klicks und Tastendrücke "ins Leere" gehen, bis abschließend ein Bluescreen mit dem STOP-Code 0xf4 erscheint und ich das System neu starten muss.
Hier erstmal einige Eckdaten zum System:

GIGABYTE GA-Z68X-UD7-B3
Intel Core i7-2600
4x Kingston HyperX DIMM 4GB PC3-10667U CL7-7-7-20
2x Zotac GeForce GT 430 Zone Edition
OCZ Vertex 60 GB
Mehrere Samsung-Festplatten mit verschiedenen Kapazitäten
Windows 7 64-Bit mit den jeweils aktuellsten Treibern

Keine der Komponenten ist übertaktet, die Temperatur der CPU ist selbst nach 24h unter Volllast (d.h. alle 4 Kerne auf 100%) nie über 55°C. Das Problem tritt wie gesagt sporadisch auf, d.h. manchmal stürzt das System nach vier oder fünf Stunden ab, manchmal aber erst nach zwei oder drei Tagen Dauerbetrieb. Ich konnte bisher kein wirkliches Muster erkennen, abgesehen von zwei Details:
1. Das Schreiben großer Datenmengen, vor allem parallel, scheint die "Lebensdauer" des Systems zu verkürzen, wenn auch nicht immer
2. In der Ereignisanzeige gibt es nie einen Eintrag zum Absturz (abgesehen von den Einträgen nach dem Neustart, die lediglich aussagen, dass das System unerwartet heruntergefahren wurde). Selbiges gilt für den Crashdump - obwohl eingestellt wird keine Crashdump-Datei erstellt
Diese beiden Details lassen mich vermuten, dass es sich um einen Festplattenfehler oder einen anderen Fehler, der die Festplatten involviert, handeln könnte. Am ehesten tippe ich auf die SSD, da (vgl. 2. Punkt) nie Daten über den Absturz gespeichert werden.
Nun meine Frage: wie kann ich herausfinden, woran es tatsächlich liegt? Die SSD kann ich momentan nicht tauschen und zum kompletten Neuaufsetzen von Windows fehlt mir die Zeit (zumal ich bezweifle, dass das etwas ändert, da die Installation ja noch sehr jung ist).

Vielen Dank im Voraus für eure Hilfe
Grüße
Dust Signs
 
Lade dir bitte Crystal Disk Info (Freeware) herunter und erstelle einen Screenshot der Smart-Werte. Achte darauf, dass alle Smart-Attribute zu sehen sind.

Stelle Crystal Disk Info aber bitte vor dem Screenshot unbedingt von Hex auf Dec um (Menüleiste: Optionen -> Erweiterte Optionen -> Hex-Wert -> 10 [DEC]) und setze im Sprache(Language)-Menü das Häkchen bei "S.M.A.R.T. Infos auf Englisch".

Mit der Tastenkombination [Alt]+[Druck] bzw. [Print] erstellst du gezielt vom gerade aktiven Fenster einen Screenshot, der dabei in die Zwischenablage von Windows kopiert wird. Mit einem beliebigen Bildbetrachtungs- oder Bearbeitungsprogramm, z.B. IrfanView, kannst du es über "Bearbeiten -> Einfügen" aus der Zwischenablage holen und mit "Datei -> Speichern unter..." unter einem beliebigen Namen abspeichern. Ab Vista ist auch Paint zu gebrauchen. In Paint einfach auf Einfügen und anschließend auf
Zuschneiden.png
Zuschneiden (Strg+Umschalt+X) klicken. Über das Diskettensymbol oben in der Titelleiste kann das Bild gespeichert werden. Als Dateiformat eignet sich bei derartigen Bildern PNG weit besser als JPG (die Qualität ist besser und die Datei kleiner). Speichere solche Bilder also bitte immer als PNG-Datei ab.

Das Forum bietet die Möglichkeit das Bild direkt auf dem Server von Computerbase hochzuladen und im Beitrag anzuzeigen. Du brauchst also keinen externen Dienst zu benutzen. Hier findest du eine Schritt-für-Schritt-Anleitung: klick!
 
Hallo!

Anbei die Screenshots. Die Festplatte, auf der "I:" liegt, habe ich nicht abgebildet, da keine SMART-Daten vorhanden sind. Es handelt sich um ein RAID 5 auf 4 weiteren Samsung-Platten, die über einen (PCIe-)RAID-Controller zusammengefasst sind (SMART-Status all dieser Platten ist laut RAID-Management-Software "ok"). Die SMART-Werte der restlichen Platten sehen aus meiner Sicht nicht so schlecht aus - einige andere Tools wie Adenix SMART Explorer, FanSpeed (und dessen SMART In-Depth Online Analysis) und HD Tune melden auch nichts Auffälliges.

Grüße
Dust Signs
 

Anhänge

  • 1.png
    1.png
    114,6 KB · Aufrufe: 232
  • 2.png
    2.png
    118 KB · Aufrufe: 208
  • 3.png
    3.png
    111,7 KB · Aufrufe: 188
  • 4.png
    4.png
    114,3 KB · Aufrufe: 194
Zuletzt bearbeitet: (Screenshot mit englischen SMART-Infos hochgeladen)
Wenn ein Minidump von einem Bluescreen erstellt wird, dann ist eigentlich nie die SSD selbst schuld, denn wäre sie dafür verantwortlich, so hätte der Minidump nicht geschrieben werden können! Prüfe also mit Blue Screen View ob ein Minidump vorhanden ist und wenn ja, was die Ursache war und mache dann ggf. auch mal einen RAM Test mit memtest86. Dabei musst Du von USB oder CD booten, mindestens einen PASS, besser 3 bis 6 oder über Nacht durchlaufen lassen und es darf kein Fehler auftreten.


Was mich an Deiner SSD wundert: Da sind 100.000P/E Zyklen angegeben, was eigentlich für eine SLC SSD spricht. Ist das eine oder wurde nur die falsche FW aufgespielt? Die Zellen sind bei Deiner SSD sehr ungleichmäßig abgenutzt, zwischen 2 und 27606 mal!! Das ist aber typisch für den Indilinx Barefoot, ebenso die hohe Writeamplification, die bei Dir 83 beträgt. Zwar sind noch keine Programm- oder Löschfehler vermerkt, wohl aber Lesefehler und wenn die nun gerade beim Pagefile aufgetreten sind, dann gibt es eben einen Bluescreen.

Wenn Du die SSD nicht jetzt schon tauschen willst (nimm aber diesmal eine gute, Crucial m4 oder eine von Samsung), kannst Du eigentlich nur die Auslagerungsdatei auf ein anderes Laufwerk verlegen, was man eigentlich nicht machen soll, oder mal die SSD mit h2testw überprüfen, ggf. mehrfach.
 
Hallo Holt!

Bezüglich des Crashdumps hast du mich missverstanden - ich hatte oben geschrieben, dass keiner erstellt wird. Ich denke auch nicht, dass die Abnutzung der SSD an der Auslagerungsdatei liegt, denn diese habe ich deaktiviert. Die RAM-Auslastung liegt ohnehin nie über 30%. Den RAM habe ich schon vor ein paar Tagen mit memtest überprüft - der ist in Ordnung.
Danke für die detaillierte Kommentierung der SMART-Daten der SSD - das ist für mich sehr interessant, da ich mich damit nicht sehr gut auskenne. Die SSD selbst ist diese hier: http://www.amazon.de/gp/product/B001NPCTBE. Laut Geizhals ist sie vom MLC-Typ. Lässt das weitere Schlussfolgerungen in Kombination mit den oben genannten Daten zu?

Grüße
Dust Signs

PS.: h2testw werde ich heute Abend ausprobieren und die Ergebnisse posten
 
Der genaue Typ wie bei Amazon verlinkt ist es nicht, Deine hat noch 64GB und die im Link ist die Serie II mit nur noch 60GB und es sollte wohl ehr die Vertex Plus 60GB sein, die beim Kundenfeedback auf newegg ganz schlecht wegkommt.

Wenn das eine MLC SSD ist, dann hat sie definitiv die falsche Firmware bzw. falsche Angaben zur Haltbarkeit der NANDs in der FW. Keine Auslagerungsdatei zu haben ist übrigens auch keine gute Idee, denn Windows defragmentiert das RAM über diese. Wenn also ein Programm einen grossen Speicherblock anfordert und nicht geung freier Speicher am Stück verfügbar ist obwoh ingesamt noch genug frei wäre, kann es der Speicheranforderung also nicht nachkommen.

Die Lesefehler können auf jeden Fall für Deine Probleem verantwortlich sein, auch wenn es keine Auslagerungsdatei gibt. Schau Dir mal die Attribute CA (Gesamte Bitfehler vom Flash) 2860480 und CB (Gelesene Sektoren mit korrigierbaren Bitfehlern) 2752768 an. Bitfehler sind bei Flash normal, deswegen brauchen SSDs ja auch eine Fehlerkorrektur, kritisch wird es nur, wenn diese nicht reicht die Fehler zu korrigieren sondern nur noch zu erkennen, die Zahlen also voneinenader abweichen. Bei Dir ist der Unterschied 107712 Sektoren, was 52MB entspricht die schon falsch oder garnicht zurückgeliefert wurden.

Du kannst eigentlich nur mit h2testw testen und/oder alle zip/rar/7z Archive auf der SSD mal testen und wenn dabei Fehler auftreten oder der Unterschied zwischen den Werten von CB und CA ansteigt, dann würde ich die Anschaffung einer neuen SSD mal ins Auge fassen.
Ergänzung ()

Ein FW Update auf die 1.6 wäre vielleicht noch eine Möglichkeit, allerdings sterben Indilinx SSDs gerne mal bei einem FW-Update und der Restlebenszähler dürfte dann auf unter 10% fallen, denn Du hast schon durchschnittlich 4583 P/E Zyklen verbraucht und die neue FW dürfte nur 5000 Zyklen im Ganzen angeben (CD). Da manche FW-Updates bei der Indilinx aber auch die Zähler zurücksetzen, könnte sie auch wieder mit 100% erscheinen, wobei die Zellen natürlich genauso verschliessen bleiben wie sie eben schon sind. Weswegen ich mir niemals eine gebrauchte Indilinx kaufen würde.
 
Zuletzt bearbeitet:
Hallo!

Ich habe nun h2testw ausprobiert und komme (fast) immer zu einem Bluescreen als Ergebnis. Kurz davor wird noch eine Fehlermeldung ausgegeben, deren genauen Wortlaut ich allerdings nicht genau wiedergeben kann, da der Bluescreen die Meldung zu schnell "überdeckt". Sie lautet in etwa "Gerät ist nicht angeschlossen" o.ä. Ich vermute also, dass ich um den Kauf einer neuen SSD nicht herumkommen werde.
Was die Daten der SSD angeht, bin ich etwas verwirrt. Ich hatte die SSD im August 2009 bei Amazon (siehe Link oben) für ca. 250€ gekauft. Leider habe ich die Verpackung der SSD nicht mehr und kann daher nicht sagen, was auf deren Label steht - die PLUS-Verpackung kommt mir allerdings gar nicht bekannt vor. Ich werde noch versuchen herauszufinden, wie meine SSD nun wirklich genau heißt (HD Tune und der Gerätemanager sagen nicht mehr als "OCZ Vertex").
Danke vorerst für eure Hilfe und auch für die Kaufempfehlung - die Crucial-SSDs sehen von den Leistungsdaten her sehr gut aus - nur die Schreibgeschwindigkeit kommt mir etwas niedrig vor. Ich werde mal ein bisschen weitersuchen und sehen, was es sonst noch so gibt.

Grüße
Dust Signs
 
Der AS-SSD Benchmark sollte oben Links hinter dem Laufwerksbuchstaben mehr anzeigen, Du brauchst ja nicht zu benchen um keinen Bluescreen zu erzeugen.

Die Schreibrate der Crucial m4 64GB ist mit der 009er FW etwas angestiegen und kommt so aus 100 bis 105MB/s. Lesend erreicht sie jetzt über 500MB/s. Die Samsung 830 64GB schafft 160MB/s aber die ganzen Sandforce SSD liegen mit realen, nicht komprimierbaren Daten sogar noch unter den 95MB/s die für die m4 angegeben sind. Die Sandforce Controller komprimieren die Daten und die beworbenen Transferrate werden mit ATTO mit extrem komprimierbaren Daten (nur Nullen) gemessen. OCZ im Datenblatt der Agility3 auch die Werte mit nicht komprimierbaren Daten an: "60GB: Seq. Lesen 180MB/s, seq. Schreiben 65MB/s" und für die Vertex3:
" 60GB: Seq. Lesen 455MB/s, seq. Schreiben 85MB/s"
Ergänzung ()

Sonst nimm doch eine m4 128GB, sollte Amazon Kulant sein und zumindest einen Teil des Kaufpreises erstatten, es werden ja immerhin noch 96% Restleben angezeigt :D
 
Danke für die ausführliche Information. Ich denke, die m4 128 wandert auf meinen Wunschzettel :). Dass für die alte SSD noch etwas erstattet wird, wage ich zu bezweifeln, da sie älter als zwei Jahre ist.

Grüße
Dust Signs
 
Mach jedenfalls schnell ein Backup Deiner wichtigsten Daten, sofern noch nicht geschehen und Du könntest auch noch mal einen aktuelle Screenshot von den S.M.A.R.T. Werten der SSD ziehen und hier posten. Es ist schon seltsam, dass die FW die offenbar defekten Zellen nicht erkennt und ersetzt.
 
Hallo!

Im Anhang ein aktueller Screenshot. Daten brauche ich keine zu sichern - auf der SSD liegt nur die Windows-Installation. Alle meine Daten liegen auf den anderen Festplatten.

Grüße
Dust Signs
 

Anhänge

  • smart.png
    smart.png
    112,2 KB · Aufrufe: 176
Da sind nochmal 113 unkorrigierbare Lesefehler hinzugekommen, was zu erwarten war. Alles andere hätte mich nur auch sehr gewundert. Offenbar ist die 1.3er FW nicht in der Lage richtig mit fehlerhaften Block umzugehen und diese durch Reservesektoren zu ersetzen, denn der Read Failure Block Count bleibt bei Deiner auf 0. Die 1.6er FW von der Vertex Turbo auf der M225 im Dauerschreibtest auf xtremesystems.org kann das:

cdim225oczvertexturbo11.png


Wenn Du die SSD sowieso abgeschrieben hast, keine Ambitionen hast sie zu reklamieren oder in der Bucht zu vertickern (was unfair dem Käufer gegenüber wäre aber wohl leider in solchen Fällen auch oft gemacht wird) und Dich die Gefahr eines Totalausfallls nicht abschreckt, dann könntest Du versuchen sie auf die 1.6er FW zu bringen. Danach viellleicht einmal als Datenlaufwerk anschliessen und mit h2testw prüfen damit der Controller die Chance bekommt. die defekten Blöcke zu erkennen und auszusortieren. Landet beim Update die FW in so einem defekten Block oder sind es zuviele, so ist sie danach dann vermutlich nicht mehr zu gebrauchen, das Risiko besteht.
 
Zuletzt bearbeitet:
Gut... um sicher zu gehen, dass nicht (mehr) viel passiert, habe ich gerade die m4 mit 128 GB bei Amazon bestellt. Ich werde die (bisherige) Systempartition auf die neue SSD klonen und die alte SSD entsorgen. Sollte ich immer noch mit Fehlern zu kämpfen haben (weil das Klonen durch Lesefehler beeinträchtigt worden ist), wird mir nichts anderes übrig bleiben als das System neu aufzusetzen (doch aus Zeitgründe versuche ich vorher den Weg über das Klonen).
Danke für eure Hilfe und die vielen Tipps. Um OCZ-SSDs werde ich wohl in Zukunft einen großen Bogen machen. Bei einem (ehemaligen) Kaufpreis von 250€ hat eine funktionsfähige Firmware auf der SSD zu sein - eine solche nachzuliefern ohne den Kunden Bescheid zu sagen und das Flash-Risiko noch dazu auf den Kunden abzuwälzen (vgl. Supportseite), finde ich ehrlich gesagt eine Frechheit.

(Trotz allem) weihnachtliche Grüße
Dust Signs
 
Nach dem Klonnen kannst Du ja mit sfc /scannow (cmd.exe als Administrator starten) mal prüfen, ob wenigstens die Systemdateien noch intakt sind. Wenn Du die danach nicht gleich in die Tonne trittst sondern doch noch ein FW-Update versuchst, würde ich mich über ein Feedback freuen.
 
Hallo,
nimm auf jeden Fall eine Neuinstallation des Systems vor, sicherlich sind auch Systemdaten defekt und das sfc \scannow bringt nur den Patchstand der Systemdateien durcheinander.

Am Einfachste lädst Du dir die ISO mit SP 1 runter und nutzt das von MS angebotene USB Stick Tool um die Installation von einem USB Stick aus zu tun

Hier der Link für die ISOs (legal, lagern sogar beim MS Hoster)
http://www.heidoc.net/joomla/technology-science/microsoft/14-windows-7-direct-download-links

USB Download Tool
http://www.chip.de/downloads/Windows-7-USB_DVD-Download-Tool_38589636.html

Falls Du Home Edition installieren musst kannst Du in der ISO eine Datei namens ei.cfg löschen, dann kann man sich die Windows - Version beim Setup einfach aussuchen.

Dann am Besten noch das Winfuture Updatepack runterlade, dann geht das Updateinstallieren über einen Rutsch.

So sparst Du Dir viel Zeit und belastest Deine Platte nicht unnötig.
 
bernieserver, hast Du den Thread überhaupt richtig durchgelesen oder nur das Eröffnungspost?
 
Da wird aus einer Mücke (ein Thread im Crucial Forum wo ein paar Leute mit verschiedenen m4 FW / Kapazität Versionen Problem haben) ein Elefant gemacht. Defekte und Ausfällle kommen bei alle technischen Geräten vor, auch bei Crucial, aber weder oft noch gehäuft in bestimmten Versionen oder auf besonderen Plattformen.
 
Der oben genannte BSOD-Fehler wird mich nicht (mehr) betreffen, denn die m4 versagt seit einigen Tagen und dutzender mühseliger Wiederherstellungsversuche mithilfe der Tipps aus dem Crucial-Forum ihren Dienst und liefert beim Anstecken an andere PCs nur noch Datenmüll und E/A-Fehler. Ich werde sie (d.h. die m4) morgen zurückschicken und eine andere SSD kaufen - und dabei einen mehr als großen Bogen um OCZ und Crucial machen... Schade und für mich völlig unverständlich, dass so viele Firmen unfertige und/oder so fehlerbehaftete Produkte auf den Markt bringen - noch dazu bei diesen Preisen.
Danke nochmals für eure Hilfe bei der Fehlersuche.

Dust Signs
 
So unausgereift ist die m4 nun wirklich nicht, Du hast wohl einfach Pech gehabt und eine mit einem Fertigungsfehler erwischt. Der Bug betraf ja nur Modelle ab 5000 Betriebsstunden und auch die Samsung 830 hat gerade eine neue FW bekommen, die auch Fehler behebt die sogar ebenfalls BSOD verursachen können. Auch Plextor hat gerade neue FW Versionen gebracht. Dann wäre vieleicht die Intel 510 erste Wahl für Dich, die ist nur nicht ganz billig.
 
Alternate 1
Zurück
Oben