SMART-Werte von 1/2 Dutzend Samsung HD204UI gefallen mir nicht

fiestaforever

Lt. Junior Grade
Registriert
Mai 2013
Beiträge
296
Hallo,

wie anderswo bereits berichtet, mache ich gerade einen Festplatten-Testmarathon, und bin gerade mit einem halben Dutzend Samsung HD204UI/Seagate ST2000DL004 durch. Die Platten sollen in eine Art von RAID (ZFS oder etwas anderes) zusammengespannt werden (1 oder 2 als Reserve). Es ist ein bisschen ein "Sammelsurium" an HD204UIs, weil ich einige schon hatte, und andere (notgedrungen) in *bay zugekauft habe.

Alle Platten waren entweder neu (wenn auch schon bis zu 2 Jahren "gelagert") oder so gut wie neu (max. 300 Stunden), und alle sind in meinen Tests gut 100 bis über 300 Stunden gelaufen. Alle wurden mindestens 2 x, z.T. öfter kpl. beschrieben. Keine wies am Anfang irgendwelche Lesefehler auf.

Alle Platten bestehen die Herstellertests (ESTOOL oder SeaTools), aber die SMART-Werte am Ende der Tests gefallen mir irgendwie nicht.
Keine wiederzugewiesenen oder schwebenden Sektoren, keine "Uncorrectable"-Sektoren, keine UDMA-Fehler.
Aber das folgende Bild:

Code:
Exemplar			1	2	3	4		5	6

Power-on hours			329	133	191	426		469	421
Read Error Rate			85	3	29	81		3	72
B5/Program_Fail_Cnt_Total(*)	45168	9524	8483	15948300	103878	9772
G-Sense Errors 			11868	0	0	0		0	5
Write Error Rate 		59	4	72	1		3	49

(*) Bezeichnung lt. Smartctl, CDI gibt "Unknown" an
(Ganz schön schwer, hier so etwas wie eine ordentliche Tabelle zu bauen. Hoffentlch bleibt das Ding auch ordentlich...)

Exemplar_1.png Exemplar_2.png Exemplar_3.png

Exemplar_4.png Exemplar_5.png Exemplar_6.png

Alle Platten weisen nun einige Lesefehler und "Write Errors" auf. Ich habe in den letzten Jahren fast ausschließlich Samsung-Platten verwendet, und kann mich nicht erinnern, je eine mit mehr als 1 "Read Error" oder "Write Error" gehabt zu haben.
Auch von vier HD154UI, die ich vorher getestet habe, weisen die beiden "guten" weder "Read" noch "Write Errors" auf (die beiden anderen waren schlecht).

Der Wert "Program_Fail_Cnt_Total" (Bezeichnung lt. Smartctl, CDI gibt "Unknown" an) von bis zu 15948300 (Exemplar 4) irritiert mich.
Die 11868 "G-Sense Errors" von Exemplar 1 sind irgendwann am Anfang ziemlich schlagartig entstanden, danach ist der Wert nicht mehr gestiegen. Möglicherweise eine mangelhafte Befestigung, ein vibrierendes Gehäuse o.ä.

Exemplar 1 fiel außerdem einmal beim H2benchw-Datenintegritätstest durch, weil es ein falsches Byte zurückgeliefert hat. Das konnte ich aber nicht reproduzieren. Ansonsten gab es keine Auffälligkeiten in den Testergebnissen.
Exemplar 1 und 4 (eine "HD204UI/Z4") habe ich am heftigsten "durchgenudelt", die hatten beide vorher 0 Stunden.

Ich wollte mal ein oder zwei "Expertenmeinungen" einholen, was von diesem Bild zu halten ist, und ob man auf diese Platten ruhigen Gewissens "setzen" kann.

Ich habe das mal nicht in den Sammelthread geworfen, weil ich ja keine echten Probleme mit den Platten habe, sondern nur wissen will, was ich von ihnen halten soll.
 
ALso die 1. hatte schwere Erschütterungsprobleme. die 2. schon bei 48°C , da mußt was für die Kühlung tuen, vllt gibts dann auch keine Read/Write Fehler mehr.
 
Zuletzt bearbeitet von einem Moderator:
"Erschütterungsprobleme" von Nr.1: Zu diesem Wert hatte ich ja oben schon etwas geschrieben. Die 11868 "G-Sense Errors" hatte sie bereits mit ca. 60 Betriebsstunden, seitdem ist kein einziger dazugekommen. Dürfte also auf irgendwelche besonderen Umstände zurückzuführen sein.
Interessanterweise hatte sie damals noch keinen einzigen "Read" oder "Write Error".

(Edit: )
Temperatur von Nr.2: Damals war es wimre ziemlich heiß (außerdem ist sie wohl damals von der noch heißeren anderen Platte mit "beheizt" worden). Und 48° sind doch noch völlig in der Spezifikation, oder?
 
Zuletzt bearbeitet:
Ausschließen kann man nichts, aber ich glaube nicht daran.
Zumindest mit der maximal gemessenen Temperatur korrelieren die Lese- und Schreibfehler offensichtlich nicht (und auch nicht mit den Betriebsstunden):

Code:
Exemplar			1	2	3	4	5	6

Power-on hours			329	133	191	426	469	421
Temp (max) (**) 		51	52	49	45	53	52
Temp (min) (**) 		19	22	18	16	8	22
Read Error Rate			85	3	29	81	3	72
Write Error Rate 		59	4	72	1	3	49

(**) lt. Smartctl
Danach hätte die Platte mit der höchsten Maximaltemperatur (und der höchsten Temperaturdifferenz) die wenigsten Fehler, nämlich Nr. 5. Das ist auch die Platte mit den meisten Betriebsstunden.
Andererseits stellt sich ohnehin die Frage, wie glaubwürdig die Temperaturwerte sind. Der Wert von 8° ist offensichtlich Unsinn.
Ich würde die Fragestellung eher nicht an der Temperatur festmachen.
 
Welches spitzen Mainboard bzw. welcher SATA Controller wird denn verwendet ?
 
Aufgrund des Bedarfs an "Massenabfertigung": 3-4 alte Dell Optiplex GX620 im Originalzustand.
 
Für die Verwendung als einzelne Festplatten wären alle aufgezählten Fehler irrelevant, für den RAID Einsatz schauts wohl anders aus, wie schnell es dir das angestrebte RAID mit diesen Samsungs zerlegt wird ein Live-Test zeigen.
 
Etwas OT: Warum ist in 4 Screenshots dein Systemlaufwerk auf Status Gelb? Nicht das die jetzt zufällig ein Problem bekommen hat.
 
@ emeraldmine:
Danke, aber ich glaube nicht, dass die Dell-Diagnosesoftware noch etwas ausspuckt, was SMART-Selbsttests, Smartmontools, HDTune, H2benchw, H2testw, Samsungs ESTOOL und Seagates SeaTools für DOS und für Windows nicht ausgespuckt haben. Ich habe mich eigentlich an den Platten sattgetestet, und will nur noch wissen, was ich von den Ergebnissen halten soll.
Dass die PCs alt sind, weiß ich. Nicht mein Problem, sie gehören mir nicht. ;)

@ Smurfy1982:
Der Status des Systemlaufwerks ist egal. Das sind olle Festplatten, auf die ich XP plus Testprogramme geklont habe, um Paralleltests ausführen zu können. Die haben mal einen remappten Sektor oder einen pending oder solche Sachen. Sollte das Ergebnis eigentlich nicht beeinflussen.

@ Inzersdorfer:
Warum könnte es das RAID zerlegen, wegen TLER/CCTL? Es wird mit ziemlicher Sicherheit ein Soft-RAID; eigentlich sollte es ZFS werden, aber da habe ich ein paar Schwierigkeiten mit (v.a. wg. der chaotischen OS-Landschaft). Evtl wird es auch UnRAID, DrivePool/DriveBender, Windows Storage Spaces o.ä.

Kann noch jemand etwas zu dem dubiosen "Program_Fail_Cnt_Total"-Wert (B5) sagen?

BTW: Zur Not hätte ich noch 5 neue Hitachi 5K3000/2TB (dieses Wochenende mit großen Mühen erstanden) als Ersatz, aber denen traue ich eigentlich noch weniger zu als den Samsungs. Und außerdem wären die eigentlich für etwas anderes verplant.
 
fiestaforever schrieb:
und will nur noch wissen, was ich von den Ergebnissen halten soll.

Ich sage die SATA Controller sind Mist, vor allem für RAID Betrieb, einfach veraltet die Software und die Hardware, meine Meinung.
 
Ich will die Platten ja gar nicht in den Kisten betreiben, die habe ich mir nur zum Testen "ausgeliehen".

Die Platten sollen, wenn sich nicht noch was anderes findet, in den hier, der steht schon seit > 1 Jahr bei mir zuhause rum und dient mir vorläufig als Allzweck-PC.

(Edit: )
Die SATA-Controller dürften m.E. nicht für die Fehler verantwortlich sein. Zumindest haben sie es bei einer ganzen Menge anderen Platten auch ohne solche Fehler hinbekommen. Und bei den HD204UI sind die Ergebnisse ja auch eher breit gestreut.
 
Zuletzt bearbeitet:
Ich persönlich meine die Platten sind OK , was nicht heißen will dass da keine 0,01 % tige Wahrscheinlichkeit zu Datenverlust besteht ;)

Wenns nicht für ne Firma ist, würde ichs laufen lassen , aber wenn da harte Euros auf dem Spiel stehen würde ich nur originale verpackte Neuware einsetzen. Suchs dir aus ;D
 
@fiestaforever: Na dann, wenn es eh nur Platten mit Testsystemen sind, ok ;)
 
Zurück
Oben