SMART interpretieren - Offline_Uncorrectable 3

Hallo zusammen,
Ich habe hier eine WD40EZRX (WD Green 4TB) mit folgenden SMART-Werten. Die Offline_Uncorrectable 3 springen natürlich direkt ins Auge. Was mich aber stutzig macht, ist dass Raw_Read_Error_Rate und Reallocated_Sector_Ct auf 0 steht.
Wie interpretiert ihr das? Würdet ihr der Platte noch über den Weg trauen?


ID​
Attributsname​
Flag​
Wert​
Schlimmstes​
Schwellenwert​
Typ​
Aktualisiert​
Wenn fehlgeschlagen​
Ursprünglicher Wert​
1​
Raw_Read_Error_Rate​
0x002f​
200​
200​
51​
Pre-fail​
Always​
-​
0
3​
Spin_Up_Time​
0x0027​
181​
171​
21​
Pre-fail​
Always​
-​
7925​
4​
Start_Stop_Count​
0x0032​
100​
100​
0​
Old_age​
Always​
-​
604​
5​
Reallocated_Sector_Ct​
0x0033​
200​
200​
140​
Pre-fail​
Always​
-​
0
7​
Seek_Error_Rate​
0x002e​
200​
200​
0​
Old_age​
Always​
-​
0​
9​
Power_On_Hours​
0x0032​
98​
98​
0​
Old_age​
Always​
-​
1718​
10​
Spin_Retry_Count​
0x0032​
100​
100​
0​
Old_age​
Always​
-​
0​
11​
Calibration_Retry_Count​
0x0032​
100​
100​
0​
Old_age​
Always​
-​
0​
12​
Power_Cycle_Count​
0x0032​
100​
100​
0​
Old_age​
Always​
-​
199​
192​
Power-Off_Retract_Count​
0x0032​
200​
200​
0​
Old_age​
Always​
-​
139​
193​
Load_Cycle_Count​
0x0032​
198​
198​
0​
Old_age​
Always​
-​
7727​
194​
Temperature_Celsius​
0x0022​
123​
95​
0​
Old_age​
Always​
-​
29​
196​
Reallocated_Event_Count​
0x0032​
200​
200​
0​
Old_age​
Always​
-​
0
197​
Current_Pending_Sector​
0x0032​
200​
200​
0​
Old_age​
Always​
-​
3
198​
Offline_Uncorrectable​
0x0030​
200​
200​
0​
Old_age​
Offline​
-​
3
199​
UDMA_CRC_Error_Count​
0x0032​
200​
200​
0​
Old_age​
Always​
-​
0​
200​
Multi_Zone_Error_Rate​
0x0008​
200​
200​
0​
Old_age​
Offline​
-​
3

Ich wechsel mein Home-NAS (Qnap TS-230), und Systemwechsel sind ja immer gute Gelegenheiten zum neustrukturieren. Die HDD-Preise schießen ja leider durch die Decke, ich habe einem der 2 Backup-Systemen entdeckt, dass da tatsächlich diese Platte, also mit CMR schlummert. Würd ich sofort ins Haupt-NAS reinnehmen.
Wenn ich ihr einigermaßen vertrauen kann.
 
Wie erklärt sich, dass der Reallocated_Sector_Ct noch auf 0 steht?
 
weil die sektoren noch "pending" sind. erst wenn die platte diese sektoren als defekt erkennt, werden sie mit reservesektoren ersetzt. man kann mit einem "long" selftest rausfinden, welche sektoren das sind und welche adressen diese haben. mit einem "dd" kann man mehrmals gezielt auf diese sektoren schreiben und die platte so dazu bringen, diese sektoren auszuschliessen.

defekt ist die platte damit nicht, man muss nur die werte im auge behalten.
 
Da ist nix tot. Offline_Uncorrectable und Current_Pending_Sector geben einfach Sectoren wieder, bei denen die Plattenlogik noch gar nicht entschieden hat, ob sie tatsächlich durch Reservesektoren ersetzt werden müssen. Diese Sektoren beinhalten einfach nicht abgeschlossene Daten, die sich deshalb nicht lesen lassen. Schon ein leichter Stoss, der den Schreib-/Lesekopf auslenkt oder eine aprupte Ausschaltung der Platte können sowas verursachen. Spätestens nach einer kompletten Formatierung weis man, ob die Sektoren tatsächlich defekt sind, denn dann sind die entweder reaktiviert oder wurden durch Reservesektoren ersetzt und stehen unter Reallocated_Sector_Ct.
 
  • Gefällt mir
Reaktionen: Madnex
Ja, wie üblich: Backup machen und im Auge behalten; das trifft aber auf jede HDD uns SSD zu. Wirklich defekt ist sie noch nicht, gibt bei den Sektoren nicht ohne Grund einen Schwellwert nach dem alles andere nach baldigem Tod aussieht. Das ist bei dir aber offensichtlich nicht der Fall.
 
Offline_Uncorrectable Sektoren sind tot. Die werden durch Reservesektoren ersetzt. Pending_Sector kann wieder hergestellt werden und funktionieren normal weiter oder werden nach einem Test als Offline_Uncorectable für tot erklärt und ebenfalls mit Reservesektoren ersetzt.

Natürlich kann man jetzt argumentieren dass dadurch die Festplatte nicht defekt ist und jede Menge Reservesektoren bereitstehen. Der Wert Multi_Zone_Error_Rate sagt aber dass auf der Oberfläche eines Platters irgendwo Probleme bestehen. Vermutlich da wo die pending und offline Sektoren sind.

Wenn man jetzt analog dazu wieder auf Auto Erklärungen umschwenkt wäre das so als wenn einem die Werkstatt erzählt, dass am Auto wenig Öl im Motor ist, die Bremse vorne rechts manchmal nicht funktioniert, das aber alles kein Problem ist und man problemlos mit der Karre und der ganzen Family mehrere tausend km in den Urlaub fahren kann. Kann klappen, muss aber nicht.

Wenn mir meine Festplatte per Smart schon mitteilt dass sie vermutlich bald stirbt würde ich darauf hören anstatt zu warten bis der Fall dann eintritt.
 
Offline uncorrectables sind Sektoren die bei Selbsttests der Platte als nicht lesbar befunden wurden.

Zusammen mit pending sectors werden die nach dem nächsten Beschreiben auf Lesbarkeit getestet, können sie da gelesen werden reduziert sich der Eintrag entsprechend, scheitert das Lesen wieder werden sie durch Reservesektoren ersetzt.

Multi-Zone Error Rate sind Schreibfehler.
 
  • Gefällt mir
Reaktionen: Madnex
Inzersdorfer schrieb:
Zusammen mit pending sectors werden die nach dem nächsten Beschreiben auf Lesbarkeit getestet, können sie da gelesen werden reduziert sich der Eintrag entsprechend, scheitert das Lesen wieder werden sie durch Reservesektoren ersetzt.
Wobei der Wert von Offline_Uncorrectable erst nach dem nächsten Selbsttest aktualisiert wird. Das nur als Ergänzung zu deinem Beitrag.

Bei den Current_Pending und den Offline_Uncorrectable Sektoren dreht es sich in der Regel um dieselben Sektoren. Der Unterschied ist einfach nur die Art der Erkennung und der Zeitpunkt der Aktualisierung des jeweiligen Wertes.

Dass die Raw_Read_Error_Rate auf 0 steht, könnte daran liegen, dass die Festplatte seit dem Erkennen der problematischen Sektoren einige Zeit lang andere Bereiche fehlerfrei lesen konnte und deshalb dieses Smart-Attribut zurückgesetzt hat. Das konnte ich vor einigen Jahren mal bei einer defekten Hitachi HDD beobachten, mit der ich ein wenig experimentiert habe.
 
Zurück
Oben