SMART Fehlerhafte Sektoren werden nicht realloziiert

Dreadslayer

Lt. Junior Grade
Registriert
Feb. 2008
Beiträge
314
Liebe HDD-Experten

SMART meldet für meine WD30EFRX-68AX9N0 fehlerhafte Sektoren:
Code:
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       3613
  3 Spin_Up_Time            0x0027   183   180   021    Pre-fail  Always       -       5808
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       225
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   004   004   000    Old_age   Always       -       70805
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       225
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       172
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       52
194 Temperature_Celsius     0x0022   123   109   000    Old_age   Always       -       27
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       17
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       18
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       41

Die 17 Current_Pending_Sector wollte ich mittels badblocks durch Schreiben der Sektoren realloziieren:
Bash:
# badblocks -wsv -o bb_WD30EFRX-68AX9N0.log /dev/sdh
Checking for bad blocks in read-write mode
From block 0 to 2930266583
Testing with pattern 0xaa: done
Reading and comparing: done
Testing with pattern 0x55: done
Reading and comparing: done
Testing with pattern 0xff: done
Reading and comparing: done
Testing with pattern 0x00: done
Reading and comparing: done
Pass completed, 17205 bad blocks found. (293/0/16912 errors)

Nun die S.M.A.R.T. Werte nach dem Durchgang:
Code:
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       15304
  3 Spin_Up_Time            0x0027   253   180   021    Pre-fail  Always       -       1250
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       232
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   003   003   000    Old_age   Always       -       70873
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       232
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       179
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       52
194 Temperature_Celsius     0x0022   121   109   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       1
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       18
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       41

Raw_Read_Error_Rate ist stark angesteigen. Seltsamerweise hat sich Current_Pending_Sector auf 1 reduziert ohne dass Offline_Uncorrectable, Reallocated_Event_Count oder Reallocated_Sector_Ct sich erhöht hätten. Wie kann dies sein? Soll ich nochmals einen badblocks Durchgang starten oder denkt ihr die Platte ist verloren?

Besten Dank für eure Hilfe
 
Zuletzt bearbeitet:
ich würde gar nicht erst auf den Gedanken kommen, so eine HDD weiter zu nutzen, wo ein Fehler ist
kommen in der Regel schnell mehr dazu, also bitte austauschen und evtl. nicht gegen eine WD
(mein Stapel an defekten Festplatten enthält mittlerweile zu ca. 90% WD - und das sind viele, ich
handle seit Jahren nicht mehr mit WD).
 
Das ding ist im eimer, ein vollformat nullt das, aber kurze zeit kommt das wieder, hatte das mal bei einer frischen red 4tb, wurde aber anstandslos getauscht


Aber 70k stunden schafft auch nicht jede, meine älteren sind bei an die 50k^^
 
  • Gefällt mir
Reaktionen: madmax2010
Dreadslayer schrieb:
Seltsamerweise hat sich Current_Pending_Sector auf 1 reduziert ohne dass Offline_Uncorrectable, Reallocated_Event_Count oder Reallocated_Sector_Ct sich erhöht hätten. Wie kann dies sein?
Das bedeutet normalerweise dass die Sektoren beim erneuten Schreibversuch keinen Fehler zeigten und deshalb normal weiter verwendet werden.

Was mich aber verwundert sind die raw_Read_Errors (ist ja keine Seagate die da ihre Lesevorgänge zählt) und das was badblocks da an fehlerhaften Blöcken meldet (und das schon wieder einer Pending ist)
 
Kann schon sein, dass die Sektoren dann doch noch geschrieben (und wieder gelesen) werden konnten. Ein fehlerhafter Schreibvorgang muss nicht an defekter Oberfläche liegen, z.B. kann der auch wegen Vibrationen fehlschlagen. Das Problem wird dann erst später beim Auslesen entdeckt.

Aber es kann natürlich auch sein, dass da ein "schleichender" Fehler der Oberfläche vorliegt oder einfach die Firmware der Platte irgendwas in Richtung Reallokation macht, das aber nicht in SMART anzeigt. Alles möglich. Firmwares sind buggy und seltsam.

raw_read_errors sagt nicht viel, zumal der Wert eigentlich wohl bei den meisten Platten zweigeteilt ist.

Direkt nach einem badblocks-Durchlauf sollte allerdings Pending schon auf 0 sein, das sieht also nicht ganz so toll aus.
Ergänzung ()

Hatsune_Miku schrieb:
Das ding ist im eimer, ein vollformat nullt das, aber kurze zeit kommt das wieder
Ich hab hier eine Platte, die das auch ähnlich hatte, aber seit dem betroffene Sektoren neu schreiben sauber funktioniert (ich hab da einfach direkt im gemounteten System mit dd rumgefuhrwerkt und vorher mit debugfs nachgesehen, dass da keine Dateien an der betroffenen Stelle mehr liegen. Frickelig, aber dafür schnell). Wenn man Backups hat und das System nicht superkritisch ist, was soll's.
Ergänzung ()

Dreadslayer schrieb:
Soll ich nochmals einen badblocks Durchgang starten oder denkt ihr die Platte ist verloren?
Ein Oberflächentest smartctl -t long /dev/... könnte auch helfen oder wenigstens weitere Infos bringen.
 
Zuletzt bearbeitet:
Raw_Read_Error_Rate und Seek_Error_Rate sollte bei Western Digital eigentlich bei 0 bleiben. Anders sieht es bei Seagate aus, da werden abnormal hohe Werte angezeigt, diese können ignoriert werden, da Seagate eine andere Kodierung für die Werte zugrunde legt.

Da die WD aber Raw_Read_Error_Rate anzeigt, würde ich diese Festplatte nicht mehr für wichtige Dinge nutzen. Das Sektoren nach einem Test nicht mehr "Pending" sind ist an sich erstmal normal, jedoch kann die Zahl bei weiterer Benutzung wieder ansteigen. Die HDD sollte dann diese Sektoren ersetzen.
 
Vielen Dank für all eure Einschätzungen! Ich verstehe, dann ist es ja grundsätzlich gut, dass diese 18 Current_Pending_Sector wieder verschwunden sind - dass aber trotzdem ein neuer aufgetaucht ist eher schlecht. Dies gekoppelt mit der stark steigenden Raw_Read_Error_Rate gibt mir schon ein ungutes Gefühl.
GrumpyCat schrieb:
Wenn man Backups hat und das System nicht superkritisch ist, was soll's.

Ein Oberflächentest smartctl -t long /dev/... könnte auch helfen oder wenigstens weitere Infos bringen.
Dann setze ich die Platte noch in einem Raid-Z2 für Backups ein, ich denke das kann ich riskieren bis sie ganz tot ist. Ein Smart-Test macht afaik aber nur Lesetests oder? Pending Sectors werden damit nicht neu beschrieben.
Questionmark schrieb:
ich würde gar nicht erst auf den Gedanken kommen, so eine HDD weiter zu nutzen, wo ein Fehler ist
kommen in der Regel schnell mehr dazu, also bitte austauschen und evtl. nicht gegen eine WD.
So eine HDD läst sich je nachdem schon noch lange nutzen. Ich traue generell keiner Festplatte, egal wie die SMART-Werte aussehen. Ich verwende lediglich Dateisysteme mit Checksumming (ZFS) und genügend Parität (Mirror oder Raid-Z2 rsp. 6), so werden Festplattenfehler sowieso automatisch korrigiert.
Hatsune_Miku schrieb:
Aber 70k stunden schafft auch nicht jede, meine älteren sind bei an die 50k^^
Ich will mich ja nicht beschweren, aber die 3 WD-Greens haben keine Fehler und stehen auch bei 70k. Klar dass es zuerst ne WD-Red nimmt ^^
floklo4 schrieb:
Raw_Read_Error_Rate und Seek_Error_Rate sollte bei Western Digital eigentlich bei 0 bleiben. Anders sieht es bei Seagate aus, da werden abnormal hohe Werte angezeigt, diese können ignoriert werden, da Seagate eine andere Kodierung für die Werte zugrunde legt.
Ignorieren würde ich diesen Wert auch bei einer Seagate nicht. Einfach die effektiven Werte berechnen lassen mit einem Tool, z.B. https://yksi.ml
 
Zurück
Oben