ST8000NM000A-2KE101: Hardware_ECC_Recovered 213085440

linuxnutzer

Commander
Registriert
Dez. 2011
Beiträge
2.458
So weit ich mich erinnere, ist eine Seagate-HD fehlerhaft, wenn die Zahl 9 stellig ist. HD zurückgeben?

Device Model: ST8000NM000A-2KE101

1 Raw_Read_Error_Rate 0x000f 083 064 044 Pre-fail Always - 213085440
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 1
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 076 060 045 Pre-fail Always - 39706362
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 110
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 1
18 Unknown_Attribute 0x000b 100 100 050 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 058 049 040 Old_age Always - 42 (Min/Max 26/51)
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 0
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 30
194 Temperature_Celsius 0x0022 042 051 000 Old_age Always - 42 (0 26 0 0 0)
195 Hardware_ECC_Recovered 0x001a 009 009 000 Old_age Always - 213085440
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 99 (255 19 0)
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 62512212672
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 62512223256
 
linuxnutzer schrieb:
So weit ich mich erinnere, ist eine Seagate-HD fehlerhaft, wenn die Zahl 9 stellig ist.
Aber nur in Hexadezimaler Darstellung, das ist bei deiner Platte nicht der Fall.

Edit: zumindest der dezimale Wert wäre kleiner... der hexadezimale der davor steht wäre 00F0... was ist da jetzt der echte RAW-Wert?
 
Die Platte sollte in Ordnung sein, die Seagates haben bei den Parametern Raw_Read_Error_Rate und Hardware_ECC_Recovered out of the Box irgendwelche Werte.

Auffällig ist auch, dass der Wert bei beiden SMART Parametern identisch ist.

Ich habe hier 10 Seagate 8TB platten und die haben das alle. Sowohl die ST8000NM0045 als auch die ST8000AS0002. Die Platten stammen aus min. 5 Bestellungen über mehrere Jahre. Also auch kein Serienproblem.

Die Parameter Reallocated_Sector, Current_Pending_Sector und Offline_Uncorrectable sind da wesentlich kritischer.
Ergänzung ()

Ergänzung, was die Hersteller in die SMART Parameter für Informationen hinterlegen ist leider nicht genormt. Die machen das alle etwas anders. Seagate hat dazu auch etwas geschrieben:
https://www.seagate.com/de/de/suppo...-smart-diagnostic-utilities-results-203971en/

Insbesondere interessant sind die Hinweise:
Some third-party SMART software programs display a list of attributes that seem to announce or foreshadow a SATA hard drive failure
Please remember that these third-party programs do not have proprietary access to Seagate hard disk information, and therefore often provide inconsistent and inaccurate results. SeaTools is more consistent and more accurate and is the standard Seagate uses to determine hard drive failure.
 
Die Werte sind identisch weil wohl jeder Lesevorgang auch eine ECC Prüfung nach sich zieht. Und die unteren 8 Stellen geben die Anzahl der Vorgänge an, die Fehler stehen dann in den linken 4 Stellen.

Und ich weiß jetzt nicht was diese hexadezimalen Ziffern in der Ausgabe da bedeuten sollen... das können aber nicht die RAW Werte sein. Von daher sollte die Platte in Ordnung sein.

Edit: ok, wenn man in den verlinkten Thread reinschaut sieht man die volle Ausgabe und da auch was die Werte davor bedeuten, weils da eigentlich noch ne Überschriftenzeile mit der Erklärung gibt... der RAW Wert steht am Ende und ist dezimal. Muss also für die Analyse erst noch auf Hex umgerechnet werden.
 
Wie alt ist deine HDD?
Lade dir mal von Seagate deren Diagnose-Tool SeaTools für USB. Erstelle damit einen USB-Boot-Stick und lasse dann die Schnelldiagnose und die erweiterte Diagnose laufen.
 
Platte nach dem Kauf kurz angeschlossen.

1 Raw_Read_Error_Rate 0x000f 100 100 044 Pre-fail Always - 2128
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 1
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 045 Pre-fail Always - 491
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 0
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 1
18 Unknown_Attribute 0x000b 100 100 050 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 253 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 073 071 040 Old_age Always - 27 (Min/Max 26/27)
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 0
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 3
194 Temperature_Celsius 0x0022 027 040 000 Old_age Always - 27 (0 26 0 0 0)
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 2128
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 253 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 0 (159 13 0)
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 0
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2128


Platte nach dem langen Smart-Test:

1 Raw_Read_Error_Rate 0x000f 100 100 044 Pre-fail Always - 2128
3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 1
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 066 060 045 Pre-fail Always - 4417593
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 13
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 1
18 Unknown_Attribute 0x000b 100 100 050 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 253 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 059 052 040 Old_age Always - 41 (Min/Max 26/48)
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 0
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 10
194 Temperature_Celsius 0x0022 041 048 000 Old_age Always - 41 (0 26 0 0 0)
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 2128
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 253 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 11 (109 100 0)
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 0
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2128

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 11 -
# 2 Short offline Completed without error 00% 0 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
 
Wie alt ist deine HDD?

Steht doch in der Tabelle

Lade dir mal von Seagate deren Diagnose-Tool SeaTools für USB. Erstelle damit einen USB-Boot-Stick und lasse dann die Schnelldiagnose und die erweiterte Diagnose laufen.

Mich interessiert nicht was diese Tools sagen, der Smart-Test ist ja auch ok. Seagate hat kein Interesse HDs zurückzunehmen. Die Tools lesen ja auch nur die Smartwerte aus. Ich habe die Option die HDs noch zurückzugeben, ohne zu diskutieren, will das aber eigentlich nicht und eine neue wieder fast 1 Woche testen.
Ergänzung ()

Jesterfox schrieb:
213085440 (DEZ) = CB36D00 (HEX)

Also alles in Ordnung.

Man rechnet also die 8 Stellen vom Hex-Wert und nicht vom Dez-Wert?

Mein Befehl meinte auch, dass sie ok ist.

echo "obase=16; 213085440" | bc | cut -c8-100
 
Zuletzt bearbeitet:
linuxnutzer schrieb:
Man rechnet also die 8 Stellen vom Hex-Wert und nicht vom Dez-Wert?
Ja, weil die Aufteilung der Stellen intern auf die Bits erfolgt und das lässt sich nur bei Hex 1:1 auf Stellen übertragen, aber nicht bei Dezimal (genau aus dem Grund ist die Hexadezimale Darstellung auch so verbreitet in der IT, weil eine Hex-Stelle exakt 4 Bits entspricht)
 
  • Gefällt mir
Reaktionen: linuxnutzer
Danke, mir ist auch klar, dass es ein Stress-Test ist, die HD 4x komplett zu beschreiben

# time badblocks -b4096 -svw /dev/sdf
Es wird nach defekten Blöcken gesucht (Lesen+Schreiben-Modus)
Von Block 0 bis 1953506645
Es wird getestet Mit Muster 0xaa: erledigt
Lesen und Vergleichen: erledigt
Es wird getestet Mit Muster 0x55: erledigt
Lesen und Vergleichen: erledigt
Es wird getestet Mit Muster 0xff: erledigt
Lesen und Vergleichen: erledigt
Es wird getestet Mit Muster 0x00: erledigt
Lesen und Vergleichen: erledigt
Durchgang beendet, 0 defekte Blöcke gefunden. (0/0/0 Fehler)

real 5237m45,396s
user 183m1,260s
sys 240m42,742s

Aber so eine Exos ist auch keine Billigplatte und wird für prof. Nutzung verkauft. Ich mache keine Backups auf HDs, die diesen Test nicht überstehen.
 
linuxnutzer schrieb:
Man rechnet also die 8 Stellen vom Hex-Wert und nicht vom Dez-Wert?
Richtig, es geht ja um die beiden DWORDs mit dem Zählerstand der Vorgänge und nur in der hexadezimalen Anzeige kann man die BYTE, WORD und DWORD sinnvoll getrennt betrachten.
 
  • Gefällt mir
Reaktionen: linuxnutzer
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 99 (255 19 0)

Darüber brauche ich mir also auch keine Gedanken machen?

aktuell:

240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 99 (107 181 0)
 
Nein, die machen auch nur in der hexadezimalen Anzeige Sinn, wobei die obersten Bytes Bruchteile von Stunden sind.
 
  • Gefällt mir
Reaktionen: linuxnutzer
# smartctl -s on -F hex48 /dev/sda
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.15.0-62-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=======> INVALID ARGUMENT TO -F: hex48
=======> VALID ARGUMENTS ARE: none, nologdir, samsung, samsung2, samsung3, xerrorlba, swapid <=======
Ergänzung ()

smartctl -s on -a -v N,hex48 /dev/sdf

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 082 064 044 Pre-fail Always - 0x000008ff3dd0
3 Spin_Up_Time 0x0003 090 090 000 Pre-fail Always - 0x000000000000
4 Start_Stop_Count 0x0032 099 099 020 Old_age Always - 0x0000000005d2
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0x000000000000
7 Seek_Error_Rate 0x000f 089 060 045 Pre-fail Always - 0x0000301bdbc7
9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 0x6ffe00001e07
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0x000000000000
12 Power_Cycle_Count 0x0032 099 099 020 Old_age Always - 0x0000000005c6
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0x000000000000
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0x000000000000
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0x000000000000
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0x000000000000
190 Airflow_Temperature_Cel 0x0022 049 037 040 Old_age Always In_the_past 0x00cd34300033
191 G-Sense_Error_Rate 0x0032 097 097 000 Old_age Always - 0x000000001882
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 0x000000000006
193 Load_Cycle_Count 0x0032 085 085 000 Old_age Always - 0x000000007bd7
194 Temperature_Celsius 0x0022 051 063 000 Old_age Always - 0x001300000033
195 Hardware_ECC_Recovered 0x001a 005 001 000 Old_age Always - 0x000008ff3dd0
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0x000000000000
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0x000000000000
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0x000000000000
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 0xf12400001111
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 0x0013d8705918
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 0x000b64c25311

https://www.smartmontools.org/browser/trunk/smartmontools/smartctl.8.in

Die Manpage muss ich mir aber noch genauer ansehen, ob der Befehl das tut was ich will.
 
Zuletzt bearbeitet:
ups, da bin ich in der Manpage ein bisschen verrutscht... das F steht für eine andere Format-Sache, müsste "smartctl -v N,hex48" sein.

Wobei man für die speziellen Attribute wohl statt "hex48" auch "raw24/raw32" verwenden könnte, dann müsste man das aber auf diese Attribute beschränken (das "N" steht für alle Attribute), hätte aber dann die getrennte Auflistung der Fehler und der Vorgänge zur Folge (wenn ich die manpage richtig versteh).
 
linuxnutzer schrieb:
9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 0x6ffe00001e07
...
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 0xf12400001111
Das fett markierte sind die Bruchteile der Stunden, die am Ende stehen und wenn Du öfter nacheinander ausliest, sollten sich die Werte des fett geschriebenen Teils dann auch ändern, wobei die Head Flying Hours wohl kurz davor sind wieder eine volle Stunde zu komplettieren und dann am Ende 1112 stehen wird.
 
  • Gefällt mir
Reaktionen: linuxnutzer
Zurück
Oben