[Sammelthread] HDD-Probleme, SMART-Analysen

tach, in meinem server laufen 4 festplatten, eine davon machte jetzt plötzlich komische geräusche. leider kann ich nicht erkennen welche. ich hab mal die smart-daten ausgelesen, irgendwie sehen 3 nicht gut aus. hohe werte bei 'Raw_Read_Error_Rate' und 'Seek_Error_Rate'. mit ausnahme der geräusche gab es nie probleme mit den platten. ist aus den daten etwas zu erkennen welche evtl. die probleme gemacht hat?

Code:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.13.0-25-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   079   065   006    Pre-fail  Always       -       71953404
  3 Spin_Up_Time            0x0003   094   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       98
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   070   060   045    Pre-fail  Always       -       10158651
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       94 (146 151 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       94
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 1
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   071   061   040    Old_age   Always       -       29 (Min/Max 27/29)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       37
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       283
194 Temperature_Celsius     0x0022   029   040   000    Old_age   Always       -       29 (0 19 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       1
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       56h+03m+11.030s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       19421246432
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       9726334529

*****

  GNU nano 4.8                                                    b2.txt                                                             
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.13.0-25-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   108   100   006    Pre-fail  Always       -       19594480
  3 Spin_Up_Time            0x0003   091   091   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       67
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       4295105282
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       54
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       65
183 Runtime_Bad_Block       0x0032   098   098   000    Old_age   Always       -       2
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       4295032834
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   070   058   045    Old_age   Always       -       30 (Min/Max 27/30)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       34
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       191
194 Temperature_Celsius     0x0022   030   042   000    Old_age   Always       -       30 (0 17 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       2
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       26 (178 235 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       7758050776
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       9765062532

******

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.13.0-25-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   144   144   054    Pre-fail  Offline      -       83
  3 Spin_Up_Time            0x0007   128   128   024    Pre-fail  Always       -       273 (Average 270)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       549
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   138   138   020    Pre-fail  Offline      -       33
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       479
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       537
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       556
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       556
194 Temperature_Celsius     0x0002   187   187   000    Old_age   Always       -       32 (Min/Max 15/42)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

*******

  GNU nano 4.8                                                    b4.txt                                                             
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.13.0-25-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   116   099   006    Pre-fail  Always       -       103624688
  3 Spin_Up_Time            0x0003   094   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       284
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   066   060   030    Pre-fail  Always       -       4748678
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       643
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       271
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       0 0 1
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   068   053   045    Old_age   Always       -       32 (Min/Max 29/32)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       219
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       1228
194 Temperature_Celsius     0x0022   032   047   000    Old_age   Always       -       32 (0 18 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       412h+13m+06.652s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       33376887449
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       37999125467
 
@FatManStanding
Könntest du uns noch die genauen Modellbezeichungen der Platten nennen ?
Je nach Hersteller gibt es da Feinheiten der der Interpretation des RAW_VALUE.
Das bei der dritten Platte die Attribute 240, 241 und 242 fehlen ist ein Copy&Paste Fehler ?
 
hier die modellbezeichnungen.
1: seagate ST4000DM005-2DP166
2: seagate barracuda OOS4000G
3: hitachi HDS5C3020BLE630
4: seagate ST2000DM001-1CH164

für die festplatte wurden dazu keine angaben durch smartctl ausgegeben. hab es nochmal versucht, die fehlen weiterhin.
 
ST4000:
1 Command Timeout - nicht aktuell
1 UDMA CRC Error - nicht aktuell

Barracuda:
1 Suchfehler - nicht aktuell
2 Command Timeouts
2 UDMA CRC Errors - nicht aktuell

Hitachi:
-

ST2000:
1 Command Timeout

Zur Geräuschortung im laufenden Betrieb eine Papprolle von einer Küchenrolle oder Klopapierrolle ans Ohr halten und die Platten abhorchen (dabei werden störende Geräuschreflektionen reduziert).
 
was heißt 'nicht aktuell'.

Die Geräusche sind nicht ständig, das passiert immer mal kurz. Ich lass jetzt testweise die platten mal einzeln laufen und hoffe was zu hören. Bisher immer nur wenn alle an waren.
 
nicht aktuell: bei der letzten Aktualisierung der SMART Werte durch die Plattenelektronik (d.h. ein variabler Zeitraum) keine derartigen Probleme anliegend; Bei üblichen Laufzeiten von bis zu 8h am Stück i.d.R. zumindest seit dem letzten boot.

Zum abhorchen geht ein Stethoskop natürlich auch.
 
über das "reinhören" hab ich keine unterschiede erkannt. das problem tritt wie gesagt nicht immer auf. daher lasse ich die platten gerade einzeln laufen wenn ich von zu hause aus arbeite.

das problem trat auch dann auf, wenn man "etwas" mit den platten (als die noch in einem einfachen case steckten) oder dem nas gemacht hat, ohne direkt auf die platten zu schrieben/avon zu lesen. kann man irgendwie "beschäftigung simulieren"? was auch immer der rechner macht, wenn man externe platten ansteckt ohne aktiv etwas mit dem inhalt zu machen.
 
sudo smartctl -t <long> -C /dev/sd♥

startet den SMART Long Selftest im Foreground Mode (♥ für den entspr. Laufwerksbuchstaben)

smartctl -X

beendet den Test
 
  • Gefällt mir
Reaktionen: Skysnake
Ich dachte du läßt die Platten einige Zeit unter Last laufen.
Zur benötigten Zeit:

sudo smartctl -c /dev/sd♥

zeigt die jeweils benötigte Zeit für die Short/Extended/Conveyance self-test routine.
 
  • Gefällt mir
Reaktionen: Skysnake
Hallo zusammen, nachdem ich heute für meine Samsung 980 Pro (Systemplatte) ein Update (Samsung Magician bot es an) aufgespielt habe, startete der Rechner neu und Windows lädt nicht mehr. Er scheint die Festplatte nicht mehr zu erkennen.
Hättet ihr einen Tipp für mich? Win10, Gigabyte Aorus Pro X570 mit Ryzen 7 5800X
 
Sieht man die Festplatte im BIOS noch ?
 
Mehrfach bei ausgeschalteten PC aus- einstecken - Versuch macht klug
 
  • Gefällt mir
Reaktionen: Melges
Melges schrieb:
Er scheint die Festplatte nicht mehr zu erkennen.
Bleiben wir bitte bei einer SSD (Samsung 980 Pro).
Nur scheint, oder weißt du nicht, wo man das bei deinem Board/UEFI nachschauen kann?
Mit Update meinst du vermutlich ein Firmware-Update.
Möglicherweise hat das deine Daten gelöscht oder irgendwas ist schief gelaufen und die SSD ist tot. Das wäre der worst case.
Um das festzustellen, wäre jetzt entweder ein Linux oder ein WindowsPE auf einem USB-Stick nicht schlecht, um mal zu sehen ob die SSD erkannt wird und ob noch Daten drauf sind.
Für WindowsPE empfehle ich HBCD und als Linux hier aus dem Downloadbereich Ubuntu Mate oder was auch immer aktuell genug ist.
Zum erstellen dann entweder Rufus nehmen oder gleich Ventoy und dann kannst du mehrere ISOs darauf speichern und davon starten.
 
  • Gefällt mir
Reaktionen: Melges
Danke! Simples Strom-Aus-Strom-An hat schon geholfen....
Ergänzung ()

Ich war schon gerade mit dem 2. Rechner beim Erstellen des Notfall-Stick.
Danke für eure Hilfe und schönen Abend!
 
  • Gefällt mir
Reaktionen: HerrAbisZ
ist die hdd noch in ordnung oder mus ich sie bald ersetzen ?

1643621817488.png
 
Zurück
Oben