[Sammelthread] HDD-Probleme, SMART-Analysen

Zustand von Mutters Festplatte.png


Mutters Festplatte.

Der Rechner hat vorhin rumgespackt, daher meine Mutter wollte etwas machen und der Rechner ist eingefroren. Der An-/Aus-Schalter ließ auch nach langem Drücken den Rechner nicht abschalten. (Kann sein, dass ich ich das Frontpanel mal vor Ewigkeiten falsch angeschlossen habe und Reset nicht geht.) Daher habe ich am Netzteil ausgeschaltet. Danach wieder an und es kam das Menü mit abgesicherten Modus und normaler Start. Letzteres habe ich ausgewählt und es stand dann da "Windows wird gestartet", ohne dass das Zeichen da animiert wurde. Auch nach einer halben Stunde sah es genauso aus. Ich dachte schon, die Festplatte ist im *rsch. Ist sie es tatsächlich?

Wieder abgewürgt und wieder angeschaltet und es passierte nichts. 5 Minuten später lief irgendein Lüfter oder mehrere. Nächste Vermutung: Netzteil wieder hinüber? Dabei wurde es vor paar Monaten gewechselt.

Rechner abgeklemmt und bei mir ran. Es kam ein Menü mit Reparatur und normaler Start, wieder letzteres ausgewählt. Kiste ist hochgefahren und lief. Dann wollte er einen Neustart, weil Gerät installiert, dann ins Bios und bei +12V so 12,408-12,460V. Erscheint mir bisschen dolle zu sein, aber gerade noch im Rahmen, da laut Wiki 12,6V Obergrnze ist. Anschließend wieder ins Windows. Ihr Ding und dieser Beitrag gingen jetzt an dem Rechner. Mal sehen, on der Rechner drüben dann auch wieder geht, bzw. wie lange.
 
Zuletzt bearbeitet:
Banger schrieb:
Der Rechner hat vorhin rumgespackt
Das ist ja ein echter Oldtimer und hat sich gut gehalten, sehr gut sogar, es gibt keinen Hinweis auf einen Fehler der Platte, obwohl sie die vom Hersteller geplante Nutzungsdauer schon deutlich überschritten hat. Wenn der Rechner genauso alt war wie die HDD, dann ist es auch kein Wunder wenn der mal aufgibt, Hardware ist üblicherweise nur auf eine Nutzungsdauer von 5 Jahren ausgelegt, sie hält zwar oft länger, wie auch diese HDD zuweilen viel länger, aber hält eben auch nicht ewig.
 
Also Festplatte eher nicht im Eimer. Diese war mal in einem PC, den meine Mutter von einem Bekannten bekommen hat, ca. 2008, schätze ich. Der hatte einen P4 auf 775. Das wurde dann zu AM2 mal getauscht, alte Hardware von mir, dann nochmal getauscht. Ich vermute mal, das Mainboard oder das Netzteil (12,46V) ist wieder Schrott. Ich habe den Rechner etwas gesäubert und dann wieder in Betrieb genommen. Freeze beim Hochfahren oder sogar im Bios. Dann gehe ich mal einen anderen Thread suchen, um da das Problem zu schildern, weil Netzteil und Mainboard gehören dann doch nicht in den Festplatten-Thread.
 
Banger schrieb:
Also Festplatte eher nicht im Eimer.
Die ist alt, den S.M.A.R.T. Werten nach aber absolut in Ordnung.
 
  • Gefällt mir
Reaktionen: HerrAbisZ und Banger
Hallo zusammen!

Ich habe zwei nagelneue 8 TB Seagate Ironwolf Pro (Modell ST8000NE001-2M7101).
Bei beiden habe ich mit HDDScan den ausführlichen SMART-Test (Platte 1) bzw. "Read Data to the Host" (Platte 2) laufen lassen. Beide Tests dauerten rd. 11 Stunden.
Die Tests wurden ohne Fehlermeldung abgeschlossen. Alle SMART-Ampeln sind grün mit Ausnahme der Temperatur bei Platte 1 nach dem Test (siehe unten).

Ich bin Laie und habe daher Schwierigkeiten im Verständnis der SMART-Werte.
Soviel ich weiß sollten auf jeden Fall die SMART-Werte Nr. 5, 187, 188, 197 und 198 beim RAW(hex) nur Nullen ausweisen. Das ist bei beiden Platten vor und nach dem Test der Fall.
Wie sind aber die anderen rot umrandeten Werte vor und nach dem Test zu verstehen?
Obwohl alle SMART-Ampeln grün sind mache ich mir schon Gedanken, ob das alles in Ordnung ist.
Könnt Ihr mir dazu bitte etwas sagen?
Ist eine der beiden Platten als besser zu sehen und daher zu bevorzugen?
Oder würdet Ihr eine Platte evtl. sogar zurückgeben?

Platte 1:
Erstes EinschaltenNach 11 Stunden Test
SG 1v.JPG
SG 1n.JPG

Platte 2:
Erstes EinschaltenNach 11 Stunden Test
SG 2v.JPG
SG 2n.JPG

Ferner wurden folgende Ergebnisse ausgegeben:
Platte 1: Platte 2:
SG 1.JPG
SG 2.JPG

Herzlichen Dank für jeden Hinweis und jede Meinung im Voraus!
 

Anhänge

  • SG 1.JPG
    SG 1.JPG
    14,1 KB · Aufrufe: 266
  • SG 2.JPG
    SG 2.JPG
    14 KB · Aufrufe: 264
Dass sich bei "188" der Worst von 253 auf 100 gestellt hat klingt logisch, der aktuelle Value ist ja auch 100 (auch schon vor dem Test). Ansonsten sind diese Werte das was der Controller in die RAW-Werte hineininterpretiert und solange sie nicht unter den Threshold fallen sind sie nicht kritisch.

Bei den 3 Werten bei denen RAW nicht 0 ist ist es bei Seagate so das die linken 4 oder 6 Hex-Stellen auf jeden Fall 0 sein sollte, denn das sind die eigentlich gezählten Fehler, der Rest ist die Anzahl der Vorgänge. Und das ist bei den Platten auch jeweils 0, von daher ist da alles in Ordnung.

Platte 1 wird nur n bisschen warm... kann man da evtl. was am Airflow noch verbessern?
 
  • Gefällt mir
Reaktionen: Basebayer
Herzlichen Dank, Jesterfox!

Ich hatte die Platten zum Testen bisher nur an ein offenes USB 3.0 Gehäuse angeschlossen. Letztlich benötige ich Platten für mein neues NAS. Da kommen sie dann ja in einen Airflow.
Ich verstehe Dich also so, dass die nagelneuen Platten in Ordnung sind und eigentlich keine zu bevorzugen ist.
Ich würde wegen der Temperatur sicherheitshalber doch zu Platte 2 tendieren.

Darf ich noch was nachfragen:
Ich habe hier auch eine 8 TB Digital Red (Modell WD80EFAX-68KNBN0).
Erstes EinschaltenNach 11 Stunden Test
WDv.JPG
WDn.JPG

Wie gesagt sind meines Wissens die SMART-Werte Nr. 5, 187, 188, 197 und 198 wichtig.
Wie ist es zu verstehen, dass hier 187 und 188 überhaupt nicht erscheinen?
 
Basebayer schrieb:
Ich verstehe Dich also so, dass die nagelneuen Platten in Ordnung sind und eigentlich keine zu bevorzugen ist.
Ich würde wegen der Temperatur sicherheitshalber doch zu Platte 2 tendieren.
wenn das unter den selben Bedingungen war würd ich auch die zweite bevorzugen, scheint ja weniger warm zu werden.

Was die WD angeht... das mit den SMART Werten ist nicht so ganz durchgängig bei den verschiedenen Herstellern welche Werte sie überhaupt rausgeben und teilweise auch was sie bedeuten.
 
  • Gefällt mir
Reaktionen: Basebayer
Basebayer schrieb:
Soviel ich weiß sollten auf jeden Fall die SMART-Werte Nr. 5, 187, 188, 197 und 198 beim RAW(hex) nur Nullen ausweisen.
188, also die Command Timeouts können auch andere Ursachen haben, Vibrationen oder auch Probleme mit dem SATA Datenkabel, sogar wenn sie bei einer anderen Platten am gleichen Controller auftreten, die sind also nicht so kritisch. Ebenso müssen 197 und 198 nicht unbedingt einen Schaden an der Platte als Ursache haben, auch Vibrationen oder unerwartete Spannungsabfälle können zu schwebenden Sektoren führen.
Basebayer schrieb:
Wie sind aber die anderen rot umrandeten Werte vor und nach dem Test zu verstehen?
Bei Seagate sind die Rohwerte der Attribute Seek Error Rate, Raw Read Error Rate und Hardware ECC Recovered nicht einfache Zählerstände der Fehler, sondern enthalten die Fehlerzähler nur in den 2 höchsten Bytes (die linken 4 Stellen bei hexadezimaler Anzeige der Rohwert in CrystalDiskInfo) und die rechten 8 Stellen (4 Byte) sind der Zähler der Vorgänge dar. Die Ermittlung der Aktuellen Werte funktioniert mehr oder weniger für diese Attribute nach dieser Formel für die Suchfehler:
Wie man sieht, muss auch erst eine bestimmten Anzahl von Vorgängen erfolgt sein, bevor der Aktuelle Wert überhaupt errechnet wird, ist diese Anzahl erreicht fällt er und steigt dann wieder, sofern es keine/nicht zu häufig Fehler gibt.
 
  • Gefällt mir
Reaktionen: Basebayer
Hallo zusammen,

ich betreibe zwei Seagate Ironwolfs in meinem Synology 218 play NAS. Heute morgen habe ich eine Notification erhalten, dass eine Platte 16 fehlerhafte Sektoren aufweist. Danach habe ich eine erweiterte SMART Analyse gestartet, die jedoch mit Fehler abbrach. Daraufhin wurde sie als "schwer fehlerhaft" eingestuf. Siehe Bild. Sie ist aber immer noch aktiv und funktionert auch. Der IronWolf Healthcheck (vom NAS) sagt, dass alles in Ornung ist.

Könnt Ihr mal bitte einen Blick auf die SMART Werte werfen? Was würdet Ihr empfehlen? Die Platten haben noch 1 Jahr Garantie.

Synology_status.JPGSeagate_check.JPGSMART_1.JPGSMART_2.JPGSynology_status_1.JPG
Vielen Dank schonmal!
 
Zuletzt bearbeitet:
Die hat 8 Schwebende Sektoren, die 8 Offline Uncorrectable dürften die gleichen sein, nur wird das Attribut nur einmal beim Starten aktualisiert und nicht laufend, wie das der Schwebende Sektoren. Schwebende Sektoren sind einfach nur Sektoren deren Daten nicht mehr zur ECC passen die hinter jedem Sektor steht und die mit deren Hilfe auch nicht mehr korrigiert werden können. Da die korrekten Daten nicht mehr feststellbar sind, gibt die Platte statt falscher Daten einen Lesefehler als Antwort wenn man versucht diese schwebenden Sektoren zu lesen. Das kann auch anderen Gründe als defekte Oberflächen haben, z.B. einen Stromausfall (davon gab es ja 19) während eines Schreibvorgang der dazu führt, dass eben nicht die ganze Daten plus der neuen ECC geschrieben wurden oder wegen eines Stoßes oder Vibrationen ist der Kopf beim Schreiben aus der Spur gekommen und hat Daten auf der Nachbarspur überschrieben. Auch arbeiten HDDs nicht 100%ig und die Hersteller geben die Fehlerhäufigkeit auch in Form der UBER an, wobei eine UBER von 1:10^14 bedeutet, dass je 10^14 gelesener Bits was etwa 12TB gelesener Daten entspricht, ein Lesefehler und damit schwebender Sektor im Rahmen der Erwartungen liegt.

Die Controller merken sich die schwebenden Sektoren und prüfen die Daten nach dem erneuten Schreiben auf diese Sektoren, dann verschwinden diese einfach oder werden eben durch Reservesektoren ersetzt.

HDDs in einem echten RAID, also einem mit Redundanz und nicht einem RAID 0 welches eigentlich ein AID 0 ist, zeigen daher normalerweise keine schwebenden Sektoren, weil die RAID Controller (ggf. RAID SW) bei Lesefehlern die Daten aus den Daten der anderen Platten rekonstruiert und den Sektor überschreibt bei denen der Lesefehler aufgetreten ist. Ist Dein Pool denn ohne Redundanz? Dem letzten Bild nach, sollte es 1 Laufwerk Fehlertoleranz geben, aber es sieht so aus als wäre nur ein Laufwerk im Pool, womit das RAID also korrupt ist.
 
Danke mal für die Erklärung. Normalerweise sollte das ein RAID1 sein. Eventuell wurde die HDD wegen des schweren Fehlers aus dem Pool entfernt. In diesem Fall macht es wohl Sinn, die HDD auszubauen, formatieren, wieder einbauen und dann das RAID wieder aufbauen lassen?
 
Arschgaul schrieb:
Eventuell wurde die HDD wegen des schweren Fehlers aus dem Pool entfernt.
Möglich, aber dann hat Synology da totalen Mist gebaut, denn Lesefehler sind wie gesagt normal und die UBER spezifiziert wie oft man mit einem rechnen muss, ohne dass die HDD ihre Spezifikationen verletzt. Deswegen darf keine HDD aus dem RAID fliegen, solange die Antwort innerhalb des Timeouts gekommen ist, was aber eigentlich nur bei Hardware RAID Controllern und HDDs ohne TLER/ERC der Fall ist. NAS Platten wie die IronWolf haben aber TLER/ERC und damit darf eine Platte nicht wegen eines Lesefehlers aus einem RAID Verbund mit Redundanz fliegen, sonst macht es ja kaum Sinn so ein RAID zu bauen, dies macht man ja extra damit eventuelle Lesefehler kompensiert werden und man dann nicht das Backup einspielen muss um die betroffene Dateien wiederherzustellen.
 
e/ Mit dem Fred eines ähnlichen Problems aus diesem Forum gelöst.
Lösung:
Über cmd die Festplatte auswählen und mit CLEAN löschen,
dann im Gerätemanager neu zugewiesen.

Danke, falls sich inzwischen jemand um eine Lösung Gedanken gemacht hat!


Hallo zusammen,
ich habe mir vor einiger Zeit eine externe Festplatte zugelegt, eine Western Digital
WDC WD10SMZW-11Y0TS0 1000,1 GB

Hat auch gut funktioniert gehabt, jedoch nur selten verwendet.
Habe diese Festplatte dann an einem TV gekoppelt gehabt, zum Aufnehmen. Dafür hab ich die Externe über den TV formatieren müssen. Das Recorden hat sich dann aber mit dem Beseitigen des TVs erledigt gehabt.

Nun möchte ich die Externe wieder als Externe nutzen, aber beim Anschließen an mein Notebook wird die Externe nicht als Laufwerk angegeben... Obwohl von Windows ganz normal erkannt

1595673548550.png

Intenso = eine andere Externe

Unter Geräte wird die Festplatte erkannt

CrystalDiskInfo kann die Festplatte auch einfach erkennen.

1595673628552.png


Die Datenträgerverwaltung zeigt mir die Festplatte an, aber ich kann kein Laufwerksbuchstaben zuweisen (Datenträger 2)

1595673846525.png


(Volume löschen ist die einzige auswählbare Option)


Hat jemand schon Erfahrung mit so einem Problem?
Danke
lg
Markus
 

Anhänge

  • 1595673575980.png
    1595673575980.png
    48,6 KB · Aufrufe: 265
Zuletzt bearbeitet:
chackyo schrieb:
Über cmd die Festplatte auswählen und mit CLEAN löschen,
Du meinst mit DISKPART und CLEAN gelöscht, damit bekommt man die Partitionierungsinformationen entfernt. Also eine Eingabeaufforderung "Als Administrator" starten und folgendes eingeben:

  • diskpart
  • list disk
  • select disk x (x steht für die Nummer des Laufwerks aus list disk, die richtige Platte sollte an der Kapazität zu erkennen sein, sonst andere Platten besser vorher abklemmen um Datenverlust zu vermeiden, vor einer Windowsinstallation sowieso, damit der Bootloader nicht dort landet)
  • detail disk (nur um sicher zu gehen die richtige Platte ausgewählt zu haben)
  • clean (clean löscht alle Partitionierungsinformationen, clean all überschreibt alles mit 00 und dauert entsprechend länger, man kann danach auch nichts mehr wiederherstellen)
  • exit

Aber wo kommt der Beitrag mit der Frage her?
 
  • Gefällt mir
Reaktionen: chackyo
Holt schrieb:
Du meinst mit DISKPART und CLEAN gelöscht, damit bekommt man die Partitionierungsinformationen entfernt. Also eine Eingabeaufforderung "Als Administrator" starten und folgendes eingeben:

  • diskpart
  • list disk
  • select disk x (x steht für die Nummer des Laufwerks aus list disk, die richtige Platte sollte an der Kapazität zu erkennen sein, sonst andere Platten besser vorher abklemmen um Datenverlust zu vermeiden, vor einer Windowsinstallation sowieso, damit der Bootloader nicht dort landet)
  • detail disk (nur um sicher zu gehen die richtige Platte ausgewählt zu haben)
  • clean (clean löscht alle Partitionierungsinformationen, clean all überschreibt alles mit 00 und dauert entsprechend länger, man kann danach auch nichts mehr wiederherstellen)
  • exit

Aber wo kommt der Beitrag mit der Frage her?

Danke, schöne Zusammenfassung.
Genau das war es. Habe nach dem Schließen den Thread nicht mehr gefunden gehabt, deswegen nur noch grob sagen können was ich (nach Anleitung) gemacht habe.

Habe mich selbst gespoilert, um den Beitrag möglichst klein zu halten, da gelöst falls das deine Frage war.
 
Hallo allerseits!

Ich habe jetzt mal meine beiden externen Festplatten mit DiskInfo angeschaut. Da mir die Parameter im Detail nichts sagen, wollte ich euch bitten, mal nachzusehen, ob die beiden Platten noch in Ordnung sind. Ich nutze sie nämlich für Backups meiner wichtigen Daten. Die Seagate ist schon über 10 Jahre alt, hat bisher aber immer funktioniert. Die WD ist deutlich neuer und hat bisher auch keine Probleme gemacht (aber man weiß ja nie...).



Extern-Seagate_2020_07_29.jpg


Extern-WD_2020-07-29.jpg
 
Jennis schrieb:
Die Seagate ist schon über 10 Jahre alt, hat bisher aber immer funktioniert.
Damit ist sie dann weit über die vom Hersteller geplante Nutzungsdauer hinaus und auch wenn HDDs meistens länger als diese 5 Jahre halten, so halten sie doch nicht ewig. Die Werte sehen gut aus, aber mir fallen viele unerwartete Spannungsabfälle auf, auch wenn manches was anderes schreiben, würde dringend empfehlen immer die "Hardware sicher entfernen" Funktion zu nutzen. Außerdem solltest Du unbedingt ein Backup aller wichtigen Daten haben, auch von denen die auf dieser externen Platte stehen.
 
Zurück
Oben