HDDs für wöchentliche Sicherungen

Crys

Lt. Commander
Registriert
Apr. 2009
Beiträge
1.665
Hallo zusammen,

ich habe die Ausfälle meiner letzten Dutzend NAS HDDs analysiert und mir ist erst jetzt ein systematischer Fehler meiner Hardware aufgefallen: 24/7 NAS HDDs eignen sich nicht für Sicherungen, die nur alle Tage/Woche/Monate erfolgen!

Kleine Fakts:
ich habe (WD red 3TB) HDDs, die >100.000 Betriebsstunden haben, bei <100 Starts und immer noch keine SMART Fehler aufweisen.
Ich habe (WD red 6TB) HDDs, mit <400 Betriebsstunden, bei >400 Starts, welche schon Fehler aufweisen.
Vorhin ist eine HDD (WD red 4TB) gestorben, bei ca. 900 Betriebsstunden, mit fast 10.000 Starts* ...
(* hier war ein Fehler in einem Sicherungsskript schuld).

Ist ja ganz logisch! Je nach Größe des Systems ist es aber nicht sinnvoll, die Sicherungs-HDDs immer laufen zu lassen (bei gerade ca. 12€/a pro HDD Stromkosten).

Was für NAS/Server HDDs sind für viele Starts ausgelegt?
Im konkreten geht es um ein neues System mit einer Sicherung von 3TB plus wöchentliche inkrementelle Sicherungen, die je ca. 10h am Stück laufen. In der restlichen Zeit sind die HDDs im Stand-by.

Vielen Dank!
 
Crys schrieb:
die Ausfälle meiner letzten Dutzend NAS
Wieviele Dutzend Festplatten von wievielen insgesamt sind dir denn schon ausgefallen im Kurzzeitbetrieb?

Daß z.B WD red Platten durch ein paar hundert Einschaltungen oder generell durch zu häufiges Einschalten kaputt gehen, kann ich nicht bestätigen!

Welchen systematischen Fehler hat jetzt deine Hardware?
 
  • Gefällt mir
Reaktionen: H3llF15H
Motorrad schrieb:
Welchen systematischen Fehler hat jetzt deine Hardware?
Wie beschrieben: 24/7 HDDs als 1/7 HDD verwendet ...

Motorrad schrieb:
Wieviele Dutzend Festplatten von wievielen insgesamt sind dir denn schon ausgefallen im Kurzzeitbetrieb?
Jemals ausgefallen:
für stündliche-monatliche Sicherung: 8 von 22 HDDs
(davon ausgefallen) stündliche Sicherung: 4 von 8 HDDs*
(Zeitraum ca. 10a)
* hier ausgefallen 4/4 WD red 6TB (zwei Chargen) und 0/4 WD red 4TB (aber schon mit SMART Fehlern).
Alle 8 HDDs sind bei 900-50.000h ausgefallen.

Beim Rest sind 4 von ca. 80 HDDs (alles 24/7 HDDs, gemischte Marken/Typen) auch über ca. 10 Jahre ausgefallen. Hier aber immer (soweit dokumentiert) nach je über 100.000 h.
 
  • Gefällt mir
Reaktionen: Crys
Der Vergleich hinkt leider, da es sich jeweils um unterschiedliche Platten handelt.
Ergänzung ()

Die Enterprise HDDs werden aber auch mit 600000 Starts spezifiziert.
Leider steht nicht ob es sich um Einschaltvorgänge oder Startzyklen aus dem Standby handelt.
 
Crys schrieb:
24/7 NAS HDDs eignen sich nicht für Sicherungen

sie eignen sich schon, wenn man die nicht abschalten / in den Tiefschlaf legen würde!
Wenn man unbedingt da sparen will, muss man halt Desktop Platten im NAS verbauen für die Sicherungen.
 
Fusionator schrieb:
Der Vergleich hinkt leider, da es sich jeweils um unterschiedliche Platten handelt.
Die HDDs sind so ähnlich wie möglich. Und die Tendenz ist ja klar erkennbar.

Fusionator schrieb:
Leider steht nicht ob es sich um Einschaltvorgänge oder Startzyklen aus dem Standby handelt.
Startzyklen aus dem Standby.
In SMART wird aber nicht unterschieden!?

Sebbi schrieb:
Crys schrieb:
24/7 NAS HDDs eignen sich nicht für Sicherungen
sie eignen sich schon, wenn man die nicht abschalten / in den Tiefschlaf legen würde!
Wenn man unbedingt da sparen will, [...]
Crys schrieb:
24/7 NAS HDDs eignen sich nicht für Sicherungen, die nur alle Tage/Woche/Monate erfolgen!
Da wurde ganz klassisch der entscheidende Halbsatz aus dem Zitat weggelassen :D

1W Standby-Last, je HDD und 40c/kWh, bei allen 22 HDDs bei mir würden dann 77€/a kosten (wenn diese auch bei mir wären). In 10 Jahren hat man da einen ganzen NAS gespart :D
 
Crys schrieb:
Da wurde ganz klassisch der entscheidende Halbsatz aus dem Zitat weggelassen

nein, denn im privaten Umfeld, in dem wir uns hier normalerweise hier im Forum befinden, wird idR nicht aller paar Stunden / live gesichert etc. Daher braucht man das nicht extra zu erwähnen.
Vorallem da du speziell auf 24/7 HDDs eingehst, die extra dafür ausgelegt sind 24/7 zu laufen ohne abgeschaltet zu werden.

Das die schneller kaputt gehen je öfters die neu eingeschaltet werden als andere Varianten ist so ungefähr die Erkenntniss wie die Erkenntniss, das Wasser nass ist.

Crys schrieb:
1W Standby-Last, je HDD und 40c/kWh, bei allen 22 HDDs bei mir würden dann 77€/a kosten (wenn diese auch bei mir wären). In 10 Jahren hat man da einen ganzen NAS gespart

Rechne noch dagegen, wie die Verschleißerscheinungen sich auswirken, so das du einen neue Platte die dann holen musst, eventuell 1x in 3 Jahren bei Desktop Platten ( ~ 150 €) oder 1x pro Jahr bei NAS Platten ( ~ 200 €).
Wenn du das noch in den Vergleich zu deiner Aussage "ich habe (WD red 3TB) HDDs, die >100.000 Betriebsstunden haben, bei <100 Starts und immer noch keine SMART Fehler aufweisen." stellt, dann sieht die Rechnung übrigens ganz anders aus.

übrigens die >100000 h auf der Red 3 TB glaube ich nicht. Das wären über 11,4 Jahre. Die Red Serie wurde aber erst 2012 vorgestellt. Sprich ca. 10 Jahre max. wäre möglich also Super Early Adopter. Entweder ein Auslesefehler oder da stimmt etwas nicht.
 
Crys schrieb:
Startzyklen aus dem Standby.
Also im WD Purple Datenblatt finde ich nichts von Start/Stop Cycles :confused_alt: Da steht nur 600000 Load/Unload Cycles. Gleiches gilt für die Exos X16.
Daraus könnte ja man den Schluss ziehen, dass es zumindest nicht mehr als 600000 Start/Stop Zyklen sein können, wenn die Köpfe sonst nicht geparkt werden.

Man zeige mir mal ein HDD Datenblatt, wo eine konkrete Angabe zu Anzahl der Powercycles zu finden sind ;)
Gerne auch etwas der letzten 15 Jahre..

Crys schrieb:
In SMART wird aber nicht unterschieden!?
Bei meinen REDs gibt es unter CDI Start/Stop Count und Power Cycle Count.

Sebbi schrieb:
Das die schneller kaputt gehen je öfters die neu eingeschaltet werden als andere Varianten ist so ungefähr die Erkenntniss wie die Erkenntniss, das Wasser nass ist.

Ja, das wird halt immer gern gemutmaßt. Aber wieso sollte eine Enterprise Platte nicht einmal ein paar wenige Einschaltzyklen pro Tag überstehen? Für mich ist das schlichtweg nicht plausibel.
Man kann also eine Platte mit sehr robuster Mechanik bauen, doppelt gesichertem Motor und Aktuator, diverse Kompensationsmechanismen für Vibrationen und thermischem Drift in der Kopfelektronik, aber wehe, die muss sich dreimal am Tag einschalten.

Dagegen ist also eine windige Desktopplatte ein Musterbeispiel bei der "Einschaltfestigkeit" Klar doch...
 
  • Gefällt mir
Reaktionen: Crys und Motorrad
Fusionator schrieb:
Aber wieso sollte eine Enterprise Platte nicht einmal ein paar wenige Einschaltzyklen pro Tag überstehen? Für mich ist das schlichtweg nicht plausibel.

weil der Komponenten auf Dauerleistung und entsprechende Wärmebelastung ausgelegt sind. Und das Problem ist nicht ansich die Mechanik, sondern der thermische Stress. Sprich wenn die durch den Ruhezustand auskühlt, sind die Komponenten einfach nicht so dafür ausgelegt wie Desktopplatten.

Hast du schon mal gesehen, wie ein Datencenter umzieht? Die Platten werden sogar in einer beheizten Box untergebracht, damit diese nicht auskühlen.
Crys schrieb:
Was für NAS/Server HDDs sind für viele Starts ausgelegt?

keine meiner Meinung nach, denn NAS / Server läuft idR 24/7 daruf sind die Platten optimiert.
Darum sind auch in den Datenblättern oft keine Einschaltzyklen vermerkt bei 24/7 Platten.
Load-unload cycles hingegen ja, nur werde damit auch oft die Zyklen gezählt, wo nur die Köpfe geparkt werden, nicht aber die Spindel aufhört sich zu drehen.
 
Sebbi schrieb:
Sprich wenn die durch den Ruhezustand auskühlt, sind die Komponenten einfach nicht so dafür ausgelegt wie Desktopplatten.
Solch eine Erklärung dafür, höre ich jetzt zum ersten mal!

Billigere Desktopplatten sollen also aus besser aufeinander abgestimmten Materialien bestehen, die z.B. ähnlichere Ausdehnungskoeffizienten haben und es dann somit zu geringeren inneren Spannungen im Material kommen soll und Toleranzen weitgehend gleich bleiben!? Und das ganze bei Temperaturunterschieden zwischen lauwarm und handwarm!

Nach meinem Verständnis wird andersherum ein Schuh daraus. Alle Arten von Platten sind im Antriebsbereich für den Dauerbetrieb ausgelegt/ geeignet! Es wäre wider die Natur, wenn ein warmgefahrenes System nach erreichen der Betriebstemperatur plötzlich beginnt sich selbst aufzufressen. Oder darf es nach erreichen der Betriebstemperatur noch ein Stündchen länger laufen, bevor der massive Verschleiß einsetzt. Oder, wie lange ist eigentlich "nicht im Dauerbetrieb" pro hochfahren der Platte, pro Tag?

Ich habe gelernt, daß Festplatten vom Hersteller für eine bestimmte Betriebsstundenzahl ausgelegt sind und die erreichen sie am einfachsten, wenn sie immer durchlaufen. Da von den Herstellern aber auch vorgesehen ist, daß die Platten eine definierte Zahl an Jahren genutzt werden sollen können, würden sie diese Jahre dann nicht durchhalten, weil die Betriebsstunden vorher schon abgelaufen sind.
Um die vorgesehene Nutzbarkeitsdauer dennoch zu erreichen, haben es die Hersteller sich dann so vorgestellt (und kommunizieren das dann auch so), daß eben die einfachen Desktopplatten pro Tag nur eine gewisse Anzahl an Stunden betrieben werden sollen, damit sie auch ihr geplantes Alter erreichen. Und schon hat man eine Festplatte, die (angeblich) nicht für den Dauerbetrieb geeignet ist!

Bei den "richtigen" Dauerbetriebsplatten sind dann die möglichen Betriebsstunden durch besseres Material, Technik und Firmware so weit gesteigert, daß sie gerade bei Ablauf ihrer vorgesehenen Nutzungszeit auch (zufällig) ihre Betriebsstunden erreicht haben.

Kurzfassung:

Beide Typen von Platten sollen z.B. 6 Jahre genutzt werden können. Die Dauerbetriebsplatte kann diese Zeit im Dauerlauf erreichen, weil ihre maximale Betriebsstundenzahl darauf ausgelegt ist (bessere Lager, besseres Material, angepaßte Firmware, etc.). Die einfachere Platte kann die 6 Jahre im Dauerlauf nicht durchhalten, weil z.B ihre möglichen Betriebsstunden nur halb so hoch sind wie die der höherwertigeren Platte. Ihre dann z.B. nur 3 Jahre Betriebsstunden kann sie dann aber trotzdem an einem Stück abreißen!


Und daß der Antriebsmotor für die Magnetscheiben bei einer generell höherwertigen NAS- Platte nur für wenige hundert bis tausend Anläufe konstruiert sein soll, kann ich mir auch nicht vorstellen!
An welcher Stelle würde denn hier der Hersteller sparen und zu welchem Zweck!? Um Herstellungskosten zu sparen, um den Antrieb leichter zu machen?
Was soll den überhaupt beim Anlaufen eines Spindelmotors kaputt gehen, gerade wenn er noch durch eine ausgeklügelte Firmware gesteuert und überwacht wird!?
Mich würde es nicht überraschen, wenn die Hersteller aus Kostengründen bei ähnlichen Desktop- oder NAS- Platten den selben Motor verbauen würden.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Crys
Sebbi schrieb:
Und das Problem ist nicht ansich die Mechanik, sondern der thermische Stress. Sprich wenn die durch den Ruhezustand auskühlt, [...]
Diese Vermutung (!) kann ich auch aus zweiter Hand bestätigen. Ein Freund ist Leiter des Uni RZ und vermutet, dass des einen größeren zusammen zwischen konstanter Temperatur und Lebensdauer gibt.
Aber ... bei meinen HDDs war dies (wahrscheinlich) nicht der Fall. Die ausgefallenen 4x 6TB HDDs waren zwischen anderen (baugleichen) HDDs, welche im Dauerbetrieb waren. In Betrieb haben alle HDDs 39°C. Wenn die defekten HDDs eingeschalteten wurden (nach 22-23h offline), zeigte hddtemp 38°C an.

Was für HDDs ich für solche Sicherungsarten in Zukunft verbauen soll, weiß ich (immer noch) nicht.
Ich revidiere meine Erkenntnis zu einer Vermutung. Es kann auch Zufall sein.
 
Zurück
Oben