Festplatten Server nach Laufzeit austauschen?

c-mate

Rear Admiral
Registriert
Aug. 2010
Beiträge
5.926
Hi,

gestern ist am SQL Server eine Festplatte ausgefallen, nicht weiter schlimm, läuft ja im Raid und die neue Platte wurde innerhalb 24 Stunden geliefert.
Allerdings dazu folgende Überlegung bzw Frage.
Die Festplatten im Server wurden logischerweise alle zur selben Zeit angeschafft und haben demzufolge auch alle die selbe Laufzeit. Jetzt ist eine defekt, was ja evtl. bedeuten könnte, dass die Platten ihre max Kapazität erreicht haben.
Ich glaube der Raidverbund kann den Ausfall von zwei Platten kompensieren, aber wenn die Platten ihre Laufzeit erreicht haben, könnte es ja dann auch theoretisch sein, bzw sich die Möglichkeit erhöhen, dass zb 3 Platten gleichzeitig ausfallen.
Zwar vermutlich immer noch eher unwahrscheinlich, aber wer weiß.

Daher die Frage, tauscht man bei Servern denn üblicherweise nach einer gewissen Laufzeit die Platten komplett vorsorglich aus, um das o.g. zu verhindern?

THX
 
Das würde ich vom Alter der Festplatten abhängig machen.
Je älter, desto höher die Ausfallwahrscheinlichkeit.
Zumal man in so einem Fall auch nötigenfalls eine Kapazitätsanpassung vornehmen kann, wenn der Platz nicht mehr ausreichen sollte.

Ich tausche generell nach spätestens 4 Jahren.
 
Wie wichtig ist das System? Kannst du einen "steher" von einem Tag verkraften (Backup wirds wohl geben?)? Wenn nicht würde ich auch, abhängig vom Alter der Platten austauschen.
 
Ich würde auf jeden fall dafür sorgen dass du Ersatzplatten lagernd hast!
Wenn dir am Freitag am Abend eine kaputt geht, hast du vielleicht erst Montag in der Früh eine Ersatzplatte...

Also kauft ein zwei Ersatzplatten und legt die in einen Schrank, für Notfälle!
 
Und ein raid ist kein Backup also immer brav Backups von dem Raid anlegen. Dann bist du auf der sicheren Seite
 
Daher die Frage, tauscht man bei Servern denn üblicherweise nach einer gewissen Laufzeit die Platten komplett vorsorglich aus, um das o.g. zu verhindern?

Nein, macht man eigentlich nicht. Natürlich steigt mit zunehmendem Alter der Platten das Risiko das sie ausfallen, in der Praxis leben aber selbst Platten der selben Baureihe so unterschiedlich lang das dieses Risiko minimal ist. Wenn die an einem gescheiten Raid Controller hängen weiß der auch mit den zurückgemeldeten Smart Werten etwas anzufangen und wird die Platten schon rechtzeitig in Rente schicken.
 
Einen Datenbankserver (SQL) oder auch anderen Server in einem professionellen Umfeld, womöglich ein einem 24/7-Umfeld, ohne Hot-Spare-Laufwerke im Raid laufen zu lassen in der heutigen Zeit, grenzt schon an Fahrlässigkeit bzw. liebt das Risiko und für den ist der Jobverlust kein Problem.
 
Ja, auf jeden Fall Ersatzplatten im Schrank lagern. HDDs gehen meiner Erfahrung entweder in den ersten 3 Monaten kaputt oder nahezu nie.

Allerdings vergrößert sich die Fehlerliste mit der Zeit, aber ein fehlerhafter Block ist in meinen Augen keine defekte Platte, schließlich haben HDDs schon im Auslieferungszustand eine defectlist.

Schwieriger stelle ich es mir vor, präventiv defekte Blöcke zu finden und nicht erst, wenn im laufenden Betrieb Daten angefordert werden, oder schlimmer, wenn gerade eine HDD ausgefallen ist und nun komplett gesyncht wird (obwohl dieser Fall per Raid-6 unwahrscheinlich ist).
Man müßte z.B. am Wochenende die komplette Oberfläche lesen, was natürlich Stunden dauert.
 
Hallo

wir überwachen bei uns im Rechenzentrum alle Platten, diese werden nur getauscht bei Ausfall oder zuviele Sectoren Fehler, alles andere uns unwirtschaftlich, gerade bei SSD und SAS Platten.

Macht tägliche Smartchecks und Backups, so könnt Ihr der HDDs bis zum Tod nutzen.

Mit freundlichen Grüßen

Martin Krüger
 
Also ich habe die Erfahrung gemacht, dass je länger eine Platte läuft desto besser und zuverlässiger ist sie.
Alle Platten die bei mir mal Defekte aufwiesen, sind innerhalb des ersten Jahres Dauerbetrieb kaputtgegangen.

Platten die nach 2-3 Jahren im SMART immer noch 0 fehlerhafte Sektoren zeigen, werde ich garantiert nicht wieder hergeben.
Das sind die Besten die man kriegen kann.
 
Außerdem tauschst du ja durch die "nach-und-nach-Ausfälle" innerhalb einer gewissen Zeit automatisch alle Platten mal aus. Wenn du nach X Jahren alle Platten auswechseln wolltest, wären da sicher 30% dabei, die erst vor X Monaten getauscht wurden. Ziemlich unwirtschaftlich.
Wir haben hier im Betrieb seit langer Zeit Raid 5 am Laufen mit einer Hot Spare - Platte, dieses Raid 5 läuft dann nochmals gespiegelt an einen anderen Standort. Es ist noch nie vorgekommen, dass während eines Rebuilds eine weitere Platte abgekratzt ist. Dass es dann gleich drei sind ist sehr sehr unwahrscheinlich...
 
(Dass Raid nichts mit Backup zu tun hat sondern mit Ausfallsicherheit ist natürlich klar)

Ob eine Hot Spare Platte dabei ist weiß ich nicht
Es gibt keine Kapazitätsprobleme, also kein Aufrüsten notwendig
Es gibt ein tägliches GVS Backup auf eine Storage, mehrere kleine Backups auf externe Platte und ein großes tägliches differenzielles Backup auf ein HP Bandlaufwerk (Monats Bänder liegen im Safe, Wochen Bänder bei mir zuhause, Tages Bänder nehme ich jeden Tag mit nach Hause und am nächsten Tag wieder mit)
Wir könnten für den worst case Notfall kurzfristig baugleiche Platten aus dem stillgelegten alten Exchange Server nehmen
Was für ein Raid weiß ich grad nicht, aber ich denke es ist Raid 5 (8 Platten á 146GB)
 
Zuletzt bearbeitet:
Dann schau da mal nach, eine Hot Spare - Platte ist sehr wichtig, gerade wenn ein Ausfall am Wochende/Nachts/in der Urlaubszeit passiert, bist du froh drum!
 
Ohne Hot Spare darf dir genau 1 Platte ausfallen.

Genau der Fall ist bei der Storage eines Bekannten aufgetreten. Raid 5 ohne HotSpare, Platte fällt aus und während diese Platte nachbesorgt wurde ist eine weitere Platte ausgefallen.
Backup gab es keines da die Daten nicht so wichtig waren - weg waren die Daten.
 
Mhm ich dachte wieviele Plattenausfälle ein Raid 5 System verträgt hängt von der Anzahl der verwendeten Platten ab. Kann da aber auch was verwechseln, dann evtl. vielleicht nicht Raid 5.
Muss ich mich mal schlau machen
 
Zuletzt bearbeitet:
Bei Raid 5 funktioniert immer 1 Platte als "Datenretter". Deswegen lautet da auch die Speicherplatzberechnung:

(Anzahl der Platten x Kapazität) - 1 x Kapazität
 
c-mate schrieb:
Mhm ich dachte wieviele Plattenausfälle ein Raid 5 System verträgt hängt von der Anzahl der verwendeten Platten ab. Kann da aber auch was verwechseln, dann evtl. vielleicht nicht Raid 5.
Muss ich mich mal schlau machen

Ein RAID 5 darf immer genau eine Platte ausfallen. Wenn man möchte dass 2 Platten ausfallen dürfen, muss man ein RAID 6 machen.
 
OK dann ist es vielleicht ein Raid 6. Aber wie gesagt, muss ich mich schlau machen.

Danke @all für die schnellen Antworten!
 
Genau diese Diskussion habe ich vor einigen Jahren auch einmal mit meinem damaligen Chef geführt. Seiner Meinung nach sollte man alle Platten sogar jährlich auswechseln.

Bei absolut kritischen Systemen kann man darüber nachdenken, nach der Hälfte der geplanten Betriebszeit zumindest einmal proaktiv einen Teil der Platten zu tauschen. Die etwas größeren RAID-Arrays (> 5 Platten pro Array) sollten ohnehin m.E. über mindestens eine Hotspare-Platte verfügen.

Ansonsten halte ich das bei den meisten Systemen für Verschwendung und Arbeitsbeschaffungsmaßnahme.

Besagter Chef war übrigens auch nur rund ein halbes Jahr bei uns, daher hat sich die Situation relativ schnell entspannt.
 
Zurück
Oben