Raid 5 - 1HDD degraded wegen timeout

K

Kartonschachtel

Gast
Hallo

Ich hatte auf einem 3ware-Controller ein Raid5 mit 4x 750GB (7200rpm) Festplatten am laufen. Eine HDD musste ich jetzt nach 2 Jahren ersetzen, und zwar habe ich diese durch eine 5400rpm mit 1,5 TB ersetzt. Lief jetzt 3 Monate alles wunderbar, bis der Controller die neue Festplatte wieder rausgeschmiessen hat, der Fehler war ein "timeout".


-> Ich habe das Raid aber jetzt wieder repariert, läuft wieder alles gut (soweit ich das beurteilen kann ;))

Hängt das mit den Unterschiedlichen Geschwindigkeiten der Platte zusammen (die neue ist ja nur 5400rpm)?


Hat das schon jemand gehabt?


Danke
 
Beim Raid sollte man immer 4 identische Festplatten nutzen..
 
Wir haben mit nem 3Ware Controller letztens auch sowas komisches mit Drive Timeout gehabt.
Der Support unserer Bastelbude hat empfohlen im BIOS die Option C1E für die CPU zu deaktiveren. Das hat geholfen.

Es liegt wohl daran dass die Kombination von Stromspartechnik + Controller + Platten bei uns nicht passt. Vielleicht trifft das auch auf deine Platte zu. Die Timeout-Meldungen müllen auch das Alarm-Log zu.
 
Zuletzt bearbeitet:
Benzer schrieb:
@IC3HANDS: Nicht wirklich...

Es müssen allerdings identlische HDD's sein was die Hardware specs angeht. Das Problem könnte also tatsächlich die langsamere HDD sein.

Dann müsste der Controller das Timeout im Millisekunden auswerten, daran wird es wohl nicht liegen.
Ich vermute, dass die Platte sich selber in den StandBy fährt, beim Zugriff muss die Platte erst hochdrehen und das wird als Timeout bemerkt. Oder die Platte hat defekte Sektoren bei der das Laufwerk lange braucht und diese fehlerfrei zu lesen.
Platten die für RAID vorgesehen sind melden dann den Fehler sofort, der Controller ergänzt dann die fehlenden Informationen. Nur solche Platten sind halt etwas teurer.
 
Hmhmhm es handelt sich um eine Eco-Green, war die einzig griffbereite Festplatte ;)


Soll ich sie austauschen? Oder hilft das deaktivieren von C1E? Oder gibt es sonst noch eine Möglichkeit
 
Also ich hab noch keine Festplatte gesehen (auch Eco oder Green Platten) die sich einfach abgeschaltet hat bzw. einfach in den Sleep Modus gegangen ist ohne einen entsprechenden Befehl erhalten zu haben.

Ein Möglichkeit zu diesem Thema wäre das der Controller einen Spindown von Festplatten die im Array laufen unterstützt. Und bei einem Aufwecken aus dem Sleep kann es halt sein das die Green länger gebraucht hat anzulaufen und so aus dem Array geflogen ist.

Generell würde ich in so einem Array die Festplatte aber auch gegen eine mit den anderen vergleichbare austauschen. Muss ja nicht die selbe sein.

C1E etc hat eigentlich nix mit dem Controller zu tun. Meine AMD CPU im Server taktet auch fröhlich hoch und runter und die stink normalen WD Greens im Raid 5 fliegen nicht aus dem Array.
 
Soll ich sie austauschen? Oder hilft das deaktivieren von C1E? Oder gibt es sonst noch eine Möglichkeit
Ich weiss nicht, ob es unter Win die Möglichkeit gibt, von einzelnen Platten im RAID-Verbund die SMART-Werte auszulesen, unter Linux geht das.
Schlimmstenfalls beim nächsten Rausfallen die Platte mal an einen anderen Controller/USB per Adapter anschließen und nachsehen, ob da pending sectors/reallocated zu finden sind.
Das wäre eine Erklärung für die timeouts.
Bei nicht-RE-Edition Platten hat man neben diesem Problem auch möglicherweise noch mit äußeren Einflüssen durch andere Platten im Käfig zu kämpfen.
 
Humptidumpti schrieb:
C1E etc hat eigentlich nix mit dem Controller zu tun. Meine AMD CPU im Server taktet auch fröhlich hoch und runter und die stink normalen WD Greens im Raid 5 fliegen nicht aus dem Array.

Das habe ich mir eigentlich auch gedacht und wäre von allein niemals auf die Idee gekommen dass es daran liegen könnte. Aber der PC-Bauer hat mir vorgeschlagen das mal zu deaktivieren und unser Server schnurrte daraufhin wieder wie ein Kätzchen.
Das es bei dir nicht passiert dürfte daran liegen, dass der Bug auf die älteren 3Ware-Modelle beschränkt ist. 96xx und 98xx wenn ich mich recht erinnere.

@Kartonschachtel: Kannst es ruhig mal ausprobieren. Es kann nichts kaputtgehen. Weder an Hardware noch an Software. Wenns nix hilft kannste es problemlos wieder aktivieren.
 
Zurück
Oben