RAID1-Array macht Zicken

Tarkus

Ensign
Registriert
Sep. 2005
Beiträge
238
Mein Board: ASUS A8N-E
Prozessor: Athlon 64 (3000+)
Meine Laufwerke: 2x 160 GB SATA2 (Samsung) im RAID1-Verbund

Vor etwa 2 Wochen und gestern schon wieder hatte ich Probleme mit dem RAID-Verbund.

Während des Arbeitens mit dem PC ging plötzlich nichts mehr, nicht mal Strg-Alt-Entf. Nach dem Betätigen der Reset-Taste bootete das System neu. Gleich im Anschluss an das Begrüßungsbild des Boards kam statt des Hinweises, der RAID-Verbund sei ''healthy'' rot blinkend die Warnung, beide Laufwerke seien ''degraded''. Der weitere Bootvorgang war deutlich langsamer als sonst, aber Windows arbeitete völlig normal. Lediglich im Explorer war die zweite Festplatte nicht mehr verborgen, sondern erschien als ganz normales Laufwerk (Inhalt beider Platten bis dahin identisch). Nach erneutem Booten rief ich dort, wo die oben beschriebene Warnung kam, mit F10 das RAID-Setup auf. Dort konnte ich, wenn ich eine der beiden Platten ausgewählt hatte, nicht viel machen - entweder Löschen (Delete) oder Wiederherstellen (Rebuild). Das Drücken der R-Taste (für Rebuild) zeigte aber keinerlei Wirkung.

Also hatte ich den PC neulich zum Service gebracht (weil noch Garantie). Dort überprüfte man zunächst die Festplatten, mit dem Ergebnis, dass diese Okay sind. Anschließend sicherte man mein komplettes System und stellte dann den RAID-Verbund wieder her. So weit, so gut.

Doch gestern passierte es erneut. Derselbe Fehler. Diesmal habe ich nicht das RAID-Setup, sondern unter Windows den sogenannten RAID-Manger bemüht und dort die Option gewählt, das Array zu löschen, was auch nach wenigen Sekunden abgeschlossen war. Danach bekam ich eine neue Auswahl-Optionen, nämlich ''Array rekonstruieren'', die ich ebenfalls ausführte. Nun, eine ganze Festplatte spiegeln dauert zwar eine ganze Weile, aber es hat zumindest funktioniert. Der RAID-Verbund steht wieder und alles ist erst mal wieder okay.

Meine Frage ist nun:


Was kann die Ursache für ein solches Problem sein? Gibt es irgendwelche Konfigurations-Möglichkeiten, die ich optimieren könnte, damit das jetzt nicht ständig passiert? Sind solche Probleme bekannt und eventuell auch eine Lösung?
 
Zuletzt bearbeitet:
Es könnte sein, dass der Controler hin und wieder aus der Synchronisation kommt.

"degraded" oder "critical" heißt immer, dass alles noch funktioniert, aber das RAID im weitesten Sinne gewartet werden muss.

Hier gibt es einige "maintenance" Operationen (sprich: Wartungsarbeiten) die man hin und wieder durchführen sollte, wie zB die Synchronisation.

Maintenance Operationen laufen immer als Backgroundactivity (BGA) weil das Raid weiter nutzbar bleibt - nur mit langsamerer Geschwindigkeit. Sind diese abgeschlossen, geht es wieder fullspeed weiter.

Das Raid auflösen, eine Platte löschen und das Raid neu erstellen ist also das gleiche wie "synchronisieren", nur einfacher.

Zur Ursache: Meiner Meinung nach hast du wohl auf zuvor benutzen Festplatten nach Erstellung des Arrays keine Initialisierung vorgenommen (dabei werden alle im RAID beteiligten Festplatten komplett gelöscht aber auch strukturiert, ähnlich formatieren.), deshalb kommt es nun zu sporadischen Fehlern.

Eigentlich ist ein RAID1 keine große Sache und das primitivste RAID überhaupt, darum verwundern deine Probleme schon etwas. Vielleicht einfach mal weiter beobachten, und wenn das System auf "degraded" geht, in der Controlersoftware nachschauen welche Festplatte ausgefallen ist, wenn immer dieselbe ausfällt ist es vielleicht doch ein HDD oder sogar Kabelproblem.

Bitte die Kabel benutzen die beim Controler dabei waren, oder gute geschirmte!
 
Zuletzt bearbeitet:
Danke erst mal für die ausführliche Antwort. :o)
Ein paar Dinge sind mir allerdings noch nicht klar.

F_GXdx schrieb:
Hier gibt es einige "maintenance" Operationen (sprich: Wartungsarbeiten) die man hin und wieder durchführen sollte, wie zB die Synchronisation.
Wie mache ich das? Wo finde ich eine solche Funktion?

F_GXdx schrieb:
Maintenance Operationen laufen immer als Backgroundactivity (BGA) weil das Raid weiter nutzbar bleibt - nur mit langsamerer Geschwindigkeit. Sind diese abgeschlossen, geht es wieder fullspeed weiter.
Heißt das, ich hätte eigentlich gar nichts machen und nur abwarten müssen, bis es von allein wieder läuft? Nicht wirklich, oder?

F_GXdx schrieb:
Zur Ursache: Meiner Meinung nach hast du wohl auf zuvor benutzen Festplatten nach Erstellung des Arrays keine Initialisierung vorgenommen (dabei werden alle im RAID beteiligten Festplatten komplett gelöscht aber auch strukturiert, ähnlich formatieren.), deshalb kommt es nun zu sporadischen Fehlern.
Hmmm... der PC wurde vom Händler zusammengestellt. Kann mir kaum vorstellen, dass die Platten zuvor benutzt waren. Oder habe ich dich falsch verstanden?

F_GXdx schrieb:
Eigentlich ist ein RAID1 keine große Sache und das primitivste RAID überhaupt, darum verwundern deine Probleme schon etwas. Vielleicht einfach mal weiter beobachten, und wenn das System auf "degraded" geht, in der Controlersoftware nachschauen welche Festplatte ausgefallen ist, wenn immer dieselbe ausfällt ist es vielleicht doch ein HDD oder sogar Kabelproblem.
Auch hier die Frage ... wo genau kann ich nachschauen? Hinweis: Im RAID-Setup (noch bevor Windows startete) wurden beide(!) Platten als degraded angezeigt. Im RAID-Manager (unter Windows) lautete die Meldung, dass zwar die Spiegelung nicht korrekt laufe, die Platten selber aber optimal laufen würden.

Übrigens, falls ich das Problem nicht zufriedendstellend gelöst bekommen sollte, stellt sich für mich natürlich die Frage, ob ich evtl. gänzlich auf den RAID-Verbund verzichte und die zweite Festplatte einem anderen Zweck zuführe. Nur welchem? Zum Arbeiten brauche ich keine 2 x 160 GB, da ich derzeit gerade mal gut 20 GB drauf habe. Die zweite Platte würde sich also als Sicherungs-Medium anbieten. Fragt sich halt, ob es besser ist, sie eingebaut zu lassen oder evtl. in ein externes Gehäuse zu setzen. Letzteres hätte meines Erachtens den Vorteil, dass diese dann im Normalfall ausgeschaltet bleibt und somit vor Viren und anderm Ungeziefer geschützt wäre. Im Fall des Falles könnte man also einfach den letzten Stand zurück kopieren. Sehe ich das richtig?
 
Naja, Raid 1 ersetzt definitiv kein Backup der Daten !
Es erhöht die Ausfallsicherheit, ist aber keine Garantie für Datenverluste.
Die solltest du in jedem Fall auf ein externes Medium sichern, wenns sich um wichtige Dinge handelt.
Klar die 160GB Platte bietet sich da förmlich an, wenn du sie nicht im Rechner brauchst.
 
Nostromo33 schrieb:
Naja, Raid 1 ersetzt definitiv kein Backup der Daten !
Es erhöht die Ausfallsicherheit, ist aber keine Garantie für Datenverluste.
Klar. So war es auch geplant. Ausfallsicherheit. Bei einem Defekt einer Festplatte einfach mit der anderen weiter arbeiten können ohne sofort etwas unternehmen zu müssen.

Nostromo33 schrieb:
Die solltest du in jedem Fall auf ein externes Medium sichern, wenns sich um wichtige Dinge handelt.
Das mache ich ohnehin, nämlich auf DVDs. Dann allerdings meist nur die eigenen Daten (zum Teil als Differenzial-Backup), weil's sonst zu lange dauern würde. Jedenfalls nicht jedes Mal eine Komplett-Sicherung. Im Fall der Fälle müsste ich dann zwar das System neu aufsetzen, hätte dann aber wenigstens fast alle eigenen Daten gesichert.

Nostromo33 schrieb:
Klar die 160GB Platte bietet sich da förmlich an, wenn du sie nicht im Rechner brauchst.
Nun ja, was braucht man schon wirklich? Sie war halt als Ausfall-Sicherung gedacht. Eine externe Platte wollte ich mir zwar ohnehin bald zulegen, doch da hätte ich dann lieber eine deutlich größere genommen, auf der zwei komplette Spiegelungen Platz hätten und zusätzlich noch Raum für eine Schnellsicherung der eigenen Daten wäre.
 
Zuletzt bearbeitet:
F_GXdx schrieb:
...wenn immer dieselbe ausfällt ist es vielleicht doch ein HDD oder sogar Kabelproblem.
Bitte die Kabel benutzen die beim Controler dabei waren, oder gute geschirmte!
Der Fehler ist mittlerweile mehrfach aufgetreten und es könnte sich tatsächlich um ein Kabel-Problem handeln. Ich hatte noch ein einzelnes (verpacktes) Kabel in meinem Bestand und dieses jetzt an der Festplatte, die ausfiel, gegen das dort befindliche ausgetauscht. Der Stecker des neuen Kabels scheint tatsächlich ''strammer'' zu sitzen. Anschließend lief die Rekonstruktion des Arrays auch deutlich schneller ab. Ob das wirklich die Lösung ist, kann ich noch nicht beurteilen, da der Fehler ja nicht täglich auftrat.

Nun noch eine Frage:
Du empfiehlst ''gut geschirmte Kabel'' zu verwenden. Ich habe gestern mal mit verschiedenen Computer-Händlern in unserer Umgebung telefoniert, doch die haben nur Standardware. Lediglich ein einziger konnte mir zumindest ein SATA2-Kabel anbieten, also eines mit Verriegelung an den Steckern. Ansonsten sei das aber baugleich mit den anderen. Kann mir bitte Jemand einen guten Kabeltyp und dafür eine Bezugsquelle nennen?
 
Falls es noch Jemanden interessieren sollte: Vergangene Woche habe ich versucht, den Fehler mit telefonischer Unterstützung des Service-Technikers einzugrenzen. Nun, all zu viele Möglichkeiten scheint es ja nicht zu geben. Entweder es liegt an einer der beiden Festplatten oder an den Kabeln oder am Board (Bios eingeschlossen).

Die Kabel scheiden wohl aus, da der Fehler bei allen getesteten Kabeln auftritt.

Eine Analyse des Boards würde recht lange dauern, da (laut Auskunft des Technikers) nach Ablauf des ersten halben Jahres nicht mehr der Händler, sondern der Hersteller zuständig sei, und das dauere erfahrungsgemäß zwischen 2 und 4 Wochen, in denen ich dann halt auf meinen PC verzichten müsse.

Deshalb schlug er vor, zuvor auszuprobieren, ob es nicht vielleicht doch an einer der Festplatten liegen könne (obwohl er die ja neulich getestet und als i.O. befunden hatte). Schön und gut, nur hatte ich ja bereits festgestellt, dass das System nicht bzw. nicht korrekt läuft, wenn ich eine der Platten einfach abziehe - mit der einen läuft der PC nämlich fehlerhaft und mit der anderen überhaupt nicht.

Der letzte Versuch brachte aber einen Teilerfolg. Und zwar habe ich die beiden Platten einfach mal gegeneinander ausgetauscht (also den Stecker von Platte 1 auf Platte 2 und umgekehrt). Im gemeinsamen Betrieb funktionierte auch das nicht, aber im Einzelbetrieb funktioniert die Platte 2 dann doch (also die Platte, die eigentlich nur die Spiegelung der anderen war).

Das System läuft also mit dieser einen Platte nun bereits seit über einer Woche ohne Mucken! Ich werde noch ein paar weitere Tage warten und wenn sich bis dahin nichts ändert, darf ich wohl davon ausgehen, dass tatsächlich ein Laufwerksfehler vorliegt. Oder sehe ich das falsch?
 
Hatte so ein ähnliches Problem mit einem A8N-Sli Deluxe, weil da nach nem Gehäuselüfterausfall der Chipsatz zu heiß wurde. Hab auch ewig gesucht bis ich die Lösung fand. oO

Bei mir war das lustige, das die Platten ausfielen ich aber grade im Arbeitsspeicher aktive Anwendungen ohne Probleme weiter nutzen konnte. So hab ich z.B. ein Länderspiel über die TV Karte ohne Probleme schauen können und erst als ich ne Einstellung machen wollte, also auf die Platte zugegriffen wurde der Rechner hängen blieb. Laut Speedfan trat der fehler ab etwa 36° beim Chipsatz auf, aber der Kühler war viel heißen wenn man mit den Fingern dran langte. Das ist aber ein allgemeines Problem der A8N Boards das diese Temp falsch ausgelesen wird.
Jetzt liegt die Temp wieder bei <30° und ich hatte keine Probleme mehr.
 
Zurück
Oben