RAID 5 Erklärung

lordg2009

Lt. Commander
Registriert
Apr. 2009
Beiträge
1.559
Hi

Seit einiger Zeit spiele ich nun auch mit dem Gedanken, meine Daten mit einer RAID-Variante zu versehen. Dabei geht es mir besonders um die Datenredundanz, nicht um die Transferraten. Ich würde mich in Sicherheit wiegen, bei dem Gedanken, eine Festplatte könnte ausfallen. Dabei habe ich mir gedacht, ein Raid 1 System wäre die Lösung, nun geht mir dabei aber die Hälfte des Speicherplatzes verloren. Deshalb fand ich die RAID 5 Variante sehr interessant. Leider hat mir weder der wikipedia-Artikel noch der hiesige RAID-Thread geholfen RAID 5 zu verstehen. Es klingt sehr beeindruckend, dass eine von 4 HDDs ausfallen kann und man trotzdem 3/4 des Gesamtspeicherplatzes nutzen kann. Doch wie muss man sich das genau vorstellen. So wie ich es verstanden habe, ist einer von vier Datenblöcken auf den vier HDDs jeweils mit redundanten Daten gefüttert, aber wie können diese redundanten Datenblöcke die Information der jeweils 3 anderen Datenblöcke rekonstruieren, wo er doch einfach weniger Speicherplatz birgt.

Ich hoffe die Frage war nicht zu komisch gestellt
Vielen Dank
 
SuFu nutzen bzw. auf Wikipedia gibt es einen ausführlichen Bericht zu Raids. Übrigens, Vorsicht wenn man nicht zu viel Ahnung davon hat, wenn mal eine HDD ausfällt!

Bei Raid5 immer min. 4 Platten nehmen, bei 3 bricht die Schreibleistung sonst erheblich ein.

http://de.wikipedia.org/wiki/RAID
 
ein raid 5 hat aber auch risiken; man kann ein raid wohl auch "zerschießen", zumindest liest man in foren öfter von traurigen ehemaligen raid besitzern. ein systemwechsel kann u.u. auch schwiereiger sein. bei den heutigen plattengrößen erscheint mir ein volles backup die praktischste lösung.
 
@Na-Krul

Ich nutze für nicht Systemplatten, auf denen ich Daten lagere, die selten geändert werden müssen eine TrueCrypt-Verschlüsselung. Wenn meine Volumen eingebunden werden, werden sie im normalfall immer schreibgeschützt eingebunden. Somit ist Virus, oder versehentliches Löschen kein Problem. Ich möchte ein RAID-System um größere Mengen Daten zuverlässig über eine längere Zeit zu speichern. Die sich ständig ändernden Daten kommen auf eine nicht RAID Platte.

Was hat es mit dem Zerschießen auf sich.
Ergänzung ()

@King Kryson

Dein schlauer google Link hat mich nicht wirklich erhellt. Was bei wikipedia im RAID Artikel steht habe ich schon gelesen. Offenbar werden sogenannte Parity-Informationen auf einem von vier Datenblöcken gespeichert, die in der Lage sind eine Fehlerkorrektur zu ermöglichen. Was ich jedoch nicht verstehe, ist, wie dieser eine Datenblock die Informationen beinhalten kann, die nötig sind, um einen beliebigen von drei weiteren Blöcken rekonstruieren zu können.
 
Sagen wir auf einer Platte hast du an einer bestimmten Stelle ein 1, auf der zweiten Platte eine 0, auf der dritten wieder eine 1. Auf der 4. werden die dann mit einem exklusiven Oder verknüpft, 1 XOR 0 ergibt 1, 1 XOR 1 ergibt 0.

Dann hast du also:
1 | 0 | 1 (| 0)

Fällt jetzt die 4. Platte aus, ist das egal, weil die Nutzinformationen sowieso nur auf den ersten 3 liegen. Fällt eine der anderen Platten aus, kann man über die Information auf der 4. das ausgefallene Bit rekonstruieren:
1 | x | 1 | 0
Dabei verknüpft man das Bit auf der "Sicherungsplatte" wieder per XOR mit den noch bekannten:
(von rechts nach links) 0 XOR 1 ergibt 1, 1 XOR 1 ergibt 0 => 1 | 0 | 1 | 0

Wäre beispielsweise die 1. ausgefallen:
x | 0 | 1 | 0
(von rechts nach links) 0 XOR 1 ergibt 1, 1 XOR 0 ergibt 1 => 1 | 0 | 1 | 0

Das ist, soweit ich das damals verstanden habe, das Prinzip von RAID5. Entweder die Platte fällt aus, die sowieso eigentlich keine Daten beinhaltet oder es fällt maximal eine Platte aus, die dann dank der Bits auf der Sicherungsplatte und durch das Bekanntsein der entsprechenden Bits auf den anderen Platten vollkommen rekonstruiert werden kann.
 
Das wart nie die Frage...
Hier ein (schematisches) Beispiel.
(Ob das nun mit XOR, OR oder was weiss ich was läuft, weiss ich nicht Ad Hoc)

A B C D
1 0 1 0
In dem Beispiel liegen die Daten auf A-C. D ist hier eine Parität aus A bis C. Und zwar hier OR in meinem Beispiel.
1+0=>1 (A und B), 1+1=>0 (Das Ergebnis von A+B, dann ein OR mit C. Das Ergebnis ist D.)

Wenn nun A wegbricht, dann kann man berechnen...
(D)0 + (C)1 => 1. (Ergebnis von D+C)1 + (B)0 => 1(A).
Somit hat man A wieder berechnet.
Das sind Paritäten, mit Hilfe derer man den ursprünglichen Inhalt eben zurückrechnet.
Ob das Beispiel nun mathematisch korrekt ist, weiß ich nicht.
Schematisch stimmts jedenfalls.
(Eine Datei wird immer gestriped)
 
AP Novas Erklärung ist soweit korrekt, bis auf ein Detail, dass Blockweise unterschieden wird auf welcher Platte die Parity Infos stehen.

D.h. es gibt keine dedizierte Parity Platte wie bei RAID 4, sondern die Paritys verteilen sich gleichmäßig auf alle Platten.

Data 1-a | Data 1-b | Data 1-c | Parity
Data 2-a | Parity | Data 2-b | Data 2-c
Data 1-a | Data 1-b | Parity | Data 1-c
etc...

Die Berechnung ist dann übrigens doch noch etwas komplexer, aber prinzipiell ist es korrekt beschrieben.

Edith sagt:
Bei tiefergehenden Interesse kann ich nur das WhitePaper von Peter Anvin empfehlen: Link (PDF). Es beschreibt zwar RAID 6 welches nochmal komplexer sit, aber man kann daraus auch die RAID 5 Berechnungsgrundlagen extrahieren.
 
Zuletzt bearbeitet: (Link eingefügt)
Danke euch dreien. Die letzten 3 Antworten waren genau das, was ich wissen wollte und das ganze noch ohne dem freundlichen Hinweis, dass man RAID5 auch bei google eingeben kann. Wunderbar, das ist echte Hilfe.
 
Abgesehen davon ist die Behauptung
Galaxy9000 schrieb:
Bei Raid5 immer min. 4 Platten nehmen, bei 3 bricht die Schreibleistung sonst erheblich ein.
völliger Unfug.

Du kannst die Daten wie immer Du willst
Ich möchte ein RAID-System um größere Mengen Daten zuverlässig über eine längere Zeit zu speichern.
im Zugriff haben, aber nur davon noch eine, besser zwei Kopien an verschiedenen anderen Orten aufbewahrt, schützt vor Verlust(Feuer, Wasser, Diebstahl, Dummheit,...).
RAID5 hat bloss den Vorteil, bei Ausfall einer Platte diese tauschen zu können, ohne den Betrieb unterbrechen zu müssen.
 
Zuletzt bearbeitet:
... Und keinen Datenverlust bei Hardwareausfall einer Platte befürchten zu müssen.
Naja, sagen wir, zumindest keinen Kompletten. Fehler können beim Rebuild aber auch auftreten (und dann natürlich bei einem 500GB Truecrypt Container...).
Daher, wie Ernst sagt: Immer sichern :)
 
Alternate 1
Zurück
Oben