Raid 5 eine Festplatte ausgefallen

latiose88 schrieb:
Ja es tritt mir so oft in den Hintern bis ich Mal wirklich in die Gänge komme .der Wandel das dauert manmal lange.
Das ist eine schöne Umschreibung dafür, dass so manche es halt nur auf die harte Tour lernen. 🤣
 
latiose88 schrieb:
@prian ja so sehe ich das auch. Es hilft nix . Ist ja mit 2 Wochen ja eh schon gewiss ne harte Belastung für die restlichen Festplatten. Und normalweise habe ich Geld daheim aber es läuft gerade nicht so gut. Es ist nie gut zu wenig Geld daheim zu haben. Sieht man ja bei mir. Ein bisschen Puffer muss man einplanen ,das gehört so.

Ich hoffe jedenfalls das es noch nicht zu spät ist.

Satzzeichen wie .,:!? gehören direkt an das vorangegangene Wort. Die Regel ist simpel und alle anderen Teilnehmer in diesem Diskussionsfaden können das auch.

latiose88 schrieb:
Naja ich wusste nicht das es auch nach hinten los gehen kann. Dabei ist es ja egal ob es ein lineares oder in sich zusammen ist. Oder sind dann bei jedem was bei linear dabei ?

Bitte bemühe Dich in Deinem eigenen Interesse um Verständlichkeit - es sind DEINE Daten, um die es hier geht!

Der folgende Beitrag von Forist gea ist kapitaler Unsinn.

gea schrieb:
Bei einem Raid-5 im degraded Modus sollte man so schnell wie möglich die defekte Platte ersetzen und ein Rebuild starten. Es gibt dabei zwei Möglichkeiten:

1. Das Rebuild läuft durch, Glück gehabt
2. Es tritt ein nicht behebbarer Lesefehler (ure, bad sektor) auf einer der verbleibenden Platten auf. In dem Fall ist das

Was ist '"ure"?!

gea schrieb:
Raid-5 oft verloren.

Ein Lesefehler auf einer der verblieben Platten hindert nicht daran, die restlichen Sektoren auszulesen.
Wenn alle Sektoren mit gleicher Wahrscheinlichkeit ausfallen, dann gehen bei modernen Festplatten mit einer Sektorgröße von 4096 Byte (physische Größe auf dem Datenträger, egal was die Schnittstelle emuliert!) genau 4096 Byte verloren. Das hindert aber niemanden, alle anderen Sektoren auszulesen. Spannend wird es erst, wenn der Sektorverlust die Metadaten beschädigt, bei NTFS wären das der Bootsektor und die MFT. 4096 Byte entsprechen vier nebeneinanderliegenden MFT-Einträgen.

Das ist Spielkram für einen Datenretter, der dafür noch nicht einmal die Festplatte öffnen muss.
Wenn die RAID-Geometrie nicht dokumentiert ist, muss die halt noch gefunden werden, ist aber auch kein Problem.

gea schrieb:
Bei sehr großen nicht-Enterprise Platten liegt die Wahrscheinlichkeit bei 1:10^14 bis 1:10^15.

Bei billigeren 10^14 bedeutet das einen nicht behebbarer Lesefehler pro ca 12 TB Daten. Da aktuelle Platten doppelt so groß sein können würde das statistisch zwei Fehler pro einmal Platte lesen bedeuten. Ein Raid-5 hätte in dem Fall eine sehr hohe Wahrscheinlichkeit, beim Rebuild zu sterben.

Nein, da stirbt gar nichts. Es gibt einen Datenverlust von einem Sektor, sprich 4096 Bytes. Und der trifft höchstwahrscheinlich den Inhalt einer Datei oder nicht genutzten Speicherplatz.

gea schrieb:
Moderne Platten haben 10^15, das bedeutet ein nicht behebbarer Fehler pro 120TB. Bei einer 24TB Platte tritt dann ein Fehler pro 5x Platte lesen auf. Ein Totalausfall ist damit immer noch wahrscheinlicher als mit einem Würfel eine 6 zu bekommen.

Nochmal: ein Totalausfall aus den von Dir genannten Gründen ist total unwahrscheinlich.

Auf dem Notebook eines Kollegen mit über 12000 hängenden Sektoren (unlesbar) konnte ich noch zig Dateien retten. Nach Deiner Lesart wäre das doch gar nicht möglich?

gea schrieb:
Was lernt man daraus:

1. Raid-5 mit großen Platten unbedingt vermeiden,
stattdessen Raid-6 benutzen, das verkraftet zwei Ausfälle

oder besser moderne Dateisysteme wie btrfs, ReFS oder ZFS mit Copy on Write, Prüfsummen und Softwareraid benutzen. Das Software-Raid ist dabei erheblich robuster (stirbt nicht beim ersten Crash beim Schreiben dank Copy on Write). Dank

ReFS ist proprietärer Müll. Das ist immer an dem tosenden Schweigen zu vernehmen, wenn ein armer ReFS-Benutzer im Netz fragt, wie er sein ReFS rettet. Da gibt es keine sachlichen Antworten weil -meines Wissens- noch keiner die Strukturen per Reverse Engineering analysiert hat. Hier im Forum gibt es natürlich Antworten, ich brauche gar nicht zu wiederholen, welche...
Die RAID-Funktionen unter btrfs arbeiten nicht stabil. Bei Festplattenverbünden steigt die Ausfallwahrscheinlichkeit um den Faktor der Anzahl der verwendeten Festplatten.
Wer sich diesen Komfort unter btrfs leisten will, von vielen anderen Schwächen einmal abgesehen, spielt ohne Backup Vabanque.

Software-Raid ist die Emulation der Hardware-Raid-Funktionen in Software.
Software-Raid und die Dateisystemeigenschaft "Copy on write" haben nichts miteinander zu tun und kennen einander auch nicht, das sind Verfahren, die auf verschiedenen Ebenen von Festplattenspeichern arbeiten
Und auch die Kombination der beiden löst nicht das "Write Hole"-Problem, siehe hier:

[...One more option to avoid a write hole id to use a ZFS which is a hybrid of a filesystem and a RAID. ZFS uses "copy-on-write" to provide write atomicity. However, this technology requires a special type of RAID (RAID-Z) which cannot be reduced to a combination of common RAID types (RAID 0, RAID 1, or RAID 5)....]

https://www.raid-recovery-guide.com/raid5-write-hole.aspx
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Camarillo
"Gemini (ich kanns kaum besser zusammenfassen)"

URE steht für Unrecoverable Read Error und bezeichnet einen nicht behebbaren Lesefehler bei einem Speichermedium, wie einer Festplatte (HDD) oder SSD. Es ist eine statistische Kennzahl, die die Wahrscheinlichkeit angibt, dass ein Lesevorgang fehlschlägt, weil die interne Fehlerkorrektur des Laufwerks den Fehler nicht beheben konnte.

Ein Unrecoverable Read Error (URE) während des Rebuilds eines degraded RAID-5 Arrays führt in der Regel zum kompletten Ausfall des Arrays und damit zum Datenverlust. RAID 5 kann den Ausfall von genau einer Festplatte tolerieren. Ein URE während des Wiederherstellungsprozesses ist im Prinzip ein zweiter Fehler zu einem kritischen Zeitpunkt.


Copy-on-Write (CoW) in Dateisystemen wie ZFS und ReFS schützt atomare Schreibvorgänge und damit das Dateisystem und das RAID wirksam vor Korruption bei einem Absturz oder Stromausfall während des Schreibens.

Die Schutzfunktion von Copy-on-Write (CoW)
CoW erreicht dies durch einen transaktionalen Ansatz, bei dem die Datenstruktur (Metadaten und Datenblöcke) immer in einem konsistenten Zustand gehalten wird.
 
  • Gefällt mir
Reaktionen: mchawk777
Naja ich sortiere und kopiere jedenfalls weiter. Ist ein gutes Gefühl nun endlich mal weiter zu kommen. Ich hoffe das ich das noch schaffe bevor noch eine Festplatte aussteigt. Bin ja jedenfalls auf dem richtigen Weg. Und ich gebe jedenfalls weiter Gas. Das ich mal wieder Verluste haben sollte ,kommt mir garnicht in den Sinn .
 
gea schrieb:
"Gemini (ich kanns kaum besser zusammenfassen)"

URE steht für Unrecoverable Read Error und bezeichnet einen nicht behebbaren Lesefehler bei einem Speichermedium, wie einer Festplatte (HDD) oder SSD. Es ist eine statistische Kennzahl, die die Wahrscheinlichkeit angibt, dass ein Lesevorgang fehlschlägt, weil die interne Fehlerkorrektur des Laufwerks den Fehler nicht beheben konnte.

Ein Unrecoverable Read Error (URE) während des Rebuilds eines degraded RAID-5 Arrays führt in der Regel zum kompletten Ausfall des Arrays und damit zum Datenverlust. RAID 5 kann den Ausfall von genau einer Festplatte tolerieren. Ein URE während des Wiederherstellungsprozesses ist im Prinzip ein zweiter Fehler zu einem kritischen Zeitpunkt.
Gea, wer hat denn nun Recht? Was denkst Du?
 
Um "Recht haben" gehts bei statistischen Wahrscheinlichkeiten nicht.

Man kann allenfalls sagen, wenn man gesund alt werden möchte, sollte man nicht rauchen sondern sich ausgewogen ernähren und ausreichend bewegen. Gibt natürlich 80jährige Kettenraucher ohne und 20 jährige mit Lungenkrebs obwohl die nie geraucht haben.

Schaut man nur auf die, könnte man auf die Idee kommen, es ist ja egal ob man raucht oder nicht und alles andere sind Verschwörungstheorien.
 
Zurück
Oben