Datensicherheit bei Festplatten?

Choco2 · 26. Februar 2012

Wie ist das mit der Datensicherheit bei Festplatten und defekten Sektoren?

Ein HDD kann ja eine gewisse Anzahl an defekten Sektoren verkraften.

Das System erkennt diese und beschreibt die halt einfach nicht mehr.

Aber:

Was passiert jetzt, wenn ich z.B. eine große .iso Datei schon geschrieben habe und in der Zeit vom Schreiben bis zum wieder lesen werden ein paar Sektoren davon kaputt.

Kann es sein, dass dann die ganze .iso Datei defekt ist?

benneq · 26. Februar 2012

Natürlich kann das passieren. Auf der anderen Seite sollte die HDD über Checksummen mittels großem Rechenbedarf die Sektoren wieder herstellen können

OhNoIKilledMyHD · 26. Februar 2012

Nein, eigentlich ist dann ist nur der Teil auf dem Sektor defekt, aber dennoch kannst Du mit der iso im Ganzen häufig nichts mehr anfangen, weil sie aufgrund der defekten Blöcke nicht mehr korrekt gelesen/gemountet werden kann.

JanR · 26. Februar 2012

Hi,

dafuer hat man ja ein Backup seiner Daten.

Normal gehen Sektoren nicht einfach so kaputt, sondern verschlechtern sich im Laufe der Zeit, was dann VOR dem Ausfall zum Ummappen fuehrt.

Das war frueher nicht unbedingt so. Ich erinnere mich noch an die "legendaere" IBM DTLA, bei der mir oefter mal eine Platte aus dem RAID flog und danach einen "Reallocated Sector" mehr hatte. Danach liess sie sich wieder integrieren, sprich, komplett beschreiben. Folglich hat also der Sektorverlust das Ummappen angestossen, die Daten waren dann aber weg (was im RAID nicht stoert).

Heute laeuft das anders: Meine aktuellen Seagates haben durchaus "reallocated sectors" im SMART, haben aber auch beim RAID-scrubbing nie Fehler geworfen. Von daher sieht das sehr danach aus, als wuerde die Steuerung einen Sektor bereits ummappen, bevor es kracht, sprich, wenn die Fehlerkorrektur in hohem Masse verwendet werden muss.

Auf der anderen Seite sollte die HDD über Checksummen mittels großem Rechenbedarf die Sektoren wieder herstellen können

Das stimmt auf der Ebene nicht. Das tut sie bei jedem Lesen und muss damit auch im ganz normalen Betrieb sehr viel wieder rekonstruieren - moderne Platten "raten + fehlerkorrigieren" dank sehr feinen magnetischen Strukturen oefter mal. Einen Sektorfehler "nach oben", also zum OS, gibt es erst, wenn das nicht mehr gereicht hat. Da kann dann auch nichts mehr getan werden, die Daten sind weg und man sollte das Backup wieder einspielen. Wie oben schon gesagt, spricht aber bei modernen Platten viel dafuer, dass die Fehlerkorrekturrate ein Faktor ist, der darueber entscheidet, wann ein Sektor ersetzt wird. Geschieht das, solange man die Daten noch wiederherstellbar sind, dann hat man Glueck (und das OS merkt davon gar nichts, nur im SMART kann man das an den "reallocated sectors" sehen).

Eine Gefahr dieses Ansatzes ist, dass so ein Mechanismus nur beim Lesen greifen kann. Liegt das ISO also jahrelang ungelesen rum, dann kann es durchaus passieren, dass die Platte nie die Chance hatte, Probleme zu sehen. Gerade in einem RAID kann sowas leicht zu Doppelplattenfehlern fuehren... Gegenmassnahme ist das "disc scrubbing", also das regelmaessige Lesen + Neubau der Checksummen bzw. Checken der Spiegelung).

Wenn man allerdings regelmaessig Backups macht und dabei die Files auch pruefen laesst (Checksummen oder so), dann fuehrt das alleine schon dazu, dass alles ab und an mal gelesen wird und die Platte die Chance bekommt, schleichende Probleme durch Ummappen zu loesen. Und: Man hat ein Backup, es kann einem also egal sein.

Insgesamt: Es gibt nur zwei Sorten von Leuten: Der einen Sorte ist noch nie eine Platte kaputtgegangen und die andere Sorte macht Backups.

Viele Gruesse,

Jan

Choco2 · 26. Februar 2012

JanR schrieb:
Hi,

dafuer hat man ja ein Backup seiner Daten.

Backup mache ich natürlich schon.

Aber was ist, wenn ich von der schon defekten .iso ein Backup mache?

Ich müsste ja erst die .iso prüfen und dann erst sichern.

JanR · 26. Februar 2012

Hi,

Aber was ist, wenn ich von der schon defekten .iso ein Backup mache?

Genau das passiert nicht. Das Fehlermodell einer Festplatte ist, dass sie dir entweder den richtigen Inhalt des Sektors liefert oder eine Fehlermeldung. Datenverfaelschung ist an der Stelle im Grunde ausgeschlossen, da die Daten intern mit Pruefsumme gespeichert sind. Wenn die Platte sich also nicht sicher ist, dass die Daten stimmen, dann bekommst du "bad sector" oder sowas, aber eben keine falschen Daten.

Das bedeutet aber NICHT, dass nicht trotzdem Daten verfaelscht werden koennen. Nur liegt das dann am Controller oder der Uebertragung (SATA hat keine Pruefbits fuer die Uebertragung Platte<->Controller) oder am RAM des Rechners, denn wenn du die Datei kopierst, dann geht das immer ueber den Arbeitsspeicher. Sind da Bits kaputt und du hast keinen ECC-Speicher auf einem passenden Board, dann kann es eine schleichende und unbemerkte Verfaelschung geben. Letzteres (kaputtes RAM) ist wesentlich wahrscheinlicher als SATA-Fehler auf dem Kabel oder ein Controller, der Daten von sich aus verfaelscht.

Viele Gruesse,

Jan

Ernst@at · 26. Februar 2012

(SATA hat keine Pruefbits fuer die Uebertragung Platte<->Controller)

Woher kommen dann bloss UDMA CRC Errors her, wenn Kabel/Verbindung schlecht ist ?

JanR · 26. Februar 2012

Hi,

Woher kommen dann bloss UDMA CRC Errors her, wenn Kabel/Verbindung schlecht ist ?

Guter Punkt.

Fakt ist, dass es einige verlaessliche Berichte aus dem ZFS-Umfeld zu genau dem Problem gibt (Verfaelschung zwischen Platte und Controller), aber das kann natuerlich ebenso auch im Controller geschehen. Der originale Autor (ich muss mal nach dem Link suchen) schob es auf die Verbindung, aber du hast da schon recht, dass da was sein muss, sonst muesste ein mieses Kabel sofort eine solche Wirkung ohne jede Warnung haben.

Aendert insgesamt aber nichts an der Tatsache, dass die Platte entweder einen korrekten Sektor oder einen Fehler liefert.

Viele Gruesse,

Jan

Ernst@at · 26. Februar 2012

"zwischen Platte und Controller" ist nicht korrekt.
Der Datentransfer findet direkt zwischen Speicher und Endgerät statt. "DMA"= Direct Memory Access
Unerkannte Fehler können im Speicher (wie schon erwähnt) oder im Endgerät produziert werden, Am Weg dazwischen kann ein Fehler auch mal unerkannt bleiben, wenn er "zufällig" die richtige Prüfsumme ergibt
Das gleiche kann auch mit minimalster Wahrscheinlichkeit beim Lesen von der Oberfläche passieren

Suche

Datensicherheit bei Festplatten?

Choco2

Banned

benneq

Fleet Admiral

OhNoIKilledMyHD

Lieutenant

JanR

Ensign

Choco2

Banned

JanR

Ensign

Ernst@at

Admiral

JanR

Ensign

Ernst@at

Admiral

Ähnliche Themen

Passend zum Thema

Test Samsung SSD 990 „Erschwingliche“ Effizienz zwischen Evo und Pro?

Retro Im Test vor 15 Jahren SSDs von Crucial, OCZ und Extremememory im Duell

Speicherpreise Nach dem Höhepunkt 2027 folgt 2028 der Absturz?