Schwebende Sektoren, was tun, Garantiefall?

sind eigentlich schon daten weg bei einem gekippten Bit? Ich mein son Dateisystem hat doch auch ne gewisse Redundanz oder vielleicht sogar die Festplatte selbst auch?
 
Ich hatte schon mal Datenverlust bei ausschließlich schwebenden Sektoren. Waren so ca. 120 Stück, und dann trat plötzlich ein Lesefehler auf - es gab aber weiterhin keinen einzigen unkorrigierbaren Sektor laut SMART, nur die ca. 120 schwebenden.
War eine Samsung F3 Platte - wurde über Seagate aber anstandslos getauscht.
 
Eigentlich sollten bei "schwebenden Sektoren" keine Datenverluste auftreten, die Fehlerkorrektur kann normalerweise 1 Bit Fehler korrigieren.
Bedenklicher sind die "unkorrigierbaren Sektoren", hier sind mehr als 1 Bit gekippt, die Fehlerkorrektur kann das nichtmehr abfangen.
Redundanz im Wortsinn gibt es bei den Daten auf Massenspeichern nicht, dazu ist ein RAID bzw. eine gespiegelte Platte notwendig. Für den Ersatz defekter Sektoren gibt es jedoch Reservesektoren, je nach Modell und Größe zw. mehreren Hundert und mehreren Tausend.
 
Redundanz im Wortsinn gibt es bei den Daten auf Massenspeichern nicht, dazu ist ein RAID bzw. eine gespiegelte Platte notwendig

Nein. Wenn die Fehlerkorrektur 1Bit Fehler korrigieren kann muss Redundanz vorhanden sein sonst würde das nicht funktionieren.

Dazu ist keine weitere Platte nötig.

Zumindest wenn wir über Redundanz im Sinne der Informationstheorie reden
 
Ja genau, Zwei gekippte Bits in einem Sektor führen zu Datenverlust,
da die Fehlerkorrektur dies nicht mehr beheben kann, das ist dann Redundanz.
 
Joa mir ging es halt um das Wort Redundanz. Denn auch ne einzelne Platte hat ja durch Fehlerkorrektur ne gewisse Redundanz schon integriert
 
Inzersdorfer schrieb:
Eigentlich sollten bei "schwebenden Sektoren" keine Datenverluste auftreten, die Fehlerkorrektur kann normalerweise 1 Bit Fehler korrigieren.
Bedenklicher sind die "unkorrigierbaren Sektoren", hier sind mehr als 1 Bit gekippt, die Fehlerkorrektur kann das nichtmehr abfangen.
Hallo Inzersdorfer,

das sehe ich anders. Nach meinem Wissen sind schwebende Sektoren schwer (nach Ernst@ats Argumentation, wobei ich nicht vollends davon überzeugt bin) oder nicht mehr lesbare Sektoren und müssen auch nicht unbedingt nur ein gekipptes Bit haben (der Fehlerkorrekturcode jedes Sektors sollte eigentlich ein gekipptes Bit on-the-fly auffangen können, was dann eher unter "Raw Read Error Rate" zu finden ist, allerdings auch nur, wenn dadurch ein erneuter Lesezugriff auf diesen Sektor notwendig wird). Diese Sektoren können von der Festplattenlogik aber noch nicht ersetzt werden, da diese davon ausgeht, dass noch relevante Daten darin gespeichert sind, die möglichst nicht verloren gehen sollen. Also wird versuchst durch Lesezugriffe, die immer mal wieder durchgeführt werden, die Daten zu retten. Spätestens aber beim nächsten Schreibzugriff, wenn die darin gespeicherten Daten sowieso ihre Gültigkeit verlieren, besteht die Möglichkeit die Sektoren auszutauschen (was passiert, wenn durch den Schreibzugriff der Sektor nicht wieder problemlos lesbar wird).

Meines Wissens sind "unkorrigierbaren Sektoren" (die im englischen eigentlich "offline uncorrectable sectors" heißen) nichts anderes als schwebende Sektoren, die beim offline Selbsttest der Festplatte gefunden wurden. Soweit ich weiß erzeugt ein "offline uncorrectable sector" auch einen Eintrag in der "current pending sectors"-Liste.

Da du dich in letzter Zeit aber intensiv mit dem Thema beschäftigt hast (und deine Sache sehr gut machst :) *beideDaumenhoch*) möchte ich nicht ausschließen, dass du dazu nähere Informationen gefunden hast. In diesem Fall wäre es nett von dir mir mal ein paar Quellen zukommen zu lassen. Jedenfalls interessiert es mich, wie du auf das gekippte Bit kommst. Eigene Theorie?

@All
Die Interpretation der Smart-Werte basiert immer nur auf Beobachtungen und Schlussfolgerungen (also Theorien), da es keine oder sehr wenige gesicherten offiziellen Informationen von den Herstellern dazu gibt (Stichwort: Betriebsgeheimnis). Auch wird das Defekt-Management von Hersteller zu Hersteller unterschiedlich sein, sodass Festplatten verschiedener Hersteller, aber auch Modelle aus verschiedenen Serien desselben Herstellers, hier anders arbeiten (können).
 
Zuletzt bearbeitet:
Zum leider nur beinahe Standard SMART paßt ein abgewandelter Refrain eines Irischen Liedes:

Well, it's many a day I've surfed a hundred sites or more,
But a manual for smart sure I never saw before.


Das gekippte Bit kommt übrigens vom Datenretter TK.
 
Was Madnex schreibt scheint mir doch ehr zu passen, denn weder die Toshiba noch die WD die bei mir beide schwebende Sektoren haben, tauschen diese von alleine aus, obwohl die definitiv nicht mehr lesbar sind. Wenn die Elektronik eben auf einen Schreibbefehl wartet und sie solange der Hoffnung sie irgendwann doch noch lesen zu können nicht austauscht, dann wird das Verhalten verständlich.
 
Naja, soviel zum Thema C6 zieht immer C5 nach sich:

WD-14: C5 0, C6 2 // WD-32: C5 115, C6 162.
 
Ja, diese Theorie war offensichtlich falsch, wobei das auch nur für Festplatten von WD gelten kann. Ich möchte nicht behaupten, dass ich beim Thema Smart allwissend bin. Das bin ich nicht. Nur leuchtet mir die Theorie mit dem gekippten Bit nicht ein. Die Fehlerkorrektur sollte in der Lage sein ein einziges gekipptes Bit (optimalerweise on-the-fly) zu korrigieren. Dafür hat jeder einzelne Sektor einen Fehlerkorrekturcode, der zusätzlich zu den Nutzdaten geschrieben wird. Wenn der nicht eine einzige 0 oder eine einzige 1, was ja ein Bit darstellt, korrigieren kann, dann ist das nur unnötiger Ballast. Meine Erfahrung lehrt mich, dass "schwebende" Sektoren nicht alle prinzipiell noch lesbar sind.

Ich schätze TK und sein Fachwissen sehr, allerdings sollten wir nicht vergessen, dass er Datenrettung nebenberuflich semiprofessionell betreibt. Auch er kann nur Beobachten und seine Schlüsse ziehen, die auch nicht immer richtig sein müssen.
 
Zuletzt bearbeitet:
Das Thema Fehlerkorrektur bei Festplatten ist auch kaum dokumentiert, unterscheiden mußt du dabei jedenfalls Fehler beim Auslesevorgang selbst und Fehler der Daten bzw. des Sektors.
 
Madnex schrieb:
Meine Erfahrung lehrt mich, dass "schwebende" Sektoren nicht alle prinzipiell noch lesbar sind.

Meine auch.
Wie ich oben schon gesagt habe, bei meiner Samsung F3 wurden die schwebenden Sektoren langsam immer mehr. Ich habe das beobachtet, und auf den ersten unkorrigierbaren Sektor gewartet - der kam aber nie.

Allerdings hatte ich dann beim Stand von ca. 120 schwebenden Sektoren definitiv einen Lesefehler von der Platte. Ein Programm hat sich beim Datenbankzugriff erst mal aufgehängt, und beim anschließenden Versuch, diese Datenbank zu kopieren, kam während der Kopieraktion die Fehlermeldung, dass die Datei nicht kopiert werden kann (nach einiger Zeit und einigem Gerödel auf der Festplatte).
Seatools hat dann auch festgestellt, dass die Platte nicht korrigierbare Fehler enthält, wobei im SMART immer noch keine unkorrigierbaren Sektoren angezeigt wurden!
 
Inzersdorfer:
Eigentlich sollten bei "schwebenden Sektoren" keine Datenverluste auftreten, die Fehlerkorrektur kann normalerweise 1 Bit Fehler korrigieren.
Bedenklicher sind die "unkorrigierbaren Sektoren", hier sind mehr als 1 Bit gekippt, die Fehlerkorrektur kann das nichtmehr abfangen.​
Madnex:
Nach meinem Wissen sind schwebende Sektoren schwer (nach Ernst@ats Argumentation, wobei ich nicht vollends davon überzeugt bin) oder nicht mehr lesbare Sektoren und müssen auch nicht unbedingt nur ein gekipptes Bit haben (der Fehlerkorrekturcode jedes Sektors sollte eigentlich ein gekipptes Bit on-the-fly auffangen können, was dann eher unter "Raw Read Error Rate" zu finden ist, allerdings auch nur, wenn dadurch ein erneuter Lesezugriff auf diesen Sektor notwendig wird).​
Ich habe meines Wissens nach beim Erscheinungsbild von „Pending Sectors“ immer von schwer(d.h. nicht im ersten Anlauf, sondern nach mehreren Versuchen) oder nicht mehr fehlerfrei lesbaren Sektorinhalten geschrieben.
Da in diesem Thread auf „einzelnen oder mehreren gekippten, on-the-fly reparablen Bits“ herumgeritten wird, möchte ich den hier postenden und von mir geschätzten Expertenkollegen dazu einen erhellenden Aufguss bereiten :D:

Gekippte Bits sind in freier Wildbahn in elektronischen Schaltkreisen der Speicherung oder Verarbeitung vorzufinden, aber kaum bei der magnetischen Aufzeichnung.
Heutzutage wird ein Bit auf der Magnetoberfläche immer noch von hunderten Inseln je tausender Atome gleicher magnetischer Ausrichtung repräsentiert, und in diesem Kollektiv kippt es sich etwas schwerer als bei einem (in futuristischen Laborexperimenten erzielten) einzelnen Atomspin. Flächenübergreifende Beeinflussung(welche eine Umkehr der Magnetisierungsrichtung bewirken könnte), wird durch Anwendung eines Aufzeichnungscodes, welcher eine Häufung von zuvielen 1en oder 0en(magnetisch nach oben oder unten ausgerichtete Bereiche) nebeneinander unmöglich macht, verhindert.

Als ich mich vor vielen, vielen Jahren mal intensiver damit beschäftigt habe, wurde für einen 512B Sektor noch ein ECC nach dem RS(Reed-Solomon)-Verfahren in der Länge von 21B den Daten hinzugefügt, und schon damals konnte damit nicht bloß ein einziges falsches Bit, sondern sogar ein fehlerhafter zusammenhängender Bereich von 10 Bytes wiederhergestellt werden. Das war zu Zeiten der longitudinalen Aufzeichnung noch ausreichend, um eine „raw bit error rate“ unter 10^-10 zu gewährleisten. Inzwischen wird perpendicular(senkrecht zur Oberfläche) aufgezeichnet, die Datendichten sind immens gestiegen, und die Bits der Daten müssen erst mühsam aus der Signalsuppe mit einem weitaus höherem Störpegel(geringerer signal-to-noise ratio) gefischt(statistisch errechnet) werden, und es wird eine verbesserte raw-bit-error-rate unter 10^-11 oder gar -12 geboten. Noise-Bursts im Signal betreffen kaum ein einzelnes Bit, sondern viele.

Arbeitsunterlagen der IDEMA (International Disk Drive Equipment and Materials Associations, einem Konsortium aller Festplattenhersteller) zufolge hatten die letzten native 512B-Sektor Festplatten 9% ECC-Anteil. d.h. 50 Bytes Korrekturcode, womit mit neueren, effizienteren ECC-Verfahren Störungen im Signal von bis zu 100 Bytes Länge on-the-fly korrigiert werden konnten.
Mit der Umstellung auf Advanced Format 4K Sektoren können mit dem unverändert gebliebenen 9%-Anteil des ECC Defektstellen im Sektor bis zu 400 Bytes korrigiert werden.
Nachdem im Herstellerkonsortium wohl nicht mit aus den Fingern gesaugten Falschinformationen um sich geworfen wird, nehme ich diese Werte als gesichert an.

Ist also bei einem Lesevorgang oder des offline-scans trotzdem nicht möglich, diese Fehler per ECC zu korrigieren, wird dieser Sektor in der P-List eingetragen und scheint als „pending“ und/oder „offline uncorrectable“ im SMART auf, wobei die Firmware der Platte selbstständig noch mehrere Versuche unternimmt, ein fehlerfreies oder korrigierbares Ergebnis zu erzielen, bevor das als Read Error ans System gemeldet wird, welchen dann uU noch weitere Versuche initiiert, bevor der diesem I/O zugehörigen Applikation der Misserfolg mitgeteilt wird.(welche es dann vielleicht auch mehrmals versucht, bevor sie aufgibt) und das erst dann als Datenverlust gewertet werden kann.

Möge also in Zukunft nicht mehr mit der Metapher "einzelner gekippten Bits", oder dass "mehrere gekippte bedenklicher" sind, argumentiert werden, wenn "nicht mehr ECC-correctable" gemeint ist...


Inzersdorfer:
Naja, soviel zum Thema C6 zieht immer C5 nach sich:​

Madnex:
Ja, diese Theorie war offensichtlich falsch, wobei das auch nur für Festplatten von WD gelten kann​

Ich habe dazu keine Theorien gesponnen, sondern in Einzelfällen auf diesen Zusammenhang anhand der Fakten, dass
- bei bestimmten Herstellern
- mit bestimmten HDD-Modellen
- mit bestimmten Firmwareversionen
dieser Zusammenhang besteht, verwiesen, ohne daraus einen Anspruch auf Allgemeingültigkeit zu erheben(was vielleicht misinterpretiert wurde). Ob die bei der offline-Suche gefundenen auch bei den pendings mitgezählt werden, folgt bloss der Logik des Firmware-Programmierers, und die kann von Mal zu Mal verschieden sein.

Wenn die gesamte Platte offline durchsucht wurde, und bei von Programmen erfolgten Lesevorgängen ebenfalls die gesamte Oberfläche beackert wurde, sollte logischerweise ein Gleichstand an Fehlstellen herrschen, soferne nicht dazwischen welche dazugekommen sind.
Ich habe aber Fälle beobachtet, wo in beiden Werten hochgezählt wurde, obwohl zwar ein offline-scan, aber keinerlei Programmaktivitäten stattfanden, oder diese Sektoren vom Filesystem noch niemals angesprochen wurden.
 
Zurück
Oben