SMART: Helium-Level sinkt / Wie am effektivsten Daten sichern?

pizzastueck

Cadet 4th Year
Registriert
Sep. 2018
Beiträge
121
Hallo zusammen,

eine meiner Festplatten hat gestern den SMART-Status "schlecht" ausgeworfen. Es scheint wohl so, dass das Helium-Level innerhalb der Platte sinkt (siehe Bild im Anhang). Dazu klickert sie ab und zu. Kann man anhand des SMART-Status ungefähr sagen, wie lang die Platte noch durchhält? Wenn das Helium-Level unter einen kritischen Stand sinkt, besteht die Gefahr eines Headcrash, also das die Schreib/Lese-Köpfe auf die Scheiben krachen, korrekt?

Ich habe diese Festplatte damals aus einer WD Elements 10 TB ausgebaut, mir ist außerdem dummerweise mal Cola oder irgendwas kleberiges in das Gehäuse der externen Festplatte gelaufen. Ich hatte die Platte damals ausgebaut und dann mit Isopropanol versucht, das zu reinigen. Anschließend hab ich sie in mein NAS eingebaut. Dummerweise habe ich die Platte nicht in mein SnapRAID-Verbund eingebunden.

Ich weiß, kein Backup, kein Mitleid. Mir stellt sich nun die Frage, wie ich die Daten auf der Platte am schnellsten / am schonendsten sichern kann. Die sterbende Platte ist mit dem Dateisystem XFS formatiert, falls das relevant sein sollte. Die Platte, auf die die Daten kopiert werden soll, ist ebenfalls eine neue WD Elements 10 TB, komplett leer.

Ich würde die Daten der Platte mittels rsync auf eine Platte übertragen. Gibt es andere / bessere Methoden bzw. wie würdet ihr vorgehen. Eventuell mit dd die Platte 1:1 auf die neue spiegeln? Das sollte doch ohne Probleme funktionieren, die Sektoren sollten ja noch alle in Ordnung sein, oder?

Gruß
 

Anhänge

  • cdi-helium-fail.png
    cdi-helium-fail.png
    90,8 KB · Aufrufe: 580
ddrescue zum sichern der platte nutzen. Damit ein image ziehen, brauchst dafuer auf einem anderen datentraeger etwas mehr als 10tb freien speicher am stueck.
ddrescue schaut bemerkt fehlerhafte sektoren, ignoriert diese erst und baut aus alles was problemlos lesbar ist ein brauchbares image. dann schaut es, was es noch aus dem rest zu holen gibt.

Ist hier nicht unbedint notwendig, aber wenn du sicher gehen willst :)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: wesch2000 und pizzastueck
Solang die Platte noch normal läuft einfach die Daten runterkopieren. Erst wenn sie anfängt Lesefehler zu produzieren müsstest du mit speziellen Tools ran die sich davon nicht beirren lassen.
 
  • Gefällt mir
Reaktionen: madmax2010 und pizzastueck
@pizzastueck
Einfach mit ddrescue auf die gute Platte spiegeln. Gar nicht lange überlegen.
Wenn es schneller gehen soll, dann gleich in Linux einbinden und auf Dateiebene die relevanten Dateien kopieren.
pizzastueck schrieb:
das Helium-Level innerhalb der Platte sinkt
Kannst du sagen in welchem Zeitraum der Helium-Level gesunken ist?
Der wird ja hoffentlich nicht innerhalb von drei Tagen so stark gefallen sein.
pizzastueck schrieb:
Ich habe diese Festplatte damals aus einer WD Elements 10 TB ausgebaut, mir ist außerdem dummerweise mal Cola oder irgendwas kleberiges in das Gehäuse der externen Festplatte gelaufen.
Solche Platten sind ja absolut dicht. Das sollte keinerlei Einfluss gehabt haben. Cola enthält aber Phosphorsäure und das mögen Bauteile und Leiterbahnen überhaupt nicht.
pizzastueck schrieb:
Wenn das Helium-Level unter einen kritischen Stand sinkt, besteht die Gefahr eines Headcrash, also das die Schreib/Lese-Köpfe auf die Scheiben krachen, korrekt?
Aber sowas von… Du weißt aber nicht, ab wann das passieren kann. Du bist ja bereits unter dem Grenzwert. Da hätte man ruhig die SMART-Werte regelmäßig anschauen können, oder vom NAS überwachen lassen.
 
  • Gefällt mir
Reaktionen: madmax2010
Fusionator schrieb:
Cola enthält aber Phosphorsäure und das mögen Bauteile und Leiterbahnen überhaupt nicht.
Muss auch sagen, ich habe keine Ahnung was zur dichtung genutzt wird. Würde mich nicht wundern wenn die das auch uncool fanden
 
Sehr interessant. Das schlechte Helium Niveau sehe ich das erste Mal.

Ich habe auch zwei HDD mit Heliumfüllung. Bekanntermaßen diffundiert Helium ja durch fast alles hindurch, ähnlich Wasserstoff. Eine Art Haltbarkeit haben Heliumplatten daher mit Sicherheit, allerdings bin ich bei dem gezeigten Beispiel doch eher skeptisch, ob es sich hier tatsächlich um einen natürlichen Verschleiß handelt oder ob nicht doch eher eine Undichtigkeit irgendwo vorliegt.

Mit so wenig Betriebsstunden sollte das Heliumlevel eigentlich nicht kritisch sein, oder irre ich mich hier?

Seine Diffusionsrate durch Festkörper beträgt das Dreifache von Luft und ca. 65 Prozent von Wasserstoff.
Quelle: Wikiedia Artikel über Helium
Helium vs. Luftfüllung Zuverlässigkeit 2018 (Backblaze)
 
Zuletzt bearbeitet:
madmax2010 schrieb:
ich habe keine Ahnung was zur dichtung genutzt wird.
Die Platten sind von unten komplett dicht und die Oberseite ist mit dem Gehäuse verschweißt.
Unter diesem "Deckel" sieht man eine ganz normale Festplatte, sofern man sich da mal mit einer Feile ans Entfernen machen würde.
Ich weiß nicht, ob da jetzt Reste von Cola genügen würden um da an einer Stelle ein Loch reinzufressen 🤷‍♂️
Aber die Whites sind ja eh nur Ausschuß nach Meinung mancher Zeitgenossen, also sind Ausfälle normal.
Erstaunlicherweise findet man einfach keine Berichte über massive Ausfälle....


Mr.Seymour Buds schrieb:
Das schlechte Helium Niveau sehe ich das erste Mal.
Ich auch.
Mr.Seymour Buds schrieb:
Mit so wenig Betriebsstunden sollte das Heliumlevel eigentlich nicht kritisch sein, oder irre ich mich hier?
Bis jetzt nicht

1653143829261.png
 
  • Gefällt mir
Reaktionen: Mr.Seymour Buds
Irgendwas ist da an der CDI-Ausgabe seltsam.
Das Current Helium Level ist doch laut Rohwert 0x64, also dezimal 100. Sprich genau wie in dem generell auf dezimal geschalteten Screenshot von Fusionator. Auch meine WD Heliumplatten zeigen ebenfalls jeweils noch Füllstand 100.

Wie es bei Rohwert 100 zustande kommen soll, dass der "aktuelle" Wert 22 beträgt (also den Grenzwert 25 unterschritten hat) ist mir ad hoc schleierhaft...

Soweit ich weiß, wird der Heliumstand nicht direkt über eine Art Heliumsensor ermittelt sondern irgendwie indirekt aus der Flughöhe des Lesekopfes. Evtl. liegt da einfach wirklich ein mechanisches Problem vor, das hier irgendwie kurzzeitig als verschwindendes Helium fehlgedeutet wurde und sich dann wieder eingependelt hat...
 
Zuletzt bearbeitet:
Erstmal danke für die Informationen!

Fusionator schrieb:
Kannst du sagen in welchem Zeitraum der Helium-Level gesunken ist?
Ich habe auf der Platte selbst noch ein smartctl-Log von vor einigen Wochen . Sobald ich die Daten übertragen habe, kann ich nachschauen über welchem Zeitraum das passiert ist. Die Platte hat aber seit längerer so ein klackern bzw tickern. Das haben andere Platten der gleichen Baureihe nicht.

Fusionator schrieb:
Da hätte man ruhig die SMART-Werte regelmäßig anschauen können, oder vom NAS überwachen lassen.
Witzigerweise habe ich in OMV5 die SMART-Überwachung aktiv. Das Unterschreiten des Grenzwertes muss ja nach dem Ausschalten des NAS passiert sein, da selbst das Mainboard eine Meldung ausgegeben und den Boot gestoppt hat. Davor hat alles funktioniert und OMV hat auch keine Warnung ausgegeben.

Purche schrieb:
Irgendwas ist da an der CDI-Ausgabe seltsam.
Wie bereits oben genannt, selbst das Mainboard hat eine SMART-Warnung ausgegeben und den Boot gestoppt ("S.M.A.R.T Status Bad, Backup and Replace.") Sobald mein OMV-NAS wieder läuft und ich die Platte gesichert habe, kann ich smartctl-Logs posten.

Ich habe ja versucht, die Reste zu entfernen, dabei habe ich gesehen, dass auf der Unterseite der Platte, unterhalb der Platine so blaue "Schwämme" zu sehen sind. Ich glaube, die Flüssigkeit ist auch bis dahin gelaufen. Vielleicht hat das ja auch etwas mit dem Fehler zu tun.
 

Anhänge

  • Oberseite.jpg
    Oberseite.jpg
    3,3 MB · Aufrufe: 258
  • Schwämme.jpg
    Schwämme.jpg
    1,1 MB · Aufrufe: 285
  • Unterseite.jpg
    Unterseite.jpg
    1,9 MB · Aufrufe: 271
@Purche
Stimmt. Gar nicht aufgefallen. Vermutlich, weil mein Gehirn HEX-Zahlen ignoriert ;)

@pizzastueck

Mal GSmartControl unter Windows anwerfen (sollte unter Linux auch gleiche Funktion haben)
und dann mal die Statistics der Platte anschauen (falls die das unterstützt) und dann über View Ooutput sich eine detailierte Aufstellung geben lassen. Kann sehr aufschlussreich sein


1653149038669.png


1653150204452.png

Ergänzung ()

pizzastueck schrieb:
Witzigerweise habe ich in OMV5 die SMART-Überwachung aktiv.
Ok, dann muss man das wohl noch feiner konfigurieren, dass man bei Änderung bestimmter Attribute sofort (über Mail?) informiert wird.

Dazu würde ich Curent Helium Level/Curent Pending Sector/Reallocation Event Count/Uncorrectable Sector/Spin Retry Count/Reallocated Sectors Count zählen.
Bei den Attributen wartet man besser nicht bis da der Schwellwert unterschritten wird.
Vielleicht sogar noch Attribut 01/07 mit aufnehmen. Bis jetzt sind die bei mir überall auf 0.
 
Zuletzt bearbeitet:
Helium hat ja eine deutlich geringere Dichte als Luft, resp Stickstoff. Das sollte eigentlich dazu führen, dass die Köpfe an Flughöhe gewinnen (also eher das Gegenteil von Headcrash), und das die Temperatur, wegen der höheren Reibung zunehmen sollte.

Beides natürlich fast genauso schlecht wie Headcrash. Zu hoch fliegende Köpfe werden sicherlich auch Probleme mit dem Lesen bekommen. Also, wie hier ja auch schon alle gesagt haben, Daten runter, und ab zum Hersteller.
Die blauen Schwämmchen halte ich für "Resonanzverhinderungsschwämmchen".
 
pizzastueck schrieb:
Ich habe ja versucht, die Reste zu entfernen, dabei habe ich gesehen, dass auf der Unterseite der Platte, unterhalb der Platine so blaue "Schwämme" zu sehen sind. Ich glaube, die Flüssigkeit ist auch bis dahin gelaufen. Vielleicht hat das ja auch etwas mit dem Fehler zu tun.
Dann hättest du die Platine gleich abschrauben müssen und Notfalls Platine und Schwamm mit Isopropanol behandeln müssen. Das kannst du ja immer noch machen. Cola auf der Leiterplatte macht sich definitiv nicht gut.


Blende Up schrieb:
Die blauen Schwämmchen halte ich für "Resonanzverhinderungsschwämmchen".
Möglich als Nebeneffekt. Ich dachte immer, der soll als Isolation dienen.

Blende Up schrieb:
und ab zum Hersteller.
Dann sollte man aber tunlichst alle Spuren beseitigen incl. Fingerabdrücke und hoffen, dass keine Schrammen am Label sichtbar sind und am Gehäuse ebenfalls nichts auf einen Ausbau hindeutet.

Dann kann man sein Gück versuchen.
 
pizzastueck schrieb:
Die Platte hat aber seit längerer so ein klackern bzw tickern. Das haben andere Platten der gleichen Baureihe nicht.
Ich habe mehrere WD 80 EZAZ (8TB Helium) WD MyBooks

Eine davon ist nervig laut u. vibriert stark, leider habe ich nicht retourniert, funktioniert aber trotzdem und besteht alle Tests also da gibts eine Streuung

Ich nutze die inzwischen, auch wegen Stand By Problemen (unnötiges Aufwachen), wieder als externes Datengrab. Steckerleiste aus und es ist Ruhe

Helium Level ist bei allen auf 100 bei dir auch warum das Programm diesen Wert bei dir ankreidet verstehe ich nicht

Ich würde nicht basteln beim Rumschrauben machst du die Platte eher kaputt gerade die Kabel sind versiegelt und geklebt und empfindlich also. Gerade wenn das schon länger her ist was da passieren kann ist an sich schon passiert

Wenn ich einen Cola Unfall hätte würde ich es in Dest. Wasser versenken und dann noch mal kurz in Isopropanol zur schnellen Verdrängung/Verdunstung und dann trocknen lassen und hoffen

aber auseinander bauen kann man da an sich nichts

Garantie ist nach dem Ausbau/Shucken an sich sowieso verwirkt
 
kieleich schrieb:
beim Rumschrauben machst du die Platte eher kaputt gerade die Kabel sind versiegelt und geklebt und empfindlich also. Gerade wenn das schon länger her ist was da passieren kann ist an sich schon passiert
Die Platine kann man abschrauben; da passiert gar nichts (habe ich schon gemacht :D), außer man hat keinen passenden Torx und zwei linke Hände. Zumindest sieht man dann sofort, ob Cola auch an die Platine und vielleicht sogar an den Verbinder zur Leseeinheit (oder wie immer das Teil heißt) gelangt ist. Wenn sich da durch die Säure etwas langsam auflöst, kann da schon Helium entweichen. Da reicht ja ein Mikroskopisch kleiner Kanal.

kieleich schrieb:
Wenn ich einen Cola Unfall hätte würde ich es in Dest. Wasser versenken und dann noch mal kurz in Isopropanol zur schnellen Verdrängung/Verdunstung und dann trocknen lassen und hoffen

Also musst du ja doch die Platine abschrauben, denn die ganze Platte würde ich dann doch eher nicht in Wasser und dann in Alkohol tauchen :D Obwohl die ja dicht sein muss, aber der Schwamm hält dann die Feuchtigkeit doch zu lange.
 
@Blende Up

Ich bin zwar kein Physiker, aber ich glaube deine Ausführungen zum Heliumdiffusionsprozess passen so nicht. Helium diffundiert durch Festkörper hindurch - im Gegenzug kann von Außen aber kein Luftgemisch ins Innere der HDD eindringen. Vermutlich ist die HDD unter leichtem Überdruck abgefüllt worden, das heisst in der Tendenz wird der Gasdruck im Inneren der HDD abnehmen und sich erst dem Normaldruck und später dem Vakuum annäheren. Im Vakuum ist die Reibung durch Gasmoleküle zu Festkörper aber nicht höher im Vergleich zur Heliumfüllung, sondern niedriger. Das Heliumpolster zwischen HDD Platter und Lese/Schreibkopf wird immer dünner. Der Kopf müsste demnach eher aufsetzen, als abheben.
 
Zuletzt bearbeitet:
Purche schrieb:
Soweit ich weiß, wird der Heliumstand nicht direkt über eine Art Heliumsensor ermittelt sondern irgendwie indirekt aus der Flughöhe des Lesekopfes. Evtl. liegt da einfach wirklich ein mechanisches Problem vor, das hier irgendwie kurzzeitig als verschwindendes Helium fehlgedeutet wurde und sich dann wieder eingependelt hat...
Auch, wenn es einem bei der eigenen Platte nicht wirklich mehr Sicherheit gibt, wird nach allem, was ich im Netz bishe dazu gefunden habe, kein echter Heliumdrucksensor genutzt.

WD nutzt dazu (laut ihrem eigenen Patent) eine Art Temperaturdifferenzmessung:
https://forum.hddguru.com/viewtopic.php?f=1&t=35770

Und an anderen Stellen liest man auch von der messung der Flughöhe des Lesekopfes:
https://www.reddit.com/r/DataHoarder/comments/dol5ty/the_helium_level_smart_data_in_my_10tb_wd/

Demnach gäbe es mehr wie genügend Möglichkeiten zu Sensorfehlern ohne dass die HDD ein reales Problem hätte.

Ob man da nun mit DDRescue sichert oder zunächst die wichtigen Daten ganz trrivial kopiert und sich danach an die eher unwichtigen Daten macht (naja, kien Backup = alles unwichtig) muss jeder selber wissen.
 
  • Gefällt mir
Reaktionen: Mr.Seymour Buds und pizzastueck
Zurück
Oben