SMART Daten nicht von jeder Platte

geohei

Ensign
Registriert
Apr. 2008
Beiträge
168
Hallo.

Hatte soeben einen Fehler auf meinem RAID5 (Tekram, ARC-1210). Eine (der 4 500 GB SATA2) Platten wurde als defekt angezeigt. Das RAID Volume war "degraded" (klar!).

Nachdem ich den SATA2 Anschluss der Platte einmal abgezogen und wieder eingesteckt habe, wurde die Platte neu "Rebuild" (3 Stunden), und alles lief wieder.

Frage - was ist die mögliche Ursache dass die Platte als defekt angezeigt wurde, jedoch nach dem späteren "Rebuild" keine Fehler mehr auftraten?

Gruß
 
AW: SMART Daten nicht vun jeder Platte

Vielleicht ein wackliger Stecker? Vielleicht solltest du die Platte auch mal mit nem Tool vom Hersteller auf Probleme prüfen lassen.
 
AW: SMART Daten nicht vun jeder Platte

Die Stecker habe ich bereits abgezogen und wieder eingesteckt (Platten und Karte). Trotzdem bleibt der Fehler. Die Platten arbeiten sonst tadellos. Wie könnte ein nicht richtig sitzender Stecker dieses Phänomen verursachen ohne den sonstigen Betrieb zu stören?

Die Tools des Herstellers greifen nicht auf die Platten hinter dem RAID Adapter zu (ist das normal)?

Auch Third Party Tools erfassen die SMART Daten (z.B. Temperatur) der Platten nicht.

Gruß,
 
AW: SMART Daten nicht vun jeder Platte

Wenn die Platten mir Raid-Modus sind kannst nicht auf die SMART Daten zugreifen, ich kenn zumindest keinen Raid Controller mit dem es geht. Du wirst wohl mit keiner Software glück haben. Das einzigste was geht ist wenn du die Platten als einzell Platte anspricht (kein Raid modus am Controller eingestellt) dann kannst du die Tools des Herstellers Nutzen. nachteil, es könnten Daten verlohren gehn oder das Raid arry wird neu aufgebaut.
 
AW: SMART Daten nicht vun jeder Platte

Ich kann mir nicht leisten die Platten einzeln nach und nach aus dem RAID zu entfernen.

Was kann das hier noch sein ... ?!?!

- Ist es möglich, dass SMART bei den beiden Platten, die keine SMART Daten ausgeben, in irgend einer Form ausgeschaltet ist (Software oder Hardware [Jumper])?

- Die Stecker wurden überprüft. Scheint alles ok zu sein. Ist es möglich dass der RAID Controller eine Funktion hat, die SMART bei den Platten einzeln ein und ausschaltet bzw. anzeigt? Ich habe alles durchforstet, jedoch nichts gefunden (weder im web Interface, noch im BIOS Interface).

Mit dem Support sieht es auf den Areca Seiten sehr dürftig aus. Weiss jemand, wo ich sonst noch nachfragen könnte ...

Gruß,
 
AW: SMART Daten nicht vun jeder Platte

SMART greift nicht bei den RAID-Controllern im Consumer-Bereich (auf einem Mylex mit SCSI-Drive konnte ich hingegen auf die Maintenace-Tracks der Drives zugreifen) genausowenig wie bei USB-Laufwerken. Die Commands des ATA-Protokolls, die dafür nötig sind, werden schlicht und ergreifend nicht durch gereicht.
Die einzige Möglichkeit die Du hast, ist ein Offline-Test mit z.B. der UBCD und den darauf befindlichen Tools, dazu solltest Du die Drives einzeln am Onboard-SATA (IDE-Mode, NON-RAID-Mode) anschließen und zur Sicherheit den RAID-Controller ausbauen um der Firmware desselben keine Möglichkeit zu bieten, an den verbliebenen Drives Harakiri zu laufen.
 
AW: SMART Daten nicht vun jeder Platte

Ich glaube wir reden aneinander vorbei. Ich möchte die SMART Daten vom RAID Controller aus (also von der dafür vorhergesehenen Software des RAID Herstellers) zugreifen (nicht über 3rd party software, die ich auf dem Rechner installiere um an SMART Daten zu gelangen). Ich habe 4 identische WD SATA2 Festplatten im RAID 5 Verbund. Auf 2 kann ich zugreifen (mittels des RAID Web Interface oder BIOS, egal), auf 2 nicht.

Was ist verkehrt mit den 2?

Das RAID läuft sonst offensichtlich einwandfrei!

Gruß,
 
AW: SMART Daten nicht vun jeder Platte

Wenn der Controller es in der Tat können soll, wirst Du dennoch so vorgehen müssen, wie von mir beschrieben, denn es kann dann nur bedeuten, dass SMART auf den beiden Drives auf disabled steht. Offenbar kann die Software (Webinterface) SMART nicht einschalten auf den einzelnen Drives.
 
AW: SMART Daten nicht vun jeder Platte

Ok. Aus deiner Antwort geht hervor, dass man SMART auf den Laufwerken ein- und ausschalten kann. Das war mir bis jetzt unbekannt. Ok, werde das 'mal versuchen.

BTW ... leider gibt es von Controller hersteller (Areca, Tekram) recht wenig Support und dieses Problem zu lösen :(

Gruß
 
AW: SMART Daten nicht vun jeder Platte

Hallo

Ich habe ein SMART Fehler:
smarthdqz2.jpg


Anzahl der verbrauchten Reserve-Sektoren.
Deutet auf Oberflächenprobleme hin, da nur dann automatisch ein Reservesektor einen normalen ersetzt.
Ist dieser Zähler ungleich Null, ist die Ausfall-Wahrscheinlichkeit verfünffacht. Ein solcher folgt dem ersten Reallocation Event meist binnen eines halben Jahres.

Die Platte ist vom Januar 2008.

Kan man diese Smart Werte in Ordnung bringen?
 
AW: SMART Daten nicht vun jeder Platte

Das sind Medien Errors, die durch die Reallocation des def. Sektors (Sparing) bereits i.O. gebracht wurden. Eine geringe Anzahl von ausgetragenen Sektoren an sich sind noch kein Problem, entscheidend ist eher in welcher Zeit wieviele Fehler aufgetreten sind und Sektoren gespared werden mußten (eine Disk hat ein paar tausend Spare-Sektoren und auch etliche Spare-Tracks). Man sollte die Anzeige über einen längeren Zeitraum beobachten.
 
Danke. Kann es sein, dass der Wert wieder auf OK wechselt?

Denn jetzt wird sie im Fileserver nicht mehr gestartet, beim Booten kommt Meldung:

SMART Error on SATA PORT 4. Backup your Data and replace Harddisk...

Dort war diese HDD Platte. Habe sie ausgabaut und bei mir die SMART werde angeschaut, siehe 2 Post oberhalb.
 
Das hängt wohl auch vom verwendeten Tool ab. Ich habe z.B. eine Disk seit vielen Jahren im Einsatz (30'er Maxtor - rein als Swapdrive verwendet) mit etlichen Reallocated Sectors, der Status wird in HD Tune als O.K. angegeben, die Zeile ist aber highlighted in gelb. In einem anderen Tool wird der Gesamtstatus mit 40% angegeben.
 
Die letzten 4 Artikel sind sehr interessant, haben aber nichts mit dem Thread zu tun ;)

Ok ... also weiter. Ich habe das hier im Handbuch gefunden ...
HDD SMART Status Polling
An external RAID enclosure has the hardware monitor in the
dedicated backplane that can report HDD temperature status
to the controller. However, PCI type controllers do not use
backplanes if the drives are internal to the main server chassis.
The type of enclosure cannot report the HDD temperature to the
controller. For this reason, "HDD SMART Status Polling" function
was added to enable scanning of the HDD temperature function.
It is necessary to enable “HDD SMART Status Polling” function
before SMART information is accessible. This function is disabled
by default.
...
Wieso ist die Funktion by default aus. Ist doch nützlich die Temperatur zu wissen ?!?!

Was ist ein "backplane"?

Gruß,
 
Bei thematisch ähnlichen Problemen, hängen sich User an bestehende Threads, da ist im Prinzip nichts gegen zu sagen, besonders wenn das Problem zuvor bereits abgehandelt wäre (könnte man im Prinzip hier schon so sehen, bezogen auf den Titel).

Eine Backplane ist ein System zur Aufnahme von Steckkarten oder auch Disks. Der Teil des Mainboards, der die Steckplätze für die PCI- und PCIe-Karten aufnimmt, könnte man als Backplane bezeichnen. Besonders alles was in Form von Bussen angeschlossen wird und komfortabel gewechselt werden soll, bietet sich an über eine Backplane aufgenommen zu werden, üblicherweise gehört dann ein sog. Cardgage dazu, welches die mechanische Führung sicherstellt. Man spart sich dann die Verkabelung der einzelnen Karten oder Disks und schiebt sie einfach in den Cardgage, die elektrische Verbindung wird dann über die Backplane hergestellt. Storage-Enclosure sind üblicherweise so aufgebaut.

Am Ende des Textes ist im Prinzip das beschrieben, was ich oben bereits ausgeführt habe, SMART muß enabled sein, damit man die Informationen überhaupt abfragen kann.

SMART kann man z.B. mit den Smartmontools einschalten (befindet sich z.B. UBCD).
 
Thema ist IMHO noch nicht abgeschlossen da ich noch immer die 2 Platten habe, die keine SMART Daten ausgeben. Wie dem auch sei ...

Danke für die Erklärungen mit dem Backplane, jedoch hat mehrfaches Ein- und Ausschalten der SMART Features über die RAID Software (web und BIOS Interface) auch zu keinem Ergebnis geführt. 2 Platten geben keine SMART Daten aus!

Merkwürdig bleibt trotz allem, dass bei 4 baugleichen Platten, bei 2 SMART eingeschaltet wurde und bei den restlichen 2 nicht. Ich kann im Moment leider keine Platte entfernen um die direkt (also nicht über den RAID Controller) anzusprechen.

smartmontools sind mir bekannt, erreichen die Platten jedoch wahrscheinlich auch nicht über den RAID Controller hinweg.

Code:
D:\Program Files\smartmontools\bin>smartctl -s on /dev/hda
smartctl version 5.38 [i686-mingw32-xp-sp2] Copyright (C) 2002-7 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

ATA/SATA driver is possibly a SCSI driver not supporting SMART.
If this is a SCSI disk, please try adding '-d scsi'.
=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.
SMART Disabled. Use option -s with argument 'on' to enable it.

D:\Program Files\smartmontools\bin>smartctl -d scsi -s on /dev/hda
smartctl version 5.38 [i686-mingw32-xp-sp2] Copyright (C) 2002-7 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Smartctl open device: /dev/hda failed: Invalid argument

Gruß,
 
Die Devicefiles (hda, hdb etc.) passen nur bei IDE Geräten, SCSI und SATA sind meist unter sda, sdb usw. zu finden. Bei SCSI ist SMART etwas anders gestaltet und weicht von SATA an, -d SCSI ist also nicht nötig.

Du solltest also mit /dev/sda beginnen und zunächst mit smartctl -a /dev/sda beginnen, den Status abzufragen, das sollte bei zwei Laufwerken funktionieren.
 
Wenn Du schon einen Raid5 hast und Dir somit Datensicherheit wichtig zu sein scheint, dann solltest Du keinen Gedanken daran verschwenden eine Festplatte mit Sektorfehlern weiter verwenden zu wollen. Raus mit der Platte aus´m System und ne Neue rein.

Die S.M.A.R.T Sache ist schön recht und gut nur leider protokolliert das Teil Sektorenfehler erst wenn sie von den Schreib/Leseköpfen an der jeweiligen Position festgestellt werden. Nen Oberflächentest bzw. n Raidrebuild nach Plattenausfall und *ups* auf einmal wurden aus den anfänglich 5 fehlerhaften Sektoren 300 - 500 mit schweren Kratzgeräuschen beim Zugriff und schlimmstenfalls einem Ausfall einer zweiten Platte und das beim Rebuild kann einen schnell in´s Schwitzen bringen. :mussweg:
 
Zurück
Oben