WD Red werden im NAS QNAP TS431 fehlerhaft oder nicht erkannt

Norbert_Focus

Lt. Junior Grade
Registriert
Okt. 2005
Beiträge
415
Blödes Problem.

Ich habe im TS 431+ vier WD Red WD40EFRX im Raid 10, also 8TB gespiegelt.
Ich schalte das NAS nur übers Wochenende mal ein, sodass die Platten weniger als 300 Betriebsstunden haben.
Das NAS und die Platten wurden Dez16 gekauft, also NAS ist aus der Garantie, die Platten haben drei Jahre, also noch bis Dez19.

Problem:
Es fing vor 4 Wochen damit an dass beim booten des NAS die Platte in Bay 2 als disconnected angezeigt wurde und nicht erkannt wurde.
Wenn ich diese dann gezogen habe ( NAS abgeschaltet) und wieder einsteckte plus booten, dann wurde sie erkannt und es wurde mit der Neuerstellung des Verbunds begonnen, was bei 3 TB Daten einen ganzen Tag gedauert hat.
Beim nächsten Start eine Woche später trat genau dasselbe Problem auf.
Nachdem ich dies zweimal mitgemacht habe bestellt ich einfach erstmal eine neue WD Red gleichen Typs.
Diese ist seit heute Nacht drin und innerhalb von zwei Minuten war sie eingebunden ohne das irgendwelche Daten kopiert werden müssen, fand ich komisch........naja.

Aber es geht mit zweitem Problem weiter:
Nun passierte, während ich ein paar Tage auf die neue Platte wartete, dass plötzlich die Disk in Bay1 eine Warnung bringt und ich einen BadBlock Scan machen soll.
Diesen habe ich dann auch heute Nacht mal angestossen und es dauert nun seit 12 Stunden an und ist grade mal bei 50%.


Mittlerweile, nach einer kleinen Google Recherche glaube ich eher an einen Fehler des NAS und nicht der Festplatten.
Man liest das Leute mit 50.000 Stunden 4 Platten am laufen haben und mir gehen zwei in einem Monat bei unter 300 Stunden kaputt?

Ich warte jetzt erstmal die restlichen 12 Stunden bis der BadBlock Scan fertig ist und dann boote ich das System mal neu um zu sehen was passiert.
Zwischenablage01.jpg
Zwischenablage02.jpg
 
Zuletzt bearbeitet:
Ja das liegt sicher am NAS und nicht an der Platte, hatte auch schon mal so ein Fall.
 
Ich hoffe du hast von deinen Daten ein ordentliches Backup. Das wäre nach den ersten Symptomen das wichtigste.
 
Ja,das habe ich auf zwei anderen Platten nochmal.....
Ergänzung ()

altavilla schrieb:
Ja das liegt sicher am NAS und nicht an der Platte, hatte auch schon mal so ein Fall.
Ob es sich lohnt sich an QNAP zu wenden und auf Kulanz zu hoffen, das Ding ist keine zwei Monate über die Garantie, wenn es wirklich das NAS sein sollte?
Könnte es evtl. gar nur ein Firmwareproblem sein?
Ich installiere immer die neuste Version wenn sie angeboten wird.
 
Zuletzt bearbeitet:
Kann mir nicht vorstellen, dass es an der Firmware liegt. Habe auch ein QNAP und installiere immer die aktuellste Firmware. Denke es ist ein Problem der Backplate.
Ist sicher ein Versuch wert auf Kulanz zu tauschen.
 
Genau backplate war auch das Schlagwort was ich in Bezug auf solche Probleme ergoogeln konnte.
Ist damit die Platine gemeint in die alle Platten einrasten, oder der Rahmen, wie auch immer das da drin aussieht?
 
altavilla schrieb:
das liegt sicher am NAS und nicht an der Platte
Wieso?

Die Platte hat 2028 schwebende Sektoren. Schwebende Sektoren sind Sektoren deren Daten nicht mehr zur ECC passen die hinter jedem Sektor steht und mit deren Hilfe auch nicht mehr korrigiert werden können. Da die korrekten Daten nicht mehr feststellbar sind, gibt die Platte statt falscher Daten einen Lesefehler als Antwort wenn man versucht diese zu lesen. Das kann auch anderen Gründe als defekte Oberflächen haben, z.B. einen Stromausfall während eines Schreibvorgang der dazu führt, dass eben nicht die ganze Daten plus der neuen ECC geschrieben wurden oder wegen eines Stoßes oder Vibrationen ist der Kopf beim Schreiben aus der Spur gekommen und hat Daten auf der Nachbarspur überschrieben. Auch arbeiten HDDs nicht 100%ig und die Hersteller geben die Fehlerhäufigkeit auch in Form der UBER an, wobei eine UBER von 1:10^14 bedeutet, dass je 10^14 gelesener Bits was etwa 12TB gelesener Daten entspricht, ein Lesefehler und damit schwebender Sektor im Rahmen der Erwartungen liegt.

Die Controller merken sich die schwebenden Sektoren und prüfen die Daten nach dem erneuten Schreiben auf diese Sektoren, dann verschwinden diese einfach oder werden eben durch Reservesektoren ersetzt.

HDDs in einem echten RAID, also einem mit Redundanz und nicht einem RAID 0 welches eigentlich ein AID 0 ist, zeigen daher normalerweise keine schwebenden Sektoren, weil die RAID Controller (ggf. RAID SW) bei Lesefehlern die Daten aus den Daten der anderen Platten rekonstruiert und den Sektor überschreibt bei denen der Lesefehler aufgetreten ist. Wieso diese hier trotzdem schwebende Sektor, sollte man den NAS Hersteller mal fragen. Oder ist der Zustand des RAIDs schon degraded?
 
Schweregrad Datum Uhrzeit Benutzer Quellen-IP Anwendung Kategorie Inhalt
Warnung 2019/02/03 16:24:49 System 127.0.0.1 Storage & Snapshots Volume [Storage & Snapshots] RAID group "1" is degraded. Volume: DataVol1.


Dies wurde aber angezeigt weil die Disk in Bay2 als ausgefallen bzw. disconnected angezeigt wurde, nicht wegen dem Sektorfehler
Schweregrad Datum Uhrzeit Benutzer Quellen-IP Anwendung Kategorie Inhalt
Informationen 2019/02/03 16:23:23 System 127.0.0.1 Hardware Status I/O Ports [Hardware Status] "Host: Disk 2": NCQ disabled. Timeout error.


Defekte Sektorsuche mittlerweile bei 92% angekommen.

Man beachte bitte dass es sich hier um eine Platte mit um die 250 Betriebsstunden handelt, es nie einen Stromausfall gab und das NAS im Regal steht und nie bewegt wird.
Es handelt sich um ein Raid10 und nicht 0 , also zumindest der 4 Plattenverbund gesamt
 
Zuletzt bearbeitet:
Wenn das RAID degraded ist, dann ist die betroffenen HDD wohl nicht mehr Teil des RAIDs und damit ist es dann auch kein Wunder, dass sie eben schwebende Sektoren aufweist. Scheinbar war ein Timeout error am 03.02. der Grund für den degraded Zustand, nur wundert mich dies bei einer Red, die sollte nach 7s mit einem Lesefehler antworten, wenn sie einen Sektor nicht mehr lesen kann, HW RAID Controller warten gewöhnlich 8s bis sie eine HDD als defekt werfen und SW RAIDs, wie sie bei NAS üblich sind, eigentlich noch viel länger. Keine Ahnung was die NAS Hersteller da immer wieder bei den RAIDs einstellen damit so ein Mist passiert.

Neue Platten fallen übrigens besondern häufig aus, wie alle neuen technischen Geräte und obendrein sind HDDs sehr empfindlich und werden von Händlern oft schlecht verpackt an die Kunden geschickt. Von HGST gibt es dieses Video über die Empfindlichkeit und korrekt Handhabung von HDDs, mit dem Empfehlung wie die Umgebung aussehen sollte auf denen mit HDDs gearbeitet wird und sie weisen darauf hin, dass die Schäden sich auch erst später bemerkbar machen können.

Es gibt bei WD aus der Seite Beispiele guter HDD Verpackung und wie es nicht gemacht werden sollte.
 
Ich habe mich vertan, die Platten im NAS sind keine 250 Stunden im Betrieb ( wunderte mich irgendwie beim überschlagen im Kopf :-) ) sondern 250 Tage, trotzdem geringe Laufzeit.

Auf Platte 1 wurden nun 2028 defekte Sektoren beim Scan ( 23 Stunden) gefunden.
Der Neustart hat auch geklappt und die ausgetauschte "defekte" Platte 2 wird nicht mehr bemängelt.

Jetzt sagt er noch das Dateisystem wäre nicht sauber und ich soll es überprüfen lassen, was lange Zeit in Anspruch nehmen könnte.

OK, weiter abwarten .........
 
So, ich bin nun soweit dass ich Laufwerk 1 auch neu bestellt habe.

Im Moment bestehen folgende Probleme.
Vorweg, ich habe noch ein Backup meiner Daten und auf dem PC hier sind sie auch drauf.

Das Acronis Backup auf dem NAS, welches ich wöchentlich anfertigen lasse, ist weg, alle anderen Daten, tausende Musikfiles und Filme und Fotos sind noch drauf und abrufbar.
Abruf funktioniert aber nur über den Fileserver vom NAS oder über FTP im Windowsexplorer.
Wenn ich im Windowsexplorer unten bei Netzwerk auf das NAS gehe bekomme ich immer nur den Fehler 0x080070035, es konnte keine Verbindung zur Netzwerkressource aufgebaut werden.
Einmal bekam ich das Verzeichnis des NAS zu sehen eben, aber ich konnte nicht auf die Ordner zugreifen weil die Fehlermeldung kam.
Ebenso kann ich das NAS in Acronis True Image nicht mehr auswählen, keine Verbindung, selber Fehler.

Wie gesagt Zugriff per ftp geht, download und upload auf das NAS.

Was kann sich da ohne mein zutun an der Config geändert haben?
Oder kann es daran liegen dass das Raid Volume beschädigt ist?

Ich habe an der Config nichts verändert, ich habe diese Woche nur ein Spiel installiert welches auch das Microsoft Net Framework erneuert hat.
 
Hilfe !!

Jetzt nachdem ich Disk 1 und 2 gegen neue getauscht habe wird plötzlich Disk 3 und die neuen 1&2 nicht erkannt.

Ich glaube das NAS ist einfach am A*

Ich habe die neuen Disk jeweils in runter gefahrenem Zustand getauscht und danach neu gebootet.
Nun wollte ich das NAS komplett neu aufsetzen, aber es findet nur die Disk 4.
Ich denke doch mal ich habe da nichts falsch gemacht.
 

Anhänge

  • Zwischenablage02.jpg
    Zwischenablage02.jpg
    257,8 KB · Aufrufe: 450
Poste doch mal die S.M.A.R.T. Werte der betroffenen Platten.
 
Die Platten werden ja garnicht mehr erkannt und um sie extern zu betreiben habe ich im Moment keine Möglichkeit..
Bay 1 und 2 sind neue Platten drin und Bay 3 waren normale Werte um 250 Betriebsstunden ohne andere Fehler.

Im Forum vom QNAP Club gibt es identische Fehlerbeschreibungen bei denen die Backplane defekt war.
Habe eine Anfrage an QNAP nach Kulanz gestellt da ich ja zwei Monate aus der Garantie bin und mir zeitgleich jetzt ein 431P2 4GB neu bestellt.

Das entweder reparierte oder defekt bleibende TS431+ werde ich dann verhökern.
Jetzt erstmal abwarten ob sie mein Gehäuse nehmen um es auf Kulanz zu reparieren oder nicht .........
 
Du weißt doch noch gar nicht ob es an der Backplane liegt. Wenn Du die Platte gerade nicht irgendwo extern testen und die S.M.A.R.T. auslesen kannst, baue sie doch in ein anderes Bay, soweit ich das verstanden haben bist Du doch sowieso gerade am Neueinrichten. Die schwebenden Sektoren die die andere Platte hatte, kommen jedenfalls nicht von einer defekten Backplane.
 
Es werden die Platten 1, 2 und 3 nicht im NAS erkannt plötzlich, nachdem die letzten Wochen erst eine, dann zwei Platten nicht erkannt wurden.
Zwei Platten wurden schon ersetzt.

Was soll es anders sein?
Zwei neue Platten und zwei mit 250 Betriebsstunden plötzlich defekt?

Es kann nur am Gehäuse oder zu einem kleinen Teil noch an der Firmware liegen.
Wäre es aber die Firmware würde man davon mehr finden im Internet.
Zu defekten Backplanes findet man allerdings etliches mit identischen Fehlern ab 2017 bis heute......

Alle Platten, ausser die eine mit den defekten Sektoren, hatten beim letzten Start einwandfreie Smartwerte, lt. dem was man im Menu des NAS auslesen kann.
Habe leider keine Screenshots, ausser dem von oben mit den defekten Sektoren.

Ich gehe zu 100% davon aus dass die Platten im neu bestellten NAS einwandfrei laufen werden.
Sollte ich mich irren kann ich dieses ja immer noch umtauschen, wobei 4 statt 1GB Speicher und 1,7 statt 1,4 Ghz Prozessor schon netter sind bei dem neuen.
 
Es ist zum Mäuse melken.
Nachdem das System gestern nur noch die eine Disk erkannt hat und ich es runtergefahren habe habe ich es eben nochmal eingeschaltet.
Bootvorgang dauerte eine Stunde, in die Oberfläche kam ich nicht rein aber in den Details beim Qfinder konnte ich sehen dass wieder nur eine Platte angeblich eingebaut war.

Also habe ich alle Platten mal ohne runterfahren gezogen, System runter gefahren, ohne Platten hochgefahren und dann die Platten wieder eingesteckt.
Jetzt zeigt er mir wieder alle 4 Platten an und ich musste das System komplett wie ein frisch ausgepacktes neu einrichten.

Der QNAP Support hat sich gemeldet und möchte die Fehlerprotokolle und Log Dateien haben, jetzt habe ich natürlich keine weil das System grade neu aufgesetzt wird.
Trauen tue ich dem Teil aber nicht mehr und werden nen Teufel tun da noch Daten drauf zu sichern.

Morgen kommt mein neues NAS
 
Zurück
Oben