ZFS Status: Degraded

Ach Mist, jepp hatte ich gar nicht gepostet. Hier, was er beim Kurztest alles ausgespruckt hatte:


=== START OF INFORMATION SECTION ===
Model Family: Western Digital Red Plus
Device Model: WDC WD40EFRX-68N32N0
Serial Number: WD-WCC7K1FK38EK
LU WWN Device Id: 5 0014ee 2be1c7992
Firmware Version: 82.00A82
User Capacity: 4.000.787.030.016 bytes [4,00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 5400 rpm
Form Factor: 3.5 inches
Device is: In smartctl database 7.3/5852
ATA Version is: ACS-3 T13/2161-D revision 5
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is: Sun Sep 14 12:49:53 2025 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x80) Offline data collection activity
was never started.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (45480) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 483) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x303d) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 16
3 Spin_Up_Time 0x0027 161 160 021 Pre-fail Always - 6933
4 Start_Stop_Count 0x0032 085 085 000 Old_age Always - 15562
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 085 085 000 Old_age Always - 11331
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 086 086 000 Old_age Always - 14595
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 6
193 Load_Cycle_Count 0x0032 195 195 000 Old_age Always - 15555
194 Temperature_Celsius 0x0022 125 103 000 Old_age Always - 25
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 11331 -
# 2 Short offline Completed without error 00% 5174 -
# 3 Short offline Completed without error 00% 5003 -
# 4 Short offline Completed without error 00% 4825 -
# 5 Short offline Completed without error 00% 4641 -
# 6 Short offline Completed without error 00% 4523 -
# 7 Short offline Completed without error 00% 4451 -
# 8 Short offline Completed without error 00% 4368 -
# 9 Short offline Completed without error 00% 4150 -
#10 Short offline Completed without error 00% 3740 -
#11 Short offline Completed without error 00% 3497 -
#12 Short offline Completed without error 00% 3344 -
#13 Short offline Completed without error 00% 3259 -
#14 Short offline Completed without error 00% 3036 -
#15 Short offline Completed without error 00% 2919 -
#16 Short offline Completed without error 00% 2651 -
#17 Short offline Completed without error 00% 2432 -
#18 Short offline Completed without error 00% 2122 -
#19 Short offline Completed without error 00% 1764 -
#20 Short offline Completed without error 00% 1151 -
#21 Short offline Completed without error 00% 1041 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
Sieht für mich gut aus. Auch keine fehlerhaften oder umgeschriebenen Sektoren. Auch der Rest passt.
Der Fehler liegt wohl doch woanders!
 
  • Gefällt mir
Reaktionen: JumpingCat
Dann stoppe ich jetzt den Long-Test. Ok, was mache ich denn sinnvollerweise als nächstes um den Fehler einzugrenzen?
 
Ich würde einfach einen neuen Scrub noch einmal anstoßen und sehen, was dann passiert und ob der Fehler noch einmal auftaucht.

Ansonsten aktuelles BIOS, alle Stecker noch einmal überprüfen, andere Kabel, Softwareupdate, RAM (Befestigung) usw.
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: JumpingCat und will-lee
Ok, den Scrub mache ich tatsächlich gerade schon nachdem ich nochmal zpool clear genutzt habe. Aktuelles Bios ist drauf, gibt sonst nur ein betaBios seit zwei Jahren. Den Rest mache ich dann in der Reihenfolge.

Tja, was soll ich sagen:

pool: data
state: ONLINE
scan: scrub repaired 0B in 00:00:23 with 0 errors on Sun Sep 14 15:50:30 2025
config:

NAME STATE READ WRITE CKSUM
data ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
ata-WDC_WD40EFPX-68C6CN0_WD-WX32D35A9K72 ONLINE 0 0 0
ata-WDC_WD40EFRX-68N32N0_WD-WCC7K1FK38EK ONLINE 0 0 0


Das ist doch verrückt. Heute morgen hat genau das zu den gleichen Fehlern nochmal geführt.....


Vielen Dank euch. Dann bin ich zumindest froh, dass die Platte anscheinend nicht hinüber ist. Beobachte ich natürlich trotzdem weiterhin.
 
Nicht immer gleich wild machen lassen! Bei einem Ausfall einer HDD keinen Test machen, sondern nur die Werte auslesen! Man will die Sache ja nicht schlimmer machen, als sie ohnehin schon ist. Es wäre ja schade, wenn ein Test die HDD killt, anstatt ggf. noch Daten zu sichern. Das alles kann man aber aus den Daten schon gut ableiten. Beobachte es einfach weiter. Du hast deine Kenntnisse ja jetzt weiter vertieft.
 
  • Gefällt mir
Reaktionen: will-lee und Azghul0815
Hatte jetzt noch einen Smart Error: Self Test Log Error Increased from 0 to 1, aber das schiebe ich jetzt mal auf den abgebrochenen Long-Run.

Da gab es einen Read-Error. Falls der bestehen bleibt, informiert mich das System in 24 Stunden. So lange lasse ich das jetzt laufen und schiebe heute Abend da einfach mal die Daten drauf, die ich eh extra gesichert habe. Dann scrube ich noch mal und schaue, was das System sagt.

Wenn ein Smart Error bestehen bleibt, entferne ich die Platte aus dem Pool und ersetze die bei Gelegenheit.
 
will-lee schrieb:
Beim nächsten Scrub der gleiche Fehler.

Hier wäre es dann interessant gewesen, in welcher Anzahl die Fehler beim zweiten Scrub aufgetreten sind. Beim ersten hattest du 25 Lese- und 36 Prüfsummenfehler. Ist theoretisch natürlich möglich, dass bis zum zweiten Scrub neue Fehler durch z.B. Bit Rot entstanden sind und jetzt beim dritten Scrub eben nicht.

will-lee schrieb:
Beobachte ich natürlich trotzdem weiterhin.

Das wäre zu empfehlen. Schau, ob es immer wieder die selbe HDD ist, die Lese- und Prüfsummenfehler aufweist. Noch sind die Werte nicht dramatisch. Nur, dass beim zweiten Scrub schon wieder neue Fehler aufgetreten sind, war eben verdächtig.
 
Das waren 37 Read und 25 Prüfsummenfehler davor. Hab die Logs noch in meinen Mails.
 
  • Gefällt mir
Reaktionen: Banned
Hmm, okay. Schon auffällig viele. Auf jeden Fall beobachten, würde ich sagen. Am besten in ner Woche oder so noch mal nen Scrub machen.
 
Ersetzen würde ich die HDD erst dann, wenn der Fehler reproduzierbar und nachweisbar ist.

Immerhin beziehst du deine Aussagen aus einem OS, welches auch Fehler in der Interpretation haben kann.

Du hast aber im Thread genügend Hinweise bekommen, die möglichen Ursachen noch einmal zu vertiefen. Es wäre ja unschön, wenn du die HDD austauschst und der Stecker saß nicht richtig oder es gab einen Wackelkontakt.

Ich würde die HDD auch einmal komplett formatieren und nicht wie üblich die Schnellformatierung nutzen. Notfall auch ein Low-Level-Format, um den Auslieferungszustand wiederherzustellen.

Ausgehend von deinen Informationen würde ich die HDD aber nicht tauschen, nur weil eine Software oder ein OS etwas behauptet. Auch kannst du die HDD am Rechner noch einmal testen und auslesen. Sollte ein Fehler an den Verbindungen bestehen, kann dieser dann aber behoben sein.

Auch das sind Probleme, die bei einem fertigen NAS weniger auftreten. Neben der Hardwarebastelei kommt auch die Software dazu, welche mehr oder weniger ausgereift ist. Wie bei Windows gibt es bei selbst zusammengestellten Systemen immer wieder einmal Probleme, die eigentlich nicht auftauchen sollten. Neben der Hardware bekommt man bei einem Fertig-NAS auch die Software dazu. Entsprechend sollte man über genügend Hintergrundwissen verfügen, wenn man sich auf so ein Projekt einlässt. Oft stehen die Empfehler dieser Projekte (YouTube, Blogs, Foren) bei Problemen nicht zur Verfügung. Das gilt besonders für Systeme, die auf eine Community setzen. Aus diesem Grund sehe ich das auch erst etwas für Fortgeschrittene und empfehle diese OS nicht für Einsteiger.

Auch ich nutze dieses System/OS einfach, weil ich kein Interesse habe, dauernd zu basteln. Dann hätte ich keine Zeit mehr, hier etwas zu schreiben, und ich würde mich nicht unbedingt als Anfänger sehen. Warum sollte ich mir mein Leben schwerer machen, als es ist? Natürlich könnte ich das alles auch in Debian umsetzen und mehr Zeit investieren, aber warum, wenn es fertige Lösungen gibt? Irgendwann muss man auch einmal die Kirche im Dorf lassen.

Abschließend könnte man bei deinem Projekt sagen, dass du es dir einfacher vorgestellt hast, es ist teurer geworden als gedacht und jetzt noch die HDD, welche du ja einsparen wolltest. Das gehört zur Ehelichkeit dazu und könnte eine Hilfe für andere User sein, die mit den gleichen Gedanken spielen. Das ist jetzt keine Kritik, sondern nur meine Beobachtung und der Grund, warum ich solche Projekte nicht empfehle. Aber aus Fehlern lernt man, sonst hätte ich ja auch nicht den einen oder anderen Tipp. 😎
 
  • Gefällt mir
Reaktionen: Azghul0815
snoogans schrieb:
Es wäre ja unschön, wenn du die HDD austauschst und der Stecker saß nicht richtig oder es gab einen Wackelkontakt.

Dann müssten aber normalerweise Fehler bei Attribut 199 angezeigt werden. Der Transfer zwischen SATA-Controller und Laufwerk ist schließlich CRC-abgesichert. Sollte es hier unerkannte Fehler geben, würde das m.E. eher auf ein Controller-Problem hindeuten - auf welcher Seite auch immer.
 
@snoogans das stimmt alles. Aber ich hätte tatsächlich nicht diesen Lerneffekt. Mein nächstes wird dann wahrscheinlich ein UGreen, aber andererseits soll das hier idealerweise ja ewig laufen. Mit ZFS und SMART hätte ich mich vermutlich sonst nie so eingehend beschäftigt bzw. mit Dateisystemen im Allgemeinen. Auch mal ein System komplett einzubauen hat mir jetzt beim Gaming-PC Projekt schon geholfen. Z.b. würde ich niemals versuchen, so was in ein ITX Gehäuse zu quetschen. Midi-Tower, denn einen gewissen Platz habe ich da einfach gerne. Für das NAS ist ITX als Gehäuse ok, für einen Gamingrechner für mich nicht.

Aber ich würde auch jedem, der keinen Bock auf Basteln hat, zu Synology (früher) bzw. einem anderen Fertig-NAS raten. Aber grob wusste ich ja, was auf mich zukommt. 🙂
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: und tschüss
@Banned
Was ist bei der Elektrik oder Elektronik schon normal?
Ich habe im Beruf wie auch mit der IT schon viele Sachen gehabt, die einfach nicht sein hätten dürfen.
Aus diesem Grund sehe ich lieber einmal mehr und genauer nach als zu wenig.
Strom und Magnetfeld können manchmal komische Sachen machen.
Aus diesem Grund bin ich immer ergebnisoffen, selbst für das Ergebnis. Dieses muss ja erklärbar und reproduzierbar sein.

@will-lee
Danke für die Ehrlichkeit. Ob Ugreen dann noch interessant ist, wird sich zeigen. Für mich zählen das Ergebnis bzw. das Gesamtkonzept und der Preis. Die Hersteller sind dabei zu vernachlässigen. Aus diesem Grund bevorzuge ich auch freie Software für die Anwendungen, um sich von vornherein möglichst unabhängig zu machen. Ugreen nutzt ja ein Debian 12 und hat eine angepasste NAS-GUI, um das Arbeiten zu vereinfachen. Auch bei einem Fertig-NAS wird man nicht um das Dateisystem und die SMART-Werte herumkommen und ist die häufigste Frage bei HDD-Problemen, weil die meisten User mit den Werten nichts anfangen können.

Wie lange dein „ewig“ halten wird, wird sich noch zeigen, bin da aber optimistisch. Wenn ich mich irre, war es ein Board von Asrock. Asrock haben immer einen hohen Absatz, aber oft begründet durch den niedrigen Preis. Leider gibt es nicht viele Bretter mit N100 und keins mit gleichwertiger Ausstattung zu Ugreen DXP2800/4800. Asrock hat immer wieder Probleme mit seiner Hardware, egal welchen CPU-Hersteller. Wenn das Mainboard jetzt schon kein Update mehr bekommt, solltest du wenigstens die letzte Version und Beta installieren.

Wenn du das System noch nicht produktiv einsetzt, warum testest du nicht einmal DSM von Synology aus? Das läuft hier nebenbei schon ewig auf geänderter Hardware und ganz ohne die üblichen Syno-Gängelungen.
 
Hatte ja vorher ein Syno. Läuft die Software einfach so und auch legal auf einem offenen NAS?
Bei AS Rock bin ich nur gelandet, weil die die einzigen mit dem direkten 19V-Anschluss waren.
 
Zuletzt bearbeitet:
will-lee schrieb:
Läuft die Software einfach so und auch legal auf einem offenen NAS?

Xpenology und ähnliche Setups laufen wohl unter der "Duldung" von Synology aber ohne deren Support.
Ich hatte das mal in kvm (proxmox) zum testen von DSM installiert. Habe mir das Zeug mehrfach nachhaltig zerschossen. Habe dann aber doch ein echtes Synology gekauft.
 
Zuletzt bearbeitet:
Ok. Also ich bin mit OMV eigentlich ziemlich zufrieden. Geht bisher alles leicht von der Hand. ZFS ist natürlich nur von der Community. Das normale da ist Ext4. Vielleicht schaue ich mir noch TrueNAS an, aber da war schon vorab was, was mich gestört hat. Und Unraid ist leider zu einem relativ teuren Lizenzmodell gewechselt und ich mag nicht, dass das von einem Stick gebootet wird, auch wenn es dann im Arbeitsspeicher ist. Proxmox wäre noch eine Variante, die aber einfach zu drüber ist, für die zwei, drei Sachen, die ich machen will. Aber vielleicht teste ich einfach noch mal durch.
 
will-lee schrieb:
AS Rock bin ich nur gelandet, weil die die einzigen mit dem direkten 19V-Anschluss waren
Das ist auch das einzige Mainboard, was so etwas anbietet. Bei anderen Mainboards muss man halt die Steckerlösung nehmen, um ein externes Netzteil verwenden zu können.

Wenn du schon Erfahrungen mit DSM gemacht hast, solltest du den Loader einmal ausprobieren. Du benötigst nur noch einen USB-Stick, worauf die Software installiert wird. Es gibt unterschiedliche Loader: RR-Loaders wjz304, tinycore-redpil von Peter Suh oder den ARC-Loader von AuxXxilium. Alle findest du auf GitHub. Ich würde diese Reihenfolge empfehlen, gemessen an den Erweiterungen und Features. Eigentlich ist die Verwendung selbsterklärend. Teste es einfach aus. Bestehende Configs und Backups kannst du verwenden. Auch eine Migration zwischen unterschiedlichen Modellen ohne Neueinrichtung ist kein Problem. Die Online-Updates funktionieren ebenfalls, wie auch die Installation auf NVMe als Systemspeicher (ohne weitere Laufwerke). Das Ganze funktioniert schon stabil über Jahre hinweg. Erst, wenn du es testet, kannst du dir eine Meinung davon bilden! Vorteil: du lernst wieder etwas. 👍

JumpingCat schrieb:
Habe mir das Zeug mehrfach nachhaltig zerschossen.
Dann hast du wohl etwas falsch gemacht. Es läuft hier äußerst stabil und bei Bekannten auch auf unterschiedlichen Ugreens. Sozusagen: Was der eine nicht bietet, hat der andere und umgekehrt.
 
  • Gefällt mir
Reaktionen: JumpingCat
Die läuft dann auch mit den ganzen Synology Apps für iPhone, Android usw.? Das wäre natürlich schick. Mein altes DS war halt ein ARM da war nix mit Docker oder VMs und auf die neuen Synologys habe ich aus Hardwaregründen keinen Bock.
 
Klar doch 😎. Sogar der Loader funktioniert in der VM wieder und darin … (hatte einmal Langeweile). Man muss ja einmal alles getestet haben, um sich eine Meinung zu bilden.

Docker und VM waren ja nur bei den Plus-Modellen vorgesehen, welche auf x86 basieren. Mit ARM hättest du ein anderes, einfaches Einsteigermodell (Standard, Play oder J).

Auch die richtige Hardware, Temperatur, Lüfter etc. wird vom System übernommen und kann einfach über die Add-ons hinzugefügt werden.
 
Zuletzt bearbeitet von einem Moderator:
Zurück
Oben