Festplattenauslastung ohne Grund bei 100%

atze peng

Lt. Junior Grade
Registriert
Dez. 2010
Beiträge
470
Hallo,
ich besitze ein Synology 218 mit zwei WD Red 4 TB. Alles ist etwas mehr als 6 Jahre alt. Beide Festplatten laufen im RAID 1 bzw der Synology Version davon.
In letzter Zeit ist das Nas sehr langsam geworden. Zugriffe auf Daten dauern ewig und selbst die Anmeldung auf das Nas hat teilweise 5 bis 10 Minuten gedauert.
Die cpt Auslastung betrug dabei maximal 40%, Arbeitsspeicher maximal 65%.
Beide Festplatten hingen fast permanent bei 100% fest.

Was habe ich gemacht? Alle Dienste gestoppt, die man anhalten kann. Das Nas eine Weile in Ruhe gelassen und geguckt ob alle Updates installiert sind.
Nun ist die CPU Auslastung bei 10% und Arbeitsspeicher bei 40%. Eine Festplatte hat eine Auslastung zwischen 0 und 5%, die andere immer noch fast permanent von 100%, wobei die zwischendurch maximal mit 1mb/s liest oder schreibt.
Der smart Test des Nas hat nichts gebracht und es wird auch gesagt die Festplatte sei OK.

Als nächstes habe ich die besagte Festplatte ausgebaut und mir die smar Werte am PC angeguckt (schlauerweise kann man die ja nicht mehr bei Synology einsehen). Die Werte sehen eigentlich alle OK aus (siehe Anhang).
Jetzt ist die Frage: was ist da los? Ist die Festplatte trotzdem kaputt? Man hört und spürt nichts unnormales.
 

Anhänge

  • PXL_20241024_162443699.jpg
    PXL_20241024_162443699.jpg
    4,5 MB · Aufrufe: 855
Du kannst doch dien smart Werte sehen per SSH.

Was hat das NAS den gemacht als das lief? Lief da eventuell ein btrfs scrub oder anderer Cleanup Job wie Speicherrückgewinnung oder Snapshots aufräumen?

Wie war die RAM Auslastung zu dem Zeitpunkt und der Swap?
 
Als der Nas Datenträgerauslastung von 100% hatte (nicht kurzzeitig, sondern über mehrere Tage) lief nichts großes. Wurde die gesagt alles gestoppt und die Auslastung auf einer Festplatte war trotzdem über Stunden hinweg 100%.
Generell wird das Nas ausschließlich als Datengrab verwendet.

RAM Auslastung wie oben beschrieben. Es ging nicht um einen kurzen Zeitpunkt, sondern ein längerer Zeitraum.
Von Swap habe ich keine Ahnung.
 
atze peng schrieb:
Beide Festplatten laufen im RAID 1

Aber der Screenshot zeigt nur eine. Im Menü das NAS sollte es ne Übersicht geben.
Ergänzung ()

atze peng schrieb:
die andere immer noch fast permanent von 100%, wobei die zwischendurch maximal mit 1mb/s liest oder schreibt.

Wahrscheinlich die, die wir nicht sehen.
 
Banned schrieb:
Aber der Screenshot zeigt nur eine. Im Menü das NAS sollte es ne Übersicht geben.
Ergänzung ()

Bei dem Screenshot handelt es sich wie geschrieben um die Festplatte, die permanent bei 100% Auslastung festhing, die ich aus dem Nas ausgebaut und an einem PC ausgelesen habe.
Banned schrieb:
Wahrscheinlich die, die wir nicht sehen.

Die Festplatte, die nicht gezeigt wird, lief vor ausschalten des Nas bei 0-5%, wie ich oben erwähnt hatte.
 
atze peng schrieb:
Die Festplatte, die nicht gezeigt wird, lief vor ausschalten des Nas bei 0-5%, wie ich oben erwähnt hatte.

Und die SMART-Werte von der sind okay? Also nur, um das auszuschließen (könnte doch m.E. theoretisch auch sein, die intakte HDD rödelt sich einen ab, um die Daten der anderen wiederherzustellen, und die andere schafft es nicht, die Daten korrekt zu schreiben oder so). Das Ausbauen hättest du dir wohl sparen können, schätze ich, außer du hast damit noch weitergehende Belastungstests gemacht oder so.
 
Die smart Werte der anderen Festplatte sehen genau so aus. Eigentlich sehr gut.
Ich habe noch Belastungstests gemacht, dabei ist aber nichts raus gekommen.
 
Hmm, mysteriös. Ich würde die Platte mal komplett plattmachen und dann wiedereinbauen, so dass der Rebuild startet. Dann weiterhin beobachten. Sonst fällt mir leider nicht viel ein, evtl. hat sonst noch jemand ne Idee.
Dass nur eine Platte in dem RAID-Verbund dieses Verhalten aufwies, deutet m.E. schon irgendwie auf ein Problem mit dieser oder ihrem Anschluss am NAS hin. Könntest ja testweise mal die Steckplätze tauschen (wobei das eigentlich bei Attribut C7 was auslösen sollte - aber manchmal gibt es komische Sachen und Synology ist halt proprietär).
 
Auf die SMART Interpretation vom DSM kann man sich nicht mehr verlassen. Zieh die mal raus und prüfe die an einem PC. Chkdsk /r z.B.

Für mich riecht das nach defekter HDD.
 
Zuletzt bearbeitet:
@sini Der Screenshot im ersten Post ist von Windows. Hab die Platten schon raus gezogen und dort ausgelesen.




Habe das Nas gestern Abend wieder zusammen gebaut und einfach laufen lassen ohne irgendwelche Dienste zu aktivieren.
Platte 1 permanent zwischen 90 und 100% Auslastung, Platte 2 irgendwo zwischen 0 und 9%.
CPU bei 2%, RAM 39%, Netzwerk up- und Download um die 1 KB/s beide Platten lesen um die 1MB/s und schreiben um die 10kb/s
Unter iops lesen und schreiben beide aktuell nichts.
 
Wie gesagt prüfe die Festplatte mit chkdsk /r oder einem anderen Tool deiner Wahl. Wenn die unter Windows unter IDLE im Taskmanager ebenfalls bei 100% hängt, dürfte klar sein was los ist 😏
 
Habe hd sentinel und hd tune pro checken lassen. Beide haben bei beiden Platten nichts gefunden.

Mache ich mal das Nas aus, ziehe Platte 1 raus und gucke wie dann die Auslastung aussieht?
Sollte ja dank RAID eigentlich nichts passieren aber ich habe etwas Respekt davor :D
 
atze peng schrieb:
Mache ich mal das Nas aus, ziehe Platte 1 raus und gucke wie dann die Auslastung aussieht?
Sollte ja dank RAID eigentlich nichts passieren aber ich habe etwas Respekt davor :D
Nun, dann wird das RAID ohne zweite Festplatte erstmal meckern. Und so bald du die zweite Platte wieder reinsteckst, musst du das RAID reparieren (Festplatte zuweisen usw.). Resync fertig.

Aber davon abgesehen, ich hatte viele WD40EFRX über die Jahre im Einsatz. Die spacken tatsächlich manchmal einfach ohne Grund in Synologys ab. Laufen dann nach dem Ausbau noch jahrelang problemlos in PCs ...
 
Spannend. Jetzt wo Platte 1 raus ist (die sonst bei 100% Auslastung hing) ist Platte 2 bei 100% Auslastung und hängt da seit 10 min unverändert.

Also doch irgendwas vom Nas aus?
Wie könnte ich noch raus finden woran das liegen kann? Im Ressourcen Monitor unter Prozesse kann man leider nicht gucken was Auslastung der Datenträger verursacht.
 
atze peng schrieb:
Spannend. Jetzt wo Platte 1 raus ist (die sonst bei 100% Auslastung hing) ist Platte 2 bei 100% Auslastung und hängt da seit 10 min unverändert.
Dann vermute ich, dass irgendwas lesend zugreift. Aber das war ja auch schon dein Verdacht. Platte 1 wird vermutlich primär zum lesen verwendet und jetzt wo Platte 1 weg ist, muss halt Platte 2 dafür herhalten ...

Also ich habe gerade mal auf eine DS218p zugegriffen und geschaut. Hier ist alles auf 0%. Gibt auch nur 2 aktive Prozesse und der Rest schläft. Guck mal unter Verbindungen -> verwendete Dateien

Hast du zufällig die Tage DSM 7.2.2 installiert? Nicht, dass dies doch die Leistungsfähigkeit übersteigt? (permanentes swappen oder ähnliches). Aber du schreibst auch, dass der RAM nicht ausgelastet ist, seeehr seltsam.
 
Wenn ich mir die Auslastung und den Durchsatz der letzten 6 Monate angucke fällt folgendes auf: am 12.10. ab 9:18 geht die Auslastung für beide Platten schlagartig auf 100% und bleibt ab da auf einem sehr hohen Niveau. Davor war die Auslastung permanent bei 0% über beide platten. Ab dem 12.10. ist Platte 1 permanent bei 100% und Platte 2 zwischen 100 und 0%.
Der Durchsatz bleibt bis vor dem 12.10. auf permanent bei 0. Sowohl lesend als auch schreibend.
Ab dem 12.10. ist eine Grundlast von 1mb/s lesen pro Platte und 0,5 mb schreiben pro Platte mit kurzen Spikes von bis zu 10mb/s pro Platte lesen und 0,8mb/s schreiben. Absolutes Maximum ein mal kurz 30 MB/s lesen auf einer einzelnen Platte.

Also alles in allem nichts was 100% Datenträgerauslastung rechtfertigen sollte.


Bei verwendete Daten ist überhaupt nichts. Alles leer.

Ja DS 7.2.2 wurde am 22.10. installiert. Also lange nach dem Problem.

Was ich sonst nur noch bei den Benachrichtigungen sehe: 12.10. 08:22 (also knapp vor dem Problem): Nas wurde nicht ordnungsgemäß herunter gefahren (hab ich nichts von mit bekommen) und auf Volume 1 ist nur noch wenig freie Kapazität (habe ich danach aufgeräumt. Allerdings erst wesentlich später und nicht direkt ab 9 Uhr. Kann also nicht direkt mit diesem starken Anstieg der Auslastung zusammen hängen.)


Versteh trotzdem noch nicht wie eine Auslastung entstehen kann ohne dass auch gelesen bzw geschrieben wird....
 
Es gibt interessante Neuigkeiten.
Nachdem das Raid wiederhergestellt wurde, gibt es eine Auslastung, die vorher so nicht war.

5 min lang gibt gibt es zyklisch dolle Anfragen an die eine Festplatte ohne dass in Netzwerk was passiert und ohne das doll gelesen oder geschrieben wird. Die CPU ist zu der Zeit eigentlich auch nur mit I/O beschäftigt. nach den 5 Minuten ist für 10 min Ruhe damit es dann wieder von vorne los geht. Zum Ende der hohen Festplattenauslastung sinkt die Ramauslastung ganz kurz auf 0%.

Ich glaube das ist langsam eher ein Fall für den Synology Support oder?


CPU:
CPU.PNG

Netzwerk:
Netzwerk.PNG

Ram:
RAm.PNG

lesen/schreiben:
read write.PNG

IOPS:
IOPS.PNG

Auslastung:
Auslastung.PNG
 
Ich habe gerade noch mal auf der DS218p geschaut.
  • CPU dümpelt <5% vor sich hin (weil auf Weboberfläche angemeldet)
  • Arbeitsspeicher = gerade Linie bei 39%
  • Netzwerk = gerade Linie bei 0%
  • Datenträger = gerade Linie bei 0%
atze peng schrieb:
Ich glaube das ist langsam eher ein Fall für den Synology Support oder?
Würde ich auch so sehen.

Wobei was mir noch einfällt. Du hast die Syno nicht zufällig vom Internet erreichbar gemacht? Nicht, dass das Teil unter Dauerfeuer von extern steht. Könntest ja mal das Netzwerkkabel ziehen und gucken wie die sich dann verhält 😅
 
@sini Eigentlich habe ich die Verfügbarkeit (hatte es per quick Connect gemacht) ausgeschaltet. Aber das kann man ja gleich mal flott probieren.

@Restart001 was genau meinst du? Es hängen mehrere Windows PCs im Netzwerk.
 
Zurück
Oben