SanDisk Ultra 3D 4TB - cold data bug?

SFFox

Commander Pro
🎅Rätsel-Elite ’24
Registriert
Dez. 2010
Beiträge
2.169
Hallo zusammen.

Ich betreibe 2x die SanDisk Ultra 3D 4TB in meinem NAS und vermute stark, dass die Firmware unter einem Cold Data Bug leidet.

Das System:
  • 5950X @ CO+ECO Mode
  • 32GB DDR4 RAM
  • Gigabyte B550I AORUS PRO AX
  • 1x Kingston A1000 NVMe 256GB
  • 2x SanDisk Ultra 3D 4TB
  • diverse HDDs an 3rd Party Controller
  • OS: Ubuntu Server, aktueller 6.19er Kernel
Setup:
Die SanDisk SSDs laufen als klassisches mdadm RAID0 auf dem wiederum ein LUKS encrypted Drive angelegt ist und eine einzelne EXT4 Partition beinhaltet. Diese 8TB werden als fileshare per samba im lokalen Netzwerk genutzt. Ein Backup findet auf ein 3x 8TB RAID1 aus HDDs statt sowie alle paar Monate auch noch auf eine extern gelagerte 8TB USB HDD.

Das Problem:
Jetzt passiert mir nach längerem Betrieb zum zweiten Mal, dass Daten, die etwa ein halbes Jahr alt sind, immer langsamer gelesen werden können. Während ich Dateien, die erst einen Monat alt sind intern auf die NVMe SSD mit ~1GB/Sek kopieren kann, schwanken ältere Dateien zwischen 20-150MB/Sek mit seltenen kurzfristigen Dips auf 0 MB/Sek. Getestet ist das alles mit ~8GB großen Video Files, so dass es sich in den Tests auch um den best case durch sequential file transfers handelt.

Was letztes Mal geholfen hat war ein kompletter Reset der SSDs und die Dateien vom Raid-Backup zurück auf die SSDs zu schieben für einen Refresh.

Jetzt ist es wieder so weit. Der "Verfall" hat wieder begonnen. Der SanDisk Support ist wenig hilfreich und bietet auch keinerlei Linux Support an. SMART ist unauffällig. Durch die dips fliegt das filesystem manchmal in den read-only mode, wenn man wirklich eine ganze Menge am Stück liest UND schreibt Schreibvorgänge an sich sind nicht betroffen bzgl. performance, es sind die Lese-Operationen, die alles zum hängen bringen. Schreiben von anderen Laufwerken auf das SSD Raid bleiben unproblematisch auch bei großen Datenmengen.

In der realen Welt fällt es mir symptomatisch immer dann auf, wenn die 2.5Gbit Netzwerk-Transfers nicht voll ausgelastet sind.

Auf Reddit finden sich User mit ähnlichen Problemen, aber ansonsten scheint es kein groß bekanntes Problem zu geben. Die baugleiche WD Blue 3D scheint ebenfalls betroffen. Firmware Updates hierfür gibt es nicht.
https://www.reddit.com/r/DataHoarder/comments/16ymtbu/strange_behaviour_from_sandisk_ssd/

Was tun?
Vielleicht ist eine meiner SSDs auch einfach ein Garantiefall!? Die Firmware sollte alte Speicherzellen eigentlich refreshen ohne vom eingesetzten Dateisystem abhängig zu sein oder ist euch bekannt, dass das nur mit Windows + NTFS funtkioniert/unterstützt wird?
Die latest firmware ist jedenfalls installiert. Mit der Evo 840 hatte Samsung damals ein ähnliches Problem, das mit einem Refresh Tool und später mit einem Firmware Update behoben wurde, wenn ich mich richtig erinnere. Ich fürchte aber SanDisk wird da wenig zu bewegen sein, falls es den Usern nicht auffällt, oder eben doch mit meiner Nutzungsweise zusammen hängt.

Vielleicht habt ihr ja auch eine Ultra 3D im Einsatz und könnt mal die Leserate alter Daten testen? :) Alleine für das Feedback wäre ich schon sehr dankbar.
 
@Restart001 Danke für den Tipp... 🤷‍♂️ Bestenfalls sind ein paar User jetzt vorgewarnt, die SSD ist ja gerade wieder "reduziert" auf Amazon.
 
Die SSD sind bekannt für das Problem und der Hersteller für's ignorieren
 
  • Gefällt mir
Reaktionen: Nero FX und feris
@Tenferenzu Danke für den Hinweis. Dann lohnt es sich ggf. den ganzen Support Parkour von SanDisk doch mal durch zu spielen (die wollen ja unbedingt die Infos von ihrem Windows Diagnose-Tool). Ggf. gibt es dann nicht-betroffene Austausch-Laufwerke.

Immerhin hab ich noch keinen Speicherkrise-Aufpreis für die Teile gezahlt und mit TLC Memory waren sie an für sich ja auch konkurrenzlos für 200€ das Stück und haben soliden Speed, wenn die Firmware die Daten nicht vergammeln lassen würde 🙈 ... naja... Lehrgeld.
 
Mann könnte auch bei sehr wenig vorhandener Schreiblast badblocks mal laufen lassen.
Bash:
man badblocks
Sollte passende Schalter liefern.

Kann einem zwar keine funktionierende Firmware liefern, ist aber uU ein Woraround gegen die ständigen Kopier Sessions.

Ich meine passende Schalter wären -v , -n, -t
Aber check das bitte vorher noch einmal!
 
@launacorp Danke für den Hinweis. Nach weiterer Recherche zeigt sich, dass badblocks für dieses Vorhaben recht umstritten ist, da auch Controller-Firmware von SSDs anders mit den badblocks Instruktionen umgehen kann (kann also funktionieren, muss aber nicht).

Am Ende kann man auch wirklich selbst formatieren und neu aufspielen für einen Refresh, wo BadBlocks ja auch jeden Sektor einzeln durch geht 🤷‍♂️ Bequemer ist nur, dass es inplace statt findet, wenn es funktioniert.

Ich habe ein schönes Script, das 3 file streams von dem 3x 8TB RAID1 auf die SSDs gleichzeitig aufbaut, so dass die SSDs auch wieder relativ flott gefüllt werden.

Ebenfalls inplace funktioniert brauchbar gut:
Bash:
find /target_folder -type f -exec sh -c 'cp -p "$1" "$1.tmp" && mv "$1.tmp" "$1"' _ {} \;
Allerdings nur so lange die ältesten Daten noch nicht zu lange degradiert sind, denn sonst kommt es zu einem Timeout beim Lesen, was einen Schreibvorgang verzögert, welcher durch diesen Timeout dann das filesystem in den read-only state setzt.

Nächstes Mal wieder Aufpreis für die gute alte Samsung 🙈
 
Zuletzt bearbeitet:
Alternate 1
Zurück
Oben