SSD: Offenbar unbemerkte Datenkorruption auf T3 SSD ?

MiniPCHTPC

Cadet 4th Year
Registriert
Mai 2015
Beiträge
98
Ich habe in mehreren Dateien Datenkorruption bemerkt. Ich habe den Verdacht, dass von meiner externen SSD Samsung T3 teilweise falsche Daten ausgelesen werden.
Gerade gestern erst kopierte ich ein Archiv, welches heute beim Entpacken (am Ziel) beschädigt war. Als ich dasselbe Archiv, welches ich gestern kopierte, heute an der Quelle auf der T3 SSD entpackte gab es kein Problem.
Tatsächlich unterscheiden sich beide Dateien in einem Block von 16 Bytes.

Ein vergleichbares Problem habe ich bereits in der Vergangenheit gelegentlich festgestellt im Zusammenhang mit dieser SSD - auch hier waren stets Blöcke von 16 Byte in Dateien beschädigt.
Was mir sorgen macht sind natürlich die Daten, bei denen mir das nicht aufgefallen ist. Fällt jemandem ein, wie man dem Problem weiter auf den Grund gehen könnte?

Ich würde jetzt ein Programm suchen, was einen Block (zb 50GB) schreibt und diesen immer wieder liest, um hier auf Fehler zu testen. h2wtest macht das zwar grundsätzlich, ich weiß jedoch nicht, ob hier nur die Geschwindigkeit getestet wird, oder ob auch der Inhalt stets geprüft wird.

EDIT: Windows 10 ist das Betriebssystem, nebenbei bemerkt.
 
Zuletzt bearbeitet:
Teste mal mit Crytsal Disk Info, was der SMART-Status sagt...

Sollte da "Vosricht" oder gar "Schlecht" stehen, dann schmeiß die SSD weg...

Aktuelle Backups hast du doch hoffentlich?


"Testen" kannst du übrigens ganz einfach, in dem du z.B. Archive (Backups, zip, etc...) kopierst und wieder ausliest (= entpackst). - Besonders bei richtig großen Dateien dieser Art sollte der Fehler dann auftreten.
 
Zuletzt bearbeitet:
Auf der Platte liegen Daten, die kein Backup haben (z.B- die Letzte Sicherung meines Handys), von denen ich aber nun auch nicht sicher sein kann, dass sie in Ordnung sind. Dasselbe würde ja dummerweise für alle Daten gelten, die Irgendwann mal auf dem Datenträger waren - das ist unmöglich zu rekonstruieren.

Crystaldisk meldet Gut und 100%
 
H2testw testet auch ob einzelne Sektoren falsche Daten haben.

Hab gerade eine kleine SD-Karte zum Versuch ausgegraben:
Wenn alles OK ist sieht es so aus:
h2testw-OK.png

Nach Ändern von je 1-2 Byte per Hex-Editor an 4 Stellen in der Test-Datei sieht das Ergebnis dann so aus:
h2testw-Fehler1.pngh2testw-Fehler2.png
 
Dann mache den RAM Test mit Memtest86 oder Memtest86+, denn korrupte Dateien sind neben Abstürzen typische Zeichen für RAM Fehler. Teste alle Riegel so wie sie eingebaut sind, ändere da nichts und lass auch die BIOS Einstellungen so wie sie unter Windows betrieben werden, genau so müssen sie ja auch fehlerfrei laufen. Wenn es keine Fehler gibt, warte 6 PASS ob es so bleibt und wenn es Fehler gibt, teste zuerst mit den Standardeinstellungen neu, sollte übertaktet worden sein und danach teste die Riegel einzeln um zu sehen ob einer defekt ist oder ggf. eine andere Ursache vorliegt warum die möglicherweise auch fehlerfreien Riegel nicht fehlerfrei zusammenarbeiten wollen.
 
Danke für die Tipps. Ich lasse h2wtest mal in Schleife über Nacht laufen

RAM würde ich erstmal ausschließen, da das System soweit stabil läuft.
 
Nur weil ein System stabil läuft, muss das RAM noch lange nicht fehlerfrei funktioniere, denn die wirklich wichtigen Teile von Windows belegen ja nur einen kleinen Teil der 8, 16 oder gar 32GB die man heute meist als RAM hat. SSDs haben eine ECC hinter jeder Page und liefern keine falschen Daten, sondern Lesefehler wenn die Daten nicht zur ECC passen und auch nicht damit korrigiert werden können. Das Gut alleine sagt nicht viel aus, poste besser mal den Screenshot von CrystalDiskInfo für die SSD, ziehe aber bitte das Fenster soweit auf, dass alle Attribute und auch die Rohwerte vollständig sichtbar sind.

Wenn es nicht das RAM ist und nicht die SSD, würden nur der USB-SATA Bridgechip der T3 oder das USB Host Controller in Frage kommen, die haben ja meist auch keine ECC Absicherung für ihre Puffer. Schau Dir mal am Beispiel der Intel NIC an, da haben die einfachsten und vor allem älteren es auch nicht:
intel-ethernet-controller-ecc-png.531765
 
h2wtest lief jetzt knapp 7 Stunden ohne Probleme. Die T3 war recht heiß, da habe ich das Ganze mal abgeschaltet.
Das interessante ist ja, dass es nicht 1 oder 2 Bitflips sind, sondern immer 16 Byte. Es dürfte also etwas sein, was in 16 Byte-Einheiten vorliegt.
Ich habe 2 verschiedene Kabel genutzt. Wenn du, Holt, an den Bridge-Chip denkst (wobei ich nicht sicher bin, ob der intern irgendwo SATA hat bei der Kompaktbauweise), dann könnte es wohl auch am Kabel liegen.
Im Kern der SSD wird das Problem wohl eher nicht liegen, sonst wären die Daten auf der T3 nicht ein paar Tage später heile vorzufinden.

Neue Bitmap.png
 
In der T3 steckt eine 850 Evo im mSATA Formfaktor und den USB-SATA Birdgechip würde ich erst verdächtigen, wenn auch dann noch Fehler auftreten wenn die an einem Rechner mit ECC RAM (und Unterstützung dafür durch das Boards und die CPU) hängt. RAM Fehler sind wahrscheinlicher und 16 Byte sind genau die Breite eines Dual Channel RAMs.
 
In 5 1/2 Stunden Laufzeit und meinem Verständnis nach 2 vollständigen Passes hat Memtest keinerlei Fehler gefunden.
2 RAM Rigel identischen Modells, sollten also auch keine Inkompatibilitäten sein.
 
So weit man mir schon verschiedentlich gesagt hat, sollte man Memtest immer mindestens 6 volle Pässe durchlaufen lassen. Das dauert bei heutigen RAM-Ausstattungen ganz schön lange, ja...
 
Ja, das System hat 16GB RAM.

Es gibt kein Quell/Ziel-PC. PC ist identisch, nur der Datenträger nicht.
 
MiniPCHTPC schrieb:
Gerade gestern erst kopierte ich ein Archiv, welches heute beim Entpacken (am Ziel) beschädigt war. Als ich dasselbe Archiv, welches ich gestern kopierte, heute an der Quelle auf der T3 SSD entpackte gab es kein Problem.

Für mich klang es nach 2 PCs.

@Holt & @highks
Woher kommt die Anzahl 6 bei den Durchläufen?
 
Quelle und Ziel sind Datenträger.
Ergänzung ()

Das würde mich auch interessieren, z.B. von Holt:

Wieso mindestens 6 mal? Bei den 16GB dauert das - da in 5,5 Std nur 2 Pass durch waren - locker einen ganzen Tag. Es wird schwerlich, das System so lange nicht zu verwenden.
 
Hallo32, das ist ein Erfahrungswert, ich hatte aber auch schon mal einen Rechner der erst ab dem 13. Durchlauf Fehler gezeigt hat, dann aber massiv. Der ist immer mal wieder abgestürzt und danach war klar warum.
 
Wurde mit allen Threads getestet oder im Failsafe?

Im Failsafe erkennt memtest 86+ manche Fehler nicht.
 
Warum sind NUR 465 GB übrig bei der 500GB Version? Wo sind die restlichen 35GB...? Bei paar Hundert MB weniger wäre es ja nicht schlimm aber so viel weniger?!
 
Es sind 465GiB, also 465*1024^3, nur zeigt Windows die falsche Abkürzung an. Das ist bei HDDs aber nicht anders und sollte so langsam bekannt sein.
 
Zurück
Oben