Samsung SM841 (mSATA) macht Probleme

mkossmann

Commander
Registriert
Dez. 2015
Beiträge
2.442
Mit der Platte gab es in der Vergangenheit immer wieder sporadisch Probleme das sie nicht mehr erkannt wurde. Die Platte stammt aus einem Dell XPS15 und wird derzeit über einen Startech mSATA-SATA-Adapter im PC betrieben.
Bei einem Leseversuch der Platte mit dd gab es einen Input/output error:
Code:
dd if=/dev/sdc of=/dev/null bs=10000000 & pid=$!
neuerPC:~ # kill -USR1 $pid
neuerPC:~ # 311+0 records in
310+0 records out
3100000000 bytes (3.1 GB) copied, 7.60325 s, 408 MB/s

neuerPC:~ # kill -USR1 $pid
neuerPC:~ # 949+0 records in
948+0 records out
9480000000 bytes (9.5 GB) copied, 23.1689 s, 409 MB/s

neuerPC:~ # kill -USR1 $pid
neuerPC:~ # 1235+0 records in
1234+0 records out
12340000000 bytes (12 GB) copied, 30.1716 s, 409 MB/s

neuerPC:~ # kill -USR1 $pid
neuerPC:~ # 1651+0 records in
1650+0 records out
16500000000 bytes (16 GB) copied, 40.3329 s, 409 MB/s

neuerPC:~ # kill -USR1 $pid
2103+0 records in
2102+0 records out
21020000000 bytes (21 GB) copied, 51.3613 s, 409 MB/s
neuerPC:~ # kill -USR1 $pid
neuerPC:~ # 9285+0 records in
9284+0 records out
92840000000 bytes (93 GB) copied, 226.457 s, 410 MB/s

neuerPC:~ # dd: error reading ‘/dev/sdc’: Input/output error
11321+1 records in
11321+1 records out
113212149760 bytes (113 GB) copied, 366.975 s, 309 MB/s

danach war die Platte tot und hat auf SMART Anfragen nicht mehr reagiert:
Code:
smartctl -a /dev/sdc |tee smartctl.log
smartctl 6.2 2013-11-07 r3856 [x86_64-linux-4.6.0-1.gaf7ce24-default] (SUSE
# RPM)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

Short INQUIRY response, skip product id
A mandatory SMART command failed: exiting. To continue, add one or more '-T
permissive' options.
Und sie wurde dann nach einem Reboot auch im BIOS des PCs nicht mehr erkannt.
Erst nachdem die Platte ( mit dem gleichen Kabel) am anderen Port des gleichen SATA Controlers (03:00.0 SATA controller: ASMedia Technology Inc. ASM1062 Serial ATA Controller (rev 02) ) angeschlossen wurde , wurde sie wieder im BIOS erkannt und man konnte smartctl -a folgendes auslesen:
Code:
smartctl 6.2 2013-11-07 r3856 [x86_64-linux-4.6.0-1.gaf7ce24-default] (SUSE RPM)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG SSD SM841 mSATA 512GB
Serial Number:    S132NYAD808730
LU WWN Device Id: 5 002538 500000000
Firmware Version: DXM43D0Q
User Capacity:    512.110.190.592 bytes [512 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2, ATA8-ACS T13/1699-D revision 4c
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Mon May 23 20:49:23 2016 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (53956) seconds.
Offline data collection
capabilities:                    (0x53) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  35) minutes.
SCT capabilities:              (0x003d) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1008
175 Program_Fail_Count_Chip 0x0032   100   100   010    Old_age   Always       -       0
176 Erase_Fail_Count_Chip   0x0032   100   100   010    Old_age   Always       -       0
177 Wear_Leveling_Count     0x0013   099   099   005    Pre-fail  Always       -       24
178 Used_Rsvd_Blk_Cnt_Chip  0x0013   100   100   010    Pre-fail  Always       -       0
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0013   100   100   010    Pre-fail  Always       -       18304
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
195 Hardware_ECC_Recovered  0x001a   200   200   000    Old_age   Always       -       0
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       2934022754
242 Total_LBAs_Read         0x0032   099   099   000    Old_age   Always       -       6641940407

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1097         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
  255        0    65535  Read_scanning was never started
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Ich sehe da keinen Hinweis auf einen Fehler

Und weiterer Leseversuch mit dd an diesem Port war dann erfolgreich:
51211+1 records in
51211+1 records out
512110190592 bytes (512 GB) copied, 1247.17 s, 411 MB/s

Ein Lesetest mit einer anderen Platte an ersten Port konnte aber auch keinen Fehler produzieren.

Ist die Platte reif für den Elektronikschrott oder gibt es noch andere mögliche Fehlerursachen ?
Ergänzung ()

hier noch die Syslogeinträge des Lesefehlers:
Code:
2016-05-23T20:06:30.528147+02:00 neuerPC kernel: [ 1268.782031] ata7.00: exception Emask 0x0 SAct 0xc00000 SErr 0x0 action 0x6 frozen
2016-05-23T20:06:30.528187+02:00 neuerPC kernel: [ 1268.782042] ata7.00: failed command: READ FPDMA QUEUED
2016-05-23T20:06:30.528189+02:00 neuerPC kernel: [ 1268.782052] ata7.00: cmd 60/00:b0:28:fc:2d/04:00:0d:00:00/40 tag 22 ncq 524288 in
2016-05-23T20:06:30.528191+02:00 neuerPC kernel: [ 1268.782052]          res 40/00:01:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
2016-05-23T20:06:30.528193+02:00 neuerPC kernel: [ 1268.782057] ata7.00: status: { DRDY }
2016-05-23T20:06:30.528195+02:00 neuerPC kernel: [ 1268.782060] ata7.00: failed command: READ FPDMA QUEUED
2016-05-23T20:06:30.528197+02:00 neuerPC kernel: [ 1268.782069] ata7.00: cmd 60/00:b8:28:00:2e/04:00:0d:00:00/40 tag 23 ncq 524288 in
2016-05-23T20:06:30.528199+02:00 neuerPC kernel: [ 1268.782069]          res 40/00:01:01:4f:c2/00:00:00:00:00/00 Emask 0x4 (timeout)
2016-05-23T20:06:30.528200+02:00 neuerPC kernel: [ 1268.782073] ata7.00: status: { DRDY }
2016-05-23T20:06:30.528201+02:00 neuerPC kernel: [ 1268.782079] ata7: hard resetting link
2016-05-23T20:06:40.568125+02:00 neuerPC kernel: [ 1278.822114] ata7: softreset failed (device not ready)
2016-05-23T20:06:40.568147+02:00 neuerPC kernel: [ 1278.822123] ata7: hard resetting link
2016-05-23T20:06:50.607947+02:00 neuerPC kernel: [ 1288.862128] ata7: softreset failed (device not ready)
2016-05-23T20:06:50.607973+02:00 neuerPC kernel: [ 1288.862136] ata7: hard resetting link
2016-05-23T20:07:01.152092+02:00 neuerPC kernel: [ 1299.406225] ata7: link is slow to respond, please be patient (ready=0)
2016-05-23T20:07:25.624121+02:00 neuerPC kernel: [ 1323.878452] ata7: softreset failed (device not ready)
2016-05-23T20:07:25.624144+02:00 neuerPC kernel: [ 1323.878462] ata7: limiting SATA link speed to 3.0 Gbps
2016-05-23T20:07:25.624146+02:00 neuerPC kernel: [ 1323.878466] ata7: hard resetting link
2016-05-23T20:07:30.792513+02:00 neuerPC udisksd[2563]: Error performing housekeeping for drive /org/freedesktop/UDisks2/drives/SAMSUNG_SSD_SM84_S132NYAD808730: Error updating SMART data: sk_disk_smart_read_data: Operation not supported (udisks-error-quark, 0)
2016-05-23T20:07:30.795952+02:00 neuerPC kernel: [ 1329.050308] ata7: softreset failed (device not ready)
2016-05-23T20:07:30.795968+02:00 neuerPC kernel: [ 1329.050318] ata7: reset failed, giving up
2016-05-23T20:07:30.795970+02:00 neuerPC kernel: [ 1329.050322] ata7.00: disabled
2016-05-23T20:07:30.795972+02:00 neuerPC kernel: [ 1329.050359] ata7: EH complete
2016-05-23T20:07:30.795973+02:00 neuerPC kernel: [ 1329.050391] sd 6:0:0:0: [sdc] tag#27 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
2016-05-23T20:07:30.795975+02:00 neuerPC kernel: [ 1329.050398] sd 6:0:0:0: [sdc] tag#27 CDB: Read(10) 28 00 0d 2e 00 28 00 04 00 00
2016-05-23T20:07:30.795977+02:00 neuerPC kernel: [ 1329.050402] blk_update_request: I/O error, dev sdc, sector 221118504
2016-05-23T20:07:30.795979+02:00 neuerPC kernel: [ 1329.050455] sd 6:0:0:0: [sdc] tag#28 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
2016-05-23T20:07:30.795981+02:00 neuerPC kernel: [ 1329.050459] sd 6:0:0:0: [sdc] tag#28 CDB: Read(10) 28 00 0d 2d fc 28 00 04 00 00
2016-05-23T20:07:30.795982+02:00 neuerPC kernel: [ 1329.050462] blk_update_request: I/O error, dev sdc, sector 221117480
2016-05-23T20:07:30.795985+02:00 neuerPC kernel: [ 1329.050564] sd 6:0:0:0: [sdc] tag#30 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
2016-05-23T20:07:30.795987+02:00 neuerPC kernel: [ 1329.050573] sd 6:0:0:0: [sdc] tag#30 CDB: Read(10) 28 00 0d 2d fc 28 00 00 08 00
2016-05-23T20:07:30.795989+02:00 neuerPC kernel: [ 1329.050578] blk_update_request: I/O error, dev sdc, sector 221117480
2016-05-23T20:07:30.795992+02:00 neuerPC kernel: [ 1329.050583] Buffer I/O error on dev sdc, logical block 27639685, async page read
2016-05-23T20:07:30.795994+02:00 neuerPC kernel: [ 1329.050691] sd 6:0:0:0: [sdc] tag#0 FAILED Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
2016-05-23T20:07:30.795996+02:00 neuerPC kernel: [ 1329.050700] sd 6:0:0:0: [sdc] tag#0 CDB: Read(10) 28 00 0d 2d fc 28 00 00 08 00
2016-05-23T20:07:30.795998+02:00 neuerPC kernel: [ 1329.050704] blk_update_request: I/O error, dev sdc, sector 221117480
2016-05-23T20:07:30.796000+02:00 neuerPC kernel: [ 1329.050709] Buffer I/O error on dev sdc, logical block 27639685, async page read
2016
 
Hast es schon einmal mit einem Firmware-Update probiert BIOS/SSD-Firmware ?
Ergänzung ()

Gibt es im BIOS Einträge mit SATA-Hotlplugging ? Sind die aktiv?
 
Nein , der ASMedia hat keine Konfigurationsmöglichkeit für SATA-Hotplugging im BIOS , das BIOS ist das neueste verfügbare BIOS, für die SSD scheint es eine neuere Firmware zu geben , die laut Beschreibung aber wohl ein anderes Problem (SM841 SED firmware change to fix the Pre-Boot Authentication issue seen on platform which has disabled SSP (Software Setting Preservation) feature ) fixen soll. Da das Problem aber nur sporadisch auftritt, werde nicht nicht sicher sagen können, das das Update auch dieses Problem löst
Ergänzung ()

Leider sagt der auf http://www.dell.com/support/home/bs/en/bsdhs1/Drivers/DriversDetails?driverId=0J8F2 gefundene Firmwareupdater, das er keine unterstützten Platten findet. Also fällt die Möglichkeit des Firmwareupdates für die SSD auch flach .
 
Das sieht mir eher nach einem Fehler des SATA Datenkabels oder mSATA Adapters oder des SATA Ports aus, wobei es leider kein Attribut 199 für Ultra-DMA CRC Fehler gibt. Hin ist die SSD gemäß den S.M.A.R.T. Werten nicht, die zeigen kein Problem an. FW Updates kannst Du wenn, dann nur vom dem OEM, also hier wohl Acer, bekommen, denn es ist eine OEM SSD und die supportet Samsung nicht selbst. Wie gut der ASMedia ASM1061 unter Linux unterstützt wird, kann ich nicht sagen, aber probiere die SSD doch auch mal an einem Port des Chipsatzes, da wird sie auch mehr Performance liefern.
 
Holt schrieb:
FW Updates kannst Du wenn, dann nur vom dem OEM, also hier wohl Acer
Platte stammt aus einem Dell XPS15


@mkossmann
ist es denn tatsächlich eine MZMPD256HAGM-000D7 ? Auch die Endung ist wichtig, D = Dell OEM, 7 = SED
Auch die bereits installierte FW sollte auf dem Label stehen.
 
@h00bi
Du hast recht, das Firmwareupdate passt nicht zur Platte. Damit gibt es wohl kein verfügbares Firmware-Update für diese Platte (MZMPDS512HAGL-000D1).
@Holt
Da da Problem auch in einem anderen PC ( mit anderen Kabeln und anderem Controlerchip) auftritt kann man wohl Verkabelung und Port ebenfalls auschließen und nur der Adapter bleibt als Ursache neben der Platte selbst übrig. Dieser Adapter ist aber weitgehend passiv. D.h. man findet ausser der mSATA-Buchse und den SATA-Steckern nur ein paar Kondensatoren und einen Spannungsregler AX1008-33 auf der Platine vor. Würde ein sporadischer Ausfall dieses Spannungsreglers zu den Symptomen passen ?
 
Stimmt, Dell nicht Acer, da hatte ich mich vertan.

mkossmann, ja der Spannungsregeler könnte es sein, es könnten auch Störungen auf den Signalleistungen sein. Probiere vielleicht einen anderen Adapter, ich meine es gibt auch welche ohne Spannungsregler, die müssen aber dann an einen nativen SATA Stromanschluss und dürfen nicht über eienn Molexadapter genutzt werden, da die mSATA SSDs 3.3V brauchen, Molex diese aber nicht bietet, sondern nur 5V und 12V. 2.5" Consumer Laufwerke brauchen eben i.d.R. nur 5V und daher haben die meisten Adapter eben diese 5V auf 3.3V Wandler, damit die dann auch wie andere 2.5" Laufwerke mit 5V funktionieren.
 
Leider sieht es inzwischen wieder mehr nach Platte aus. Wenn man die Adapterplatine ohne Gehäuse betreibt, kommt man an die Pins des Spannungsreglers. Und da konnte ich ,wenn die Platte sich aufgehängt hatte, keine schlechte Spannung messen.

Dann habe ich das XPS15, aus dem die Platte ursprünglich stammt, aufgeschraubt und die Platte wieder eingebaut. Bei einem halben Dutzend Bootversuchen wurde die Platte vom BIOS nicht erkannt. Die größere Platte aus dem XPS15 lief dagegen ohne Fehler am Adapter.

PS:
Laut Wikipedia führen inzwischen auch SATA Stromstecker keine 3,3V mehr, so das man wohl keine Adapter ohne Spannungsregler mehr bekommt.
 
Wenn es kurze Einbrüche der Spannung oder eine zu hohe Restwelligkeit gibt, wist Du das nicht so einfach messen können. Wenn die SSD vorher in den Notebook wo sie verbaut war ohne Probleme funktioniert hat, denn wird sie es jetzt sehr wahrscheinlich auch tun und nur wegen der andere Umstände, also dem Adapter oder dem SATA Port/Kabel Probleme machen. Leider hat die kein Attribut für Kommunikationsprobleme, bei mSATA sind die auch kaum zu erwarten, aber es zeigt eben mal wieder wie wichtig ordentliche und vollständige S.M.A.R.T. Attribute sind, nicht wenn die SSDs problemlos laufen, aber eben genau dann wenn sie es mal nicht tun.
 
Zurück
Oben