SMART Werte richtig interpretieren

Legolas

Lieutenant
Registriert
Sep. 2018
Beiträge
732
Hallo Gemeinde,

ich habe in meinem Proxmox Homeserver eine Samsung MVMe. Muss ich mir über den Wert "Error Information Log Entries" sorgen machen?

Danke

Code:
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        38 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    20,429,480 [10.4 TB]
Data Units Written:                 7,023,413 [3.59 TB]
Host Read Commands:                 38,389,007
Host Write Commands:                74,802,253
Controller Busy Time:               650
Power Cycles:                       17
Power On Hours:                     265
Unsafe Shutdowns:                   6
Media and Data Integrity Errors:    0
Error Information Log Entries:      34
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               38 Celsius
Temperature Sensor 2:               33 Celsius
 
  • Gefällt mir
Reaktionen: Tr0nism
schau dir das log mit nvme error-log /dev/nvme0 an. wahrscheinlich alles nur "success" meldungen :)
 
  • Gefällt mir
Reaktionen: Laborer
Legolas schrieb:
Muss ich mir über den Wert "Error Information Log Entries" sorgen machen?
Vermutlich nicht. Leider hast du diese Einträge nicht mit angegeben.

Beispiel:
Code:
Error Information Log Entries:      0

Error Information (NVMe Log 0x01, 16 of 16 entries)
No Errors Logged
 
Zuletzt bearbeitet:
0x8100 schrieb:
schau dir das log mit nvme error-log /dev/nvme0 an. wahrscheinlich alles nur "success" meldungen :)
Danke, muss ich da nochwas nachinstallieren? Mit dem Commando passiert nix
 
Legolas schrieb:
Mit dem Commando passiert nix
keine ausgabe oder programm nicht gefunden? "nvme" sollte bei proxmox standardmässig dabei sein und zumindest "nvme list" sollte deine nvme(s) anzeigen.
 
nvme list sagt command not found. Weisst Du wie das Paket heisst?
 
@Legolas Nochmal, welche Fehler stehen denn unter diesem Eintrag?
Error Information (NVMe Log 0x01, 16 of 16 entries)

Das Problem wird meist nur durch Anfragen vom OS verursacht, die das Laufwerk nicht unterstützt. Dadurch sind sie meist unproblematisch.

Das wäre z.B. so ein Fall.
smart.png
 
Zuletzt bearbeitet:
Sodala, vielen Dank an alle. Das hier sind beispielhafte Einträge. Sieht also alles gut aus:
Code:
Error Log Entries for device:nvme0 entries:64
.................
 Entry[ 0]  
.................
error_count     : 34
sqid            : 0
cmdid           : 0x701c
status_field    : 0x2002(Invalid Field in Command: A reserved coded value or an unsupported value in a defined field)
phase_tag       : 0
parm_err_loc    : 0xffff
lba             : 0
nsid            : 0
vs              : 0
trtype          : The transport type is not indicated or the error is not transport related.
cs              : 0
trtype_spec_info: 0
.................
 Entry[ 1]  
.................
error_count     : 0
sqid            : 0
cmdid           : 0
status_field    : 0(Successful Completion: The command completed without error)
phase_tag       : 0
parm_err_loc    : 0
lba             : 0
nsid            : 0
vs              : 0
trtype          : The transport type is not indicated or the error is not transport related.
cs              : 0
trtype_spec_info: 0
.................
 
Legolas schrieb:
status_field : 0x2002(Invalid Field in Command: A reserved coded value or an unsupported value in a defined field)
Genau wie ich es vermutet habe. Es Ist ein Befehl was das Laufwerk nicht unterstützt, ist also alles in Ordnung.
 
  • Gefällt mir
Reaktionen: Laborer
wichtig wäre eher zu erfahren welche SSD das ist und welche Firmware darauf werkelt. Es gab ja letztens durchaus schwerwiegende Problem bei Samsung Firmwares
 
Helge01 schrieb:
Genau wie ich es vermutet habe. Es Ist ein Befehl was das Laufwerk nicht unterstützt, ist also alles in Ordnung.
Ich buddel den Thread mal aus ;)

GIbt es eine Möglichkeit die Erhöhung des Counters durch diese
Code:
status_field : 0x2002(Invalid Field in Command: A reserved coded value or an unsupported value in a defined field)
zu stoppen?
 
@Laborer warum buddelst du den Thread aus wenn du dann doch nur eine Frage hast? Kannst du nicht einfach nachlesen was Helge01 geschrieben hat? Und was soll das mit dem stoppen des Counters, ist das nicht einfach ein falscher Befehl und damit nicht zu ändern?
 
Weil meine Frage zum Thread passt - was hat hat deine Antwort jetzt mit einer möglichen Lösung zu tun?
 
Laborer schrieb:
eine Möglichkeit die Erhöhung des Counters durch diese status_field (...) zu stoppen?
Da ich keine Erfahrung (und auch keine Infomationen) mit/zu dem Laufwerk und/oder deinem BS habe, ja, gibt es. Einfach dem Treiber abgewöhnen, nicht vorhandene Befehle zu nutzen. Keine unbekannten Befehle=kein Fehler(counter der hochzählt).
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: areiland
Zurück
Oben