Smart Error: Spin-Up-Time / Beschleunigungszeit: 1

Ein RAID ersetzt sowieso kein Backup, also braucht man im Zweifel immer noch diese x Platten, eben für das Backup.
 
hab mir mal was geiles angesehen
also iscsi parallel überkreuzt und alles redudant ausgelegt auch das netz

dazu noch 2 server mit hotplug
der typ hat im betrieb platten ausgebaut, dann mal einen server abgesteckt
dann wieder an usw

geile sache, kostet aber auch ein bisschen
aber alles vollautomatisch
 
Okay, hab jetzt testweise einfach mal das Kabel des Laufwerks
mit dem von 'nem anderen geswitcht.

Der Wert stieg trotzdem nicht...

Das Web gibt mir den Eindruck, dass der Wert auch gar nie wieder
steigt, sondern über die Lebenszeit die Fehler gesammelt werden.
Ist der Wert stabil, ist dann wohl alles gut.
Ich hatte schon öfter Probleme mit defekten SATA Kabeln... an diesem
Laufwerk hing wohl mal eins.

Kopier grad noch Daten rum und kuck, ob der Wert beim anderen
Laufwerk mit dem Kabel nun sinkt... aber bisher tut sich nix.

(Dafür macht die Kiste mir anderweitig Sorgen...
Mwargh... ich hasse PCs... Zeitvernichter.)
 
Zuletzt bearbeitet:
Katzenjoghurt schrieb:
Okay, hab jetzt testweise einfach mal das Kabel des Laufwerks
mit dem von 'nem anderen geswitcht.

Der Wert stieg trotzdem nicht...
Welchen Wert meinst du? Der in der Rohwert-Spalte? Der Rohwert von C7 steigt nur, wenn es Übertragungsfehler gibt. Ansonsten bleibt er unverändert und wird auch nicht nach einer gewissen Zeit zurückgesetzt. Anders beim "Aktuellen" und beim "Schlechtesten Wert" dieses Attributes. Die fallen bei Übertragungsfehler und sobald keine mehr auftreten steigen sie wieder (was sowohl für die aktuellen als auch für den schlechtesten gilt). Daran kann man auch gut erkennen, ob die Übertragungsfehler aktuell sind und akuter Handlungsbedarf besteht. Wurde das Problem durch den Kabeltausch behoben, werden diese beiden Werte mit der Zeit wieder auf den Ursprungswert zurückgehen (der "Aktuelle Wert" schneller als der "Schlechteste Wert").
 
Hmm... ich las nur an vielen Stellen, dass "der Wert" sich beim CRC Error nie resettet.
Auf der anderen Seite schien er auch schon mal ganz unten auf 1 gewesen zu sein.
Alles merkwürdig...
Jedenfalls verharrt er... auch nach dem Kabelwechsel mit dem eines anderen Laufwerks.
(Aus Disk 4 wurde auch prompt Disk 3... hab mich also auch nicht vertan beim rumbasteln)

crystaldiskinfo3.png

Die Spin-Up-Time ist nach 'nem Neustart/Aufwecken nun entweder bei 44 oder 67.
 
Zuletzt bearbeitet:
Madnex schrieb:
Anders beim "Aktuellen" und beim "Schlechtesten Wert" dieses Attributes. Die fallen bei Übertragungsfehler und sobald keine mehr auftreten steigen sie wieder (was sowohl für die aktuellen als auch für den schlechtesten gilt).
Sorry, aber da muss ich widersprechen, denn der "Schlechteste Wert" darf nicht wieder steigen, der markiert ja den tiefsten Stand den der Aktuelle Wert je hatte. Zwar hält sich nicht jeder Hersteller daran, aber normal ist es nicht, wenn der Schlechteste Wert wieder ansteigt.

Katzenjoghurt schrieb:
Hmm... ich las nur an vielen Stellen, dass "der Wert" sich beim CRC Error nie resettet.
Richtig, die Rohwerte von Fehlerzählern sollte nie runtergehen, die Fehler sind ja aufgetreten und bleiben daher registriert. Rohwerte die aktuelle Zustände abbilden, wie die Beschleunigungszeit zeigen den aktuellen Werte, also z.B. die Zeit für den letzten Spin-up.
Katzenjoghurt schrieb:
Auf der anderen Seite schien er auch schon mal ganz unten auf 1 gewesen zu sein.
Alles merkwürdig...
Nein, gerade bei den Ulra-DMA CRC Fehlern wird der aktuelle Werte auf der Häufigkeit gebildet, mit der die Fehler gerade auftreten und wenn der Schlechteste Wert 1 ist, ann gab es mal eine Situation in der die Kommunikation praktisch gar nicht mehr geklappt hat. Vielleicht bleibt deswegen auch der aktuelle Wert auch so gering, denn wenn keine Fehler mehr auftreten, sollte er wieder auf den Ausgangswert steigen. Achte vor allem darauf, ob der Rohwert steigt, denn das ist der Zählerstand für die Fehler.
Katzenjoghurt schrieb:
Die Spin-Up-Time ist nach 'nem Neustart/Aufwecken nun entweder bei 44 oder 67.
Nein die Time ist im Rohwert, der aktuelle Wert ist die Interpretation des Controller für diese Zeit, je höher der ist umso optimaler bewertet er diese Zeit.
 
Hm... der Rohwert (UDMA CRC errors) sitzt festgetackert auf 9415...
Hab testweise mal 100GB rumkopiert... da tat sich nüscht.

Der error Wert der anderen Platte, die jetzt das "defekte" Kabel dran
hat, scheint sich auch nicht zu ändern.

Die Spin-Up-Time entspricht der der zwei anderen baugleichen Platten im Rechner.
280D => 67
27E0 => 67
2745 => 67

(Smart im BIOS? Weiß ich gar nicht... müsst ich beim nächsten
Reboot mal nachgucken)
 
Zuletzt bearbeitet:
Holt schrieb:
Sorry, aber da muss ich widersprechen, denn der "Schlechteste Wert" darf nicht wieder steigen, der markiert ja den tiefsten Stand den der Aktuelle Wert je hatte. Zwar hält sich nicht jeder Hersteller daran, aber normal ist es nicht, wenn der Schlechteste Wert wieder ansteigt.
Wo ist das festgeschrieben, dass das so ist? Das ist nämlich Unsinn. Der "Schlechteste Wert" markiert bei vielen Smart-Attributen keinesfalls den tiefsten Stand, den der "Aktuelle Wert" in der ganzen bisherigen Lebenszeit der Platte je hatte. Das ist eine Fehlinformation, die zwar im Web an vielen Stellen gerne verbreitet wird, aber das ist definitiv falsch.

Gerade bei der Smart-ID C7 ist das gut zu beobachten und auch nachzustellen.

Holt schrieb:
Richtig, die Rohwerte von Fehlerzählern sollte nie runtergehen, die Fehler sind ja aufgetreten und bleiben daher registriert.
Auch das ist nicht zwingend der Fall. Siehe den "Current Pending Sector Count".

Katzenjoghurt schrieb:
Hm... der Rohwert (UDMA CRC errors) sitzt festgetackert auf 9415...
Hab testweise mal 100GB rumkopiert... da tat sich nüscht.
Und was ist mit dem "Aktuellen" und dem "Schelchtesten Wert"? Haben die sich bei diesem Attribut auch nicht geändert?

Forcieren kannst du das, in dem du beispielsweise h2testw in Dauerschleife auf die Platte loslässt.
 
Madnex schrieb:
Wo ist das festgeschrieben, dass das so ist? Das ist nämlich Unsinn. Der "Schlechteste Wert" markiert bei vielen Smart-Attributen keinesfalls den tiefsten Stand, den der "Aktuelle Wert" in der ganzen bisherigen Lebenszeit der Platte je hatte. Das ist eine Fehlinformation, die zwar im Web an vielen Stellen gerne verbreitet wird, aber das ist definitiv falsch.
Gesetze oder Verordnungen über die Nutzung und Auslegung von S.M.A.R.T. Werten gibt es keine, da ist also viel Spielraum und der wird auch immer wieder nach Belieben ausgenutzt. Festgeschrieben ist da also nicht, man kann nur von dem normalen Verhalten ausgehen oder von dem, was ein Hersteller selbst dokumentiert, wenn da wirklich mal eine macht und dann ist es eben i.d.R. genau so.

Madnex schrieb:
Gerade bei der Smart-ID C7 ist das gut zu beobachten und auch nachzustellen.
Alleine der Name schlechtester Wert oder "Worst" sagt doch schon aus, dass dies der schlechteste Wert ist, der bisher erreicht wurde.

Madnex schrieb:
Auch das ist nicht zwingend der Fall. Siehe den "Current Pending Sector Count".
Da ist der Rohwert auch kein inkrementeller Zähler wie bei der Fehlern, sondern gibt die Anzahl der aktuell schwebenden Sektoren wieder und das kann man mehr und mal weniger sein, denn wenn ein Sektor überschrieben und für gut befinden oder durch einen Reservesektor ersetzt wurde. Aber ich wundere mich jetzt echt sowas von Dir zu lesen.


Katzenjoghurt, hast Du auch mal F5 gedrückt damit CDI die Werte aktualisiert? Das passiert sonst nur ein bestimmten Intervall, den man einstellen kann, den Default weiß ich aber jetzt nicht mehr, ich glaube so 10min.
 
Holt schrieb:
Gesetze oder Verordnungen über die Nutzung und Auslegung von S.M.A.R.T. Werten gibt es keine, da ist also viel Spielraum und der wird auch immer wieder nach Belieben ausgenutzt. Festgeschrieben ist da also nicht, man kann nur von dem normalen Verhalten ausgehen oder von dem, was ein Hersteller selbst dokumentiert, wenn da wirklich mal eine macht und dann ist es eben i.d.R. genau so.
Ach Holt bitte... du weißt schon wie das von mir gemeint war?

Was ist denn für dich das "normale Verhalten"? Das was DU erwartest oder was?

Holt schrieb:
Alleine der Name schlechtester Wert oder "Worst" sagt doch schon aus, dass dies der schlechteste Wert ist, der bisher erreicht wurde.
Dann erzähle das bitte mal den Festplattenherstellern. Die wissen das nämlich noch nicht. ;)

Ich habe dir hier mal auf die Schnelle zwei Beispiele herausgesucht, bei denen man klar erkennen kann, dass der "Schlechteste Wert" bei C7 keinesfalls für immer gespeichert wird.

C7_UDMA-CRC-Fehler.jpg C7_UDMA-CRC-Fehler_2.png

Holt schrieb:
Da ist der Rohwert auch kein inkrementeller Zähler wie bei der Fehlern, sondern gibt die Anzahl der aktuell schwebenden Sektoren wieder und das kann man mehr und mal weniger sein, denn wenn ein Sektor überschrieben und für gut befinden oder durch einen Reservesektor ersetzt wurde. Aber ich wundere mich jetzt echt sowas von Dir zu lesen.
Du hast ja auch nicht von einem "inkrementellen Zähler" geschrieben, sondern nur von einem Fehlerzähler. ;)

Auch der Rohwert der Lesefehlerrate wird nicht bei allen HDDs für immer (inkrementell) gespeichert. Der wird, abhängig von der Marke und der Zählweise, nach einer gewissen Phase des fehlerfreien Lesens wieder auf 0 zurückgesetzt (z.B. bei Hitachi HDDs).
 
(Ich F5e wie doof... NÜSCHT tut sich... NÜSCHT!

Bitte weiterstreiten...)
 
Madnex schrieb:
Was ist denn für dich das "normale Verhalten"? Das was DU erwartest oder was?
Das was die meisten Hersteller machen, sich aus den Namen auch logisch ableiten lässt und vor allem was der Hersteller dokumentiert hat. Letzteres ist leider oft nicht verfügbar, weshalb die ersten beiden mehr Gewicht haben.

Solange ein Hersteller offenlegt was er macht, bin ich aber damit einverstanden, denn es gibt eben keine strengen Vorschriften über die Handhabung der S.M.A.R.T. Werte.
Madnex schrieb:
Ich habe dir hier mal auf die Schnelle zwei Beispiele herausgesucht, bei denen man klar erkennen kann, dass der "Schlechteste Wert" bei C7 keinesfalls für immer gespeichert wird.

Und was belegen die Bilder? Vielleicht war die Fehlerrate nur nie so hoch, dass der Aktuelle Wert überhaupt gesunken ist und damit stimmt der Schlechteste Wert dann auch. Ohne einen Screenshot der die gleiche HDD (gleiche S/N) mit weniger Betriebsstunden und einem geringeren Aktuellen Wert für C7 belegen die Screenshots also rein gar nichts und das weißt Du auch.

Hier ein Beleg für das Gegenteil:
hdcry-jpg.307966



Madnex schrieb:
Dann erzähle das bitte mal den Festplattenherstellern. Die wissen das nämlich noch nicht. ;)
Der FW Programmierer bei Maxtor wusste es, aber nicht alle Programmierer einer machen immer alles gleich. Weitere Beispiele wie dieses einer WD1002FAEX findest Du sicher selbst, wir haben ja hier im Forum eine Menge davon.


Madnex schrieb:
Du hast ja auch nicht von einem "inkrementellen Zähler" geschrieben, sondern nur von einem Fehlerzähler. ;)
Der Kilometerzähler ist auch ein inkrementeller Zähler, muss man sowas wirklich noch extra erwähnen? Das die Anzahl der Schwebenden Sektoren wechseln kann und es somit kein Zähler ist, weißt Du doch selbst, oder? Sonst ja z.B. die wäre die Temperaturanzeige auch ein Zähler und die Beschleunigungszeit ebenfalls. Ist es aber nicht, selbst wenn da ms oder irgendwelche Ticks gezählt werden, so ist es doch kein Zähler.

Madnex schrieb:
Auch der Rohwert der Lesefehlerrate wird nicht bei allen HDDs für immer (inkrementell) gespeichert. Der wird, abhängig von der Marke und der Zählweise, nach einer gewissen Phase des fehlerfreien Lesens wieder auf 0 zurückgesetzt (z.B. bei Hitachi HDDs).
Das manchen Hersteller es anders machen, darüber haben wir ja schon gestritten. Viele definieren die Zähler als Lifetime Zähler, andere eben nur für die letzten x Betriebsstunden. Wenn Du einen Gebrauchtwagen kaufen willst und der hatte schon drei Unfälle, dann willst Du wohl auch nicht gerne vom Verkäufer hören, dass der im letzten Jahr keinen Unfall hatte, sondern würdest lieber den Lifetime Zählerstand von 3 erfahren, oder? Darüber welcher mehr Aussagekraft hat und welchen wohl nicht nur ich daher bevorzuge, brauchen wir also wohl nicht zu streiten.
 
Holt schrieb:
Und was belegen die Bilder? Vielleicht war die Fehlerrate nur nie so hoch, dass der Aktuelle Wert überhaupt gesunken ist und damit stimmt der Schlechteste Wert dann auch. Ohne einen Screenshot der die gleiche HDD (gleiche S/N) mit weniger Betriebsstunden und einem geringeren Aktuellen Wert für C7 belegen die Screenshots also rein gar nichts und das weißt Du auch.
Bei über 14.000 protokollierten Übertragungsfehlern bei der von mir als Beispiel vorgezeigten Western Digital glaubst du wirklich, dass der "Aktuelle Wert" eventuell nicht gesunken ist, weil die Fehlerrate nicht hoch genug war? Wirklich?

Wir sind uns sicherlich in dem Punkt einig, dass bezüglich Smart nichts verbindlich festgeschrieben ist und es im Grunde jeder Hersteller handhaben kann, wie er möchte. So kann und gibt es bei ein und derselben Smart-ID unterschiedliche Definitionen, Zählweisen und auch Verhalten bei den normalisierten Werten. Bei unserer kleinen Diskussion hier ging es von Anfang an um meine Aussage, dass auch der "Schlechteste Wert" zurückgesetzt wird bzw. zurückgesetzt werden kann, was du prinzipiell ausgeschlossen hast (weil das ja der Bezeichnung an sich widersprechen würde). Am Beispiel meiner Hitachi Platte und der Raw-Read-Error-Rate kann ich dir das aber belegen.

Vielleicht erinnerst du dich an diesen Beitrag von mir, falls du den Thread damals verfolgt hast. Schau dir die beiden Bilder an. Auf dem zweiten Bild siehst du den Verlauf des "Aktuellen Wertes" der Lesefehlerrate. Diese Platte habe ich immer noch und vor kurzem ein Screenshot der Smart-Werte erstellt (siehe Anhang). Wie du sehen kannst ist bei der Smart-ID 01 sowohl der "Aktuelle" als auch der "Schlechteste Wert" wieder auf optimale 100 und der Rohwert zurück auf 0 gesetzt. Vergleiche meinetwegen die Seriennummern. Das ist dieselbe Platte. Und der Smart-Screenshot ist wenige Wochen alt. Die CDI-Version 6.1.12 gab es Ende 2011 noch nicht.

Um das noch mal klarzustellen. Ich bestreite nicht, dass es Unterschiede in der Zählweise und dem Verhalten bei Smart gibt. Das weißt du genauso gut wie ich. Auch der "Schlechteste Wert" von C7 kann bei der ein oder anderen Marke bzw. dem ein oder anderen Modell dauerhaft gespeichert bleiben. Dass es aber nicht immer der Fall, bzw mittlerweile (bei den wenigen verbliebenen Festplattenherstellern) nicht mehr die Regel ist (falls sie das jemals war), konnte ich mehrfach beobachten und habe es live miterlebt.

/Edit
@Katzenjoghurt
Hast du die Platte mal ackern lassen, wie ich es im Beitrag #49 vorgeschlagen habe? Das dauernde Tippen auf F5 bringt dir gar nichts.
 

Anhänge

  • 5K3000_SMART.png
    5K3000_SMART.png
    105,5 KB · Aufrufe: 104
Zuletzt bearbeitet:
Wenn es mittlerweile oft drängt sich der Verdacht auf, dass man die Laufwerke "gesundbeten" möchte um Garantieforderungen zu minimieren. Ansonsten sieht man z.B. bei bei den S.M.A.R.T. Werten der Micron C400 auch gut, was da so manchmal gemacht wird:
SMART ID 1: Raw Read Error Rate
Attribute Flags (0x32)
• Warranty = 0
• Offline = 1
• Performance = 0
• Error Rate = 0
• Event Count = 1
• Self-Preservation = 1
Current Value (8 bits)
This value is the total number of correctable and uncorrectable ECC error events divided
by the total host pages read over the life of the drive.
Note that ECC errors occurring while reading non-user data will still contribute to this
rate. The Current Value will not be calculated and remains as 0x64 until the host read
page count is not less than (100,000 × total block count ÷ 2).
Worst Value (8 bits)
The worst value of this field is the lowest value of the Current Value field ever calculated
over the life of the drive, always between 1% and 100% (0x01 to 0x64).
Raw Data (48 bits)
This data field holds the raw sum of correctable and uncorrectable ECC error events
over the life of the drive. If this ever exceeds 0xFFFFFFFFFFFF, this value will wrap
around.
Reserved/Threshold (8 bits)
The threshold for this attribute is set to 0x32 (50%).
Das ist eben das "übliche Verhalten", aber jeder Hersteller hat die Freiheit es anders zu definieren und implementieren, ohne es auch nur zu dokumentieren.

SMART ID 187: Uncorrectable Errors Count
Attribute Flags (0x32)
• Warranty = 1
• Offline = 0
• Performance = 0
• Error Rate = 0
• Event Count = 1
• Self-Preservation = 1
Current Value (8 bits)
This value is hard-coded to 100% (0x64).
Worst Value (8 bits)
This value is hard-coded to 100% (0x64).
Raw Data (48 bits)
This value is the total number of UECC errors reported by the sequencer. This reflects
the number of hard data errors, which cannot be recovered by the drive's error correction
code.

SMART ID 188: Command Timeout Count
Attribute Flags (0x32)
• Warranty = 0
• Offline = 1
• Performance = 0
• Error Rate = 0
• Event Count = 1
• Self-Preservation = 1
Current Value (8 bits)
This value is hard-coded to 100% (0x64).
Worst Value (8 bits)
This value is hard-coded to 100% (0x64).
Raw Data (48 bits)
This value is the total count of host command timeouts over the life of the drive. A command
timeout reflects the inability of the device to respond to a host command in the
amount of time specified by the host.

Die Flags geben übrigens an, ob es ein Counter ist oder nicht, aber das z.B. bei den beiden Attributen der Aktuelle Wert immer 100 ist und somit nie ein Problem signalisiert, ist allerdings schon mal fragwürdig.

SMART ID 199: Ultra-DMA CRC Error Count
Attribute Flags (0x32)
• Warranty = 0
• Offline = 1
• Performance = 0
• Error Rate = 0
• Event Count = 1
• Self-Preservation = 1
Current Value (8 bits)
This value is hard-coded to 100% (0x64).
Worst Value (8 bits)
This value is hard-coded to 100% (0x64).
Raw Data (48 bits)
This value is the cumulative number of CRC (cycle redundancy check) error counts.
This is a count of errors that occur on the interface, without distinguishing between device
and host problems.
Bei den Ultra-DMA CDC Fehler ist es das gleich, da kann auch nie was anderes als 100 kommen, was bei andere Herstellern möglicherweise ähnlich "gelöst" ist. Leider findet man in keinen Test oder Review eine Bewertung der S.M.A.R.T. Attribute. Die interessieren nur so ein paar Verrückte wie uns, für den Rest der User ist das meist unbekanntes Terrain :D
 
Bei SSDs wird bezüglich Smart sowieso einiges anders gemacht. Dass irgendetwas in Smart "hard-coded" ist, habe ich bei HDDs jedenfalls noch nicht erlebt. Du etwa?
 
Okay...
Hatte heute denselben Fehler nochmal... auf einer anderen Platte.
Wieder dasselbe Szenario: Rechner aus Ruhezustand geweckt und ... BÄMM! Spin-Up Time: 1

Ich wette, hier ist etwas anderes faul und es hängt irgendwie an der Stromversorgung.
(Auch wenn die Platten zuvor in 'nem System mit 'nem 450 oder 500W Netzteil hingen und
jetzt an 'nem be quiet! DARK POWER PRO 10 550W.)
 
Vielleicht ist es der Stecker des Stromkabels ggf. Molex Adapters. Die Federkraft kann bei den Steckern schon mal nachlassen,
 
Oder er hat komplett 'n Schuss weg.
Erst jetzt wird mir bewusst, dass an dieser Platte nun Strom- und S-ATA Kabel der
Platte hängen, die ursprünglich angeblich in den letzten Zügen hing.

Blöd auch, dass der Fehler so sporadisch auftritt....

(Adapter hängt keiner dran)
 

Ähnliche Themen

1
Antworten
6
Aufrufe
4.066
1
Zurück
Oben