Dynamic Spanned Volume (raid0),2 Member at risk,Online (Errors),Defekte hdd tauschen?

floogy

Cadet 4th Year
Registriert
Jan. 2011
Beiträge
74
Hallo,

ich habe ein Problem mit einem NAS, dessen 4x 2TB Platten in Dynamische Datenträger aufgeteilt sind (Windows XP embedded 2002, SP3, 32bit). Ein 'Simple Volume' C: 4GB und ein 'Spanned Volume' D: 8TB.

Wo ist der Unterschied zu raid 0, oder handelt es sich um raid 0? Im 'Disk Management' Wird Dynamic Online (Errors) angezeigt, oder auch nur Online (Disk 1 und 3) und 'Simple Volume' Healthy System (C:, 4GB) oder 'Spanned Volume', Healthy (Page File) (D:, 8TB)

Ich mache gerade eine Spiegelung mit rsync (DeltaCopy), die noch etwa bis Dienstag benötigen wird.
Dann möchte ich vom 4GB C: per DriveImageXML von einer LivePE ein aktuelles Image schreiben.
Ein Backup sollte damit dann vorhanden sein. Ich weiß, aber bei der Aktualisierung des Spiegels mit robocopy hatte ich einen Slash vergessen, womit der Spiegel eines 2TB großen Verzeichnisses gelöscht wurde - ungünstig. Dieser ist wiederhergestelt, allerdings fehlen nun immer noch 1,6TB, die ich vorher außer acht ließ, nun, in dieser Situation aber doch spiegeln möchte. 8TB benötigen mit rsync auf der lahmen Kiste voraussichtlich 8-10 Tage, 7,5TB sind belegt.

Zwei Harddisks Disk0 und Disk2 werden mit Online (Errors) angezeigt. Disk2 enthält C: und D: alle weiteren Festplatten sind Member für D:

smartmontools:
pd0, pd1, pd2, pd3

via C7 1000MHz CPU

Demnach ist nur pd2 mit SMART-Werten ID197 und 198 mit 9 unkorrigierbaren Sektoren beschädigt.
Allerdings weisen insgesamt drei Festplatten unter ID5 hohe Reallocation Sector Counts auf, pd2 2351 kaputte Sektoren, die ersetzt wurden, 9 stehen noch aus und können nicht mehr ersetzt werden.

Ich hatte bereits das Problem, das NAS nicht mehr starten zu können, konnte aber mithilfe einer PE Live-CD ein chkdsk auf c: machen, was bad blocks in config\SYSTEM und SOFTWARE, also in der Registry und zwei weiteren Dateien ergab (.net und midori, beide konnten später ersetzt werden). Die Registry konnte ich aus der Live-Umgebung durch Kopien unter System Volume Information\...\Snapshot nach dem chkdsk wieder herstellen. chkdsk D: ergab nach über 24h keine Fehler in bad blocks.

Nun läuft das NAS wieder, und die Spiegelung ist fast fertig.

Da die Spiegelung, und damit auch Rückspiegelung 8-10 Tage dauert möchte ich versuchen, die bereits defekte Platte z.B. mit gddrescue auf eine neue 2TB Festplatte Sektor per Sektor zu kopieren und zu ersetzen.

Würde das NAS das dynamische übergreifende Volumen nach dem Austausch fehlerfrei erkennen?

Spätere Schritte sind dann Aufbau eines größeren Ersatz-NAS mit Raid5 oder besser 6 oder 10 auf das dann online die Daten gespiegelt würden. Das bestehende NAS würde ich dann in den verdienten Ruhestand versetzen.

Um die Downtime von 8-10 Tagen auf vieleicht 2 Tage zu verkürzen, wäre dies mein Ansatz das Problem zu lösen.

Ist dieser Plattenaustausch erfolgversprechend? Was ist zu beachten?

Vielen Dank im Voraus!
 
Zuletzt bearbeitet:
Wäre es ein Raid0, dann würde es jetzt komplett im Arsch sein.
Spanned bedeutet dann wohl in dem Fall, dass es nur ein zusammengesetzter Array ist, meint .. wenn eine Platte voll ist, wird auf der nächsten weitergeschrieben. JBOD wäre die "richtige" Raid-Bezeichnung dafür.
 
Hallo HisN, vielen Dank für die Info. Denkst Du, dass ich mit roadkill's raw copy, dd oder besser gddrescue aus einer Live-Umgebung (PE oder Linux) per blockweisem cloning der gefährdeten Platte, diese auf eine neue Platte übertragen könnte, und den Clone an Stelle der pd2 ins NAS einbauen könnte, und alles wäre wieder in Ordnung?

Das wären nur 2TB Kopierarbeit.
 
Das müßte getestet werden, allerdings wird der Controller erkennen das es eine andere Platte ist (LUN).

@HisN:
Spanned (oder Big/Concat) ist schon korrekt, JBOD ist einfach nur ein Haufen einzeln ansprechbarer Platten.
 
Unter einer virtualbox XP Testinstalaltion hat es mit roadkill's raw copy geklappt. Im Grerätemanager wurde die 'neue Festplatte' sofort erkannt und das Spanned Volume als healthy angezeigt.

Ich werde noch einen Test mit einem Linux-Live-System und gddrescue machen, wegen der fehlerhaften Blöcke, nicht, dass sich raw copy daran die Zähne ausbeißt und abbricht, bzw. durch die retries die Platte unnötig belastet wird und die Gefahr erhöht wird, dass sie sich verabschiedet.

Ich werde berichten. Wenn alle Syncs abgeschlossen sind werde ich sie in zeitnahen Abständen im Taskplaner ansetzen und bis zum Wochenende das NAS so online halten. Zum Wochenende werde ich dann das Cloning der defekten Platte ins Auge fassen. Ich hoffe dann nächste Woche eine tragfähige interims Lösung mit dem repariertem NAS zur Verfügung zu haben und in Ruhe ein Neues mit mehr Redundanz (Raid5/6 oder raidz/2) aufbauen zu können.

Im Notfall muss ich entweder den Mirror freigeben, oder schneller eine andere NAS-Lösung bereitstellen und die Daten aus dem Spiegel rüberschaufeln.
 
Hallo,

ich habe die Festplatte nun mit gddrescue geclont, es ergaben sich 6 Fehler in 4608 Byte in defekten Sektoren.
http://bpaste.net/show/Ve1Lvi1Hl568KNLhDkbD/

Leider funktioniert das aber noch nicht so wie ich mir das vorstelle. Die fehlerhaften Blöcke liegen laut dem letzten chkdsk, vor dem Wechsel der Platten im freien Bereichen, nicht in Datendateien.

Zur Zeit bin ich mit der systemrescuecd sowohl auf dem NAS, als auch auf dem Rechner mit dem ich die Platten geklont habe. In dem NAS ist nun die neue Platte. Das Windows XP PE hat sie nicht erkannt. Im Datenträgermanagment erschien sie als Disk0 dynamic unavailable, ohne eigenschaften wie Größe. Mit testdisk konnte ich aber in C: die Dateien sehen, und wahrscheinlich hätte eine Analyse auch D: zum Vorschein gebracht.

Ich denke aber, dass das Problem die neue GUID der getauschten Platte darstellt, und, dass das XP PE den SB-Stick, von dem gestartet wird Laufwerk C: zuweist.

Es taucht auch eine Disk auf dynamisch 'missing' reactivation klappt natürlich nicht. Das ist die kappute, aus dem System entfernte Platte.

Gibt es eine Möglichkeit die GUID der neuen Platte anzupassen, und ihr die GUID der alten Platte zu verpassen?

Hier die Ausgaben gdisks und fdisks

--

geklonter Platte (ins NAS eingebaut)
http://bpaste.net/show/0BnnAdEmWgcLMm5UDsvM/
Code:
Disk identifier (GUID): DDC06EF7-126B-4820-94F8-176808680491 (gfdisk)
Disk identifier: 0x245d1b1a (fdisk)
Partitionen (blkid)
/dev/sdc1: UUID="087C4B2C7C4B143A" TYPE="ntfs" 
/dev/sdc2: UUID="5A50239C50237DBF" TYPE="ntfs"

Hier das Plattenende (geklont)
Code:
~# dd if=/dev/sdc of=/dev/stdout bs=512 count=1 skip=3907029167 2>/dev/null|od -t x1 -
0000000 24 47 41 46 52 10 41 08 00 00 00 00 00 00 00 00
0000020 00 00 00 00 00 00 00 00 00 00 6f 80 e0 e8 00 00
0000040 00 00 00 08 00 00 00 00 00 00 00 00 00 00 00 00
0000060 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
*
0000400 21 31 32 2f 33 30 2f 32 30 30 38 2d 4e 56 2d 4d
0000420 43 50 36 31 2d 36 41 36 31 4b 47 30 41 43 2d 30
0000440 00 24 1d 61 e7 6e 00 00 00 00 00 00 00 00 00 00
0000460 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
*
0001000

__

Original Platte (PC mit dem geklont wurde):
http://bpaste.net/show/cCgV8SAZKM9Fyl2middu/
Code:
Disk identifier (GUID): 0A7D2B2C-B249-4F23-BB2F-5E08AE897B63 (gdisk)
Disk identifier: 0x245d1b1a (fdisk)
Partitionen (blkid)
/dev/sda1: UUID="087C4B2C7C4B143A" TYPE="ntfs" 
/dev/sda2: UUID="5A50239C50237DBF" TYPE="ntfs"

Hier das Plattenende (original)
Code:
~# dd if=/dev/sda of=/dev/stdout bs=512 count=1 skip=3907029167 2>/dev/null|od -t x1 -  
0000000 24 47 41 46 52 10 41 08 00 00 00 00 00 00 00 00
0000020 00 00 00 00 00 00 00 00 00 00 6f 80 e0 e8 00 00
0000040 00 00 00 08 00 00 00 00 00 00 00 00 00 00 00 00
0000060 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
*
0000400 21 31 32 2f 33 30 2f 32 30 30 38 2d 4e 56 2d 4d
0000420 43 50 36 31 2d 36 41 36 31 4b 47 30 41 43 2d 30
0000440 00 24 1d 61 e7 6e 00 00 00 00 00 00 00 00 00 00
0000460 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
*
0001000

Plattenanfang und weitere Sektoren-Stichproben (s.u.) waren ebenfalls gleich.

Ich denke, dann müsste es klappen.

Starte ich von der 'neuen' Platte, so wird der Bootloader erkannt und es erscheint das Windows XP embedded Bootmenü. Leider endet das in einem Stop 7b
http://technet.microsoft.com/en-us/library/cc753029.aspx
Ergänzung ()

Hm, sollte das doch nicht gehen?
http://technet.microsoft.com/en-us/library/cc753750.aspx

Jedenfalls zeigen gdsk oder sgdsk bei jedem Aufruf zur Anzeige der Partitionen neue GUID, diese scheint nicht auf der Festplatte hinterlegt zu sein.
Code:
% for i in {1..4};do gdisk -l /dev/sda|grep identifier;done
Disk identifier (GUID): 0283D272-33DD-40B1-B2E7-8B4B81F64AED
Disk identifier (GUID): 0DA8CB07-24C6-44FA-93F6-E449612C572F
Disk identifier (GUID): 995FABBD-4658-4C78-9761-99D4B5406620
Disk identifier (GUID): 08DF64FB-3FB4-4757-BCC6-4A0283238733

Ein Vergleich verschiedener Abschnitte
Code:
dd if=/dev/sda of=/dev/stdout bs=512 count=10 skip=0 2>/dev/null|od -t x1 -
dd if=/dev/sda of=/dev/stdout bs=512 count=10 skip=2000000 2>/dev/null|od -t x1 -
Zeigt auf beiden Platten die selben Datenblöcke, bit für bit.

Hat jemand vielleicht eine Idee?
Ergänzung ()

Anbei noch ein paar Abbildungen:
Die Datenträgerverwaltung
diskmanagement.jpg

Testdisk auf Disk0 (geklonte neue Platte, smartstatus ok)
testdisk_NAS_5.png testdisk_NAS_4.png testdisk_NAS_3.png testdisk_NAS_2.png testdisk_NAS_1.png

Die Daten sind also da. Die Platte wird nur nicht anstelle der Missing (original, defekt) genommen.

Mit smartctl kann man sehen, dass sich die Platten in der 'LU WWN Device Id' unterscheiden.
Wie schon Inzersdorfer anmerkte. (obwohl LUN wohl etwas anderes ist. Das NAS hat zwei Platten an PATA IDE Ports angeschlossen, die anderen beiden an einem Sil SCSI/SAS Controller. Die betroffene hängt am IDE-Controller.)

Hat jemand hiermit Erfahrungen? Vielleicht kann man ja in der Registry den Identifier anpassen?

artax.karlin.mff.cuni.cz/~nozkj1am/ostatni/windows/BOOT.html
So, you've decided to move your drive with Windows 2000 (or XP) to a new system, or upgraded your motherboard, and you now get the dreaded blue screen of death before the operating system gets to the desktop. All you get is a STOP 0x0000007B error (INACCESSIBLE_BOOT_DEVICE).
 
Zuletzt bearbeitet:
Zurück
Oben