Intel Raid 10 failed trotz drei aktiver Platten

Im HxD ist die physical hard Disk 1 Dein Notsystem,
die Memberplatten hard disk 2,3,4 und 5.

Die Austausch-Platte sollte eigentlich die 3 sein, warum dann aber die 4 einen MBR draufhat...
Naja, werden wir ja sehen.

Wenn Du dann die SMART und Info-Werte der Platten erstellt hast, geht es gleich munter weiter:

Im HxD sind die physical hard disk Nummern um 1 höher als in der Datenträgerverwaltung angezeigt

HxD Aufruf unter User mit Administratorrechten (oder per rechtklick - Ausführen als ...)

========= Überprüfen der Anzeigeeinstellungen, bei Bedarf richtigstellen
- Menü: Extras/Options.../View
Bytes per row: 16
Byte Group size: 1
Charset: ANSI
Offset-base: hexadecimal
- HxD beenden


- Menü: Extras/open disk/physical disk/hard disk 2 (Häkchen bei "open as readonly" NICHT entfernen)

========= extrahieren Sektor 0-7
- Menü: Edit/select block/start-offset: 0 , length: 1000, hex, OK
- Menü: Edit/copy as.../ editor view (überträgt den markierten Inhalt in die Zwischenablage)
- Menü: File/New (es erscheint in der Anzeige ein zweiter Reiter "untitled1")
- in das kleine punktierte Rechteck rechts unter ... 0E 0F klicken
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- den Cursor an der Endposition belassen, nicht in der Anzeige herumklicken!

========= extrahieren maxLBA-4 (RAID-Metadaten)
- auf Reiter "harddisk 2" klicken
- in der Menüzeile rechts auf den Button ">|" anklicken, danach auf "<" drei Mal klicken (Positionierung auf letzten Sektor und dann drei Sektoren nach vorne)
- Menü: Edit/select block/(den eingetragenen Start-Offset belassen) length: 800, hex, OK
- Menü: Edit/copy as.../ editor view (überträgt den markierten Inhalt in die Zwischenablage)
- Reiter "untitled1" anklicken
- Strg+V (überträgt den Inhalt aus der Zwischenablage) im popup "file size change": OK
- Menü: File/Save as... einen Ordner auswählen und als Dateinamen "harddisk2.txt" /speichern
- HxD beenden

Das gleiche machst Du dann noch statt mit hard disk2 auch mit harddisk3 , harddisk4 und mit harddisk5
Die vier .txt Files gezippt in den Anhang stellen,
 
OK, ich werde das mal auswerten, stelle das Ergebnis dann irgendwann in der Früh hier rein - weiter gehts dann morgen, etwa ab 18:00.
 
Super, danke schonmal für die Hilfe! Bis morgen
Ergänzung ()

Eins ist mir noch eingefallen...
Ich hatte die neue Platte zwischenzeitlich mal als 'SPARE' gekennzeichnet.
Hatte aber nichts gebracht. Also sind bestimmt auch auf der neuen Platte RAID-Metadaten drauf.
 
Im Anhang die Auswertungen
auf harddisk4 ist wie schon vorausgesehen, nur ein leerer Metadateneintrag drauf.
Die anderen auf hardddisk 2,3 und 5 sind ident.
Auf harddisk2 findet sich auch der MBR des Arrays mit 1862GiB auf 4 Partitions.

In den SMART-Daten bemerkenswert:
Port[0] Harddisk2 hat 8 G-Sense Ereignisse
Port[2] Harddisk3 hat 9 Write Error
Port[1] Harddisk4(die neue) ist unauffällig
Port[4] Harddisk5 hat 1 G-Sense und 15 Write Errors

Soweit mal nicht bedenklich.
Die Platte an Port0 und 1 tragen die geraden, die anderen beiden die ungeraden Stripes.

Der Controller hat das Handtuch geworden, als die HDD an Port1 im Rebuild (Übertragen der Daten von Port0) war und dann irgendwas(keine Ahnung) an der HDD von Port0 nicht mehr gepasst hat.

Weitere Anweisungen folgen in Kürze...
 

Anhänge

Zuletzt bearbeitet:
Ja genau, eine Platte war im Rebuild, als plötzlich alles stand und gar nichts mehr ging.
Auch Windows war komplett eingefroren. Zu dem Zeitpunkt muss die Platte an port1 den Geist aufgegeben haben.
Weißt Du, warum der Controller das Volume als FAILED eingestuft hat? Meiner Meinung nach müssten doch alle notwendigen Daten für einen rebuild auf den Platten liegen. (?)
Ergänzung ()

Die G-Sense-Ereignisse verstehe ich auch nicht. Vielleicht bin ich gegen das Gehäuse gekommen? Reicht sowas schon oder weißt Du wie "heftig" eine Erschütterung sein muss, um ein G-Sense-Ereignis auszulösen?
 
Zuletzt bearbeitet:
Warum der Array auf FAILED gegangen is, lässt sich nicht nachvollziehen.
Tritt vornehmlich bei Intel auf. Manchmal auch ohne erkennbaren Grund(Dank nicht implementierten Logs dazu bleibt man auch dumm :( )
Zu den G-Sense habe ich keine Erfahrungswerte. Erdbeben? Schwerlastwagen? Mit der Faust auf den Tisch, dass der PC gehüpft ist? :)

Die weitere Vorgangsweise:
- Sichern des MBR
- Verifizieren der Inhalte auf den 3 Platten und Markieren
- Kopieren des Platteninhaltes von harddisk2 auf die neue harddisk4 (erspart dann das Rebuild und macht gleichzeitig eine Lesbarkeitsprüfung)
- Im Bios auf RAID, Array auflösen und neu definieren
- Endcheck
- MBR restore

Ich erstell mal die Anweisungen für die nächsten beiden Schritte.

In der Zwischenzeit kannst Du Dir schon mal für den dritten Step eine ==> Boot-CD runterladen und brennen und Dir ==> die Beschreibung zu Gemüte führen :D falls Linux nicht zu Deinem Erfahrungsschatz gehört
 
Zuletzt bearbeitet:
:) Die Beschreibung hab ich mir zu Gemüte geführt. Die Rescue-CD ist auch gebrannt.
Ergänzung ()

An einen Schwertransport kann ich mich nicht erinnern, aber das mit dem Auf-den-Tisch-hauen kann gut sein! ;)
 
- Menü: Extras/open disk/physical disk/hard disk 2 (Häkchen bei "open as readonly" nicht entfernen)

========= sichern MBR
- Menü: Edit/select block/start: 0 ; length: 200, hex, OK
- Strg+C (Kopiert es in die Zwischenablage)
- Menü: File/New (es erscheint ein Reiter "untitled1")
- Strg+V (überträgt es aus der Zwischenablage - bei popup "File Size change": OK)
- Menü: File/Save as... Ordner wählen und dateiname "MBR.bin"
- Menü: File/Close (es erscheint wieder die markierte Anzeige der hard disk)

Jetzt gibst Du der Reihe nach einzeln folgende Sektornummern in der Menüzeile in das Sektoreingabefeld ein (copy&paste) und drückst dann Enter(Eingabetaste), damit er auch an diese Stelle positioniert

1024
103424
314572800
1134045184

Am Beginn jedes dieser Sektoren muss rechts "ëR.NTFS ....." stehen



- Menü: File/Close
- Menü: Extras/open disk/physical disk/hard disk 3 (Häkchen bei "open as readonly" nicht entfernen)

Hier kontrollierst Du die Sektoren

103423
314572799
1134045183
1953518591

ob auch hier überall "ëR.NTFS ....." am Beginn steht

- Menü: File/Close
dasselbe wie für harddisk3 wiederholst Du jetzt nochmals auf harddisk5

- HxD beenden
 
Danke für die super Beschreibung!

Den MBR hab ich kopiert. Willst Du ihn Dir anschauen? Hab ihn mal mit drangehängt.

Beim Prüfen der Sektoren stand immer ein "ëR.NTFS ....." am Beginn.
Ich nehme an, das ist gut so. :)
 

Anhänge

Schön, dann machen wir jetzt noch den MBR weg, damit das Linux nicht beim Mountversuch darüber stolpert:

- Menü: Extras/open disk/physical disk/hard disk 2 (Häkchen bei "open as readonly" diesmal entfernen)

========= löschen MBR
- Menü: Edit/select block/start: 0 ; length: 200, hex, OK
- Menü: Edit/Fill selection/hex values: 00/OK
- Menü: Edit/select block/start: 200 ; length: 200, hex, OK
- Menü: Edit/Fill selection/hex values: 11/OK

- Menü: File/Save (schreibt es auf die Platte zurück)
- HxD beenden

Anschließend bootest Du die rescue-CD, und wie in der Beschreibung angeführt, verifizierst Du die richtigen /dev/sd# (#=a,b,c...) anhand der Seriennummer mit dem Befehl

hdparm -i /dev/sd#

input dev ist Seriennummer ...6409
output dev ist Seriennummer ...8065

den logfile legst Du auf Deine Systemplatte (wird sda sein); zugriff darauf mit

ntfs-3g /dev/sda1 /mnt

und dann ddrescue -B -n /dev/sd[input #] /dev/sd[output #] /mnt/rescued.log

Sei sorgfältig in der Wahl der Plattenbezeichnung, Bei einem Kopieren in verkehrter Richtung verschwinden sonst Deine Daten in die ewigen Jagdgründe der IT-Hoppalas!
 
Ich muss schon sagen ... eine super Anleitung!
Der Klonvorgang läuft grade ...
 
wenn das ddrescue fertig ist (ohne Fehler), kannst Du gleich noch ein

dd if=/dev/sd[output #] of=/dev/sd[output #]

nachjagen, damit liest er auf der gerade erzeugten neuen Platte die Sektoren und schreibt sie gleich wieder an die selbe Stelle - damit werden etwaige Defekte gleich mal ausgelagert...

Damit schließe ich die heutige Vorstellung, bin morgen etwa ab 13:00 open end wieder hier - zum Finale
 
Ich wundere mich grade ein bißchen wegen der Geschwindigkeit. Mir kommt es etwas langsam vor.
bei einem Zwischenstand von 'rescued: 38000 MiB' und 'avg rate: 47000 KiB' rechne ich bei einer Gesamtkapazität von 953869 MB eine Dauer von über 5,5 h aus.
Ist das richtig so?
Ergänzung ()

Auch heute nochmal vielen Dank bis hierher! :)
bis morgen!
 
Naja, das kommt daher, weil wir im IDE am selben Channel arbeiten und somit das lesen von der einen/schreiben auf der anderen sich gegenseitig behindert.
Wollte nicht auf AHCI umstellen, weil sonst wieder die Reihenfolge anders ist, was sehr verwirren kann
 
Ok, kann ich den Rechner über Nacht werkeln lassen oder wechselt das OS der rescueCD irgendwann in einen Energiesparmodus und schaltet eventuell die Platten ab?
Ich wünsche eine gute Nacht!
 
Das Klonen war erfolgreich. Ich gehe auch mal davon aus, dass Quelle und Ziel korrekt waren. Sonst werde ich nachher noch für ein paar mehr G-Sense-Ereignisse sorgen! :D

Der Check per 'dd if=/dev/sdd of=/dev/sdd' läuft aktuell.
Ergänzung ()

... der check ist jetzt auch fehlerlos durchgelaufen
 
Danach kannst Du von der neuen Platte noch die SMART-Daten erneut abfragen, ob sich da schon Fehler bei der Aufzeichung ereignet haben.

Habe mich gerade über den von Dir mitgelieferten "Systembericht_RAID10.txt" amüsiert.
Den haben auch ein paar spezielle Dumpfbacken programmiert, da sind einige Fehler drin.

Anschließend den RAID-Mode im BIOS aktivieren und alle Platten "Reset to non RAID disk" machen.
Dann den RAID10 (stripe and mirror)wieder definieren,
Size: max
Stripesize: 64K


Wenn der Array wieder da ist, siehst Du in der Datenträgerverwaltung nach, als welche Datenträgernummer der mit 1862GB angezeigt wird.
Im HxD öffnest du die um 1 höhere physical disk, und wieder das Spielchen mit dem Sektorinhalt kontrollieren:
auf den Sektoren

2048
206847
206848
629145599
629145600
2268090367
2268090368
3907037183

muss überall am Beginn "ëR.NTFS ....." zu sehen sein.

Dann muss man bei RAID10 noch einen weiteren Test machen, um die Reihenfolge der Platten zu verifizieren, weil er nur vom ersten RAID0 liest
 
HDTune gibt mir einen (1) Write-Error auf der neuen Disk an. Ich nehme mal an, das ist kein Problem. Der Copy-Check vorhin gab zumindest keinen Fehler zurück.
Ergänzung ()

Die Sektoren passen auch. An jeder Position steht ein "ëR.NTFS ....." am Beginn.
In der Verwaltung hat der RAID-Datenträger jetzt die Nummer '0'.
 
Zuletzt bearbeitet:
Zurück
Oben