Raid5 am ICH10 - "failed"

Sieht auf den ersten Blick erfrischend richtig aus.
Auswertung erfolgt morgen... äääh ... heute früh
Ergänzung ()

So, was bisher in Erfahrung gebracht werden konnte, in aller Kürze:
Code:
Analyzing: \\Pc10\SharedDocs\fl4sh3r RAID5\Platten\harddisk1.txt

===== MBR INFORMATION ===== at LBA=0
00000001FE 55AA              Boot signature='55AA'... valid
.                            ... Partition Table entry 1 ...
00000001C2 07                Partition Type: NTFS
00000001BE 80                Boot indicator: *** ACTIVE ***
00000001C6 00080000          Start    (LBA):        2048 0-32-32
00000001CA 00200300          Size  (Blocks):      204800 12-190-50     100MiB    0.10GiB
.                            ... Partition Table entry 2 ...
00000001D2 07                Partition Type: NTFS
00000001CE 00                Boot indicator: inactive
00000001D6 00280300          Start    (LBA):      206848 12-223-19
00000001DA 00D86618          Size  (Blocks):   409393152 25483-139-0  199899MiB  195.21GiB
.                            ... Partition Table entry 3 ...
00000001E2 07                Partition Type: NTFS
00000001DE 00                Boot indicator: inactive
00000001E6 00006A18          Start    (LBA):   409600000 25496-107-19
00000001EA 0090065C          Size  (Blocks):  1543933952 96105-113-8  753874MiB  736.21GiB
.                            ... Partition Table entry 4 ...
00000001F2 00                Partition Type: unused partition entry
Das sieht erwartungsgemäß gut aus
Code:
Analyzing: \\Pc10\SharedDocs\fl4sh3r RAID5\Platten\harddisk1.txt
Analyzer Version: 2009072701

===== RAID MPB INFORMATION ===== when MaxLBA=976773168 then from Sector==>976773166 downwards
7470C05C18 312E322E3032      .... Version: 1.2.02
7470C05C38 03                # configured disks: 3
7470C05C39 01                # configured volumes: 1
.                            --- HDD [0] ---
7470C05CE0 3831333330360000  .. Serial: "S20BJ90Z813306"
7470C05CE8 3060383A          Sectors total: 976773168
7470C05CEC 00000000          SCSI ID: Port 0 Path 0 Target 0 Lun 0
.                            --- HDD [1] ---
7470C05D10 3831333331343A30  .. Serial: "S20BJ90Z813314:0"
7470C05D18 0060383A          Sectors total: 976773120
7470C05D1C FFFFFFFF          MISSING!
.                            --- HDD [2] ---
7470C05D40 3831333334370000  .. Serial: "S20BJ90Z813347"
7470C05D48 3060383A          Sectors total: 976773168
7470C05D4C 00000100          SCSI ID: Port 0 Path 0 Target 1 Lun 0
.                            --- Volume [0] ---
7470C05D68 5261696400000000  .
7470C05D70 9295720580FAFFFF  .. Map Name: "Raid"
7470C05D78 0098707400000000  Sectors: 1953536000
7470C05D84 00000000          Reserved Sectors: 0
7470C05DD8 00000000          volume LBA0 offset(LBAs or stripes? - LBAs will run in >2TiB bug): 0
7470C05DDC 084D383A          # Sectors/member: 976768264
7470C05DE0 98707400          # Stripes/member: 7631000
7470C05DE4 8000              # Sectors/Stripe: 128 ==> stripesize=64KB
7470C05DE6 03                Volume status: FAILED
7470C05DE7 05                RAID Level: RAID-5 Array
7470C05DE8 03                # member disks: 3
7470C05DE9 01                # domains: 1
7470C05DEA 00                failed disk: HDD[0]
7470C05A14 === end of metadata ===

Analyzing: \\Pc10\SharedDocs\fl4sh3r RAID5\Platten\harddisk2.txt
Analyzer Version: 2009072701

===== RAID MPB INFORMATION ===== when MaxLBA=976773168 then from Sector==>976773166 downwards
7470C05C18 312E302E3030      .... Version: 1.0.00
7470C05C38 01                # configured disks: 1
7470C05C39 00                # configured volumes: 0
.                            --- HDD [0] ---
7470C05CD8 533230424A39305A  .
7470C05CE0 3831333331340000  .. Serial: "S20BJ90Z813314"
7470C05CE8 3060383A          Sectors total: 976773168
7470C05CEC 00000200          SCSI ID: Port 0 Path 0 Target 2 Lun 0
7470C05CF0 39                Status Flags: Disk is: Spare, Usable, Detected, Claimed,
7470C05D08 === end of metadata ===

Analyzing: \\Pc10\SharedDocs\fl4sh3r RAID5\Platten\harddisk3.txt
Analyzer Version: 2009072701

===== RAID MPB INFORMATION ===== when MaxLBA=976773168 then from Sector==>976773166 downwards
7470C05C18 312E322E3032      .... Version: 1.2.02
7470C05C38 03                # configured disks: 3
7470C05C39 01                # configured volumes: 1
.                            --- HDD [0] ---
7470C05CE0 3831333330360000  .. Serial: "S20BJ90Z813306"
7470C05CE8 3060383A          Sectors total: 976773168
7470C05CEC 00000000          SCSI ID: Port 0 Path 0 Target 0 Lun 0
.                            --- HDD [1] ---
7470C05D10 3831333331343A30  .. Serial: "S20BJ90Z813314:0"
7470C05D18 0060383A          Sectors total: 976773120
7470C05D1C FFFFFFFF          MISSING!
.                            --- HDD [2] ---
7470C05D38 533230424A39305A  .
7470C05D40 3831333334370000  .. Serial: "S20BJ90Z813347"
7470C05D48 3060383A          Sectors total: 976773168
7470C05D4C 00000100          SCSI ID: Port 0 Path 0 Target 1 Lun 0
.                            --- Volume [0] ---
7470C05D70 9295720580FAFFFF  .. Map Name: "Raid"
7470C05D78 0098707400000000  Sectors: 1953536000
7470C05D84 00000000          Reserved Sectors: 0
7470C05DD8 00000000          volume LBA0 offset(LBAs or stripes? - LBAs will run in >2TiB bug): 0
7470C05DDC 084D383A          # Sectors/member: 976768264
7470C05DE0 98707400          # Stripes/member: 7631000
7470C05DE4 8000              # Sectors/Stripe: 128 ==> stripesize=64KB
7470C05DE6 03                Volume status: FAILED
7470C05DE7 05                RAID Level: RAID-5 Array
7470C05DE8 03                # member disks: 3
7470C05DE9 01                # domains: 1
7470C05DEA 00                failed disk: HDD[0]
7470C05A14 === end of metadata ===
Da ist einiges durcheinandergekommen, weil die Platte2 rausgenommen und als Spare dazugekommen ist und die anderen einzeln dranhingen.
Merkwürdig ist die RAID-Version auf Platte2.
Ich werde mir das noch ein wenig genauer ansehen und am Abend gehts dann möglicherweise weiter...
 
Eigentlich erfrischend gut, aber ich bin mit anderem Problem leider busy.
Kann daher vorerst hier nicht weitermachen - bitte Geduld
 
Ich sehe gerade - laut den Meta Daten ist HDD 0 für den "Failed"-Status des Arrays verantwortlich - HDD 1 ist im "Spare"-Modus. Wird das nicht zu problemen führen? Wird das Array überhaupt einen Rebuild aus HDD0 und 2 machen können?
 
Das kommt wohl daher:
Zusätzlich waren plötzlich zwei Festplatten als "Offline Member" gemeldet. Nach etwas Kabelvodoo war es mir wieder möglich zwei Platten als "Member Disk" zum laufen zu bekommen - Array Status aber weiterhin auf failed. Daraufhin hab ich die "Offline Member" Platte aus dem Array gelöst , eine weitere Platte geschnappt und darauf Win 7 x64 installiert. Die dritte Platte ist weiterhin angestekckt und wird vom Raid Bios als "non-raid Disk" bezeichnet
und hat nichts zu sagen, weil damit sowieso alle Matadaten verbockt wurden
 
Naja du musst zugeben, dass es für einen "Raid-Laien" naheliegend ist, die Verkabelung zu prüfen und die Kabel untereinander zu tauschen.
 
Deswegen sollten RAID-Laien auch keine RAIDs betreiben.

Beispiel: Angenommen, Platte A,B,C

Kabel an B wird defekt. Dann steht auf A und C dass B ausgefallen ist und auf B, dass alle OK sind(weil er dort nichts mehr hinschreiben konnte).

Dann tauscht Du das Kaputte Kabel von B auf A
Dann steht auf A, die damit nicht ansprechbar ist, dass B ausgefallen ist (von vorher)
Auf C findet er B ausgefallen und wieder da, rebuild geht nicht, weil A ausgefallen ==> failed
und auf C steht dann B und A ausgefallen

Dann tauscht du das Defekte Kabel auf C, somit ist C nicht mehr erreichbar.
Auf A steht, dass B ausgefallen ist(von vorher) und rebuild geht nicht, weil C nicht da ist ==> failed
auf A wird geschrieben, dass B und C ausgefallen ist.

Dann tauscht Du das defekte Kabel, A,B,C sind alle wieder ansprechbar.
Auf A steht, dass B und C ausgefallen sind
auf B steht, dass alles OK ist
Auf C steht, dass A und B ausgefallen sind
==> inkonsistenz, failed
auf B wird geschrieben, A und C failed (weil neuerer Timestamp als auf B)
 
Zuletzt bearbeitet:
Gibt es eigentlich eine Möglichkeit das CCTL-Feature in der Firmware der Platten zu aktivieren? Allein das würde zumindest die Wahrscheinlichkeit vermindern dass der Controller eine Platte als defekt markiert.
 
Hmm - habe hierzu ein Tool gefunden. "HDAT2" heißt das Programm und es soll wohl tatsächlich möglich sein CCTL zu aktivieren - dummerweise speichert die Festplatte die Einstellung aber nicht und nach einem Neustart ist die die Funktion wieder deaktiviert.
 
Bei Samsung Platten ist es schon ein Abenteuer, die auf SATA 1.5Gb/s zu konfigurieren.
Ich hab echt den Überblick verloren, bei welchen man das wie einstellen kann, und ob es einen Power-cycle übersteht.
 
Also in dem Fall die Sache lieber sein lassen - ok.

Ohne jetzt ungeduldig zu erscheinen - darf ich fragen wann es weiter geht? :D
 
Morgen schlägt es den Gong zur letzten Runde. Dann sollte wieder Platz bei mir im Hirn für was anderes sein...
 
Hallo, ich lese gerade einige Threads zum Thema RAID wiederherstellen, und wollte
mich mal bei Ernst@at für einige, für mich, wichtige Info's bedanken.

Kurze Frage: Leider gehts im Thread "Intel SCRS 28x RAID5 zerlegt" nicht mehr weiter ?
Hätte mich interessiert, obs doch noch geklappt hat... Ansonsten
Fl4sh3r: Viel Glück.
 
Leider gehts im Thread "Intel SCRS 28x RAID5 zerlegt" nicht mehr weiter
Doch, nur unterirdisch. Das ist der mit der höchsten Priorität, mit dem ich seit 2 Wochen intensiv im Clinch liege, und der heute wohl endgültig abgeschlossen werden kann.
Ein Abschlussbericht folgt dann dort.
 
So, ich muss mich hier erst wieder einlesen, was ich bis jetzt verbrochen habe...
Weiß noch nicht, ob ich noch dazukomme, heute hier weiterzumachen, morgen früh klappts aber bestimmt :D
 
Also bisher hat sich hier noch nicht viel getan - habe dir nur die Metadaten des Arrays zugeschickt. :D
 
Ja, die hab ich damals angesehen und mir gerade eine Strategie zurechtgelegt, als der andere GAU dazwischenfunkte... Muss mich da wieder eindenken...
 
@Ernst

hast du vielleicht eine Anlaufstelle im web, die einem den ganzen Raid-Aufbau etwas näher erklärt und einem beibringt wie man die Metadaten richtig interpretiert?
 
Zurück
Oben