DEGRADED RAID auf Gigabyte P35 DQ6

chew

Cadet 4th Year
Registriert
Okt. 2008
Beiträge
103
hallo,

Vor ca einer Woche fiel während des Windowsbetriebs die SAMSUNG an port 4 (nun wieder betroffen) aus. Das sah so in der Matrix Storage Console aus.

Nach einem Reboot lief die Platte und das matrix RAID wieder normal.
Leider schob ich das Problem auf einen Fußkontakt mit dem Sata Kabel. Ich checkte jedoch die einzigste raid0 Partition auf sensitive Daten.

Folgender Ablauf geschah nun heute früh.
PC normal gestartet. Windows Vista startete jedoch selbst nach 15 minuten nicht ( ladebalken lief und lief).
Deshalb reboot, beim Intel RAID Controller Post wurde nun folgender Zustand angezeigt.


Daraufhin schaltete ich den PC aus und checkte alle Kabel, alles IO. Daraufhin erneuter Reboot , mit seid dem folgendem intel RAID Controller Post.


Meine Vermutung ist ein Hitzeproblem/tod der Elektronik da die nun auf Port 4 betroffene Platte die schlechteste, Lian Li Gehäuse bedingt, Kühlung hat. Die Festplate macht keine ungewöhnlichen Geräuche ( klacken, kratzen )

Folgende Port belegung vor dem matrix RAID Ausfall.
port0: seagate raid0
port1: seagate raid0
port2: dvd rom
port3: samsung backup
port4: samsung raid 0,1 <--- error
port5: samsung raid 0,1

Seid 1996 wahrscheinlich nun die erste defekte ,eines natürlichen Todes gestorbene, Platte bei mir.

Die Daten im raid0 sind eher unwichtig. Wäre es noch möglich an eine Dateiliste zu kommen ?

@Ernst@at : Ist dieser Fehler womöglich wieder Controller bedingt?
 
Zuletzt bearbeitet:
Wahrscheinlich ist deine Samsung tot. ist bei der platte leider mir auch schon passiert, die gehört nicht in ein raid 0. wenn ich das richtig sehe spiegelst du aber mit den samsungs die seagates?
dann solte das raid 0 doch ok sein. nur der mirror ist im eimer. entferne den mirror und versuch es neu. das nächste mal bau ein raid 5 auf, das würde jetzt noch leben und ist (zumindest als hardwareraid auch deutlich schneller)

Wenn das raid 0 tot ist, ist auch die dateiliste weg.
 
Zuletzt bearbeitet:
Da es sich um ein RAID1 handelt, kann es sein, das auch nur der Miiror für eine Diagnose ausreicht.
Mache mal eine Diagnose ob die Partition mit Daten von deiner zweiten Platte angezeigt werden.
Speziell Deeper Search jkann hilfreich sein.

Mache mal eine Diagnose deiner Mirror-Platte mitz Testdisk;
Mache mal eine Diagnose nach dieser Anleitung;

Lade dir mal Testdisk Version 6.12 beta für Windows.
Link dazu gibt es hier;
https://www.computerbase.de/downloads/systemtools/festplatten/testdisk/
Starte Testdisk bestätige bei dem Log-Datei-Screen mit Enter, wähle deine betroffene Festplatte aus und bestätige mit Enter, bestätige bei Partition Table Typ Intel, bestätige bei Analyse mit Enter und setze mir einen Screenshot.
Bestätige auch bei Quick Search mit Enter (wenn nötig wegen Vista-check mit y) und setze mir auch den Screen.
Markiere mal die betroffenen Partitionen und drücke p auf der Tastatur ob deine Daten angezeigt werden oder eine Fehlermeldung.
Zurück kommst du mit q drücken.

Wenn keine Partition mit Daten gefunden wurde;
Bestätige weiter bis du zum Menü kommst wo unten steht [Quit] Deeper [Search] [Write] und gehe mit dem Pfeil auf [Deeper Search] (tiefere Suche) und lasse es laufen.
Setze mir auch einen Screenshot.
Die betroffene Partition sollte wenn du den Screen machst markiert sein.

Markiere mal die betroffenen Partitionen und drücke p auf der Tastatur ob deine Daten angezeigt werden oder eine Fehlermeldung.
Zurück kommst du mit q drücken.

Viele Grüße

Fiona
 
Merkwürdigerweise hat er (nach den hochgeladenen Bildern) zuerst die an Port 5 angemeckert, dann die am Port 4. Der auf diesen beiden Platten befindliche RAID0 wird noch als funktionsfähig ausgewiesen, der dahinterliegende RAID1 als degraded.
Man sollte also nach diesem Status sowohl mit dem RAID0 als auch dem RAID1 Volume noch arbeiten können

nähere Auskunft über den (die) aufgetretenen Fehler erhält man vom RAID-BootROM nicht.

Liegt auf den Platten an Port 4 & 5 am RAID0 das System, von dem Du bootest?

Normalerweise sollte nach einem Rebuid des RAID1 alles wieder im Lot sein - sicherheitshalber sollten die beiden Platten aber (über anderen non-RAID-Controller) auf Fehlereinträge im SMART überprüft werden, ein Error-can könnte zeigen, ob im RAID1-Bereich defekte Sektoren gefunden werden.
Wenn da ein Defekt ersichtlich ist, Inhalt physisch sektorweise auf Ersatzplatte übertragen, die Sektoren 0 sichern und dann den RAID neu anlegen(weil anderer Serial#) - wie schon mal früher :) geübt
 
Zuletzt bearbeitet:
Danke für deine Antwort.

Liegt auf den Platten an Port 4 & 5 am RAID0 das System, von dem Du bootest?
Nein, das liegt auf den seagate an port 0 bzw 1.

Was ist ein "Error-can" ?

Welches tool würdest du für die sektorweise Inhaltsübertragung benutzen ?
 
Ein "Error-can" ist ein HD-Tune Error-Scan , bei dem das S unter den Tisch gefallen ist :)

Zum 1:1 sektorweisen Übertragung fällt mir unter Win EASUS CloneDisk ein, sollte auch mit einer Linux LiveCD mit dd einfach möglich sein
 
Selbst Testdisk kann bereits ein Image (dd format) erstellen!
 
@Mueli: Hier ist ein in-place-replace einer eventuell defekten HDD mit einem "halben" RAID0+1 Matrix drauf angedacht, und nicht das Abziehen eines Images der kompletten Volumes - oder hab ich das falsch verstanden mit "Image"?
 
Es geht doch wohl beides, nur dazu müsste man kurzzeitig das RAID auflösen oder die Disks an andere Ports hängen! Es führen viele Wege nach Rom ;)
 
sowas nervt mich extrem. Die scheis dos tools funktionieren nicht.

Kann ich mit nur einer der Samsung platten am 2. gigabyte sata controller nach windows booten ohne das windows auf der festplatte irgend etwas schreibt bzw diese automatisch ins system einbindet ?

Was mir grad einfällt: Kann ich mit der ubuntu live cd smart werte auslesen ?
 
Zuletzt bearbeitet:
Mir ist nicht ganz klar, was Du jetzt machen willst.
dos tools funktionieren nicht
welche?

Dein Windows System, welches ja auf den Seagate liegt, kannst Du ja Booten.
Auf die Daten am RAID1 der Samsung kannst Du ja dran, weil die HDD am Port5 noch funktioniert.
Was ist mit der defekten am Port4?
gibt die defekte, am jMicron angeschlossen, noch einen Piep von sich, d.h. wird sie im BIOS erkannt und scheint in der Datenträgerverwaltung auf? Sollte so sein, sonst wäre sie im RAID0 schon offline. Die wird nur Defekte im RAID1-Bereich haben

Hast Du inzwischen eine 1TB Ersatzplatte für sie? Steck die an den zweiten jMicron Port
Dann kannst Du doch
- die Smart-Werte der fehlerhaften auslesen
- den Inhalt entweder unter Windows mit dem EASUS-Tool kopieren (was nur funktioniert, wenn es keine I/O Errors gibt)
oder alternativ mit einer LiveCD von systemrescuecd wie in diesem Thread ab Post#25 mit den Platten am jMicron
- von der defekten Platte partiell den Inhalt des RAID0 auf die neue abziehen
- von der intakten Platte partiell den Inhalt des RAID1 auf die neue abziehen

- anschließend MBR von RAID0 und RAID1 sowie den Sektor0 der defekten mit HxD sichern
- die funktionierende und die neue Platte zurück an den ICH, RAID0+1 auflösen und neu definieren
- gesicherte MBR's wieder draufschreiben mit HxD wie beim letzten Mal


Nachtrag (zu dem, was dich bewegt):
Die defekte Platte kann problemlos am jMicron angeschlossen werden, Windows kann damit nichts machen, weil da kein MBR drauf ist (der ist auf der anderen) und bestenfalls von der Datenträgerverwaltung initialisiert werden wollte.
Vielleicht schreibt das BIOS hinten drauf, das ist aber egal; damit kommst Du jedenfalls unter Windows an die SMART-Werte. Wird wohl jede Mege reallocated und/oder vorgemerkte Sektoren zeigen...
 
Zuletzt bearbeitet:
chew schrieb:
Kann ich mit der ubuntu live cd smart werte auslesen ?
Ja, mit den Smartmontools, bei Knoppix sind sie dabei, bei Ubuntu kenne ich den Lieferumfang nicht sonderlich gut. Zur Not installiert man es nach.
 
Danke für eure schnellen Antworten

ubcd 5b12 ( irgend nen kryptischer opcode fehler) und 4.11 ( kein dos tool funzt weil das virtuelle laufwerk nicht richtig funzt)
samsung hutil auf cdrw ( startet nicht, wie immer nur blinkender _ )
Hab kein bock jedesmal ewig in google nach den fehlerursachen zu suchen.

gibt die defekte, am jMicron angeschlossen, noch einen Piep von sich, d.h. wird sie im BIOS erkannt und scheint in der Datenträgerverwaltung auf? Sollte so sein, sonst wäre sie im RAID0 schon offline.

Das ist richtig. Wie gesagt kein klacken, kratzen oder ähnliches. die platte an port4 funktioniert, hat keine smart fehler.

Was ich mich frage. Was ist die ursache für solche spontanen probleme. Der billige onboard raid controller? Wieso startet windows nicht wen nur das unwichtige raid1 betroffen ist?

[FLAME ON]
Momentan kommen bei mir auch noch bluescreens kurz nach dem start oder beim windows start dazu. Die Frage ist nun woran liegts:
am nicht angeschlossenen sony erricson handy ( das nur alte treiber für vista bietet) weswegen der service abstürzt und vista mitnimmt,
an vista selbst ( die schaurige errinerung an WIndows ME werden wach)
oder an einem schleichenden hardware tod.
Wer weiß das schon ohne stundenlang foren durchsuchen zu müssen. Komisch früher hat mir das mal spaß gemacht. Ich wünsch mir die windows 2000 zeiten zurück :) .
[FLAME OFF]

EDIT:
hab jetzt die samsung an port4 in der intel matrix storage console wieder als normal markiert. Der wiederaufbau des raid hat begonnen.

EDIT2:
verdammt rebuild nicht möglich, wurde bei ca 77-80% wieder auf heruntergestuft gestellt und nun hat die samsung an port4 wieder status: fehler aufgetreten.
 
Zuletzt bearbeitet:
Gehe ich richtig in der Annahme das bei dem versuchten rebuild ( der bei 77-80% abgebrochen hat) der inhalt des raid1 von samsung port5 auf port4 kopiert wurde. Es wurden keine Daten zwischen den platten an port4 und 5 verglichen ?

Jetzt hat die samsung an Port4 laut Everest einen SMART Fehler. Jedoch weist Everest den nur als anbieterspezifisch aus!

Da mir das raid0 egal ist kann ich doch einfach die ersatz Samsung an Port4 hängen und den Raid1 rebuild anlaufen lassen ?
Tja denkste, laut intel matrix storage console ist das nicht möglich. Liegt wohl am spezifischen matrix raid, ob das bei einem raid0+1 genauso ist?

Ich hab jetzt die defekte Samsung von Port 4 mit der EASEUS disk copy boot cd sektorweise auf die Ersatzplatte kopiert. Unter Windows war mir das EASEUS todobackup zu unsicher. Laut grafischer Anzeige hätte die kopierte Festplatte nicht den gleichen Inhalt gehabt. Die boot cd funktionierte 1a und hat die mehr als 900 gb in ca 4h kopiert, richtig schnell. Laut Abschlußbericht gab es beim Clonevorgang weder Lese- noch Schreibfehler.

@ernst@at : Problem ist nur das die Ziel Platte 1,03MB zu klein war. Entspricht das der Größe eines HPA? (ka wieviel byte 2113 sektoren belegen) <---- EDIT : passt wohl genau :)

EDIT:aaahh verdammt hab vergessen das immer eine platte am port1 des jmicron hängen muss. Wie krieg ich den HPA jetzt von der neuen ersatz platte runter ?
 
Zuletzt bearbeitet:
ah wieder was gelernt.

Thx schonmal für deine erneute sehr gute Hilfe.

Die 2113 Sektoren werde ich jetzt mit hxd ersetzen, denke mal das ist die beste Möglichkeit?
 
Da hinten stehen sowieso nur ganz am Ende die RAID-Metadaten.
Wenn Du die aber von der alten Platte kopierst, wird das nicht funktionieren, weil da ja die Seriennummer der alten HDD drinsteht.
Daher am einfachsten, die Sektoren 0 der noch funktionsfähigen Memberplatte und der neuen zu sichern, und den Sektor 0 des RAID1-Volumes.
Raid auflösen und neu mit gleicher Plattenreihenfolge (bisher funktionierende an Port4, neue auf Port5) definieren, auf Sektor 0 im RAID0-Array den der funktionsfähigen Memberplatte, bei Stripesize 128K den Sektor 0 der neuen Platte auf Sektor 256 des RAID0 kopieren; und den gesicherten Sektor 0 des RAID1 wieder an Sektor 0 des RAID1 Volumes
 
puh k ich schau ma ob ich das so hinkriege.
 
grrr , erinner mich nicht daran :) , solche verstörenden Erfahrungen verdränge ich lieber ^^
Ergänzung ()

HDD capacity restore bringt "error opening driver". Liegt wohl am vista 64bit.

Mhdd findet die devices nicht und hdat2 sagt "FIRMWARE: corrupted" und erkennt als native area nur 3,77GB (hinter gelbem Pfeil blinkt in rot DIFFERENCE ). Anscheinend kann hdat2 nicht mit der samsung hd103uj umgehen. Es zeigt bei 2 von 4 meiner hd103uj festplatten "FIRMWARE: corrupted".


Dann werd ich wohl meinen 2. pc mit xp bequemen müssen. Es kann auch nie einfach sein :) .

Was mir grad auffällt, wieso muss ich nur die sektoren 0 von raid0 bzw raid1 ersetzen und nicht auch die mbrs ?

Es hängt jetzt die neue samsung am jmicron. Wen windows nun den raid0 bereich als raw partition erkennt und diesem bereits einen laufwerksbuchstaben zugewiesen hat, dann wurde von windows auf die platte NICHT geschrieben ?

Was ich bereits getan habe:
- Sektor0 für raid0 der neuen ersatz platte(port4) gesichert
- Sektor380637448 für raid1 der neuen ersatz platte(port4) gesichert
- Sektor0 für raid0 der funktionierenden platte (port5) gesichert <-- war nur mit nullen ?
- Sektor380637448 für raid1 der funktionierenden platte(port5) gesichert
- HPA der ersatz platte am 2.pc gelöscht

@ernst@at kannst du mir folgendendes bitte nochmal verständlicher aufschreiben ich will da nix falsch verstehen.
uf Sektor 0 im RAID0-Array den der funktionsfähigen Memberplatte, bei Stripesize 128K den Sektor 0 der neuen Platte auf Sektor 256 des RAID0 kopieren; und den gesicherten Sektor 0 des RAID1 wieder an Sektor 0 des RAID1 Volumes
 
Zuletzt bearbeitet:
Zurück
Oben