Windows Server 2008 Fehlerdiagnose nach Blue Screen, defekte HDD?

Domi83

Rear Admiral
Registriert
Feb. 2010
Beiträge
5.432
Hallo, es geht um eine Fehlerdiagnose am 2008er SBS... das Ereignisprotokoll habe ich schon mal durch geschaut, aber keine passenden Fehler gefunden. Ich versuche mal aufzuklären was bis dato passiert ist...

In dem Fujitsu Primergy Server sind zwei SAS Festplatten im RAID 1 verbaut. Der Windows SBS ist auf Partition C und alle anderen Dateien auf Partition D! Es kam schon ein paar mal vor das Partition D fest hing... das machte sich wie folgt bemerkbar, alle Netzlaufwerke waren noch verbunden aber ein Zugriff war nicht möglich. Wenn ich mich via RDP verbunden habe, öffnete ich den Arbeitsplatz, klickte auf C (kein Problem) und dann auf Partition D und bevor sich dann etwas tat, hätte ich beruhigt einen Kaffee kochen können.

Da beide Partitionen (System C und Daten D) auf dem gleichen Datenträger sind und die System Partition ohne Probleme funktioniert, bin ich noch nicht sofort von einem Hardwaredefekt ausgegangen. Da aber gestern morgen der Server einen Blue Screen hatte, mein IT Kollege der vor mir hier war einen Neustart (ohne Foto etc.) machte, weiß ich nun nicht was das Problem gewesen sein könnte.

Würdet ihr anhand der Fehlerbeschreibung schon auf einen (beide) HDD Defekt tippen? Aktuell läuft der Server ohne Problem.. auch gestern gab es dann keine Probleme, aber das ist ja nicht Sinn der Sache. Mit ein wenig anpassen der Dateien meiner Kollegen, könnte ich den Server für eine Diagnose vom Netz nehmen, wollte aber erst einmal Eure Meinungen hören und wo man noch nach Fehlern suchen sollte.

Gruß, Domi
 
Ich würde darauf tippen daß du den Admin fragen musst. Wenn es ein BSOD gab sollte der doch auch irgendwo geloggt sein. Bluescreenview?

Schon mal einen SMART Test gemacht?
 
Moin, im Ereignislog hab ich schon alles abgesucht was zwischen 0:00 - 8:00 gestern Vormittag lag, aber nichts brauchbares gefunden. Ein miniDump vom Bluescreen existiert nicht, da hatte ich schon mit dem Programm Bluescreenview geschaut ob ich da etwas finde und bezüglich SMART Test, da die Festplatten direkt über den Hardware RAID Controller im System hängen, können Programme wie "CrystalDisk" diese nicht erkennen.
 
Üblicherweise kannst du die SMART-Werte und die Logs über die Managementsoftware des RAID-Controllers auslesen. Ich kenne die aktuellen Fujitsu-Dinger nicht, daher kann ich dir nicht sagen, wo das zu finden ist.
 
Wenn ihr es richtig gemacht habt, habt ihr sicherlich das iRMC des Servers konfiguriert, sowie die Fujitsu ServerView-Software installiert, in welcher ihr bequem nachschauen könnt, ob eine der Festplatten einen Defekt hat, oder ob das RAID-Volume inkonsistent ist und geprüft und korrigiert werden muss und ihr euch sogar E-Mail-Benachrichtigungen einrichten könnt, falls es ein Problem gibt.

Mit der "Ich tippe"-Einstellung seid ihr relativ falsch in dem Beruf.
 
Ja ja, solche großkotzigen Sätze wie "seid ihr relativ falsch in dem Beruf" ließt man ja heutzutage immer gern und die kann man sich auch sparen :rolleyes: Die Kiste wurde 2009 von den Chefs so gewünscht, der Bekannte von ihm hat den so angeschleppt, es musste nur die Recovery DVD eingelegt werden und dann war der 2008 SBS schon installiert... ich konnte der Domäne einen Namen geben, einen Netzwerkadmin hinterlegen sowie die IP vergeben und das war es dann schon.

Ich kann nichts dafür, dass ich lieber Linux Systeme administriere. Aber auch da kann es schon mal zu Problemen führen und wenn man nicht weiter weiß, fragt man mal andere Leute nach deren Erfahrungen, da man auch mal den Wald vor Lauter Bäumen nicht sieht.

Aber euch beiden schon mal vielen Dank für den Tipp mit der Management (Fujitsu ServerView) Software... Von dem Primergy ist ein Diagnose Report Tool vorinstalliert. Das habe ich so eben angestoßen und bin auf das Ergebnis gespannt :)
 
Das sind keine großkotzigen Sätze, ihr seid Administratoren von einem Produktiv-System! Der eine macht bei einem BSOD einfach einen Neustart, ohne die Fehlermeldung zu lesen (wo ich meinen Azubis im ersten Lehrjahr die Ohren langziehe) und du tippst auf etwas, ohne es vorher analysiert zu haben. Gerade in der Linuxwelt, wo man bei Problemen noch viel mehr Logs auswertet, als bei Windows, solltest du Bescheid wissen.
Und das hat grundsätzlich auch nichts mit Windows- oder Linuxsystemen zu tun, da geht es um Sachen, die tiefer anfangen :P

Das ist echt nicht böse gemeint, aber ihr müsst da euch selber schützen, weil ihr hinterher die Dubel seid, die von allen angepampt seid und noch viel schlimmer, die die selbst im Urlaub noch genervt werden.
 
Es war auch nicht mein Plan, dass ich ins Büro komme und dann vom Kollegen erfahren "hab mal den Server neu gestartet, der hatte einen Blue Screen" :freak: Ich bin in der Regel um 8:00 pünktlich im Büro, gestern war ich leider dank Stau 20 Minuten später da und mein Kollege war vor mir da. Wir sind zwar drei Leute in der IT, aber nur einer kümmert sich um die EDV im Haus, ich. Die Kollegen haben ihre anderen Parts ;)

Das man bei Linux mehr logs liest, ist mir ja bewusst.. aber da finde ich fast immer etwas. Gab auch schon mal Vorkommnisse, wo ich auch nichts zu dem Phänomen gefunden habe. So wie jetzt in diesem Fall ebenso. Aufgrund der Vorkommnisse in den letzten Monaten tippe ich auch stark auf die Festplatten. Und da wollte ich halt gerne eine weitere Meinung hören :) Das interessante ist, das erwähnte Diagnose Tool hatte ich sogar schon mal durchlaufen lassen und es gab nichts zurück. Einzig das HTML Output File kann nicht erstellt werden, da gibt es immer einen ERROR :freak:
Generating HTML output, please wait ...ERROR
Completed: 0 error(s), 0 warning(s)
 
Deine ersten Anlaufstellen sollten sein:

- Server View RAID Manager
- iRMC Webzugriff
- ServerView Agents

so long
nubi
 
Moin, Danke für die Auflistung, da muss ich allerdings gestehen, ist ein Fehler bei mir... hätte ich vielleicht mit erwähnen sollen.

a.) Server View RAID Manager
- Wurde von mir geöffnet (scheint ein Webinterface zu sein), funktioniert aber nicht. Seiten Ladefehler

b.) iRMC Webzugriff
- In diese Service Oberfläche über den separaten LAN Port habe ich auch schon einmal nach geschaut, konnte dort aber auch nichts erkennen was aussieht wie ein Fehler.

c.) ServerView Agents
- Die bin ich step-by-step bis zu dem Diagnose Report Tool und "Maintenance Tool" durch gegangen. Laut diesen Infos, alle "OK"

Hätte ich vielleicht ganz zu Anfang schon mal erwähnen können, dass ich schon in diesen Bereichen war und nicht nur im Ereignisprotokoll. Obwohl ich halt als aller erstes das Ereignisprotokoll durchstöbert hatte und irgendwann später die genannten Punkte durchstöbert hatte. Auf die iRMC Webzugriff (Service Schnittstelle) bin ich auch erst wieder aufmerksam geworden, als ich durch das Handbuch ging und "Service LAN" gelesen hatte :freak:

Gruß, Domi
 
Hm, ohne den RAID Manager wirds schwierig. Könnt ihr alternativ übers WE einen langen chkdsk planen?
 
Der Raid Manager ist ein bischen empfindlich, da er mit JAVA läuft.
bitte hold dir von der Website von FTS den aktuellen RAID Manager und dazu das aktuelle Java. Dann sollte das auch funktionieren.
 
@chriss_msi, dass werde ich mal veranlassen.. Ist kein Problem. Unser Server hier im Haus ist eigentlich nur ein großes NAS mit Active Directory. Von daher sollte das passen :)

@nubi80, vielen Dank für den Tipp das probiere ich mal aus und gebe hinterher ein Feedback.

Gruß, Domi

Nachtrag: Okay, im ServerView RAID Manager funktioniert... SMART-Fehler 0, Sonstige Fehler 0! Irgendwie bekomme ich das Gefühl, dass die Festplatten gar nicht das Problem sein könnten. Bezüglich RAID Controller (falls es von Interesse ist), dieser identifiziert sich als "LSI RAID 0 1 SAS 8P" und ist laut Aufkleber (D2507-C11 GS1) sowie Recherchen nur ein RAID 0 1 Controller :( Hätte sonst gerne ein RAID 5 aufgesetzt wenn die HDDs defekt gewesen wären.
 
Zuletzt bearbeitet:
Domi83 schrieb:
Nachtrag: Okay, im ServerView RAID Manager funktioniert... SMART-Fehler 0, Sonstige Fehler 0! Irgendwie bekomme ich das Gefühl, dass die Festplatten gar nicht das Problem sein könnten. Bezüglich RAID Controller (falls es von Interesse ist), dieser identifiziert sich als "LSI RAID 0 1 SAS 8P" und ist laut Aufkleber (D2507-C11 GS1) sowie Recherchen nur ein RAID 0 1 Controller :( Hätte sonst gerne ein RAID 5 aufgesetzt wenn die HDDs defekt gewesen wären.

Kannst du im Manager irgendwo einen Integritäts-/Konsistenzcheck des RAID-Volumes machen? Das wäre noch ein Schritt tiefer, als der chkdsk. Und falls ja, schau, ob du einen Taskplaner findest, der einmal im Quartal an einem Wochenende den Check selber ausführt (dann hast du den RAID nach Best-practise eingerichtet).

Ansonsten rate ich dir von RAID5 ab, du hast bei eurer Konstellations / eurem Anwendungsbereich keinen Vorteil (beide vertragen eine Ausfall-HDD), aber den Nachteil, dass RAID5 langsamer, als RAID1 ist.
 
Der Modus nennt sich bei Fujitsu MDC (Make Data Konsistent) und ist standardmäßig einmal die Woche aktiv.
Zu finden ist die Einstellung im RAID Manager auf den Controllereinstellungen.

Du hast in der Tat nur einen RAID 0 / 1 / 10 Controller ohne Cache.

http://manuals.ts.fujitsu.com/file/3490/lsi-modular-raid-ug-en.pdf

Warum allerdings ein RAID5 langsamer soll als ein RAID1 sein soll, ist mir dann doch ziemlich schleierhaft.
Alle meine Tests im Fujitsu Umfeld haben eine lineare Performance Steigerung der Schreib und Leseraten ergeben. Ein RAID5 aus drei Platten ist schon fast doppelt so schnell wie eine Spiegelung. Lediglich die Zugriffszeit bleibt gleich oder wird minimal schlechter. (aber auch nur wenn das RAID5 ohne Write Back betrieben wird)

so long
nubi
 
Zurück
Oben