Physikalischer Host ohne Grund abgestürzt (Stop 0xEF) - HP DL 380 G7

Zensai

Boba Fett
Administrator
Registriert
Aug. 2008
Beiträge
13.007
Hallo zusammen,

heute hat sich bei uns mitten im Betrieb einer unserer HP DL380G7 (1 von 3 Hyper V Hosts) verabschiedet.

Das Failover hat soweit funktioniert (eine der VMs hat nen Abflug gemacht und ist neugestartet, alle anderen waren weiter verfügbar).

Bevor ich jetzt allerdings die Maschinen wieder zurück schiebe möchte ich natürlich herausfinden, warum das Ding abgeschmiert ist.

Dumps wurden keine generiert, Die Syslogs sind auch leer.

Nachdem ich dann mal die HP Insight Diagnostics installiert habe, sah ich folgende Fehler:


Critical OS 08/19/2014 12:47 08/19/2014 12:47 1 Operating System failure (Windows bug check, STOP: 0x000000EF (0xFFFFE001B6AEB900, 0x0000000000000000, 0x0000000000000000, 0x0000000000000000))
Caution POST Message 08/19/2014 12:49 08/19/2014 12:49 1 POST Error: 212-Processor 1 Failed
Caution POST Message 08/19/2014 12:50 08/19/2014 12:50 1 POST Error: 1719 - A controller failure event occurred prior to this power-up


Laut Google, HP Support Page, Foren etc pp könnte das leider alles sein.


Mein Problem: Ich kann den Server aufgrund der Geschäftsprozesse nicht einfach herunterfahren und warten. Auch wenn er derzeit keine Maschinen hostet.

Im Spoiler findet ihr die Hardwarekonfiguration:
System


Produktname
ProLiant DL380 G7

Seriennummer
XXXXXXXXXXXXX

Prozessorpaket 1
Intel(R) Xeon(R) CPU E5620 @ 2.40GHz

Prozessorpaket 2
Intel(R) Xeon(R) CPU X5660 @ 2.80GHz

Betriebssystemumgebung
Microsoft Windows Server 2012 R2 Datacenterx64 Version, (Build 9600)

Gesamtspeicher - 81920 MB


Hauptplatine 1


Status der Karte 1
Online

DIMM 1G (DDR3)
2048 Mbytes

DIMM 2D (DDR3)
8192 Mbytes

DIMM 3A (DDR3)
8192 Mbytes

DIMM 4H
Not Installed

DIMM 5E (DDR3)
8192 Mbytes

DIMM 6B (DDR3)
8192 Mbytes

DIMM 7I
Not Installed

DIMM 8F (DDR3)
2048 Mbytes

DIMM 9C (DDR3)
8192 Mbytes

Hauptplatine 2


Status der Karte 2
Online

DIMM 1G
Not Installed

DIMM 2D (DDR3)
8192 Mbytes

DIMM 3A (DDR3)
8192 Mbytes

DIMM 4H
Not Installed

DIMM 5E (DDR3)
2048 Mbytes

DIMM 6B (DDR3)
8192 Mbytes

DIMM 7I
Not Installed

DIMM 8F (DDR3)
2048 Mbytes

DIMM 9C (DDR3)
8192 Mbytes

ECC-Speicher installiert
Ja

Informationen zu Serial Presence Detect (SPD) - DIMM 1, Card 1


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 2GB PC3-10600R 128Mx8 RoHS

Beschreibung für zusätzlichen DIMM
HP 2GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501533-001

Name des Herstellers
Micron Technology

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
08

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
11

Modulorganisation
9

Sollhöhe Modul
0xf

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
2048 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 2, Card 1


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0xf

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 3, Card 1


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0x10

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 5, Card 1


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0x10

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 6, Card 1


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0x10

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 8, Card 1


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 2GB PC3-10600R 128Mx8 RoHS

Beschreibung für zusätzlichen DIMM
HP 2GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501533-001

Name des Herstellers
Micron Technology

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
08

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
11

Modulorganisation
9

Sollhöhe Modul
0xf

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
2048 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 9, Card 1


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0x10

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 2, Card 2


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0x10

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 3, Card 2


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0x10

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 5, Card 2


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 2GB PC3-10600R 128Mx8 RoHS

Beschreibung für zusätzlichen DIMM
HP 2GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501533-001

Name des Herstellers
Micron Technology

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
08

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
11

Modulorganisation
9

Sollhöhe Modul
0xf

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
2048 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 6, Card 2


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0x10

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 8, Card 2


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 2GB PC3-10600R 128Mx8 RoHS

Beschreibung für zusätzlichen DIMM
HP 2GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501533-001

Name des Herstellers
Micron Technology

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
08

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
11

Modulorganisation
9

Sollhöhe Modul
0xf

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
2048 Mbytes

Informationen zu Serial Presence Detect (SPD) - DIMM 9, Card 2


Speichertyp
DDR3

DRAM-Speichertyp
RDIMM

DIMM-Beschreibung
DIMM 8GB PC3-10600R 512Mx4 RoHS

Beschreibung für zusätzlichen DIMM
HP 8GB 2Rx4 PC3-10600R-9 Kit

Ersatzteilnummer
501536-001

Name des Herstellers
SK Hynix

Status: Grenzwert für korrigierbare Fehler überschritten
Keine DIMM-Fehler ermittelt

Nicht korrigierbarer Fehler: Status
Keine DIMM-Fehler ermittelt

Korrigierbarer Fehler: Grenzwertzähler
0

Nicht korrigierbarer Fehler: Zähler
0

DRAM-Breite
04

Reihe
16

Speicher-DRAM-Geschwindigkeit
1333 Mbits

SDRAM-Adressierung
1a

Modulorganisation
8

Sollhöhe Modul
0xf

DDR3 Standardspannungskompatibilität
YES

DDR3 Niederspannungskompatibilität
NO

DIMM-Größe
8192 Mbytes

Kommunikation


Serielle Schnittstelle 1
(Adresse 3F8h)

USB-Gerät 1
USB-UHCI-Root-Hub

USB-Gerät 2
USB-Maus und -Tastatur

USB-Gerät 3
USB-UHCI-Root-Hub

USB-Gerät 4
USB-UHCI-Root-Hub

USB-Gerät 5
USB-EHCI-Root-Hub

USB-Gerät 6
USB-UHCI-Root-Hub

USB-Gerät 7
USB-UHCI-Root-Hub

USB-Gerät 8
Standard Universal PCI to USB Host Controller

USB-Gerät 9
Intel(R) ICH10 Family USB Universal Host Controller - 3A34

USB-Gerät 10
Intel(R) ICH10 Family USB Universal Host Controller - 3A35

USB-Gerät 11
Intel(R) ICH10 Family USB Universal Host Controller - 3A36

USB-Gerät 12
Intel(R) ICH10 Family USB Universal Host Controller - 3A39

USB-Gerät 13
Intel(R) ICH10 Family USB Enhanced Host Controller - 3A3A

Massenspeicher


Optisches Laufwerk 1
DVD, hp DVD A DS8A5LH

Festplattenlaufwerk 1, Speicher-Controller in Steckplatz 0
146.8 GB, 10k RPM, SAS, HP EG0146FAWHU

Festplattenlaufwerk 2, Speicher-Controller in Steckplatz 0
146.8 GB, 10k RPM, SAS, HP EG0146FAWHU

Festplattenlaufwerk 3, Speicher-Controller in Steckplatz 0
300.0 GB, 10k RPM, SAS, HP EG0300FAWHV

Festplattenlaufwerk 4, Speicher-Controller in Steckplatz 0
300.0 GB, 10k RPM, SAS, HP EG0300FAWHV

Festplattenlaufwerk 5, Speicher-Controller in Steckplatz 0
300.0 GB, 10k RPM, SAS, HP EG0300FAWHV

Festplattenlaufwerk 6, Speicher-Controller in Steckplatz 0
300.0 GB, 10k RPM, SAS, HP EG0300FBVFL

Festplattenlaufwerk 7, Speicher-Controller in Steckplatz 0
300.0 GB, 10k RPM, SAS, HP EG0300FBVFL

Festplattenlaufwerk 8, Speicher-Controller in Steckplatz 0
300.0 GB, 10k RPM, SAS, HP EG0300FAWHV

Logisches Laufwerk 1, Speicher-Controller in Steckplatz 0
146.8 GB, RAID 1 - OK

Logisches Laufwerk 2, Speicher-Controller in Steckplatz 0
1.2 TB, RAID 50 - OK

PCI-Steckplätze


PCI-E Slot 1
Verfügbar

PCI-E Slot 2
Wird bereits verwendet

PCI-E Slot 3
Verfügbar

Es verwundert mich einerseits, dass ich zwei verschiedene Prozessoren angezeigt bekomme.

Was meint ihr? Prozessor abgeraucht?
Raid Batterie leer?

Vielleicht hat ja jemand eine Idee.

Danke!
Zensai
 
hast du auf dem teil eine iLO lizenz aktiviert ?
 
Wie es aussieht, leider nicht.

iLO ist nicht konfiguriert und ich warte noch auf die Rückmeldung von Inside Sales, ob wir damals eine Lizenz dazu erworben haben.

Habe ich noch weitere Möglichkeiten?
 
ich würde einfach mal versuchen die ilo ip anzusteuern.
das sollte standardmäßig die ip von physischen host+2 sein

was sagt denn die doku zu dem server ? (also die, die von euer it angelegt wurde, zumindest sollte)
 
Wie gesagt ilo ist nicht konfiguriert. Daher steht auch in der Doku nichts dazu.
(Ob mans glaubt oder nicht, wir haben tatsächlich fast vollständige Dokus)

Ich habe mal einen Case bei HP aufgemacht... die haben mir natürlich erstmal das neuste SPP empfohlen.. also hab ichs gemacht...und was passiert?
BÄM Server schmiert wieder ab.

Kaltstart musste gemacht werden
-->Alle Treiber der Zweiten Netzwerkkarte sind weg.

Also versuche ichs nochmal neu mit dem SPP..bis jetzt läuft es noch.
 
Zurück
Oben