CoMo
Captain
- Registriert
- Dez. 2015
- Beiträge
- 3.674
Hallo,
ich betreue einen Root-Server bei Seedhost.
Darauf läuft Proxmox, eine OPNSense VM, die den Traffic per DNAT bekommt und ein LXC-Container. Die OPNSense läuft auf einem ZVOL mit XFS.
Das ganze System läuft auf einem RAIDz1 aus 4 drehenden Platten.
Seit ein paar Tagen schmiert die Kiste in unregelmäßigen Abständen ab. Mal nach ein paar Minuten, mal nach ein paar Tagenn. Das hier konnte ich auf der IPMI-Konsole sehen
Scheinbar rennt das ZFS hier beim Schreiben auf ein ZVOL in einen Timeout? Danach folgt wohl ein Kernel Panic.
SMART-Werte sind einwandfrei; der ZFS Pool zeigt keine Fehler.
Ich habe die Kiste ins angebotene Rescue System GRML gebootet und mit
System Health auf der IPMI Konsole zeigt ebenfalls keine Auffälligkeiten.
Ticket bei Seedhost ist offen, aber die sträuben sich sehr, irgendwas an der Hardware zu machen. Ich habe darum gebeten, die Verkabelung und den Status des Storage Controllers zu prüfen, bisher keine Antwort.
Hat jemand eine Idee, was ich hier eigenmächtig noch prüfen könnte?
ich betreue einen Root-Server bei Seedhost.
Darauf läuft Proxmox, eine OPNSense VM, die den Traffic per DNAT bekommt und ein LXC-Container. Die OPNSense läuft auf einem ZVOL mit XFS.
Das ganze System läuft auf einem RAIDz1 aus 4 drehenden Platten.
Seit ein paar Tagen schmiert die Kiste in unregelmäßigen Abständen ab. Mal nach ein paar Minuten, mal nach ein paar Tagenn. Das hier konnte ich auf der IPMI-Konsole sehen
Scheinbar rennt das ZFS hier beim Schreiben auf ein ZVOL in einen Timeout? Danach folgt wohl ein Kernel Panic.
SMART-Werte sind einwandfrei; der ZFS Pool zeigt keine Fehler.
Ich habe die Kiste ins angebotene Rescue System GRML gebootet und mit
memtester
29GB der freien 30GB durchgetestet. Keine Fehler.System Health auf der IPMI Konsole zeigt ebenfalls keine Auffälligkeiten.
Ticket bei Seedhost ist offen, aber die sträuben sich sehr, irgendwas an der Hardware zu machen. Ich habe darum gebeten, die Verkabelung und den Status des Storage Controllers zu prüfen, bisher keine Antwort.
Hat jemand eine Idee, was ich hier eigenmächtig noch prüfen könnte?