Skaro
Lt. Commander
- Registriert
- Jan. 2015
- Beiträge
- 1.118
Hallo,
wie schon im Titel zu lesen ist stürzt, seitdem ich mein Ryzen System im Sommer gekauft habe, es unregelmäßig aller 1-4 Wochen ab. Am Anfang dachte ich noch, dass das an dem alten Linux Kernel (4.9) lag, hab dann 4.11 und 4.12 selbst compiled und das hatte auch nichts geändert. Zu der Zeit war ich noch unter Debian 8 unterwegs, da ich OpenMediaVault benutzt habe.
Aktuell habe ich Debian 9 (mit 4.14er Kernel) und alle Programme die ich unter OpenMediaVault benutzt habe sind nun in Docker Container. (Plex, Samba, PlexPy, 1-2 Gameserver je nachdem was man grad spielt)
Hardware habe ich folgendes:
- Ryzen 7 1700
- ASUS Prime X370-Pro (hat 8 Lanes auf den 2. Slot und ECC Untersützung)
- Kingston ValueRAM DIMM 16GB, DDR4-2400, CL17-17-17-32, ECC
- Seasonic Prime Ultra Titanium 650W ATX 2.4 (Gekauft wegen 2x EPS)
- Eine RAID Karte die 2x SFF Anschlüsse hat die ich zur IBM HBA Karte geflasht habe (lief 1 Jahr mit Intel CPU perfekt)
- Gebrachtes Server Case mit SATA Backplate wo ich die SFF reingesteckt
- 6x8TB ZFS RAIDZ2
Software
- Debian 9 mit 4.14 Kernel
- ZFS (ZFS on Linux)
Wie schon oben geschrieben die Maschine hängt sich komplett auf. SSH geht nicht mehr, die Services gehen nicht mehr und vor ein paar Tagen hatte ich mal den Monitor angesteckt (lief 4 Tage durch bis es passiert ist) und dort war dann das Bild auch eingefroren. Auf den Monitor hatte ich mich eingeloggt und dann dmesg -wH laufen lassen aber zwischen der letzten Nachricht und wann es sich aufgehangen hat waren 6 Stunden also dadurch hatte ich auch nichts Neues erfahren.
In den Logs steht nichts. Also nichts in syslog und auch nichts im kern log. Ich habe auch so ein Crashlog Programm installiert, welches 128 MB in RAM Reserviert und das dann auf /var/crash/ schreibt aber dadurch dass es komplett eingefroren ist konnte er natürlich auch nichts schreiben und nach Hardreset ist der RAM auch geleert...
BIOS habe ich immer geupdatet, ich glaube ganze 6 mal. Ein BIOS Update hatte sogar ein Bug, den ich reportet habe und den hat Asus sogar schnell gefixt.
CPU habe ich ausgetauscht, direktes RMA durch AMD gemacht wegen der SegFault Sache von CPUs die vor der 25. KW hergestellt wurden sind.
RAM habe ich auch schon ausgetauscht durch Non ECC RAM. Hat auch nichts gebracht.
Wie ihr seht habe ich schon alles Probiert was mir eingefallen ist außer die HBA Karte mal raus gezogen (geht schlecht, da dort das ganze Raid dran hängt und 1 oder 2 Wochen will ich jetzt nicht ohne RAID warten...)
Also das letzte was ich tauschen könnte wäre also das Mainboard.
Oder kann ich sonst noch was machen?
wie schon im Titel zu lesen ist stürzt, seitdem ich mein Ryzen System im Sommer gekauft habe, es unregelmäßig aller 1-4 Wochen ab. Am Anfang dachte ich noch, dass das an dem alten Linux Kernel (4.9) lag, hab dann 4.11 und 4.12 selbst compiled und das hatte auch nichts geändert. Zu der Zeit war ich noch unter Debian 8 unterwegs, da ich OpenMediaVault benutzt habe.
Aktuell habe ich Debian 9 (mit 4.14er Kernel) und alle Programme die ich unter OpenMediaVault benutzt habe sind nun in Docker Container. (Plex, Samba, PlexPy, 1-2 Gameserver je nachdem was man grad spielt)
Hardware habe ich folgendes:
- Ryzen 7 1700
- ASUS Prime X370-Pro (hat 8 Lanes auf den 2. Slot und ECC Untersützung)
- Kingston ValueRAM DIMM 16GB, DDR4-2400, CL17-17-17-32, ECC
- Seasonic Prime Ultra Titanium 650W ATX 2.4 (Gekauft wegen 2x EPS)
- Eine RAID Karte die 2x SFF Anschlüsse hat die ich zur IBM HBA Karte geflasht habe (lief 1 Jahr mit Intel CPU perfekt)
- Gebrachtes Server Case mit SATA Backplate wo ich die SFF reingesteckt
- 6x8TB ZFS RAIDZ2
Software
- Debian 9 mit 4.14 Kernel
- ZFS (ZFS on Linux)
Wie schon oben geschrieben die Maschine hängt sich komplett auf. SSH geht nicht mehr, die Services gehen nicht mehr und vor ein paar Tagen hatte ich mal den Monitor angesteckt (lief 4 Tage durch bis es passiert ist) und dort war dann das Bild auch eingefroren. Auf den Monitor hatte ich mich eingeloggt und dann dmesg -wH laufen lassen aber zwischen der letzten Nachricht und wann es sich aufgehangen hat waren 6 Stunden also dadurch hatte ich auch nichts Neues erfahren.
In den Logs steht nichts. Also nichts in syslog und auch nichts im kern log. Ich habe auch so ein Crashlog Programm installiert, welches 128 MB in RAM Reserviert und das dann auf /var/crash/ schreibt aber dadurch dass es komplett eingefroren ist konnte er natürlich auch nichts schreiben und nach Hardreset ist der RAM auch geleert...
BIOS habe ich immer geupdatet, ich glaube ganze 6 mal. Ein BIOS Update hatte sogar ein Bug, den ich reportet habe und den hat Asus sogar schnell gefixt.
CPU habe ich ausgetauscht, direktes RMA durch AMD gemacht wegen der SegFault Sache von CPUs die vor der 25. KW hergestellt wurden sind.
RAM habe ich auch schon ausgetauscht durch Non ECC RAM. Hat auch nichts gebracht.
Wie ihr seht habe ich schon alles Probiert was mir eingefallen ist außer die HBA Karte mal raus gezogen (geht schlecht, da dort das ganze Raid dran hängt und 1 oder 2 Wochen will ich jetzt nicht ohne RAID warten...)
Also das letzte was ich tauschen könnte wäre also das Mainboard.
Oder kann ich sonst noch was machen?