Monitoring System

Bannister0946

Lt. Junior Grade
Registriert
Nov. 2021
Beiträge
372
Guten Morgen zusammen!

ich bin auf der Suche nach eine Monitoring Lösung (für Server Systeme).
Interessant wäre für mich hier Alarme wie:

  • Dienstüberwachung
  • Netzwerküberwachung
  • Festplattenüverwachung

Habe hierzu eine kostenlose self hosted Variante checkmk gefunden.
Kann das jemand empfehlen? Bzw, kann jemand (bessere) alternative empfehlen?
Wichtig: Es muss kostenlos sein.
 
checkmk ist für Firmen (>10 Hosts) im Übrigen nicht kostenlos.
 
Zabbix für alles, Windows über Agent.
Kann man auch Remote commands ausführen (z.B. automatisch Dienst neustarten, powershell oder cmd script ausführen)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: DerGast und redjack1000
Ah, scheint geändert worden zu sein. Vor ~2 Jahren waren es noch 10.
 
Ich nehme ja Zabbix und bilde da noch die Switche und USV oder HP iLO bzw Dell IDrac per SNMP ab.
Für Windows gibt es sogar Agents die man installiert und die Server/Rechner registrieren sich dann automatisch im Zabbix
 
Ich habe in meiner beruflichen Vergangenheit, vor einer halben Ewigkeit... Nagios als Monitoring genutzt, später auch mal Icinga.
Beide Monitoring-Tools, bzw. Systeme wurden durch das PRTG Monitoring abgelöst und ist seitdem bei den beiden Firmen immer noch im Einsatz.

Wir haben seht gut Erfahrung gemacht mit den von Dir genannten, notwendigen Alarmen:
  • Dienstüberwachung
  • Netzwerküberwachung
  • Festplattenüverwachung
Größe und Auslastung der Festplatte, Wachstum auch über einen historischen Zeitraum.
Dienstüberwachung, insbesondere zur Laufzeit des System,
Netzwerküberwachung in Form einer Verbindung des System, rudimentär mal einen Connect, also PING
Bzw. Status der Netzwerkkarten im System.
 
  • Gefällt mir
Reaktionen: xexex
Ich wuerde heutzutage auf prometheus+alertmanager+grafana setzen. Deutlich aktiver, flexibler und kompatibler. Icinga stirbt gefuehlt langsam aus und ist schon deutlich nerviger aufzusetzen und zu betreiben.
PRTG ist nicht open source und ist wie checkmk auch eher teurer..
 
CheckMK gibt es in zwei Varianten, der kostenlosen RAW Edition mit egal wie vielen Systemen oder eben die Enterprise mit bis zu 25 kostenlosen Hosts. Mit so unklaren Begriffen hier um sich zu werfen führt halt dazu, dass man aneinander vorbei redet oder nicht ganz korrekte Aussagen trifft...
Dann gibt's noch die fertigen Appliances von CheckMK wenn man es nicht hosten will. Apropos hosten: Wird auf Linux installiert, kann aber Windowssysteme anschließend überwachen.

Zabbix lässt sich auf fast allem außer Windows installieren, der Agent dann natürlich auch auf Windows.

PRTG Network Monitor ist meines Wissens nach nicht kostenlos, ließe sich aber auf Windows installieren. In kleinen Umgebungen schnell aufzusetzen aber ab einer gewissen Größe skaliert es nicht vernünftig und man muss zum noch teureren PRTG Enterprise greifen.

Icinga2 ist kostenlos und der Server lässt sich auch auf Windows installieren. Setup ist aber afaik etwas komplexer was ich so höre, habe es selbst aber länger nicht mehr in den Händen gehalten.

Prometheus hat überraschenderweise auch einen Windows Installer aber ist halt eine andere Art des Monitorings da hier nicht mehr klassische Events und deren Änderungen überwacht werden sondern man mit Metriken arbeitet. Anstatt zu prüfen "läuft Dienst XYZ noch" würdest du überprüfen läuft mindestens bzw. genau eine Instanz des Dienstes".
 
  • Gefällt mir
Reaktionen: Snowi
snaxilian schrieb:
Setup ist aber afaik etwas komplexer was ich so höre, habe es selbst aber länger nicht mehr in den Händen gehalten.
Das geht inzwischen sehr einfach per Puppet-basiertem installer. Nach Installation des Tools ein Command, etwas warten, und du hast n eingerichtetes Icinga2 + IcingaDB + IcingaWeb2.
https://github.com/NETWAYS/icinga-installer
 
  • Gefällt mir
Reaktionen: snaxilian
hpxw schrieb:
Zabbix für alles, Windows über Agent.
Kann man auch Remote commands ausführen (z.B. automatisch Dienst neustarten, powershell oder cmd script ausführen)
Hast Du das auch über den Zabbix Agent gelöst? Funktioniert das auch für die Linux Kisten?Ich denke da an einen Job den man ggf manuell ausführen kann wenn es ein Problem gibt. Das macht die Verwaltbarkeit etwas simpler, weil man nicht mehr hart auf der Maschine rumdaddeln muss (gerade wenn man zig unterschiedliche Linux Distris hat). So könnte man einen Login auf Zabbix anlegen, Berechtigung zum Ausführen und dann könnte da sogar der Azubi ran...
 
bei Linux kannst auch Remote commands ausführen. Händisch auslösen funktioniert nicht.
Es wird ausgelöst, sobald ein Trigger / Problem ausgelöst wird. z.B. überwachst du ein Dienst, der ausfällt, dann wird automatisch ein script oder remote command auf dem zielsystem ausgeführt.
 
Zumindest bei Icinga2 (und anderen der Nagios-Familie) ginge das per Event Handler - also das bei einem Status Change etwas ausgeführt wird. Was ich auch sehr interessant finde für das Szenario von "etwas stimmt nicht und ich wills automatisiert lösen" ist die Idee von event-driven-ansible: https://www.ansible.com/use-cases/event-driven-automation
 
  • Gefällt mir
Reaktionen: snaxilian und madmax2010
DerGast schrieb:
Das macht die Verwaltbarkeit etwas simpler, weil man nicht mehr hart auf der Maschine rumdaddeln muss (gerade wenn man zig unterschiedliche Linux Distris hat)
Nein es wird dadurch nicht simpler weil du ggf. auf die Eigenheiten der diversen Distris eingehen musst zumindest in den Punkten wo sich diese unterscheiden.
DerGast schrieb:
dann könnte da sogar der Azubi ran
Azubis sind keine billigen Arbeitskräfte.

Anyway Mit dem Zabbix Agent oder Event Handler bei checkmk/icinga2/nagios usw. ist deine Sichtweise obsolet. Einfache Probleme können so automatisiert gelöst werden, tritt das Problem dann aber wiederholt auf, bricht der Event Handler ab und macht eben doch einen Alert weil das automatische eingreifen nicht ausreichend war. Ab hier braucht es dann wieder Sachverstand um den Fehler genauer zu analysieren.

Mordenkainen schrieb:
event-driven-ansible
Danke für den Hinweis, kannte ich noch nicht. Also nützlich für die Firmen, die ein Monitoring nutzen das keine Aktionen kann und die nicht container-basierte Systeme nutzen oder habe ich gerade einen UseCase übersehen?
 
snaxilian schrieb:
Nein es wird dadurch nicht simpler weil du ggf. auf die Eigenheiten der diversen Distris eingehen musst zumindest in den Punkten wo sich diese unterscheiden.

Azubis sind keine billigen Arbeitskräfte.

Anyway Mit dem Zabbix Agent oder Event Handler bei checkmk/icinga2/nagios usw. ist deine Sichtweise obsolet. Einfache Probleme können so automatisiert gelöst werden, tritt das Problem dann aber wiederholt auf, bricht der Event Handler ab und macht eben doch einen Alert weil das automatische eingreifen nicht ausreichend war. Ab hier braucht es dann wieder Sachverstand um den Fehler genauer zu analysieren.
Findest Du es nicht etwas übergriffig auf Dinge einzugehen, die 1. nichts mit dem Thema zu tun haben und 2. ohne Hintergrundwissen zu urteilen?
1. Mir ist die Aufgabe eines Azubis durchaus bewusst und ich achte vehement(!) darauf sie ab dem 1. Lehrjahr als Kollege/Kollegin anzusehen, und sie eben auch dahingehend zu behandeln. Das macht mich, als einer der wenigen, in unserem Unternehmen aus.
Daher nehme ich zB derzeit keine entgegen da mir die Kapazitäten fehlen einen jungen Menschen auf das Berufsleben vorzubereiten. Da spielen Soft-Skills wie die zwischenmenschlicher Umgang und Reflektionsfähigkeit eine Rolle.

2. Der Hinweis ist hilfreich, danke!
Nichts anderes hätte ich damit vor.
Wir besitzen, zwei, drei VMs wo ein Dienst ab und an nicht sauber neugestartet wird. Es reicht dann meistens ihn einmal händisch wach zu rütteln.
Zabbix meldet ihn dann schon eine halbe Nacht. Und auf IT-Mitarbeiter (Dazu zählen die Programmierer und eben auch Azubis zu) bezogen: Manchmal möchte man ungerne jemanden an ein System lassen wenn die Kenntnisse fehlen. Es fängt beim Einsatz von Putty an. Unsere Softwareentwicklung kann zB fabelhaft programmieren, dennoch wäre ich beruhigter wenn jemand rollen basiert auf das Monitoring zugreift um mal eben etwas anzustoßen was im schlimmsten Fall "nicht funktioniert". Aber ob es vorher nicht funktionierte oder danach, ist dann auch irrelevant :D

Danke Dir, ernsthaft!
 
  • Gefällt mir
Reaktionen: snaxilian
Zurück
Oben