Netzwerk Überwachung

MasterMaso

Lt. Commander
Registriert
Apr. 2018
Beiträge
1.846
Hallo,

ich plane ein Tool zur Überwachung des Netzwerks in meinem Unternehmen einzuführen. Damit möchte ich die Netzwerklast
und bestimmte Dienste überwachen können und neustarten können, falls diese ausfallen.
Welches Tool könnt ihr mir da empfehlen?

MfG
MasterMaso
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: DeusoftheWired und rambodieschen
+1 prtg
 
Mit der kostenlosen Version von Nagios hat man auch die Features die ich brauche? Ich habe gehört, dass man sehr viel konfigurieren muss.
Prtg gefällt mir, ich habe allerdings noch keine Ahnung wie viele Sensoren ich benötige.
 
Je nach Größe des Unternehmens und Anzahl der Geräte kommt man sogar mit der kostenfreien Variante aus.

LG MoD
 
Netzwerküberwachung ohne viel zu konfigurieren wird halt recht schnell teuer.

Ich konfiguriere viel und setze dabei bei uns das kostenlose Zabbix ein (www.zabbix.com).
Es gibt nichts was man nicht durch ein eigenes Script durch Zabbix gestartet nicht machen könnte ...
 
Ich hätte nichts dagegen viel zu konfigurieren. Solange ich mit Nagios die Features habe, die ich benötige. Aber ich werde mir erst wohl mal Prtg anschauen und testen.
 
Icinga ist ein Fork von Nagios und ist inzwischen deutlich moderner. Aber konfigurieren muss man beides ;)
 
Ich würde auch eher von Nagios abraten, zu altbacken, zu umständlich. Icinga ist hier etwas besser, noch besser ist check_mk. Damit Du volle Features hast, solltest Du hier aber etwas Geld in die Hand nehmen.
 
+1 für check_mk
Die Installation geht fix und du kannst Server per Agent und Netzwerkgeräte per SNMP überwachen und auch eigene Skripte einbinden.
Icinga2 erfordert etwas mehr Einarbeitung bis es steht aber ist ebenfalls sehr mächtig.
PRTG wird sehr schnell sehr teuer, da jeder Switchport ein Sensor ist und skaliert irgendwann nicht mehr sauber in größeren Umgebungen bzw. musst es mit Hardware und Geld beschmeißen.
 
check_mk sieht auch gut aus. Das wichtigste ist eigentlich nur, dass ich sehe, welche Dienste bei den jeweiligen Server laufen und ich diese dann neustarten kann, da es immer so gewisse Dienste gibt, die abschmieren.
 
check_mk, icinga, prtg, nagios etc sind alles Monitoringlösungen. Du kannst dich also alarmieren lassen, wenn ein erwarteter Zielzustand (dienst läuft) nicht mehr so ist (dienst gestoppt, pausiert, etc). Anstatt einer Alarmierung kann aber auch ein sogenannter EventHandler ausgelöst sein.

Beispiel: Ein überwachter Linux Server hat einen Apache2 Webserver. Wird dieser beendet, dann löse entsprechenden EventHandler aus. Das ist ein Script was über passende Parameter wie $hostname und $servicename sich auf den Server verbindet und den Dienst neu startet.
Achtung! Du kannst hier schnell in eine Schleife geraten und solltest die Ausführung des EventHandlers beschränken auf z.B. 3mal hintereinander, danach Alert per Mail o.ä. denn sonst denkst du alles ist gut aber im Hintergrund wird seit paar Tagen jede Minute der Webserver neu gestartet weil er ein Problem hat.

Beispiel icinga2: https://linuxfrickeln.de/2016/07/16...-und-automatisiertes-neustarten-von-diensten/
Beispiel check_mk: https://www.geekbundle.org/selbstheilung-mit-check_mk-event-handler/

Generell: Ein Monitoring ist kein Allheilsbringer das auf einmal per Einhornmagie und etwas Konfetti deine Systeme wartet und patcht und repariert. In aller erster Linie zeigt es einem nur erst einmal auf was alles nicht funktioniert damit man weiß, das bzw. was man reparieren muss.

Welche Dienste laufen kannst du gut über was automatische Discovery von check_mk heraus finden. Dazu per WATO eine discovery rule definieren, die alle Dienste aufzeigt, die start-type=auto und status=running haben. Nach einem Discovery der Hosts, installierter Agent voraus gesetzt, wird für jeden Dienst, der automatisch starten soll und auch läuft ein eigener Check/Service angelegt.

Das Tool ist wie gesagt sehr mächtig und skaliert sehr gut, ich habe damit schon beruflich Umgebungen mit ~3500 Hosts (ESXi-/Win-/Linux-Server, Switche, Router, Loadbalancer, Storage, etc) mit zusammen ~150.000 Services überwacht und in der Enterprise Version musst es auch nicht mehr ganz so stark mit Hardware erschlagen. In der RAW Variante ist schnell der Storage der Flaschenhals für die ganzen Performancedaten und Graphen.
 
  • Gefällt mir
Reaktionen: Raijin, MasterMaso und Trase
@snaxilian Alles klar danke. Das System selber warten muss das Tool auch nicht zwingend können, es reicht mir, wenn ich eine Übersicht habe und vielleicht benachrichtigt werde, wenn was ausgefallen ist.
 
Zurück
Oben