Was ist checkmk: Unterschied zwischen den Versionen

Aus Xinux Wiki
Zur Navigation springen Zur Suche springen
Zeile 35: Zeile 35:
  
 
==Web-GUI („Multisite“)==
 
==Web-GUI („Multisite“)==
Multisite ist die Web-GUI von Checkmk. Neben einem schnellen Seitenaufbau bietet sie benutzerdefinierbare Ansichten und Dashboards, verteiltes Monitoring durch Einbinden mehrerer Monitoring-Instanzen via Livestatus, Integration von NagVis, eine integrierte LDAP-Anbindung, einen Zugriff auf Statusdaten via Webservice und vieles mehr. Dashboards und Ansichten können nach Benutzern oder Benutzergruppen unterschieden werden, z. B. vSphere-spezifische[20] Ansichten für VMware-Admins. Die Web-GUI existiert aktuell in deutscher und englischer Sprache.
+
*Multisite ist die Web-GUI von Checkmk.
 +
*Zugriff auf Statusdaten via Webservice
 +
*verteiltes Monitoring durch Einbinden mehrer Monitoring-Instanzen via Livestatus
 +
*Dashboards und Ansichten sind individuelle anpassbar.
  
 
==Web Administration==
 
==Web Administration==

Version vom 2. Februar 2022, 07:23 Uhr

Grundlegendes

  • Checkmk ist eine Software für das Service-Monitoring von IT-Infrastruktur.
  • Sie wird zur Überwachung von Server, Netzwerk, Applikationen, Public Clouds, Containern, Speicher, Datenbanken und Umweltsensoren genutzt.
  • Checkmk gibt es in drei Editionen
    • Open Source Edition („Checkmk Raw Edition – CRE“)
    • Enterprise Edition („Checkmk Enterprise Edition – CEE“)
    • Edition für Managed Services Provider („Checkmk Managed Services Edition – CME“).
  • Verfügbar sind diese Checkmk-Editionen für eine Reihe von Plattformen
    • Debian, Ubuntu, SLES und RedHat/CentOS, sowie als Docker-Image.
    • physische Appliances unterschiedlicher Größe
    • Virtuelle Appliance
    • Hochverfügbarkeitslösungen

Die Agenten, die Checkmk zum Datensammeln auf vielen Systemen einsetzt, sind dabei für 11 Plattformen verfügbar, darunter auch Windows.[5]

Komponenten

Monitoring-Kern („Checkmk Microcore – CMC“)

  • Die kommerziellen Varianten von Checkmk setzen einen eigenen, in C++ geschriebenen, Monitoring-Kern ein.
  • Die Open-Source-Variante „Checkmk Raw Edition“ setzt aktuell noch einen Nagios-Kern ein.

Konfiguration- & Check-Engine

  • Checkmk bietet eine eigenständige Diensterkennung und Einstellungserzeugung.
  • In der Prüfzeit wird jeder Host nur noch ein einziges Mal kontaktiert.
  • Die Prüfergebnisse werden an den Monitoring-Kern als passive Checks übermittelt.

Checkmk nutzt unterschiedliche Methoden, um auf die Daten der Zielsysteme zuzugreifen

  • Agenten, die auf dem Ziel-System installiert werden,
  • Special Agents“, die auf dem Monitoring-Server laufen und mit der API des Zielsystems kommunizieren
  • SNMP-API für die Überwachung von Netzwerkgeräten und Druckern
  • HTTP/TCP-Protokolle, um mit Webservices und Internetdiensten zu kommunizieren

Datenschnittstelle („Livestatus“)

  • Stellt einen Live-Zugriff auf alle Daten der überwachten Hosts und Services zur Verfügung.
  • Die Daten werden direkt aus dem RAM geholt.
  • Zugriff erfolgt über ein einfaches Protokoll und ist von allen Programmiersprachen aus ohne eine spezielle Bibliothek möglich.

Web-GUI („Multisite“)

  • Multisite ist die Web-GUI von Checkmk.
  • Zugriff auf Statusdaten via Webservice
  • verteiltes Monitoring durch Einbinden mehrer Monitoring-Instanzen via Livestatus
  • Dashboards und Ansichten sind individuelle anpassbar.

Web Administration

  • Komplett über den Browser administrierbar.
  • Verwaltung von Benutzern, Rollen, Gruppen, Zeitperioden, und mehr.
  • Rollenkonzept können Berechtigungen auf diese Weise granular vergeben werden.
  • LDAP und AD Anbindung

Benachrichtigungssystem

Pro Benutzer können mehrere Benachrichtigungskanäle eingerichtet und unterschiedlich regelbasiert konfiguriert werden. So kann z. B. die E-Mail den ganzen Tag, SMS aber nur für wichtige Probleme während Bereitschaftszeiten ausgelöst werden – ohne dass dafür mehrere künstliche Benutzer angelegt werden müssen. Die Benachrichtigungen können an alle oder auch nur an bestimmte Teams gehen, z. B. nur an die Speicheradmins bei einer ausgefallenen Festplatte. Doppelte Benachrichtigungen werden dabei zusammengefasst, so dass kein Benutzer über einen bestimmten Kanal doppelt benachrichtigt wird. Des Weiteren können Anwender ihre Benachrichtigungen selbst konfigurieren. In verteilten Umgebungen können Warnmeldungen zentral verwaltet werden. Für erkannte Probleme können automatisch Aktionen ausgelöst werden (Alarmsteuerung), z. B. über Skripte. Mit Checkmk direkt ausgeliefert werden Integrationen zu Email und SMS-Gateways sowie zu Kommunikations- und IT-Service-Management-Lösungen wie Slack, Jira, PagerDuty, OpsGenie, VictorOps und ServiceNow.

Business Intelligence

Das Business-Intelligence-Modul ist in die grafische Benutzeroberfläche integriert. Es aggregiert regelbasiert aus vielen einzelnen Statusdaten von Hosts und Services den Gesamtzustand von Geschäftsprozessen, deren Abhängigkeit von komplexen Anwendungen und deren Abhängigkeit von IT-Infrastrukturelementen. Es kann auch zur Darstellung von Anwendungen genutzt werden, die sich aus Microservices zusammensetzen, welche ihrerseits wieder aus Kubernetes-Pods und -Deployments bestehen. Des Weiteren können Worst-Case-Szenarien in Echtzeit simuliert werden und historische Zustände analysiert werden, um Ursachen für verschlechterte Leistungen zu verstehen.

Event Console

Die Event Console integriert die Verarbeitung von Logmeldungen und SNMP-Traps in das Monitoring. Sie wird über ein flexibles Regelwerk konfiguriert und entscheidet, ob die eingehenden Meldungen verworfen werden oder wie sie eingestuft werden. Sie kann zählen, korrelieren, Meldungen erwarten, Meldungen umschreiben und mehr. Gleiche Einträge können zu einem einzigen Ereignis zusammengefasst werden (z. B. mehrere fehlgeschlagene Logins), um die Übersicht der Ereignisse zu wahren. Auch verfügt sie über einen eingebauten Syslog-Daemon, der direkt auf Port 514 Meldungen entgegennimmt sowie einen SNMP-Trap-Receiver welcher auf Port 162 Traps empfängt.

Metrik-Graphing

Die kommerziellen Checkmk-Editionen verwenden ein eigenes Metrik- und Graphing-System. Mit diesem können Zeitreihenmetriken über lange Zeiträume mit interaktiven HTML5-Graphen analysiert werden. Die maximale Auflösung beträgt dabei eine Sekunde. Daten können aus einer Vielzahl von Datenquellen und Formaten für Metriken (JSON, XML, SNMP usw.) importiert werden und in eine plattenplatzsparende Langzeitdatenspeicherung abgelegt werden.

Alternativ können über eine Exportschnittstelle Graphite oder InfluxDB angeschlossen werden. Ab der Version CEE 1.5p16 existiert zusätzlich auch ein Datasource-Plugin für Grafana, um Daten direkt aus Checkmk in Grafana zur Visualisierung zu integrieren. Die Checkmk Raw Edition verwendet aktuell weiterhin PNP4Nagios als Graphing-System.

Reporting

Das Reporting ermöglicht die direkte Bereitstellung von PDF-Berichten, ad-hoc oder automatisiert in regelmäßigen Abständen. Es beinhaltet eine Verfügbarkeitsanalyse in der die Historie der Zustände mit einem Klick über einen beliebigen Zeitraum mit Berechnung der Verfügbarkeit bereitgestellt werden kann Verfügbarkeitsberechnungen können nicht überwachte Zeiten ausschließen, die Auflösung anpassen oder kurze Intervalle ignorieren. Neben den Verfügbarkeitsberechnungen beinhaltet das Reporting auch ein SLA-Reporting, in dem komplexe SLAs überwacht werden können. Das Reporting ist nur in den kommerziellen Varianten von Checkmk verfügbar.

Hardware-Software-Inventory

  • Das Hardware-Software-Inventory ermitteln den Bestand der gesamten Hard- und Software
  • Änderungen an der Hard- und Software überwachen, das Vorhandensein von installierten Sicherheitsupdates überprüfen
  • Zur Configuration Management Database (CMDB) i-doit besteht eine tiefe Integration, die den Austausch von CMDB-Daten mit Monitoringdaten ermöglicht.