Was ist checkmk: Unterschied zwischen den Versionen

Aus Xinux Wiki
Zur Navigation springen Zur Suche springen
 
(4 dazwischenliegende Versionen von einem anderen Benutzer werden nicht angezeigt)
Zeile 1: Zeile 1:
 +
[[Kategorie:Checkmk]]
 
=Grundlegendes=
 
=Grundlegendes=
 
*Checkmk ist eine Software für das Service-Monitoring von IT-Infrastruktur.
 
*Checkmk ist eine Software für das Service-Monitoring von IT-Infrastruktur.
Zeile 55: Zeile 56:
  
 
==Business Intelligence==
 
==Business Intelligence==
Das Business-Intelligence-Modul ist in die grafische Benutzeroberfläche integriert. Es aggregiert regelbasiert aus vielen einzelnen Statusdaten von Hosts und Services den Gesamtzustand von Geschäftsprozessen, deren Abhängigkeit von komplexen Anwendungen und deren Abhängigkeit von IT-Infrastrukturelementen. Es kann auch zur Darstellung von Anwendungen genutzt werden, die sich aus Microservices zusammensetzen, welche ihrerseits wieder aus Kubernetes-Pods und -Deployments bestehen. Des Weiteren können Worst-Case-Szenarien in Echtzeit simuliert werden und historische Zustände analysiert werden, um Ursachen für verschlechterte Leistungen zu verstehen.
+
*Das Business-Intelligence-Modul ist in die grafische Benutzeroberfläche integriert.  
 +
*Es aggregiert regelbasiert einzelnen Statusdaten von Hosts und Services den Gesamtzustand von Geschäftsprozessen.
 +
*Worst-Case-Szenarien können in Echtzeit simuliert werden und historische Zustände analysiert werden.
  
 
==Event Console==
 
==Event Console==
Die Event Console integriert die Verarbeitung von Logmeldungen und SNMP-Traps in das Monitoring. Sie wird über ein flexibles Regelwerk konfiguriert und entscheidet, ob die eingehenden Meldungen verworfen werden oder wie sie eingestuft werden. Sie kann zählen, korrelieren, Meldungen erwarten, Meldungen umschreiben und mehr. Gleiche Einträge können zu einem einzigen Ereignis zusammengefasst werden (z. B. mehrere fehlgeschlagene Logins), um die Übersicht der Ereignisse zu wahren. Auch verfügt sie über einen eingebauten Syslog-Daemon, der direkt auf Port 514 Meldungen entgegennimmt sowie einen SNMP-Trap-Receiver welcher auf Port 162 Traps empfängt.
+
*Die Event Console integriert die Verarbeitung von Logmeldungen und SNMP-Traps in das Monitoring.  
 +
*Sie wird über ein flexibles Regelwerk konfiguriert und entscheidet, ob die eingehenden Meldungen verworfen werden oder wie sie eingestuft werden.
 +
*Verfügt über einen eingebauten Syslog-Daemon auf Port 514.
 +
*Und einen SNMP-Trap-Receiver welcher auf Port 162 Traps empfängt.
  
 
==Metrik-Graphing==
 
==Metrik-Graphing==
Die kommerziellen Checkmk-Editionen verwenden ein eigenes Metrik- und Graphing-System. Mit diesem können Zeitreihenmetriken über lange Zeiträume mit interaktiven HTML5-Graphen analysiert werden. Die maximale Auflösung beträgt dabei eine Sekunde. Daten können aus einer Vielzahl von Datenquellen und Formaten für Metriken (JSON, XML, SNMP usw.) importiert werden und in eine plattenplatzsparende Langzeitdatenspeicherung abgelegt werden.
+
*Die kommerziellen Checkmk-Editionen verwenden ein eigenes Metrik- und Graphing-System.  
 
+
*Daten können aus einer Vielzahl von Datenquellen und Formaten für Metriken importiert werden und in eine plattenplatzsparende Langzeitdatenspeicherung abgelegt werden.
Alternativ können über eine Exportschnittstelle Graphite oder InfluxDB angeschlossen werden. Ab der Version CEE 1.5p16 existiert zusätzlich auch ein Datasource-Plugin für Grafana, um Daten direkt aus Checkmk in Grafana zur Visualisierung zu integrieren. Die Checkmk Raw Edition verwendet aktuell weiterhin PNP4Nagios als Graphing-System.
+
*Alternativ können über eine Exportschnittstelle Graphite oder InfluxDB angeschlossen werden.
 +
*Ab Version CEE 1.5p16 existiert zusätzlich auch ein Datasource-Plugin für Grafana.
 +
*Die Checkmk Raw Edition verwendet aktuell weiterhin PNP4Nagios als Graphing-System.
  
 
==Reporting==
 
==Reporting==
Das Reporting ermöglicht die direkte Bereitstellung von PDF-Berichten, ad-hoc oder automatisiert in regelmäßigen Abständen. Es beinhaltet eine Verfügbarkeitsanalyse in der die Historie der Zustände mit einem Klick über einen beliebigen Zeitraum mit Berechnung der Verfügbarkeit bereitgestellt werden kann Verfügbarkeitsberechnungen können nicht überwachte Zeiten ausschließen, die Auflösung anpassen oder kurze Intervalle ignorieren. Neben den Verfügbarkeitsberechnungen beinhaltet das Reporting auch ein SLA-Reporting, in dem komplexe SLAs überwacht werden können. Das Reporting ist nur in den kommerziellen Varianten von Checkmk verfügbar.
+
*Das Reporting ermöglicht die direkte Bereitstellung von PDF-Berichten in regelmäßigen Abständen.  
 +
*Beinhaltet eine Verfügbarkeitsanalyse.
 +
*Verfügbarkeitsberechnungen können nicht überwachte Zeiten ausschließen, die Auflösung anpassen oder kurze Intervalle ignorieren.  
 +
*Das Reporting beinhaltet ein SLA-Reporting, in dem komplexe SLAs überwacht werden können.
 +
*Nur in den kommerziellen Varianten von Checkmk verfügbar.
  
 
==Hardware-Software-Inventory==
 
==Hardware-Software-Inventory==

Aktuelle Version vom 10. Oktober 2024, 10:28 Uhr

Grundlegendes

  • Checkmk ist eine Software für das Service-Monitoring von IT-Infrastruktur.
  • Sie wird zur Überwachung von Server, Netzwerk, Applikationen, Public Clouds, Containern, Speicher, Datenbanken und Umweltsensoren genutzt.
  • Checkmk gibt es in drei Editionen
    • Open Source Edition („Checkmk Raw Edition – CRE“)
    • Enterprise Edition („Checkmk Enterprise Edition – CEE“)
    • Edition für Managed Services Provider („Checkmk Managed Services Edition – CME“).
  • Verfügbar sind diese Checkmk-Editionen für eine Reihe von Plattformen
    • Debian, Ubuntu, SLES und RedHat/CentOS, sowie als Docker-Image.
    • physische Appliances unterschiedlicher Größe
    • Virtuelle Appliance
    • Hochverfügbarkeitslösungen

Die Agenten, die Checkmk zum Datensammeln auf vielen Systemen einsetzt, sind dabei für 11 Plattformen verfügbar, darunter auch Windows.[5]

Komponenten

Monitoring-Kern („Checkmk Microcore – CMC“)

  • Die kommerziellen Varianten von Checkmk setzen einen eigenen, in C++ geschriebenen, Monitoring-Kern ein.
  • Die Open-Source-Variante „Checkmk Raw Edition“ setzt aktuell noch einen Nagios-Kern ein.

Konfiguration- & Check-Engine

  • Checkmk bietet eine eigenständige Diensterkennung und Einstellungserzeugung.
  • In der Prüfzeit wird jeder Host nur noch ein einziges Mal kontaktiert.
  • Die Prüfergebnisse werden an den Monitoring-Kern als passive Checks übermittelt.

Checkmk nutzt unterschiedliche Methoden, um auf die Daten der Zielsysteme zuzugreifen

  • Agenten, die auf dem Ziel-System installiert werden,
  • Special Agents“, die auf dem Monitoring-Server laufen und mit der API des Zielsystems kommunizieren
  • SNMP-API für die Überwachung von Netzwerkgeräten und Druckern
  • HTTP/TCP-Protokolle, um mit Webservices und Internetdiensten zu kommunizieren

Datenschnittstelle („Livestatus“)

  • Stellt einen Live-Zugriff auf alle Daten der überwachten Hosts und Services zur Verfügung.
  • Die Daten werden direkt aus dem RAM geholt.
  • Zugriff erfolgt über ein einfaches Protokoll und ist von allen Programmiersprachen aus ohne eine spezielle Bibliothek möglich.

Web-GUI („Multisite“)

  • Multisite ist die Web-GUI von Checkmk.
  • Zugriff auf Statusdaten via Webservice
  • verteiltes Monitoring durch Einbinden mehrer Monitoring-Instanzen via Livestatus
  • Dashboards und Ansichten sind individuelle anpassbar.

Web Administration

  • Komplett über den Browser administrierbar.
  • Verwaltung von Benutzern, Rollen, Gruppen, Zeitperioden, und mehr.
  • Rollenkonzept können Berechtigungen auf diese Weise granular vergeben werden.
  • LDAP und AD Anbindung

Benachrichtigungssystem

  • Mehrere Benachrichtigungskanäle pro Benutzer.
  • Benachrichtigungen werden regelbasiert konfiguriert.
  • Die Benachrichtigungen können an alle oder auch nur an bestimmte Teams gehen.
  • Doppelte Benachrichtigungen werden dabei zusammengefasst.
  • Anwender können ihre Benachrichtigungen selbst konfigurieren.
  • Für erkannte Probleme können automatisch Aktionen ausgelöst werden.

Business Intelligence

  • Das Business-Intelligence-Modul ist in die grafische Benutzeroberfläche integriert.
  • Es aggregiert regelbasiert einzelnen Statusdaten von Hosts und Services den Gesamtzustand von Geschäftsprozessen.
  • Worst-Case-Szenarien können in Echtzeit simuliert werden und historische Zustände analysiert werden.

Event Console

  • Die Event Console integriert die Verarbeitung von Logmeldungen und SNMP-Traps in das Monitoring.
  • Sie wird über ein flexibles Regelwerk konfiguriert und entscheidet, ob die eingehenden Meldungen verworfen werden oder wie sie eingestuft werden.
  • Verfügt über einen eingebauten Syslog-Daemon auf Port 514.
  • Und einen SNMP-Trap-Receiver welcher auf Port 162 Traps empfängt.

Metrik-Graphing

  • Die kommerziellen Checkmk-Editionen verwenden ein eigenes Metrik- und Graphing-System.
  • Daten können aus einer Vielzahl von Datenquellen und Formaten für Metriken importiert werden und in eine plattenplatzsparende Langzeitdatenspeicherung abgelegt werden.
  • Alternativ können über eine Exportschnittstelle Graphite oder InfluxDB angeschlossen werden.
  • Ab Version CEE 1.5p16 existiert zusätzlich auch ein Datasource-Plugin für Grafana.
  • Die Checkmk Raw Edition verwendet aktuell weiterhin PNP4Nagios als Graphing-System.

Reporting

  • Das Reporting ermöglicht die direkte Bereitstellung von PDF-Berichten in regelmäßigen Abständen.
  • Beinhaltet eine Verfügbarkeitsanalyse.
  • Verfügbarkeitsberechnungen können nicht überwachte Zeiten ausschließen, die Auflösung anpassen oder kurze Intervalle ignorieren.
  • Das Reporting beinhaltet ein SLA-Reporting, in dem komplexe SLAs überwacht werden können.
  • Nur in den kommerziellen Varianten von Checkmk verfügbar.

Hardware-Software-Inventory

  • Das Hardware-Software-Inventory ermitteln den Bestand der gesamten Hard- und Software
  • Änderungen an der Hard- und Software überwachen, das Vorhandensein von installierten Sicherheitsupdates überprüfen
  • Zur Configuration Management Database (CMDB) i-doit besteht eine tiefe Integration, die den Austausch von CMDB-Daten mit Monitoringdaten ermöglicht.