Vsphere-High-Availibity Netzwerk Heartbeat
Zur Navigation springen
Zur Suche springen
Normalbetrieb VMware High Availability (HA)
Das Bild zeigt eine VMware vSphere High Availability (HA) Konfiguration. Hier sind die relevanten HA-Konzepte und ihre Funktionen:
HA Cluster
- Die ESXi-Hosts im Bild sind Teil eines HA-Clusters, das aus mehreren Hosts besteht. Ein Host ist als Master konfiguriert, die anderen Hosts sind Slave-Hosts.
Master-Slave-Konfiguration
- Der Master-Host überwacht die anderen Hosts im Cluster (die Slave-Hosts) sowie die virtuellen Maschinen (VMs). Er koordiniert die HA-Aktivitäten, wie das Starten von VMs auf anderen Hosts, wenn ein Slave-Host ausfällt.
- Die Slave-Hosts führen die virtuellen Maschinen aus und berichten ihren Status an den Master-Host.
Heartbeat
- Die roten Herzen im Bild stellen den Heartbeat dar, ein Mechanismus zur Überwachung des Zustands der Hosts. Die ESXi-Hosts senden regelmäßig "Herzschlag"-Signale über das Management-Netzwerk an den Master-Host, um zu signalisieren, dass sie funktionsfähig sind.
- Fällt ein Heartbeat aus, wird angenommen, dass der Host ausgefallen ist, und HA wird aktiv, um die auf diesem Host laufenden VMs auf anderen Hosts neu zu starten.
Datenspeicher (VMFS/NFS)
- Die VMs werden auf gemeinsamen Datenspeichern (VMFS/NFS) gespeichert, die für alle Hosts im Cluster zugänglich sind. Dies ermöglicht es dem HA-Cluster, VMs nach einem Host-Ausfall auf einem anderen Host neu zu starten.
Management-Netzwerk
- Es gibt zwei Management-Netzwerke (A und B), die für die redundante Kommunikation zwischen den ESXi-Hosts und dem vCenter Server genutzt werden. Dies sorgt für zusätzliche Ausfallsicherheit.
Ausfall VMware High Availability (HA) Slave
Slave-Host Ausfall
- Der ESXi-Host auf der linken Seite ist als Slave konfiguriert und wird im Bild als ausgefallen dargestellt (roter Hintergrund). Dieser Host ist nicht mehr funktionsfähig und kann die darauf laufenden virtuellen Maschinen (VMs) nicht mehr betreiben.
Heartbeat Überwachung
- Der Ausfall des Slave-Hosts wird durch den Verlust des Heartbeats im primären und alternativen Heartbeat-Netzwerk festgestellt. Die anderen Hosts (Master und verbleibender Slave) erhalten keine Heartbeat-Signale mehr von dem ausgefallenen Host.
Master-Host Aktion
- Der Master-Host erkennt den Ausfall des Slave-Hosts anhand des fehlenden Heartbeats und initiiert die notwendigen Schritte, um die Hochverfügbarkeit sicherzustellen.
- Die betroffenen VMs, die auf dem ausgefallenen Slave-Host liefen, werden vom Master-Host neu gestartet. Dazu greift der Master auf die VM-Dateien zu, die auf dem gemeinsamen Datenspeicher (VMFS oder NAS/NFS) liegen.
File Locking Mechanismen
- Die gemeinsamen Datenspeicher verwenden File Locks und eine Heartbeat Region (bei VMFS), um sicherzustellen, dass VMs nicht gleichzeitig von mehreren Hosts betrieben werden und um den aktuellen Status der VMs zu überwachen. Bei einem Host-Ausfall werden diese Locks auf den verbleibenden Hosts neu konfiguriert, sodass die VMs auf einem anderen Host im Cluster neu gestartet werden können.
Zusammenfassung
- Der Ausfall eines Slave-Hosts in einem VMware HA-Cluster führt dazu, dass der Master-Host die Kontrolle übernimmt und die betroffenen VMs auf einem anderen funktionsfähigen Host im Cluster neu startet, um die Verfügbarkeit der VMs sicherzustellen.
Ausfall VMware High Availability (HA) Master
Master-Host Ausfall
- Der ESXi-Host in der Mitte des Clusters ist als Master konfiguriert und wird im Bild als ausgefallen dargestellt (roter Hintergrund). Dieser Host ist für die Überwachung der Slave-Hosts und die Koordination von HA-Aktivitäten verantwortlich.
Auswirkungen des Ausfalls
- Beim Ausfall des Master-Hosts gehen alle direkten Überwachungsfunktionen verloren, die dieser Host durchgeführt hat. Die Slave-Hosts bemerken den Ausfall, da sie keine Heartbeat-Signale mehr vom Master empfangen.
Wahl eines neuen Master-Hosts
- Einer der verbleibenden Slave-Hosts (in diesem Fall entweder der Host mit der MOID 98 (Managed Object ID) oder der Host mit der MOID 100) wird automatisch zum neuen Master-Host gewählt.
- Diese Wahl erfolgt durch einen Abstimmungsprozess unter den verbleibenden Hosts im Cluster.
- Der neue Master-Host übernimmt dann die Überwachungs- und Verwaltungsaufgaben für die verbleibenden Hosts und VMs.
Heartbeat und Isolation-Handling
- Wie im Bild gezeigt, erfolgt die Kommunikation zwischen den Hosts über das Primäre und Alternative Heartbeat Netzwerk.
- Zusätzlich wird eine Isolation Address (z. B. der Default Gateway) verwendet, um die Netzwerkkonnektivität zu überprüfen und sicherzustellen, dass die Hosts noch miteinander kommunizieren können.
- Nach dem Master-Ausfall verwenden die verbleibenden Hosts diese Mechanismen, um sicherzustellen, dass der Cluster weiterhin konsistent bleibt und alle VMs verfügbar bleiben.
File Locking Mechanismen
- Ähnlich wie beim Slave-Host-Ausfall verwendet das System File Locks und eine Heartbeat Region auf den Datenspeichern (VMFS und NAS/NFS), um den Zustand der VMs zu überwachen und sicherzustellen, dass sie nur von einem Host gleichzeitig ausgeführt werden.
Zusammenfassung
- Beim Ausfall des Master-Hosts in einem VMware HA-Cluster wird einer der verbleibenden Slave-Hosts automatisch zum neuen Master gewählt. Dieser neue Master übernimmt die HA-Verwaltungsaufgaben, wodurch die Verfügbarkeit der VMs im Cluster weiterhin gewährleistet bleibt.
Ausfall VMware High Availability (HA) Isolierter Host
Host-Isolation
- Ein isolierter Host ist ein Zustand, in dem ein ESXi-Host keinen Netzwerkverkehr über seine Management-Schnittstelle wahrnimmt und die konfigurierte Isolation Address (z. B. den Default Gateway) nicht erreichen kann. In dieser Situation betrachtet sich der Host als isoliert vom Rest des Clusters.
Ursachen der Isolation
- Isolation kann durch verschiedene Netzwerkprobleme verursacht werden, wie z.B.:
- Ausfall des primären und alternativen Heartbeat-Netzwerks.
- Probleme mit der Netzwerkkonfiguration des Hosts, die verhindern, dass er die Isolation Address erreicht.
- Allgemeine Netzwerkpartitionen, die den Host vom Rest des Clusters trennen.
Auswirkungen der Isolation
- Ein isolierter Host kann möglicherweise keine Heartbeat-Signale mehr an den vCenter Server oder die anderen Hosts im Cluster senden. Dadurch kann der Cluster annehmen, dass der Host ausgefallen ist.
- In Abhängigkeit von der HA-Konfiguration und den Isolation-Aktionen, die für den Cluster definiert sind, kann der isolierte Host entweder die auf ihm laufenden VMs abschalten (um ein Split-Brain-Szenario zu vermeiden) oder sie weiter ausführen.
- Gleichzeitig können die VMs auf einem anderen Host im Cluster neu gestartet werden.
Isolation Address
- Die Isolation Address ist eine IP-Adresse (oft die IP-Adresse des Default Gateway), die vom Host regelmäßig gepingt wird, um die Netzwerkkonnektivität zu überprüfen. Wenn der Host diese Adresse nicht erreichen kann, geht er in den Isolationsmodus über.
Zusammenfassung
- Wenn ein Host isoliert ist, kann er die Verbindung zu den anderen Hosts und zum vCenter Server nicht aufrechterhalten. In diesem Fall handelt er gemäß den konfigurierten Isolation-Aktionen, um die Integrität der VMs im Cluster zu gewährleisten.



