Cluster Validation mit 2008 R2

Cluster Validation wurde in der Version 2008 R2 weiter ausgebaut. Validation Tests sind eine gute Möglichkeit, um schnell und vor allem einfach herauszufinden, ob die Hardware- und Softwarekomponenten die Voraussetzungen für Failover Clustering erfüllen.

Windows Server 2008 R2 bietet nun durch die Validierung der Cluster Konfiguration zusätzlich die Möglichkeit einen laufenden Cluster hinsichtlich der getroffenen Einstellungen zu überprüfen.
Es können damit also nicht nur die Voraussetzungen vor einer Installation geprüft, sondern auch die aktuellen Settings der Ressourcen, Volumes, und des Quorums etc. – ideal zum Troubleshooting und für Dokumentationszwecke.

Validation Reports bestehen aus *.mht Dateien, die man mit einem Webbrowser öffnen kann.

Weiterführende Informationen zu den Validation Reports unter 2008 R2 im Detail:
http://technet.microsoft.com/en-us/library/cc726064.aspx

Aktuell umfasst die R2 Failover Cluster Validation die folgenden Punkte: Inventory tests, Storage tests, Network tests, System Configuration tests, Cluster Configuration tests

Stay tuned,
N.Own

Welches Quorum Model ist das passende?

Es gibt auf » MCSEboard.de immer wieder Fragen zu den Quorum Typen, die mit einem Windows Server Failover Cluster realisierbar sind. Mit Windows Server 2003 wurde ein neues Quorum Model eingeführt: Majority Node Set (MNS) und auch für Windows Server 2003 SP1 zog mit » File Share Witness ein neues cluster feature ein.

Mit Einführung von Windows Server 2008 wurden wieder neue Quorum Typen eingeführt, so daß es mittlerweile vier Quorum Models zur Auswahl gibt:

» Node Majority
» Node and Disk Majority
» Node and File Share Majority
» No Majority: Disk Only

Die neuen Typen verfolgen einen Vote-basierten Ansatz, bei dem eine Mehrheit an Stimmen den Ausschlag geben. Einige Quorum Typen sind für den Einsatz von Clustern mit gerader Anzahl an Nodes geeignet, andere zur Verwendung bei einer ungeraden Anzahl an Nodes. Auch die Storage spielt eine Rolle: Falls keine Shared Storage eingesetzt wird, sind nur zwei der Quorum Models sinnvoll. Als drittes Kriterium nennt Microsoft Multi-Site Cluster, ehemals Geo-Cluster.

Node Majority
Dieses Quorum Model bietet sich an für den Einsatz einer ungerade Anzahl an Nodes. Die Cluster- und Quorumdaten werden auf den lokalen Disks der einzelnen Nodes vorgehalten. Da die Daten auf den jeweiligen Nodes direkt abgelegt werden, hat jeder Node eine Voting Stimme – damit muss eine Mehrheit der Nodes online sein (N/2 + 1).
Daher ist es nicht sinnvoll diesen Quorum Typ bei gerader Anzahl an Nodes auszuwählen. Es wird keine Shared Storage vorausgesetzt.

Node and Disk Majority
Der Quorum Typ Node and Disk Majority wird für eine gerade Anzahl an Nodes empfohlen, da die Cluster Konfiguration zusätzlich noch auf einer Witness Disk abgelegt wird – im Gegensatz zu einer reinen File Share Witness. Damit erhält man für die Witness Disk eine weitere Voting Stimme.
Solange die Witness Disk online bleibt, kann die Hälfte der Nodes ausfallen (N/2). Dieses Quorum Model wird bei einer gerade Anzahl an Nodes standardmäßig ausgewählt, eine Shared Storage ist Voraussetzung.

Node and File Share Majority
Dieser Quorum Typ ist sehr ähnlich zu „Node and Disk Majority“, mit dem Unterschied, daß keine Disk als Voting Stimme zum Einsatz kommt, sondern eine beliebige Freigabe auf einem Server. Die Cluster Konfiguration wird dabei nicht auf dem File Share abgelegt – nur die Information darüber, welcher Node eine aktuelle Version bereithält. Falls ein Node bei einem Two Node Cluster ausfällt und der aktive keine aktuelle Daten bereithält, bleibt der Cluster offline.
Da die beiden Knoten einen identische Datenbestand aufweisen müssen für einen fehlerfreien Betrieb des Clusters, kann es bei diesem Typ zu einer „Partition in Time“, sprich: Inkonsistenzen, kommen.
Daher ist dieses Quorum Model nur in Einzelfällen einzusetzen.

No Majority: Disk Only
Der vierte Quorum Typ ist der bei Windows 2000 Server und Windows Server 2003 favorisierte und erfordert eine Shared Storage. Es können N-1 Nodes ausfallen.
Da die Storage ein SPoF darstellt, ist dieses Quorum Model inzwischen überholt: Mit Windows Server 2008 wird beim Einsatz einer Shared Storage ein Quorum vom Typ „Node and Disk Majority“ empfohlen.

Folgende TechNet Artikel bieten weiterführende Informationen:
» Understanding Quorum Configurations in a Failover Cluster
» Additional Information About Quorum Modes
» Guide: Configuring the Quorum in a Failover Cluster
» Details of How Quorum Works in a Failover Cluster

Die Wahl des Quorums will wohl überlegt sein, dabei sind die Artikel sehr hilfreich.

Stay tuned,
N.Own

Troubleshooten des Quorum Drives

Das Quorum Drive ist ein systemkritisches Volume eines Windows Server Failover Clusters. Sollte es Probleme mit dem Quorum geben, so daß ein Wechsel des Quorums nötig ist, kann der Cluster mit folgendem Kommando dazu gebracht werden ohne Quorum zu starten:

clussvc /debug /fixquorum

Die weiteren Nodes sollten dabei ausgeschaltet bleiben. Der Schalter sollte nur für den Zeitraum eines Quorumwechsels oder für Troubleshootingzwecke genutzt werden.
Um Probleme mit dem Quorum auszuschließen, kann der Schalter auch verwendet werden, da einem der Aufruf aus einer cmd.exe heraus mit dem Schalter /debug weiterführende Informationen zum Status des Clusters gibt.

Folgender TechNet Artikel beschreibt den Wechsel des Quorum Drives:
» KB280353: How to Change the Quorum Disk Designation

Falls das Quorum Drive aufgrund eines Defekts nicht mehr erreichbar ist, kann es zum EventID 1034 kommen. Auch wenn sich die Signatur der Disk ändert, wird das Volume nicht mehr vom ClusDisk Treiber als das ursprüngliche Drive erkannt.

In beiden Fällen kann mit dem Tool ClusterRecovery oder dumpcfg gearbeitet werden, um eine Disk zu tauschen:
» KB305793: How to replace a disk on a Windows server cluster
Das Tool dumpfg.exe gehört zum Windows 2000 Resource Kit und ist nicht als Download verfügbar, ich empfehle den Einsatz des aktuelleren Cluster Server Recovery Utility (ClusterRecovery.exe).
Dieses ist hier als Download verfügbar:
» Cluster Server Recovery Utility (ClusterRecovery.exe)
Das Tool clusterrecovery.exe gehört zum Windows Server 2003 Resource Kit und läuft auf Windows 2000 und Windows 2003 Server Clustern.
Weitere Informationen zu dem Thema findet man in folgendem TechNet Artikel:
» Troubleshooting Quorum Resource Problems

Um die Disk Signature zu sichern, kann das Tool confdisk.exe verwendet werden, es gehört zum Windows Server 2003 Resource Kit ist und hier als Download verfügbar:
Windows Server 2003 Resource Kit Tools

Mit folgendem Befehl kann man die Disk Configuration speichern:

confdisk /save c:\disks.sif

Die Disk Signatur kann man mit dumpcfg.exe einsehen, alternativ dazu kann man cluster.exe oder diskpart nutzen:

cluster resource <Datenträgerbezeichnung> /priv

oder

diskpart
list disk
select disk <id>
detail disk

Es empfiehlt sich eine freie LUN auf der Storage als Ersatz für das Quorum Laufwerk verfügbar zu halten. Jeweils ein GB für Quorum und Ersatzquorum ist bei den heutigen Diskgrößen kein Thema mehr und erleichtert einem die Fehlerbehebung im Falle eines Quorum-Ausfalls.

Stay tuned,
N.Own