Wie behebt man – Failover Cluster Manager trennt die Verbindung und verbindet sich wieder – Ereignis-IDs 1146 und 1265?
Zusammenfassung: Ein unerwartetes und ungeplantes Failover oder Herunterfahren des Clusters kann dazu führen, dass Sie nicht mehr auf Ihre Postfächer zugreifen können. In diesem Artikel besprechen wir das Problem, dass der Failover Cluster Manager die Verbindung mit den Ereignis-IDs 1146 und 1265 unterbricht und wieder herstellt, sowie die möglichen Lösungen zur Behebung solcher Probleme. Darüber hinaus erfahren Sie mehr über ein Exchange-Reparaturtool, mit dem Sie Postfächer und andere Daten aus einer beschädigten Datenbank wiederherstellen können.
Exchange Server verfügt mit der Database Availability Group (DAG) über ein ausgezeichnetes Hochverfügbarkeitssystem. In diesem Artikel werden wir über zwei Ereignisse in der Ereignisanzeige sprechen – Ereignis-ID 1146 und Ereignis-ID 1265, die beide mit dem Windows Cluster Service zusammenhängen, der die Verfügbarkeitsgruppe von Exchange Server steuert.
Werfen wir einen detaillierten Blick auf die genannten Ereignisse.
Ereignis-ID 1146 – Microsoft Windows Failover Clustering
Die Ereignis-ID 1146 wird mit den folgenden Informationen angezeigt:
"Das
Cluster Resource Host Subsystem (RHS) wurde unerwartet angehalten. Es wird versucht, es neu zu starten. Dies ist normalerweise auf ein Problem in einer Ressourcen-DLL zurückzuführen. Bitte identifizieren Sie die Ressourcen-DLL, die das Problem verursacht, und melden Sie das Problem dem Ressourcenanbieter."
Die Meldung zeigt an, dass etwas im Zusammenhang mit dem Cluster Resource Host Subsystem (RHS) nicht mehr funktioniert. Um das Problem zu beheben, müssen Sie zuerst prüfen, welche DLL-Datei das Problem verursacht, abgesehen davon, dass Sie es Ihrem Exchange Server-Experten oder -Händler melden müssen. Um die Ursache des Problems zu verstehen, müssen Sie weitere Nachforschungen anstellen.
Die Fehlermeldung weist darauf hin, dass das Subsystem abgestürzt ist und ein Versuch zum Neustart des Subsystems eingeleitet wird. Dies geschieht in der Regel bei einer Datenrettung oder wenn sich die Ressource in einer Sackgasse befindet.
Wenn die Deadlock-Zeitüberschreitung (die standardmäßig 20 Minuten beträgt) im Cluster-Dienst abläuft, betrachtet das Cluster Resource Host Subsystem (RHS) den Server als ausgefallen und erzwingt einen Failover-Prozess. Wenn einer der Knoten ausgefallen ist (bei nur einem Knoten im Cluster), wird der Cluster zum Schutz heruntergefahren.
Ereignis-ID 1265 – Microsoft Windows Failover Clustering
Diese Ereignis-ID erscheint, wenn es im Cluster Resource Host Subsystem (RHS) zu einem Deadlock kommt oder die DLL abgestürzt ist. Der Prozess wird in diesem Stadium abgebrochen. Es handelt sich um eine Benachrichtigung, dass der Prozess abgestürzt ist und die Ereignis-ID 1146 wird den Cluster herunterfahren.
Fehlerbehebung des Problems
Lassen Sie uns die Vorgehensweise zur Behebung des Problems besprechen.
- Zuerst müssen Sie die Ereignisanzeige öffnen und den Eintrag mit der Ereignis-ID 1265 finden. Notieren Sie sich das genaue Datum/die genaue Uhrzeit und den Namen/Typ der Ressource. Dies wird Ihnen bei der Fehlersuche helfen.
- Führen Sie dann den Befehl Get-ClusterLog in einem PowerShell-Fenster als Administrator aus und extrahieren Sie das Protokoll des Clusters.
- Dadurch wird das Protokoll erstellt, das Sie unter C:\Windows\Cluster\Reports in der Datei Cluster.log finden.
- Überprüfen Sie das genaue Datum und die Uhrzeit in der Ereignisanzeige und suchen Sie im Clusterprotokoll danach.
- Sie werden ein Ereignis finden, das dem unten stehenden ähnelt.
ERR [RHS] RhsCall::DeadlockMonitor: Der ISALIVE-Aufruf wurde für die Ressource 'Ressourcenname' abgebrochen.
INFO [RHS] Aktivieren Sie den RHS-Beendigungs-Watchdog mit Timeout 1200000 und Datenrettung 3.
ERR [RHS] Ressource Ressourcenname behandelt Deadlock. Bereinigung des laufenden Vorgangs und Beendigung des RHS-Prozesses
Anhand des Fehlers können Sie genau erkennen, welche Ressource das Problem verursacht. Es könnte Probleme mit der E/A oder sogar mit der Leistung des Speichers geben. Sie können die Auslastung der Laufwerke untersuchen. Sie können auch untersuchen, ob ein fehlerhaftes Laufwerk im RAID vorhanden ist oder eine fehlerhafte Festplatte ausgetauscht wurde, aber der Wiederaufbau des RAID die Leistung des Servers beeinträchtigt.
Zum Abschluss
Sie haben möglicherweise Probleme mit den Exchange-Servern, die Teil des Clusters sind. Nach einem abrupten Neustart würden die Dienste nicht mehr starten oder die Datenbanken können aufgrund von beschädigten Transaktionsprotokollen/Datenbanken nicht mehr gemountet werden. Die Lösung besteht darin, die Exchange-Postfachdatenbank wiederherzustellen. Dies bedeutet jedoch zusätzliche Arbeit für die Abteilung und einen Datenverlust für das Unternehmen.
Sie können den Exchange Server wiederherstellen und den Wiederherstellungsmodus verwenden, um alle Konfigurationen des Exchange Servers wiederherzustellen, wobei der Computername und die IP-Adresse erhalten bleiben. Die Datenrettung von Exchange Server kann mit Stellar Repair for Exchange durchgeführt werden. Mit dieser Anwendung können Sie beschädigte EDB-Dateien von jeder Exchange Server-Version öffnen, ohne Größenbeschränkung. Sie können die Datenspeicher durchsuchen und die wiederhergestellte Datenbank granular in PST, direkt in eine Live Exchange Server-Datenbank oder einen Office 365-Mieter exportieren. Die Anwendung ist nicht auf Benutzerpostfächer beschränkt. Es kann auch Benutzerarchive, deaktivierte Postfächer, freigegebene Postfächer und sogar öffentliche Ordner wiederherstellen. Stellar Repair for Exchange reduziert das RPO und RTO. Außerdem verringert es das Risiko eines Datenverlusts und die für die Datenrettung benötigte Zeit.