¿Cómo solucionar – Failover Cluster Manager se desconecta y se vuelve a conectar – Event IDs 1146 y 1265?

Summary: Una conmutación por error o una desconexión del clúster inesperadas y no planificadas pueden provocar que no pueda acceder a sus buzones de correo. En este artículo, trataremos el problema de la desconexión y reconexión del Administrador de clústeres de conmutación por error con los ID de evento 1146 y 1265 y las posibles soluciones para resolver dichos problemas. Además, obtendrá más información sobre una herramienta de reparación de Exchange que puede utilizar para restaurar buzones de correo y otros datos de una base de datos dañada.

Exchange Server dispone de un excelente sistema de alta disponibilidad con el Grupo de Disponibilidad de Bases de Datos (DAG). En este artículo, hablaremos de dos eventos en el Visor de Eventos – Evento ID 1146 y Evento ID 1265, ambos relacionados con el Servicio de Cluster de Windows que controla el grupo de disponibilidad de Exchange Server.

Echemos un vistazo detallado a los acontecimientos mencionados.

Evento ID 1146 – Microsoft Windows Failover Clustering

Aparece el evento ID 1146 con la siguiente información:

"El subsistema de host de recursos del cluster (RHS) se detuvo inesperadamente. Se está intentando reiniciarlo. Esto suele deberse a un problema en una DLL de recursos. Por favor, identifique la DLL de recursos que está causando el problema e informe del problema al proveedor de recursos."

El mensaje indica que algo relacionado con el subsistema de host de recursos de cluster (RHS) ha dejado de funcionar. Para solucionar el problema, primero deberá comprobar qué archivo DLL está causando el problema, además de informar a su experto o proveedor de Exchange Server. Para conocer la causa del problema, deberá investigar más a fondo.

El mensaje de error indica que el subsistema se ha bloqueado y se está intentando reiniciarlo. Esto suele ocurrir con la recuperación de Datos o el recurso está en punto muerto.

Si transcurre el tiempo de espera de bloqueo (que es de 20 minutos por defecto) en el servicio de clúster, el subsistema anfitrión de recursos del clúster (RHS) considera que el servidor ha fallado y fuerza un proceso de conmutación por error. Si uno de los nodos ha fallado (con un solo nodo en el cluster), el cluster se apaga por salvaguarda.

Evento ID 1265 – Microsoft Windows Failover Clustering

Este ID de evento aparece si hay un bloqueo en el subsistema de host de recursos del cluster (RHS) o si la DLL se ha bloqueado. El proceso se cancela en este momento. Es una notificación de que el proceso se ha bloqueado y el evento ID 1146 apagará el cluster.

Solución del problema

Analicemos el procedimiento para rectificar el problema.

ERR [RHS] RhsCall::DeadlockMonitor: La llamada ISALIVE fue cancelada para el recurso 'nombre de recurso'.

INFO [RHS] Activar el perro guardián de terminación RHS con tiempo de espera 1200000 y recuperación de datos 3.

ERR [RHS] El recurso NombreDelRecurso maneja un punto muerto. Limpieza de la operación en curso y terminación del proceso RHS

Basándose en el error, puede reconocer exactamente qué recurso está causando el problema. Podría haber problemas con la E/S o incluso con el rendimiento de la memoria. Puede examinar la utilización de los discos duros. También puede investigar si hay una unidad defectuosa en el RAID o si se ha sustituido un disco duro defectuoso pero la reconstrucción del RAID está afectando al rendimiento del servidor.

Para concluir

Es posible que tenga problemas con los servidores Exchange que forman parte del cluster. Tras un reinicio brusco, los servicios dejarían de iniciarse o las bases de datos ya no pueden montarse debido a que los registros de transacciones/la base de datos están dañados. La solución consiste en restaurar la base de datos de buzones de Exchange. Sin embargo, esto supone trabajo adicional para el departamento y una pérdida de datos para la empresa.

Puede reconstruir el Exchange Server y utilizar el modo de recuperación para restaurar todas las configuraciones del Exchange Server, conservando el nombre del ordenador y la dirección IP. La parte de recuperación de datos de Exchange Server puede realizarse con Stellar Repair for Exchange. Con esta aplicación, puede abrir archivos EDB corruptos de cualquier versión de Exchange Server, sin limitación de tamaño. Puede explorar los almacenes de datos y exportar la base de datos recuperada granularmente a PST, directamente a una base de datos de Exchange Server en vivo o a un inquilino de Office 365. La aplicación no se limita a los buzones de usuario. También puede recuperar archivos de usuario, buzones desactivados, buzones compartidos e incluso carpetas públicas. Stellar Repair for Exchange reduce el RPO y el RTO. También reduce el riesgo de pérdida de datos y el tiempo necesario para su recuperación.

Related Post

Exit mobile version