Exchange Server dispone de un excelente sistema de alta disponibilidad con el Grupo de Disponibilidad de Bases de Datos (DAG). En este artículo, hablaremos de dos eventos en el Visor de Eventos – Evento ID 1146 y Evento ID 1265, ambos relacionados con el Servicio de Cluster de Windows que controla el grupo de disponibilidad de Exchange Server.
Echemos un vistazo detallado a los acontecimientos mencionados.
Evento ID 1146 – Microsoft Windows Failover Clustering
Aparece el evento ID 1146 con la siguiente información:
"El
subsistema de host de recursos del cluster (RHS) se detuvo inesperadamente. Se está intentando reiniciarlo. Esto suele deberse a un problema en una DLL de recursos. Por favor, identifique la DLL de recursos que está causando el problema e informe del problema al proveedor de recursos."
El mensaje indica que algo relacionado con el subsistema de host de recursos de cluster (RHS) ha dejado de funcionar. Para solucionar el problema, primero deberá comprobar qué archivo DLL está causando el problema, además de informar a su experto o proveedor de Exchange Server. Para conocer la causa del problema, deberá investigar más a fondo.
El mensaje de error indica que el subsistema se ha bloqueado y se está intentando reiniciarlo. Esto suele ocurrir con la recuperación de Datos o el recurso está en punto muerto.
Si transcurre el tiempo de espera de bloqueo (que es de 20 minutos por defecto) en el servicio de clúster, el subsistema anfitrión de recursos del clúster (RHS) considera que el servidor ha fallado y fuerza un proceso de conmutación por error. Si uno de los nodos ha fallado (con un solo nodo en el cluster), el cluster se apaga por salvaguarda.
Evento ID 1265 – Microsoft Windows Failover Clustering
Este ID de evento aparece si hay un bloqueo en el subsistema de host de recursos del cluster (RHS) o si la DLL se ha bloqueado. El proceso se cancela en este momento. Es una notificación de que el proceso se ha bloqueado y el evento ID 1146 apagará el cluster.
Solución del problema
Analicemos el procedimiento para rectificar el problema.
- En primer lugar, tiene que abrir el visor de sucesos y encontrar la entrada con el ID de suceso 1265. Anote la fecha/hora exacta y el nombre/tipo de recurso. Esto le ayudará en la resolución de problemas.
- A continuación, ejecute el comando Get-ClusterLog en una ventana de PowerShell como administrador y extraiga el registro del clúster.
- Esto crea el registro, que puede encontrar en C:\Windows\Cluster\Reports en el archivo Cluster.log.
- Compruebe la fecha y hora exactas en la pantalla de eventos y búsquela en el registro del cluster.
- Encontrará un evento similar al siguiente.
ERR [RHS] RhsCall::DeadlockMonitor: La llamada ISALIVE fue cancelada para el recurso 'nombre de recurso'.
INFO [RHS] Activar el perro guardián de terminación RHS con tiempo de espera 1200000 y recuperación de datos 3.
ERR [RHS] El recurso NombreDelRecurso maneja un punto muerto. Limpieza de la operación en curso y terminación del proceso RHS
Basándose en el error, puede reconocer exactamente qué recurso está causando el problema. Podría haber problemas con la E/S o incluso con el rendimiento de la memoria. Puede examinar la utilización de los discos duros. También puede investigar si hay una unidad defectuosa en el RAID o si se ha sustituido un disco duro defectuoso pero la reconstrucción del RAID está afectando al rendimiento del servidor.
Para concluir
Es posible que tenga problemas con los servidores Exchange que forman parte del cluster. Tras un reinicio brusco, los servicios dejarían de iniciarse o las bases de datos ya no pueden montarse debido a que los registros de transacciones/la base de datos están dañados. La solución consiste en restaurar la base de datos de buzones de Exchange. Sin embargo, esto supone trabajo adicional para el departamento y una pérdida de datos para la empresa.
Puede reconstruir el Exchange Server y utilizar el modo de recuperación para restaurar todas las configuraciones del Exchange Server, conservando el nombre del ordenador y la dirección IP. La parte de recuperación de datos de Exchange Server puede realizarse con Stellar Repair for Exchange. Con esta aplicación, puede abrir archivos EDB corruptos de cualquier versión de Exchange Server, sin limitación de tamaño. Puede explorar los almacenes de datos y exportar la base de datos recuperada granularmente a PST, directamente a una base de datos de Exchange Server en vivo o a un inquilino de Office 365. La aplicación no se limita a los buzones de usuario. También puede recuperar archivos de usuario, buzones desactivados, buzones compartidos e incluso carpetas públicas. Stellar Repair for Exchange reduce el RPO y el RTO. También reduce el riesgo de pérdida de datos y el tiempo necesario para su recuperación.
Was this article helpful?