Summary: Malgré une surveillance et des correctifs constants, la matrice RAID tombe en panne ? Si cela se produit, la seule solution est de reconstruire la matrice. Mais reconstruire une matrice n'est pas une mince affaire. Le processus est long et nécessite de l'expertise. Pour reconstruire une matrice RAID en toute sécurité et sans perte de données, utilisez Stellar Data Recovery Technician. Obtenez le logiciel dès maintenant !
La façon la plus logique de réassembler les données d’une matrice de disques défaillante est de “copier les données sur un disque de rechange” et de remplacer le disque défaillant, puis d’utiliser les algorithmes RAID et les données de parité pour réassembler les données sur un nouveau disque.
Le seul problème avec la reconstruction d’un RAID est que pendant le processus de reconstruction d’une matrice RAID, les performances sont affectées par la latence. Il est possible d’éviter la latence en surveillant les disques de manière proactive avec des moniteurs de disques dédiés.
La surveillance des statistiques vitales des disques d’une matrice RAID peut aider les administrateurs ou les utilisateurs à décider si un disque doit être remplacé, évitant ainsi des pertes de données irréversibles.
Parfois, après avoir reconstruit l’ensemble de la matrice RAID, on découvre que le RAID n’est pas parfaitement construit. C’est un cas courant avec des configurations plus élevées du RAID. Plus la configuration des disques de capacité est élevée, plus la période de latence est importante et donc l’inaccessibilité des données pendant une période prolongée qui peut s’étendre sur de longues heures. Pour éviter une reconstruction incorrecte d’une matrice RAID, il est essentiel de connaître les causes exactes qui peuvent entraîner une perte de données. Ces causes sont les suivantes
- Erreur de reconstruction entraînant une perte de données
- Réseau désordonné RAID 5
- Volume RAID 5 NTFS
- RAID 5 Nouvelle configuration
Note : Nous avons pris ici l’exemple du RAID 5. Par conséquent, les causes ci-dessus et les méthodes/solutions de récupération sont associées aux configurations et reconstructions RAID 5.
Erreurs de reconstruction pouvant entraîner une perte de données
Les reconstructions sont basées sur deux facteurs : la parité et la matrice. Lorsqu’un administrateur RAID reconstruit un RAID, les éléments les plus susceptibles de le réassembler correctement sont classés en configurations Parité et Réseau. Si l’une ou l’autre de ces configurations est défectueuse, la matrice ne fonctionnera pas correctement.
S’il y a une mauvaise configuration liée à la reconstruction de la parité, comme dans les cas suivants :
- Avec lecteur mis à zéro (parité écrasée)
- Lecteur dégradé (mis en ligne de force avec parité écrasée)
- Les lecteurs ne sont pas dans l’ordre (les deux sont écrasés – données et parité).
S’il y a une mauvaise configuration liée à Rebuild RAID, comme dans les cas suivants :
- Un des lecteurs est manquant – La parité et les données sont écrasées.
- Les tailles des bandes ne sont pas similaires – La parité et les données sont écrasées.
- Les configurations de l’original et de la reconstruction diffèrent – La parité et les données sont écrasées.
Prenons des exemples :
Dans une configuration RAID Rebuild, la parité est mise à jour avec un disque remis à zéro au lieu de reconstruire le disque dur. Ici, le RAID Rebuild a détruit la parité originale. De plus, le disque remis à zéro empêchera la reconstruction du disque. Lorsque la parité est écrasée, il est difficile de recréer un disque dur endommagé ou manquant.
Un autre exemple est celui de la “matrice RAID désordonnée” pendant la reconstruction du RAID. Ici, les disques ne sont pas dans le bon ordre, et la reconstruction de la parité sur ces disques peut conduire à l’écrasement des données importantes de l’utilisateur.
Réseau désordonné RAID 5
Nous pouvons l’expliquer par un exemple. Une matrice RAID 5 idéale est présentée ci-dessous à titre d’illustration :
Dans une matrice Raid 5, les données étaient initialement disponibles sur C1 du disque 2 disponible sur Stripe 1. Pendant la reconstruction du RAID, si ces données sont écrasées par une nouvelle parité, la parité du disque 3 de la bande 1 est traitée comme un disque de données et non comme une parité, ce qui crée une corruption du “volume logique”. De plus, les données du disque de données B1 sont également affectées, créant ainsi une corruption du volume logique. Tous ces disques, comme mentionné, sont affectés et finalement endommagés.
Puisqu’il y a corruption du volume logique et que la construction de la parité n’est pas possible, il est impératif d’exécuter des outils de réparation de volume comme CHKDSK, FSCK et similaires. Au lieu de réparer, ces utilitaires peuvent parfois causer des dommages encore plus importants, entraînant la suppression des métadonnées et une matrice RAID irrécupérable. Si l’un des disques utilisés pour reconstruire la matrice RAID est un disque dégradé et que l’autre est un disque neuf, après la reconstruction, cette combinaison écrase la bonne parité avec la mauvaise. Il en résulte des données inutilisables et, en fin de compte, un système irrécupérable.
Volume RAID 5 NTFS
Si la matrice RAID perd sa configuration et que l’utilisateur tente de la reconstruire en utilisant une configuration incorrecte, cela entraîne des dommages aux données. Par exemple, une nouvelle configuration est forcée avec une taille de bande de 32K qui était initialement configurée avec une taille de 64K. La taille des données est pratiquement divisée en deux, ce qui endommage la configuration du RAID.
Nouvelle configuration en RAID5
Le système d’exploitation de la reconstruction peut ne pas être en mesure de lire les sections des métadonnées, ce qui entraîne une corruption logique et rend les données inutilisables. Dans ce cas également, la corruption du volume logique amène l’administrateur à utiliser l’outil de réparation de volume pour exécuter et réparer les lecteurs logiques. L’outil de réparation de volume peut causer d’autres dommages au volume logique et entraîner une perte de données irrécupérable.
Comme la corruption du volume logique est due à la nouvelle configuration du RAID 5, la réparation du volume logique n’est pas la bonne solution, comme on le pensait.
Comment reconstruire une matrice RAID sans perte de données ?
Quelle est la marche à suivre lorsque l’administrateur du stockage des données se trouve dans une telle situation ? Voici quelques conseils pour éviter la perte de données après la reconstruction d’un RAID :
- Ne créez jamais de nouveau fichier sur le disque endommagé : Par précaution, veillez à ne pas créer de nouveaux fichiers ni à exécuter d’application importante, jusqu’à ce que les données soient récupérées. Les nouveaux fichiers pourraient écraser les données disponibles sur le disque corrompu.
- Faites une image de la structure RAID avant de la reconstruire : La création d’une image de la structure RAID avant la reconstruction protégera les données, même si la reconstruction n’est pas effectuée. Assurez-vous que le programme de création d’image fournit une image du disque au niveau de la police scientifique ou du secteur/bloc.
- Créez une sauvegarde sur un volume séparé : La prise d’une sauvegarde permet de s’assurer que les fichiers essentiels sur la sauvegarde sont bons, et que l’écrasement des données sur le volume actif n’entraîne pas de dommages irrécupérables.
- Testez la sauvegarde avec des restaurations multiples : Restaurez la sauvegarde à différents endroits, de préférence à des emplacements physiques différents. Vous pouvez également créer une image de chaque disque séparément pour une restauration utile, avant de lancer la reconstruction.
- Exécutez l’outil CHKDSK ou FSCK uniquement après avoir effectué la sauvegarde : Faites une sauvegarde sécurisée et validez-la par une restauration appropriée avant d’exécuter les utilitaires de réparation. Ces outils de réparation supposent que la sauvegarde est disponible, et peuvent donc écraser les pointeurs de fichiers pour rendre le système de fichiers cohérent.
- N’ajoutez pas, ne déplacez pas et ne supprimez pas de fichiers : L’ajout, la suppression ou le déplacement de données à partir du RAID affecté peut compliquer la récupération des données. Copiez plutôt les fichiers, si nécessaire.
Conclusion
Sécurisez les données du RAID dès le départ. Conservez une sauvegarde, surveillez les statistiques vitales de tous les disques séparément et dans la matrice, maintenez une image disque correcte et protégez la configuration RAID. Si le RAID est toujours désorganisé et qu’il n’y a pas de mesures concrètes pour restaurer les données, recherchez un logiciel de récupération de données fiable comme Stellar Data Recovery Technician.
Ce logiciel professionnel permet aux administrateurs de stockage de données de reconstruire une matrice RAID sans perdre de données. Le logiciel propose également un logiciel de réparation de photos et de vidéos, ainsi qu’un logiciel de surveillance du disque pour contrôler l’état des performances du disque avant le processus de récupération.