Introduction

L'un des plus grands défis de la conception de systèmes de stockage est de fournir fiabilité et disponibilité. Malheureusement, dans la pratique, il existe un certain nombre de problèmes qui peuvent provoquer une perte de données dans les systèmes de stockage. La menace la plus importante pour la fiabilité d'un système de stockage de données est bien la corruption de données silencieuse . Afin de développer des méthodes de protection contre la corruption des données, il est essentiel de comprendre ses caractéristiques. La récupération de données corrompues de disque dur intervient au bout de la chaine. Lorsque la corruption est souvent irréversible.

données corrompues

Causes de corruption de données

L'une des principales causes de perte de données est la non-fiabilité du disque dur. Il est bien évidentque les disques durs sont des dispositifs mécaniques mobiles qui peuvent souffrir de problèmes mécaniques entraînant des pannes de disques et des pertes de données.

  • Par exemple, les imperfections des supports et les particules libres à l'intérieur du disque dur provoquent des micro-scratches contribuent aux erreurs latentes du secteur. Ces erreurs de secteur latentes sont détectables par les codes de correction d’erreurs internes (ECC) d’un lecteur et signalées au système de stockage.
  • Une cause moins connue, est que les disques durs actuels et leurs contrôleurs ont des centaines de milliers de lignes de code de micrologiciel de bas niveau (Firmware). Ce firmware, avec un logiciel système de niveau supérieur, a un grand potentiel pour héberger des bogues pouvant provoquer un type d'erreur de disque plus insidieux : corruption de données silencieuse, où les données sont silencieusement corrompues sans indication du lecteur.
  • Disparités de somme de contrôle, créant la possibilité d'une perte de données réelle. Même si le taux de la corruption est faible, la découverte de disparités de somme de contrôle illustre que la corruption des données est un vrai problème à résoudre et à prendre en compte par les concepteurs de systèmes de stockage.
  • Les disques SATA et leurs adaptateurs développent une somme de contrôle ne correspond pas à un ordre de grandeur plus souvent observé.

Types de corruption de données

On se concentre sur les corruptions de blocs de données de disque dur, causées par le matériel et
erreurs logicielles. Les bogues matériels incluent des bogues dans le lecteur de disque ou le firmware, ou encore mauvaise RAM et problème d'adaptateur. Les bogues logiciels pourraient également provoquer une certaine corruption. Dans de nombreux cas, la cause de la corruption ne peut être
identifiée.

  • Inadéquations de somme de contrôle : Ce type de corruption fait référence aux cas où il y a une incohérence entre les données et les sommes de contrôle.
  • Divergences d'identité : Cette classe de corruption fait référence à une discordance détectée lors de contrôle d'identité de bloc de disque pendant la lecture de fichier.
  • Incohérences de parité : cette classe de corruption fait référence à une non-concordance entre la parité calculée à partir des blocs de données et la parité stockée sur le disque en dépit de la validité des sommes de contrôle individuelles.

Protection contre la corruption de données

La détection et la récupération de données corrompues de disque dur nécessitent techniques de protection au-delà de celles fournies par le lecteur de disque. Même, la protection de données de base (comme RAID par ex.) pourrait également être incapable de détecter ces problèmes. Pour détecter la corruption des données, la technique la plus couramment utilisée est l'ajout de somme de contrôle pour chaque bloc de données validé sur le disque.

Cependant, les sommes de contrôle ne protègent pas contre toutes les formes de corruption. Par conséquent, de plus que les sommes de contrôle, le système de stockage peut utiliser également un bloc de disque au niveau du système de fichiers, contenant des informations pour détecter des corruptions jusqu'à lors, indétectables.

Afin d'améliorer encore les techniques de gestion de la corruption, il faut développer une compréhension approfondie des caractéristiques de corruption des données, car on en sait très peu de choses.

Conclusion

La corruption de données est une cause majeur de perte définitive de données. La défaillance matérielle peut être une cause principale. Mais, la source la plus importante est bien l'altération de somme de contrôle causant une corruption de données silencieuse.

Corruption de données