Etat SMART du disque dur

En ce qui concerne un disque dur, le mot SMART est l'acronyme de Self-Monitoring, Analysis and Reporting Technology. Ce qui veut dire exactement en français Technique d’Auto-surveillance, d’Analyse et de Rapport. Il s'agit de desurer un certain nombre d'attributs afin de qualifier l'état de santé d'un disque dur. Par conséquent, l'état SMART d'un disque dur peut exprimer sa capacité de fonctionner proprement et la possibilité d'une panne imminente. Certains logiciels peuvent exploiter ces information afin d'alerter l'utilisateur en cas de panne proche du disque dur.

état smart de disque

Historique du SMART

Tous les support de stockage, notamment le disque dur, sont sujet de pannes de deux types :

  • Pannes prédictibles : ces pannes apparaissent avec le temps, lentement mais sûrement, à travers d'un processus d'usure des parties mécanique, ou bien une dégradation progressive. La surveillance du disque peut détecter ce type de pannes.
  • Et pannes imprédictibles : ce sont des pannes soudaines sans aucun signe. Comme des pannes en raison d'une défaillance de composants électroniques, ou bien des mauvaise manipulations.

Les pannes mécanique représente la majorité des pannes, selon les sources spécialisées. Bien que la défaillance éventuelle peut être catastrophique, la plupart des défaillances mécaniques résultent d'une usure progressive, pouvant être signalées à l'avance. Ceux-ci peuvent inclure une augmentation de la production de chaleur, une augmentation du niveau de bruit, des problèmes de lecture et d'écriture des données ou une augmentation du nombre de secteurs endommagés. Les principaux domaines de pannes comprennent:

  • Têtes / ensemble tête: fissure sur la tête, tête cassée, contamination de la tête, résonance de la tête, mauvaise connexion au module électronique.
  • Moteur / roulements: panne moteur, roulement usé, roulement excessif, moteur ne tourne pas.
  • Carte électronique (PCB): défaillance du circuit intégré, connecteur endommagé.
  • Plateau: rayure, défaut, nouvelle tentative, mauvais suivi (servo), corrections ECC.

Ces informations ont permis aux fabricants et aux concepteurs du disque dur d'améliorer leur produit d'une part et de penser à mettre en place des mesures afin de prédire la panne. Ainsi, ils ont pu déterminer les facteurs en corrélation avec la défaillance imminente du disque dur et leurs seuils de performance.

Attributs non standardisés

Selon le fabricant, les disques utilisent des techniques différentes pour surveiller leurs performances. Par exemple, un disque compatible SMART peut surveiller la hauteur de vol de la tête au-dessus du support magnétique. Si la tête ne vole pas dans les limites acceptables, il y a de fortes chances que le disque échoue. D'autres disques peuvent surveiller des conditions supplémentaires ou différentes, telles que les circuits ECC sur la carte du disque dur ou les taux d'erreur logicielle. Lorsqu'une défaillance imminente est suspectée, les disques durs envoient une alerte via le système d'exploitation à une application qui affiche un message d'avertissement.

Par conséquent, les spécifications de S.M.A.R.T. sont entièrement spécifiques au fournisseur et, alors que bon nombre de ces attributs ont été standardisés, d'autres restent spécifiques aux fabricants. Les implémentations diffèrent et, dans certains cas, peuvent manquer de fonctionnalités communes ou attendues. D'un point de vue juridique, le terme "S.M.A.R.T." se réfère uniquement à une méthode de surveillance et ne précise pas ni les attributs, ni les seuils, ni aux méthodes de calcul.

Attributs SMART pertinents

Chaque fabricant de disque dur définit un ensemble d'attributs et définit des valeurs de seuil de chaque attribut pour un fonctionnement "normal". Chaque attribut a une valeur dont la signification dépend entièrement du fabricant. Dans le tableau suivant, on présente les attributs les plus pertinents et leur signification.

Attribut SMART

Signification

Nombre de secteurs réaffectés (Reallocated Sectors Count) Nombre de secteurs réaffectés. La valeur brute représente un décompte des secteurs défectueux qui ont été trouvés et réalloué. Ainsi, plus la valeur est élevée, plus le disque dur a dû réaffecter des secteurs. Cette valeur mesure de la durée de vie du lecteur. Un disque dur qui comptabilise beaucoup de réaffectations est plus susceptible d'avoir une panne dans les mois à venir.
Nombre de nouvelles tentatives de rotation (Spin Retry Count) Nombre de nouvelles tentatives de rotation des plateaux. Cet attribut stocke un nombre total de tentatives de démarrage en rotation pour atteindre la vitesse opérationnelle (à condition que la première tentative n'aboutisse pas). Une augmentation de cette valeur d'attribut est un signe de problèmes mécanique du disque dur.
Erreur de bout en bout (End-to-End error) Cet attribut contient un nombre d'erreurs de parité qui se produisent dans le chemin de données vers le support via la mémoire cache du lecteur.
Erreurs non corrigibles signalées (Reported Uncorrectable Errors) Nombre d'erreurs non corrigées à l'aide de l'ECC matériel.
Délai d'expiration de la commande (Command Timeout) Nombre d'opérations abandonnées en raison du délai d'expiration du disque dur.
Nombre d'événements de réallocation (Reallocation Event Count) Nombre de secteurs "instables" en attente de réallocation en raison d'erreurs de lecture irrécupérables.
Nombre des secteurs actuels en attente (Current Pending Sector Count) Nombre de secteurs "instables" en attente de réallocation en raison d'erreurs de lecture irrécupérables.
Nombre de secteurs incorrigibles (Uncorrectable Sector Count) Nombre total d'erreurs non corrigibles lors de la lecture/écriture d'un secteur. Une augmentation de la valeur de cet attribut indique des défauts de la surface du disque et/ou des problèmes dans le système mécanique.
Taux d'erreur de lecture logicielle (Soft Read Error Rate) Indique le nombre d'erreurs de lecture logicielles incorrigibles.

Conclusion

Bien que les attributs SMART, leurs valeurs et leurs interprétations soient différentes d'un fabricant à l'autre, il ne faut jamais prendre une erreur SMART à la légère. Notamment pour les attributs les plus importants cités plus haut. Dans la plupart des cas, l'utilisateur a du temps devant lui pour transférer ses propres données sur un support sain. En ignorant l'état SMART du disque, la dégradation naturelle continue à un point de non retour, où le disque ne peut plus communiquer. A ce stade, l'intervention d'un professionnel en récupération de données de disque dur devient indispensable.

SMART du disque dur
Étiqueté avec :