Comment accèder aux informations SMART sur un serveur DELL ?
SMART pour « Self-Monitoring, Analysis and Reporting Technology », est une technologie de monitoring intégrée aux disques dur et destinée à contrôler un certain nombre de paramètres en vue d’anticiper une défaillance de ces matériels. Sur certaines machines, SMART doit être activé dans le BIOS avant de pouvoir être utilisé.
« smartctl », Issu du paquet « smartmontools » disponible sur toutes les distributions Linux, offre l’accès aux informations SMART (état d’usure, erreurs d’entrées sorties, etc).
Sur un serveur en RAID matériel, comme la plupart des serveurs Dell PowerEdge ou RXXX, les points d’accès aux périphériques de blocs désignent un volume RAID. Ainsi, « /dev/sda » est un volume RAID composé de plusieurs disques physiques.
Afin d’interagir et de consulter les informations des disques physiques, il convient de préciser à « smartctl » le driver à utiliser (« megaraid ») et l’emplacement du matériel (noté « N ») :
smartctl -d megaraid,N -i /dev/sda |
Note : Bien que n’ayant pas d’importance, le device précisé à smartctl (/dev/xxxx) doit exister.
L’emplacement du disque, « N », sera déterminée via « megacli » :
# MegaCli64 -pdlist -a0 ... Enclosure Device ID: 32 Slot Number: 0 ... Enclosure Device ID: 32 Slot Number: 1 ... |
Voir le chapitre « MegaCli : Manager le contrôleur RAID« de « Installation Debian sur DELL R710, R410, R510, RXXX (Mise à jour)« pour l’installation de MegaCli.
La numérotation des disques commence à 0. Nous obtenons les informations du second disque via « smartctl » :
# smartctl -d megaraid,1 -a /dev/sda ... /dev/sda [megaraid_disk_01] [SAT]: Device open changed type from 'megaraid' to 'sat' === START OF INFORMATION SECTION === Model Family: Western Digital RE3 Serial ATA family Device Model: WDC WD1002FBYS-18W8B1 Serial Number: WD-XXXXXXXXXXXX Firmware Version: 03.00C12 User Capacity: 1,000,204,886,016 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 8 ATA Standard is: Exact ATA specification draft version not indicated Local Time is: Mon Sep 19 17:48:31 2011 CEST SMART support is: Available - device has SMART capability. SMART support is: Enabled ... SMART Error Log Version: 1 No Errors Logged ... |
Note : S’il n’est pas actif, activez l’outil de reporting « SMART » sur un disque via « smartctl -s on <device> » :
# smartctl -s on -d megaraid,N /dev/sdX |
Tests automatiques via « smartd »
Les tests automatiques des disques peuvent être lancés par le démon « smartd » installé en même temps que « smartmontools ». Son fichier de configuration est « /etc/smartd.conf ».
Afin de lancer les tests de vos disques ajoutez les lignes nécessaires à « /etc/smartd.conf ». Exemple :
18:06:33 srv ~ # sed -e '/^#\|^$/d' /etc/smartd.conf /dev/sda -a -d megaraid,0 -m root -o on -S on -s (S/../../7/00|L/../01/./00) /dev/sda -a -d megaraid,1 -m root -o on -S on -s (S/../../7/01|L/../01/./01) /dev/sda -a -d megaraid,2 -m root -o on -S on -s (S/../../7/02|L/../01/./02) /dev/sda -a -d megaraid,3 -m root -o on -S on -s (S/../../7/03|L/../01/./03) /dev/sda -a -d megaraid,4 -m root -o on -S on -s (S/../../7/04|L/../01/./04) /dev/sda -a -d megaraid,5 -m root -o on -S on -s (S/../../7/05|L/../01/./05) |
Où
- « /dev/sda » est un device devant exister sur le système ;
- « -a » active la remontée d’informations lors de la détection de changements critiques;
- « -d megaraid,N » désigne le disque n°N sur le contôleur ;
- « -m root » active l’envois des mails à root en cas de problèmes ;
- « -o on » autorise le test automatique hors ligne ;
- « -S on » active la sauvegarde automatique ;
- « -s (S/../../7/05|L/../01/./05) » lance les tests :
- S/../../7/05 : court (S-Short), le dimanche (7), à 5 heures (05) ;
- L/../01/./05 : long (L-Long), le premier de chaque mois (01) à 05 heures (05).
Un redémarrage du démon assure la prise en charge des nouveaux paramètres :
18:33:29 srv ~ # /etc/init.d/smartd restart Stopping S.M.A.R.T. daemon: smartd. Starting S.M.A.R.T. daemon: smartd. |
Sous Debian et ses dérivés pensez à activer smartd au démarrage (fichier « /etc/default/smartmontools ») :
18:33:41 srv ~ # cat /etc/default/smartmontools ... start_smartd=yes ... |
Remerciements : Merci à Sergio pour la photo.