domingo, 5 de diciembre de 2010

Comprobar estado de discos duros con Smartmontools en Debian Squeeze

---------------------------------------------------------------------------------------------------------------------------------------------------------------------
"Smartmontools" nos muestra mucha información de los discos duros además de si tienen errores o las horas estimadas de vida. Para que funcione es necesario que tu disco duro soporte la tecnologia "S.M.A.R.T.", la mayoria de discos duros la soportan.
Smartmontools lo tenemos disponible en los repositorios de Debian Squeeze asi que lo vamos a instalar con apt.
---------------------------------------------------------------------------------------------------------------------------------------------------------------------

1. Instalamos smartmontools en una consola de administrador :
         # apt-get install smartmontools

2. Listamos los discos duros conectados a nuestro PC y nos cercioramos cual es el dispositivo del disco duro que queremos comprobar :
         # fdisk -l

    Yo quiero monitorear mi disco duro ubicado en /dev/sdc, de aquí en adelante cada vez que veas "/dev/sdc" sustituyelo por el que corresponda con tu disco duro.

3. Necesitamos saber si tu disco duro soporta SMART y esta habilitado, es muy raro que no lo soporte. Le decimos a "smartctl" que nos muestre los datos que pueda leer. Vemos el fabricante, modelo, versión de firmware, pero vamos a centrarnos en las dos ultimas lineas :
# smartctl -i /dev/sdc
 ..............
..............
SMART support is: Available - device has SMART capability.
 SMART support is: Enabled


        Veo que soporta SMART y esta habilitado.
        Si lo soporta pero no esta habilitado podemos habilitarlo :
                  # smartctl -s on /dev/sdc

4. Antes de seguir comprobamos el estado de salud del disco duro, por si acaso es necesario hacer una copia de seguridad urgente :
         # smartctl -H /dev/sdc
         ..............
..............
SMART overall-health self-assessment test result: PASSED
..............


    Si no tienes una linea acabada en "PASSED" haz lo antes posible una copia de seguridad de los datos de ese disco duro, es muy probable que en cualquier momento deje de funcionar.

5. Lanzamos test del disco duro, en mi caso ha tardado un minuto :
  # smartctl -t short /dev/sdc
  ..............
  ..............
  Please wait 1 minutes for test to complete.
  ..............
        ..............


6. Pasado el minuto de espera, visualizamos los resultado del testeo :
  # smartctl -l selftest -i /dev/sdc
  ..............
  ..............
  Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
  # 1  Short offline       Completed without error       00%     11533                  -


Además de todos los datos que hemos obtenido en el paso 3 también nos dice si ha encontrado errores y las horas estimadas de vida del disco duro. A mi disco según smartmontools le quedan aproximadamente 11533 horas.

---------------------------------------------------------------------------------------------------------------------------------------------------------------------

Si no os gusta la consola hay un interfaz gráfico para "smartmontools" que se llama "gsmartcontrol". Esta también en los repositorios de Debian Squeeze y lo podemos instalar con apt :
  # apt-get install gsmartcontrol

---------------------------------------------------------------------------------------------------------------------------------------------------------------------

2 comentarios:

Anónimo dijo...

Muchas gracias.

Me ha resultado super útil, gracias de nuevo por el trabajo que has hecho.

;)

Javier dijo...

Hola Imanol, una nota:

Según mis pruebas, el parámetro lifetime indica el número de horas que ha estado encendido el disco duro, no las horas que le quedan de vida.

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 36356 -
# 2 Extended offline Completed without error 00% 36340 -
# 3 Short offline Completed without error 00% 36338 -
# 4 Short offline Completed without error 00% 36338 -

Este es el resultado de mis pruebas, donde la número #1 es la más reciente. Por lo que se puede comprobar que el parámetro lifetime es ascendente, corroborando que es, reitero, el número de horas que lleva encendido el dispositivo.

Un saludo.