Hola amigos, otra vez aca, tratando de ayudar al admin perdido como la defensa de Boca (!)
Esta vez, veremos como monitorear el estado de un Raid en una placa 3ware...
Elementos necesarios
*1 server o mas con alguna placa raid 3ware
*1 server con Nagios instalado
*1 instalacion de xenserver 6.1 (en mi caso), por eso hago check por ssh, de lo contrario tambien puede servir cualquier otro linux
*Ganas de laburar (?)
El problema a resolver es el siguiente... tomar el estado de la controladora raid y monitorearla con Nagios.
Afortunadamente ya existe un plugin que hace todo esto, asi que vamos directo a los comandos.
Antes que nada descargar el siguiente archivo
http://www.lsi.com/Pages/user/eula.aspx?file=http%3a%2f%2fwww.lsi.com%2fdownloads%2fPublic%2fSATA%2fSATA%2520Common%2520Files%2f3DM2_CLI-linux_10.2.2.1_9.5.5.1.zip&Source=http%3a%2f%2fwww.lsi.com%2fdownloads
copiar el zip al equipo que se quiere monitorear en el /tmp
Una vez copiado el archivo... ejecutar
cd /tmp unzip 3DM2_CLI-linux_10.2.2.1_9.5.5.1.zip
chmod 755 install.sh
./install.sh -i -fN0
wget -c "http://exchange.nagios.org/components/com_mtree/attachment.php?link_id=652&cf_id=29" -O check_3ware_raid
mv check_3ware_raid /usr/sbin/
#Agrego a Nagios al sudoers
echo "nagios ALL=(ALL) NOPASSWD: /usr/sbin/check_3ware_raid" >> /etc/sudoers
# Elimino el requiretty para poder chequear por ssh
sed -i '/requiretty/d' /etc/sudoers
Ahora en el servidor Nagios.... Editar el archivo commands.cfg, y agregar....
# check_3ware command definitionNota: Agregue el -t 240 porque en mi caso tarda casi 2 minutos el comando en devolver el resultado
define command
{
command_name check_ssh_3ware
command_line $USER1$/check_by_ssh -H $HOSTADDRESS$ -t 240 -C "sudo /usr/sbin/check_3ware_raid"
}
Luego agregar en la definicion del host el check
define serviceY eso es todo, para mas info de como monitorear un XenServer por ssh:
{
use generic-service
host_name Nombredelservidor
service_description 3Ware Raid Status
is_volatile 0
check_period 24x7
max_check_attempts 3
normal_check_interval 5
retry_check_interval 1
contact_groups IT
notification_interval 2500
notification_period 24x7
notification_options w,u,c,r
check_command check_ssh_3ware
}
http://support.citrix.com/article/CTX127562