From Technical Knowledge to IT Service Management

Posts Tagged ‘monitoring’

Cacti – présentation

Cacti est un logiciel de monitoring. Il est souvent classé parmi les logiciels de supervision (comme sur nuxora ;-) il est classé au meme endroit que Nagios exemple) mais il n’est pas fait pour etre un lociel d’alerte.
Basé sur la puissance de stockage de données de RRDTool. Il combine les avantages et concepts de MRTG avec RRDTool, tout en les restituant dans une nouvelle interface web  (php/mysql) beaucoup plus convivial.

Cacti permet à l’aide de SNMP ou de script (shell, bash, perl, php, sql…)de representer graphiquement l’evolution dasn le temps de points de mesures: CPU, espace disque, utilisation RAM, swap, nombre de connexion Oracle, hit sur un serveur web (apache),…..

La force de cacti se traduit par l’existence de template que l’on peut directement appliquer sur un serveur. Prenons l’exemple d’un serveur web (apache+mysql), il suffira de choisir le template correspondant à ce type de serveur (il faudra au préalable l’avoir défini une premiere fois) et nous aurons directemen en place, les mesures de base lié au serveur (CPU, disuqe, RAM…) mais aussi pour apache (hits, …) et mysql (nb de transactions,….)

Cet outil est complémenatire à Nagios et vous permettra au mieux de suivre jour apres jour l’evolution de vos serveurs, de réaliser aisnsi du capacity planning mais aussi de diagnostiquer des incidents en etudiant les courbes de la veille. Combiné à Nagios, ce duo supervison/monitoring se rendra vite indispensable une fois installé.

Nagios – présentation

Nagios (anciennement appelé Netsaint) est un logiciel de supervision sous licence GPL. Il permet de surveiller un Système d’information intégralement. Son fonctionnement est très simple, un moteur ordonnance l’ensemble des taches de supervision. Ces taches unitaires sont le résultat de l’utilisation d’un plugin. Il existe aujourd’hui plus d’une centaine de ces plugins. Un plugin est un petit programme, ou script qui va tester le bon fonctionnement d’un service/programme/équipement/…. Le résultat s’affiche à travers une console web (paramétrable avec différents filtres, pour obtenir des vues métiers/opérationnelles/…) et indique un des 4 états possibles:

  1. OK (tout va bien)
  2. WARNING (le seuil d’alerte est dépassé)
  3. CRITICAL (le service a un problème)
  4. UNKNOWN (impossible de connaître l’état du service)

Les différents points pouvant être supervisés sont quasi illimités, tout ce qui peut être scripté est “supervisable”. Les services SMTP, POP3, HTTP, NNTP, ICMP, SNMP, LDAP ,… n’importe quel service windows ou daemon linux, la CPU, l’espace disque, la RAM…. L’ensemble de cette supervision est réalisé à l’aide:

  • d’une interrogation directe en snmp
  • d’un script shell
  • d’un plugin codé en C++, Perl, Python, Ruby, PHP, C#, …..

Le tout pouvant être encapsulé dans une connexion ssh et/ou à travers un tunnel SSL

Ces tests peuvent être faits de trois manières:

  • à distance et de façon continue (depuis le serveur Nagios)
  • depuis le serveur cible et de façon continue(en faisant appel à NRPE – Nagios remote plugin execution)
  • Depuis le serveur cible et en cas d’alerte (a l’aide du daemon NSCA qui scrute en permanence l’état du service à monitorer et ne renvoie une information qu’en cas de changement d’état)

Les “filtres” pour créer des vues sont paramétrables et permettent de configurer l’accès suivant les personnes/groupes qui peuvent alors acquitter par exemple des alertes ou en recevoir suivant leur appartenance à des groupes via mail/sms

J’utilise Nagios depuis 2004, c’est un tres bon produit. Comme pour tous logiciels, il est perfectible, mais se distingue vraiment par rapport à ses concurrents (propriétaire inclus)

Liens:
Nagios
Nagiosexchange (un site regroupant beaucoup de plugins)