check_ganglia_metric

Software screenshot:
check_ganglia_metric
Dettagli del software:
Versione: 2012.02.28
Data di caricamento: 15 Apr 15
Sviluppatore: Michael T. Conigliaro
Licenza: Libero
Popolarità: 34

Rating: 2.0/5 (Total Votes: 2)

check_ganglia_metric è un plugin Nagios che consente di attivare gli avvisi in qualsiasi gangli metrica.
check_ganglia_metric è stato fortemente ispirato check_ganglia_metric.php di Vladimir Vuksan, ma si tratta di una serie di miglioramenti.

Installazione

# Pip installare check_ganglia_metric
... O:
# Easy_install check_ganglia_metric
Configurazione gangli
A meno che il server Nagios e gangli Meta Daemon sono in esecuzione sullo stesso host, probabilmente è necessario modificare il gmetad.conf per consentire connessioni remote dal server Nagios.
Per consentire le connessioni da nagios-server.example.com:
trusted_hosts nagios-server.example.com
Per consentire connessioni da tutti gli host (probabilmente un rischio per la sicurezza):
all_trusted su
Test sulla riga di comando
In primo luogo, vediamo se check_ganglia_metric può comunicare con i gangli Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Stato Ok, CPU Idle = 99,3% | cpu_idle = 99,3% ;;;;
Il messaggio "Status Ok" indica che check_ganglia_metric sta lavorando. Se hai problemi ottenere questo al lavoro, provare di nuovo con la registrazione dettagliata abilitata (verbose) al fine di ottenere una migliore comprensione in che cosa sta andando male.
Ora proviamo impostare una soglia di allarme:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Stato critico, CPU Idle = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Abbiamo detto check_ganglia_metric per restituire uno stato "critico" se la CPU Idle era maggiore di 99. Il messaggio "stato critico" indica che ha funzionato. Si noti che check_ganglia_metric analizza gli intervalli e le soglie in base alle linee guida ufficiali di sviluppo plug Nagios.
Per visualizzare un elenco completo delle opzioni della riga di comando, con brevi spiegazioni, eseguire check_ganglia_metric con l'opzione --help.
Configurazione Nagios
In primo luogo, creare una definizione del comando:
comando define {
& Nbsp; nome_comando check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ $ --metric_name = $ $ --warning = $ $ --critical = $ arg3 $ HostAddress ARG1 ARG2
}
Ora è possibile utilizzare il comando di cui sopra nelle definizioni di servizio:
definire servizio {
& Nbsp; service_description CPU inattiva - gangli
& Nbsp; uso some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; nome_host host.example.com
}
Questo funziona bene fino a quando qualcosa va storto con check_ganglia_metric (ad esempio, il file della cache non può essere letto / scritto, gangli Meta Daemon non può essere raggiunto, etc.). A quel punto, ogni servizio che si basa su check_ganglia_metric fallirà, forse si inondando con le segnalazioni. Possiamo prevenire questo attraverso l'uso di dipendenze di servizio.
La prima cosa di cui abbiamo bisogno è una definizione di comando per verificare l'età di un file:
comando define {
& Nbsp; nome_comando check_file_age
& Nbsp; command_line / usr / lib / nagios / plugins / check_file_age -f $ $ $ $ $ arg3 $ ARG1 -w ARG2 -c
}
Avanti, definiamo un servizio che controlla l'età del file di cache di check_ganglia_metric. Si noti che, per essere veramente efficace, il servizio deve essere controllato almeno (preferibilmente più) frequentemente di tutti gli altri controlli che si basano su check_ganglia_metric:
definire servizio {
& Nbsp; Cache service_description per check_ganglia_metric
& Nbsp; uso some_template
& Nbsp;!!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; nome_host localhost
& Nbsp; INTERVALLO 1
& nbsp; max_check_attempts 1
}
E, infine, abbiamo istituito la dipendenza servizio effettivo. Si noti che ho attivato use_regexp_matching in Nagios, che mi permette di utilizzare le espressioni regolari nelle mie direttive. Da attaccare "- gangli" alla fine di ogni servizio che si basa su check_ganglia_metric, posso salvare me stesso un sacco di fatica:
definire servicedependency {
& Nbsp; nome_host localhost
& Nbsp; Cache service_description per check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - gangli $
& Nbsp; execution_failure_criteria c, p
}
Ora, se qualcosa va storto con check_ganglia_metric, un solo avviso verrà inviato sul file di cache, e tutti i controlli di servizio dipendenti sarà in pausa fino a risolvere il problema che ha causato check_ganglia_metric a fallire. Una volta risolto il problema, è necessario aggiornare il timestamp sul file di cache al fine di mettere il "Cache per check_ganglia_metric" servizio di nuovo in uno stato OK (che permetterà controlli di servizio dipendenti per continuare):
& Nbsp; tocco /var/lib/nagios/.check_ganglia_metric.cache
Trucchi e consigli
E 'possibile ottenere un elenco completo dei padroni di casa e metriche disponibili attivando la registrazione "più dettagliato" (-vv). Dal momento che sono necessarie le opzioni metric_host e METRIC_NAME, si ha un po 'di "dell'uovo e della gallina" problema qui, ma questo è OK. Basta fornire alcuni dati fittizi. Il plugin errore al termine con un "host / metrica non trovato" l'errore, ma non prima di discariche sua cache:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = --metric_name manichino = -vv manichino

Cosa c'è di nuovo in questa versione:

  • Aggiungi - Opzione -metrics_max_age
  • Unisci CHANGELOG.rst in README.rst

Requisiti :

  • Python
  • Nagios

Limitazioni :

  • Non funziona con Python 2.4

Programmi simili

innotop
innotop

3 Jun 15

Softflowd
Softflowd

3 Jun 15

DJohn
DJohn

3 Jun 15

Commenti a check_ganglia_metric

I commenti non trovato
Aggiungi commento
Accendere le immagini!