Aufgefrischte Thomas-Krenn-Monitoring-Plugins
0Version 1.8 bringt übersichtlichere Ausgaben und zusätzliche Sensor-Abfragen
Zu einem umfassenden Server-Monitoring gehört neben der Überwachung von Software und Services auch das Monitoring der Hardware. Um Admins die bestmögliche Überwachung unserer Server zu ermöglichen, haben wir im Laufe der Zeit verschiedene Plugins für die Open-Source-Monitoring-Systeme Nagios und Icinga selbst entwickelt. Begonnen hat die Entwicklung mit dem ersten check_ipmi_sensor Plugin im Jahre 2009. Später kamen noch weitere Plugins hinzu, die die Möglichkeiten der Hardware-Überwachung erweiterten und beispielsweise auch Daten von RAID-Controllern oder GPU-Karten auswerten konnten. Zu diesen Plugins und auch unserer Monitoring-Lösung TKmon betreiben wir auf GitHub ein eigenes Profil mit Repositories für alle von uns entwickelten Open-Source-Programme. Für Ubuntu pflegen wir zusätzlich das Paket „nagios-plugins-thomas-krenn“, um Nutzern von Ubuntu und unserer Monitoring-Software TKmon eine bequeme Installation und Aktualisierung der Plugins zu ermöglichen.In den letzten Wochen haben wir die Monitoring-Plugins wieder an vielen Stellen aktualisiert und um zusätzliche Funktionen ergänzt. Somit gab es ausreichend Gründe, das Plugin-Paket „nagios-plugins-thomas-krenn“ mit einer Aktualisierung auf Version 1.8 zu versorgen. Dabei haben wir einige Änderungen in den Plugins vorgenommen, die für mehr Übersichtlichkeit durch klarere Plugin-Ausgaben sorgen. So wurden im check_ipmi_sensor Plugin Hinweise zu verschiedenen Statusmeldungen ergänzt, zum Beispiel ein Hinweis, dass der Server möglicherweise ausgeschaltet ist. Dieses Plugin überwacht auch den System Event Log (SEL) des BMC-Chips. Nun wurde eine summierende Ausgabe aller vorhandenen Einträge des SEL eingeführt, statt wie bisher alle Einträge auszugeben. Dieses Plugin hat darüber hinaus zwei neue Parameter erhalten, die es erlauben, Sensor-Typen oder SEL-Einträge von bestimmten Sensortypen von der Abfrage auszuschließen.
Der abgebildete Screenshot des TKmon Interfaces zeigt die aktualisierten Status-Ausgaben des check_ipmi_sensor Plugins:
Bei den beiden Plugins für RAID-Controller wurden kleinere Verbesserungen eingepflegt und für die MegaRAID Controller die Temperaturschwellwerte angepasst. Das SMART Plugin erhielt eine neue Option für Datenträger an Adaptec Controllern.
Wir haben die neue Version des Plugin-Paketes in unserem Ubuntu Repository bereits eingepflegt, mit der integrierten Updatefunktion von TKmon oder klassisch auf der Kommandozeile zum Beispiel über apt-get können Sie die neue Version bequem installieren. Bereits im TKmon angelegte Checks müssen natürlich nicht neu konfiguriert werden, die neuen Plugins werden automatisch verwendet.
Hier finden Sie alle Änderungen an den Plugins noch einmal zusammengefasst:
- check_adaptec_raid
- Keine kritische Meldung bei durchgeschleiften Devices, bzw. bei Devices mit RAW Status, mehr.
- check_ipmi_sensor
- Optionen –xT und –xST hinzugefügt
- Ausgaben von Fehlermeldungen optimiert
- Verbesserte Anzeige von SEL-Einträgen
- check_lsi_raid
- Angepasste Temperaturschwellwerte
- GasGaugeStatus Abfrage erweitert
- Check für den Fehler „failure 46“ integriert
- check_smart_attributes
- aacraid Option für Datenträger an Adaptec Controller