TKmon Servicechecks für Intel Modular Server

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen
Hinweis: Bitte beachten Sie, dass dieser Artikel / diese Kategorie sich entweder auf ältere Software/Hardware Komponenten bezieht oder aus sonstigen Gründen nicht mehr gewartet wird.
Diese Seite wird nicht mehr aktualisiert und ist rein zu Referenzzwecken noch hier im Archiv abrufbar.

Dieser Artikel zeigt die Überwachungsmöglichkeiten eines Intel Modular Servers mit TKmon. Zur Abfrage der Statusinformationen kommt dabei SNMP v2c zum Einsatz.

Vorraussetzungen

SNMP v2c Einstellungen

Testumgebung

Funktionsweise

Die Intel Modular Server Checks basieren auf dem check_snmp Plugin von Nagios. check_snmp ist Teil des Ubuntu Packages nagios-plugins-basic[1] und befindet sich unter: /usr/lib/nagios/plugins/check_snmp

TKmon-Übersicht eines Intel Modular Servers

Parameter

check_snmp arbeitet bei der Durchführung von Checks mit folgenden Parametern:

Parameter Beschreibung Beschreibung
-C SNMP Community Dieser Parameter wird vom Host übernommen.
-l Parameter Parameterangaben, z.B. "Error Central Management Module"
-s Standardwert Wenn der Rückgabewert von diesem Wert abweicht, erfolgt eine Warnung.

Verfügbare Intel Modular Server Checks

CMM Fehler

Zeigt ein fehlerhaftes CMM (Central Management Module) an. Keine Parametereingaben erforderlich. Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.201.2.1.14.1 -s 0 -l "Error Central Management Module"

IMS TKmon CMM.png

Bladefehler

Zeigt einen Bladefehler an. Durch Angabe eines Blades im Feld Blade wird dieses überprüft. 1 steht für das erste, 2 für das zweite Blade (maximal 6 einbaubar).

Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.202.1.1.7.$ARG1$ -s 0 -l "Error $ARG1$. Blade"

IMS TKmon blade.png

Switchfehler

Zeigt einen Switchfehler an. Durch Angabe eines Switches im Feld Switch wird dieser überprüft. 1 steht für den ersten, 2 für den zweiten Switch (maximal 2 einbaubar).

Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.203.1.1.14.$ARG1$ -s 0 -l "Error $ARG1$. Switch"

IMS TKmon switch.png

SCM Fehler

Zeigt ein fehlerhaftes SCM (Storage Controller Module) an. Durch Angabe eines SCM im Feld SCM wird dieser überprüft. 1 steht für das erste, 2 für das zweite SCM (maximal 2 einbaubar). Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.204.1.1.15.$ARG1$ -s 0 -l "Error $ARG1$. Storage Controller Module"

IMS TKmon SCM.png

Drives with PFA

Zeigt die Anzahl der Drives mit einem kritischen PFA Zustand (Predictive Failure Analysis) an. Keine Parametereingaben erforderlich. Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.204.1.1.24.1 -s 0 -l "Drives with PFA"

IMS TKmon drives with PFA.png

Drives rebuilding

Zeigt die Anzahl der rebuildenden Drives an. Keine Parametereingaben erforderlich. Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.204.1.1.25.1 -s 0 -l "Drives rebuilding"

IMS TKmon drives rebuilding.png

Drives missing

Zeigt die Anzahl der fehlenden Drives an. Keine Parametereingaben erforderlich. Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.204.1.1.26.1 -s 0 -l "Drives missing"

IMS TKmon drives missing.png

Kritische virtuelle Drives

Zeigt die Anzahl der virtuellen Drives mit kritischem Zustand an. Keine Parametereingaben erforderlich. Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.204.1.1.31.1 -s 0 -l "Critical virtual Drives"

IMS TKmon drives critical.png

Lüfterfehler

Zeigt einen Lüfterfehler an. Durch Angabe eines Lüfters im Feld Lüfter wird dieser überprüft. 1 steht für den ersten, 2 für den zweiten Lüfter (maximal 3 einbaubar).

Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.206.1.1.12.$ARG1$ -s 0 -l "Error $ARG1$. Fan"

IMS TKmon fan.png

Netzteilfehler

Zeigt einen Netzteilfehler an. Durch Angabe eines Netzteils im Feld Netzteil wird dieses überprüft. 1 steht für das erste, 2 für das zweite NT (maximal 4 einbaubar).

Befehl: ./check_snmp -H '$HOSTADDRESS$' -P 2c -C '$_HOSTSNMP_COMMUNITY$' -o .1.3.6.1.4.1.343.2.19.1.2.10.207.1.1.12.$ARG1$ -s 0 -l "Error $ARG1$. Power Supply"

IMS TKmon power supply.png

Weitere Informationen

Einzelnachweise


Foto Thomas Niedermeier.jpg

Autor: Thomas Niedermeier

Thomas Niedermeier arbeitet im Product Management Team von Thomas-Krenn. Er absolvierte an der Hochschule Deggendorf sein Studium zum Bachelor Wirtschaftsinformatik. Seit 2013 ist Thomas bei Thomas-Krenn beschäftigt und kümmert sich unter anderem um OPNsense Firewalls, das Thomas-Krenn-Wiki und Firmware Sicherheitsupdates.

Icon-Twitter.png 

Das könnte Sie auch interessieren

Restore System Settings beim Modular Server
SAS Initiator IDs von Compute Modulen nach Firmware Update erhöht
Windows Server 2008 - Es konnte keine neue Systempartition erstellt oder eine vorhandene Systempartition gefunden werden