Fehlerhafte IPMI Sensoren durch vollständige Initialisierung des IPMI Moduls richtigstellen
Zeigen zahlreiche IPMI Sensoren Fehlermeldungen, liegt dies häufig an einer unvollständigen Initialisierung des IPMI BMCs. In diesem Artikel beschreiben wir wie Sie den IPMI BMC vollständig initialisieren können, damit die Sensoren richtige Werte anzeigen.
Problembeschreibung
Zahlreiche IPMI Sensoren liefern Fehlermeldungen. Eine Abfrage mittels ipmitool sdr elist all zeigt beispielsweise:
[...] pef | FDh | ns | 46.1 | Event-Only watchdog | FEh | ns | 46.1 | Event-Only KIM BMC | 00h | ok | 0.0 | Dynamic MC @ 20h PLTFRM SECURITY | FCh | ns | 0.0 | Event-Only CPU Temp 1 | 00h | ns | 3.0 | Disabled CPU Temp 2 | 01h | ns | 3.0 | Disabled CPU Temp 3 | 02h | ok | 3.1 | 28 degrees C CPU Temp 4 | 03h | ns | 3.1 | Disabled Sys Temp | 04h | ns | 7.0 | Disabled CPU1 Vcore | 05h | unr | 3.0 | 1.65 Volts CPU2 Vcore | 06h | unr | 3.1 | 1.65 Volts 3.3V | 07h | lnr | 7.0 | 1.95 Volts 5V | 08h | lnr | 7.0 | 2.90 Volts 12V | 09h | lnr | 7.0 | 8.83 Volts -12V | 0Ah | unr | 7.0 | -20.20 Volts 1.5V | 0Bh | unr | 7.0 | 3.25 Volts 5VSB | 0Ch | ns | 7.0 | Disabled VBAT | 0Dh | ns | 7.0 | Disabled Fan1 | 0Eh | ok | 7.0 | 5300 RPM Fan2 | 0Fh | lnr | 7.0 | 0 RPM Fan3 | 10h | ok | 7.0 | 4300 RPM Fan4 | 11h | ok | 7.0 | 4200 RPM Fan5 | 12h | lnr | 7.0 | 0 RPM Fan6 | 13h | lnr | 7.0 | 0 RPM Fan7/CPU1 | 14h | ns | 3.0 | Disabled Fan8/CPU2 | 15h | ns | 3.0 | Disabled Intrusion | 44h | ok | 23.1 | 0 unspecified Power Supply | 16h | ns | 10.0 | Disabled CPU0 Internal E | 17h | ok | 3.0 | 0 unspecified CPU1 Internal E | 18h | ok | 3.1 | 0 unspecified CPU Overheat | 19h | ok | 3.0 | 0 unspecified Thermal Trip0 | 1Ah | ns | 3.0 | Disabled Thermal Trip1 | 1Bh | ns | 3.1 | Disabled BIOS | 00h | ns | 0.0 | Disabled [...]
Ursache
Sobald der Server an das Stromnetz angeschlossen wird beginnt automatisch die Initialisierung des IPMI BMC. Der Server kann jedoch sofort eingeschalten werden. Es erscheint dabei eine Meldung, dass die IPMI Initialisierung läuft und der Bootprozess fortgesetzt wird sobald die IPMI Initialisierung abgeschlossen ist:
Wird an dieser Stelle ein Reboot (z.B. per [Strg]-[Alt]-[Entf]) durchgeführt, läuft die IPMI Initialisierung nicht vollständig durch. In der Folge zeigen zahlreiche IPMI Sensoren Fehlermeldungen.
Lösung
Sie können zuerst probieren, das IPMI Modul zurückzusetzen. Dazu gehen Sie im Webinterface auf Maintenance -> Unit Reset.
Sollte ein Unit Reset nicht ausreichend sein, gibt es zwei Möglichkeiten:
- Fahren Sie den Server herunter und trennen Sie ihn zumindest 30 Sekunden vom Stromnetz. Drücken Sie in der Zeit mehrfach den Powerknopf des Servers. Schließen Sie ihn anschließend wieder an das Stromnetz an. Wenn Sie den Server wieder einschalten warten Sie die IPMI Intialisierung ab und warten Sie bis der Boot-Prozess automatisch fortgesetzt wird. Die IPMI Sensoren zeigen nun sinnvolle Werte. Sind Fehlermeldungen von Sensoren für nicht vorhandene Komponenten vorhanden, können Sie diese IPMI Sensoren bei Supermicro Servern ausblenden.
- Wenn Sie den Server nicht herunter fahren möchten, resetten Sie das IPMI Modul mit dem Tool ipmicfg (ipmicfg -fd stellt Werkseinstellungen wieder her) und konfigurieren Sie es anschließend erneut. Die Sensor Werte werden dann wieder korrekt angezeigt.
Autor: Werner Fischer Werner Fischer arbeitet im Product Management Team von Thomas-Krenn. Er evaluiert dabei neueste Technologien und teilt sein Wissen in Fachartikeln, bei Konferenzen und im Thomas-Krenn Wiki. Bereits 2005 - ein Jahr nach seinem Abschluss des Studiums zu Computer- und Mediensicherheit an der FH Hagenberg - heuerte er beim bayerischen Server-Hersteller an. Als Öffi-Fan nutzt er gerne Bus & Bahn und genießt seinen morgendlichen Spaziergang ins Büro.
|