Supermicro X8DT3-F falsche Thresholds bei CPU1 DIMM und CPU2 DIMM

Aus Wiki Thomas-Krenn.AG
Wechseln zu: Navigation, Suche

Bei Servern mit Supermicro X8DT3-F oder X8DT3-LN4F Mainboard zeigen die IPMI Sensoren CPU1 DIMM und CPU2 DIMM Warnmeldungen nachdem der Server an die Stromversorgung angeschlossen wurde. Die falschen Warnmeldungen verschwinden nach einem Unit Reset des Full Remote Managements. Dieser Artikel beschreibt die Hintergründe dieses Problems und die Lösung im Detail.

Inhaltsverzeichnis

Problem

Die IPMI SDR Tabelle ist nicht korrekt.

Sowohl das Webinterface als auch eine Abfrage per ipmitool sensor zeigen als Untergrenze für den Sensor 2,04 Volt und als Obergrenze 0,008 Volt:

Im Webinterface werden unter Server Health -> Sensor Readings falsche Thresholds angezeigt.

[user@adminpc ~]$ ipmitool -I lan -H 10.10.10.76 -U ADMIN sensor get "CPU1 DIMM"
Password:
Locating sensor record...
Sensor ID              : CPU1 DIMM (0x6)
 Entity ID             : 7.1
 Sensor Type (Analog)  : Voltage
 Sensor Reading        : 1.512 (+/- 0) Volts
 Status                : Lower Non-Recoverable
 Lower Non-Recoverable : 2.032
 Lower Critical        : 2.040
 Lower Non-Critical    : 0.000
 Upper Non-Critical    : 0.008
 Upper Critical        : 0.016
 Upper Non-Recoverable : 0.024
 Assertion Events      : unc+ ucr+ unr+ 
 Assertions Enabled    : lnc- lcr- lnr- unc+ ucr+ unr+ 

[user@adminpc ~]$

Auch andere Tools (etwa die Hardware-Überwachung in VMware) zeigen entsprechende Fehlermeldungen.

Bei machen Abfragearten tritt das Problem etwas anders auf. So liefert eine Abfrage per ipmitool sdr type Voltage -v zwar richtige Grenzwerte, allerdings ist der Status ebenfalls nicht auf 'ok':

[user@adminpc ~]$ ipmitool -I lan -H 10.10.10.76 -U ADMIN sdr type Voltage -v
Password: 
[...]
Sensor ID              : CPU1 DIMM (0x6)
 Entity ID             : 7.1 (System Board)
 Sensor Type (Analog)  : Voltage
 Sensor Reading        : 1.512 (+/- 0) Volts
 Status                : Lower Non-Recoverable
 Nominal Reading       : 1.448
 Normal Minimum        : 1.040
 Normal Maximum        : 1.856
 Upper non-recoverable : 1.880
 Upper critical        : 1.872
 Upper non-critical    : 1.864
 Lower non-recoverable : 1.016
 Lower critical        : 1.024
 Lower non-critical    : 1.032
 Positive Hysteresis   : 0.016
 Negative Hysteresis   : 0.016
 Minimum sensor range  : Unspecified
 Maximum sensor range  : Unspecified
 Event Message Control : Per-threshold
 Readable Thresholds   : lnr lcr lnc unc ucr unr 
 Settable Thresholds   : lnr lcr lnc unc ucr unr 
 Threshold Read Mask   : lnr lcr lnc unc ucr unr 
 Assertion Events      : unc+ ucr+ unr+ 
 Assertions Enabled    : lnc- lcr- lnr- unc+ ucr+ unr+ 
[...]
[user@adminpc ~]$ ipmitool -I lan -H 10.10.10.76 -U ADMIN sdr type Voltage
Password: 
CPU1 Vcore       | 04h | ok  |  7.1 | 1.09 Volts
CPU2 Vcore       | 05h | ok  |  7.1 | 1.13 Volts
CPU1 DIMM        | 06h | lnr |  7.1 | 1.51 Volts
CPU2 DIMM        | 07h | lnr |  7.1 | 1.52 Volts
+1.5V            | 08h | ok  |  7.1 | 1.50 Volts
+3.3V            | 09h | ok  |  7.1 | 3.26 Volts
+3.3VSB          | 0Ah | ok  |  7.1 | 3.22 Volts
+5V              | 0Bh | ok  |  7.1 | 5.06 Volts
+12V             | 0Ch | ok  |  7.1 | 12.19 Volts
VBAT             | 0Dh | ok  |  7.1 | 3.22 Volts
[user@adminpc ~]$

Betroffene Hardware von Thomas Krenn

Betroffene Firmware-Version des Full Remote Managments:

Lösung

Update vom 04.11.2009: das Problem wurde von Supermicro mit der Firmware Revision: 1.32 behoben. Wir empfehlen daher ein Update auf diese Firmware-Version.

Bei den älteren betroffenen Firmware-Versionen können Sie die falschen Einträge in der IPMI SDR Tabelle durch einen Unit Reset korrigieren. Die falschen Warnmeldungen werden dann nicht mehr angezeigt:


Share/Save/Bookmark  Feedback zu diesem Artikel geben
Meine Werkzeuge
Namensräume
Varianten
Aktionen
Navigation
Kategorien
Drucken/exportieren
Werkzeuge