Supermicro X8DT3-F falsche Thresholds bei CPU1 DIMM und CPU2 DIMM

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen
Hinweis: Bitte beachten Sie, dass dieser Artikel / diese Kategorie sich entweder auf ältere Software/Hardware Komponenten bezieht oder aus sonstigen Gründen nicht mehr gewartet wird.
Diese Seite wird nicht mehr aktualisiert und ist rein zu Referenzzwecken noch hier im Archiv abrufbar.

Bei Servern mit Supermicro X8DT3-F oder X8DT3-LN4F Mainboard zeigen die IPMI Sensoren CPU1 DIMM und CPU2 DIMM Warnmeldungen nachdem der Server an die Stromversorgung angeschlossen wurde. Die falschen Warnmeldungen verschwinden nach einem Unit Reset des Full Remote Managements. Dieser Artikel beschreibt die Hintergründe dieses Problems und die Lösung im Detail.

Problem

Die IPMI SDR Tabelle ist nicht korrekt.

Sowohl das Webinterface als auch eine Abfrage per ipmitool sensor zeigen als Untergrenze für den Sensor 2,04 Volt und als Obergrenze 0,008 Volt:

Im Webinterface werden unter Server Health -> Sensor Readings falsche Thresholds angezeigt.


[user@adminpc ~]$ ipmitool -I lan -H 10.10.10.76 -U ADMIN sensor get "CPU1 DIMM"
Password:
Locating sensor record...
Sensor ID              : CPU1 DIMM (0x6)
 Entity ID             : 7.1
 Sensor Type (Analog)  : Voltage
 Sensor Reading        : 1.512 (+/- 0) Volts
 Status                : Lower Non-Recoverable
 Lower Non-Recoverable : 2.032
 Lower Critical        : 2.040
 Lower Non-Critical    : 0.000
 Upper Non-Critical    : 0.008
 Upper Critical        : 0.016
 Upper Non-Recoverable : 0.024
 Assertion Events      : unc+ ucr+ unr+ 
 Assertions Enabled    : lnc- lcr- lnr- unc+ ucr+ unr+ 

[user@adminpc ~]$

Auch andere Tools (etwa die Hardware-Überwachung in VMware) zeigen entsprechende Fehlermeldungen.

Bei machen Abfragearten tritt das Problem etwas anders auf. So liefert eine Abfrage per ipmitool sdr type Voltage -v zwar richtige Grenzwerte, allerdings ist der Status ebenfalls nicht auf 'ok':

[user@adminpc ~]$ ipmitool -I lan -H 10.10.10.76 -U ADMIN sdr type Voltage -v
Password: 
[...]
Sensor ID              : CPU1 DIMM (0x6)
 Entity ID             : 7.1 (System Board)
 Sensor Type (Analog)  : Voltage
 Sensor Reading        : 1.512 (+/- 0) Volts
 Status                : Lower Non-Recoverable
 Nominal Reading       : 1.448
 Normal Minimum        : 1.040
 Normal Maximum        : 1.856
 Upper non-recoverable : 1.880
 Upper critical        : 1.872
 Upper non-critical    : 1.864
 Lower non-recoverable : 1.016
 Lower critical        : 1.024
 Lower non-critical    : 1.032
 Positive Hysteresis   : 0.016
 Negative Hysteresis   : 0.016
 Minimum sensor range  : Unspecified
 Maximum sensor range  : Unspecified
 Event Message Control : Per-threshold
 Readable Thresholds   : lnr lcr lnc unc ucr unr 
 Settable Thresholds   : lnr lcr lnc unc ucr unr 
 Threshold Read Mask   : lnr lcr lnc unc ucr unr 
 Assertion Events      : unc+ ucr+ unr+ 
 Assertions Enabled    : lnc- lcr- lnr- unc+ ucr+ unr+ 
[...]
[user@adminpc ~]$ ipmitool -I lan -H 10.10.10.76 -U ADMIN sdr type Voltage
Password: 
CPU1 Vcore       | 04h | ok  |  7.1 | 1.09 Volts
CPU2 Vcore       | 05h | ok  |  7.1 | 1.13 Volts
CPU1 DIMM        | 06h | lnr |  7.1 | 1.51 Volts
CPU2 DIMM        | 07h | lnr |  7.1 | 1.52 Volts
+1.5V            | 08h | ok  |  7.1 | 1.50 Volts
+3.3V            | 09h | ok  |  7.1 | 3.26 Volts
+3.3VSB          | 0Ah | ok  |  7.1 | 3.22 Volts
+5V              | 0Bh | ok  |  7.1 | 5.06 Volts
+12V             | 0Ch | ok  |  7.1 | 12.19 Volts
VBAT             | 0Dh | ok  |  7.1 | 3.22 Volts
[user@adminpc ~]$

Betroffene Hardware von Thomas Krenn

Betroffene Firmware-Version des Full Remote Managments:

  • Firmware Revision: 1.31 (Firmware Build Time : Sep 30 2009 10:53:07)
  • Firmware Revision: 1.11
  • ev. auch weitere ältere Versionen

Lösung

Update vom 04.11.2009: das Problem wurde von Supermicro mit der Firmware Revision: 1.32 behoben. Wir empfehlen daher ein Update auf diese Firmware-Version.

Bei den älteren betroffenen Firmware-Versionen können Sie die falschen Einträge in der IPMI SDR Tabelle durch einen Unit Reset korrigieren. Die falschen Warnmeldungen werden dann nicht mehr angezeigt:


Foto Werner Fischer.jpg

Autor: Werner Fischer

Werner Fischer arbeitet im Product Management Team von Thomas-Krenn. Er evaluiert dabei neueste Technologien und teilt sein Wissen in Fachartikeln, bei Konferenzen und im Thomas-Krenn Wiki. Bereits 2005 - ein Jahr nach seinem Abschluss des Studiums zu Computer- und Mediensicherheit an der FH Hagenberg - heuerte er beim bayerischen Server-Hersteller an. Als Öffi-Fan nutzt er gerne Bus & Bahn und genießt seinen morgendlichen Spaziergang ins Büro.


Das könnte Sie auch interessieren

Namenskonvention der Thomas Krenn Systeme
Tastatureingabe funktioniert beim X7DBE Mainboard nicht
Temperatur LED an der Serverfront leuchtet