Processor 5 Proc Max Therm Alarm in VMware ESX mit Modular-Server MFS5000SI Compute Module

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen
Hinweis: Bitte beachten Sie, dass dieser Artikel / diese Kategorie sich entweder auf ältere Software/Hardware Komponenten bezieht oder aus sonstigen Gründen nicht mehr gewartet wird.
Diese Seite wird nicht mehr aktualisiert und ist rein zu Referenzzwecken noch hier im Archiv abrufbar.

Bei Intel Modular Servern mit Firmware 5.5 zeigt VMware ESX/ESXi einen Processor 5 Proc Max Therm Alarm bei MFS5000SI Compute Modulen. Sie können einen solchen Alarm ignorieren. Firmware 6.0 behebt dieses Anzeigeproblem.

Fehler

Die Systemstatusanzeige des vSphere Client zeigt einen Alarm für den Sensor Processor 5 Proc Max Therm:

Modular-Server-Processor-5-Proc-Max-Therm-ESXi4.png

Details und Hinweise

Sie können diesen Alarm ignorieren. Zur Warnung kommt es da der IPMI Upper Critical Wert und der IPMI Lower Critical Wert für diesen Sensor mit 0.000 Grad Celsius definiert sind.

Minus-Werte für die Temperatur sind bei diesem Sensor normal und auch erwünscht. Der Wert gibt den Temperatur-Spielraum an, um wieviel die Temperatur noch steigen könnte, bis die CPU die Taktfrequenz verringert oder die CPU abschaltet (per PROCHOT Event).[1][2]

Hier der entsprechende Auszug aus ipmitool sdr -v (aufgerufen auf einem Linux Testsystem, das auf einem Intel MFS5000SI Compute Module installiert ist):

Sensor ID              : Proc Max Therm (0x9f)
 Entity ID             : 3.5 (Processor)
 Sensor Type (Analog)  : Temperature
 Sensor Reading        : -53 (+/- 0) degrees C
 Status                : Upper Critical
 Nominal Reading       : -21.000
 Normal Minimum        : 0.000
 Normal Maximum        : -1.000
 Upper critical        : 0.000
 Lower critical        : 0.000
 Positive Hysteresis   : 1.000
 Negative Hysteresis   : 1.000
 Minimum sensor range  : Unspecified
 Maximum sensor range  : -1.000
 Event Message Control : Per-threshold
 Readable Thresholds   : lcr ucr 
 Settable Thresholds   : lcr ucr 
 Assertions Enabled    : 

Problem behoben

Mit Firmware 6.0 hat Intel das Problem behoben. Ein ipmitool sdr -v zeigt nun korrekte Werte:

Sensor ID              : Proc Max Therm (0x9f)
 Entity ID             : 3.5 (Processor)
 Sensor Type (Analog)  : Temperature
 Sensor Reading        : -51 (+/- 0) degrees C
 Status                : ok
 Nominal Reading       : -21.000
 Normal Minimum        : 0.000
 Normal Maximum        : -1.000
 Positive Hysteresis   : 1.000
 Negative Hysteresis   : 1.000
 Minimum sensor range  : Unspecified
 Maximum sensor range  : -1.000
 Event Message Control : Per-threshold
 Readable Thresholds   : 
 Settable Thresholds   : 
 Assertions Enabled    : 

ipmitool sensor output

Hier zum Vergleich die Ausgaben von ipmitool sensor mit der Firmware 5.5 und 6.0:

Firmware 5.5

ipmitool sensor liefert bei einem System mit Firmware 5.5:

[root@centos54 ~]# ipmitool sensor
PowerUnitStatus  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Watchdog         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
ACPI State       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
BB Vtt           | 1.096      | Volts      | ok    | na        | 0.895     | na        | na        | 1.499     | na        
BB +1.5V AUX     | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +1.5V         | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.638     | na        
BB +1.8V         | 1.802      | Volts      | ok    | na        | 1.669     | na        | na        | 1.936     | na        
BB +3.3V         | 3.268      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +3.3V STB     | 3.354      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +1.5V ESB     | 1.498      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +5V           | 5.070      | Volts      | ok    | na        | 4.498     | na        | na        | 5.486     | na        
BB +12V AUX      | 12.033     | Volts      | ok    | na        | 10.647    | na        | na        | 13.230    | na        
BB 0.9V          | 0.893      | Volts      | ok    | na        | 0.778     | na        | na        | 1.018     | na        
BB VBat          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Hot Swap         | 0x0        | discrete   | 0x1080| na        | na        | na        | na        | na        | na        
KVM Session      | 0x0        | discrete   | 0x0280| na        | na        | na        | na        | na        | na        
SOL Session      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
SMI Timeout      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Memory Error     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Critical Int     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
DIMM1 Temp       | 73.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM2 Temp       | 67.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM3 Temp       | 75.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM4 Temp       | 71.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM5 Temp       | 78.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM6 Temp       | 71.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM7 Temp       | 74.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM8 Temp       | 60.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM Max Temp    | 78.000     | degrees C  | ok    | na        | na        | na        | na        | na        | na        
P1 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
P2 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
PECI P1C12       | -53.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P1C34       | -54.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C12       | -59.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C34       | -63.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
P1 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P2 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P1 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Proc Max Therm   | -53.000    | degrees C  | cr    | na        | 0.000     | na        | na        | 0.000     | na        
P1_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
CPU Populn Err   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Mezz Card Pres   | 0x0        | discrete   | 0x0480| na        | na        | na        | na        | na        | na        
Attention State  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Slot ID          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Progress         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
[root@centos54 ~]#

Firmware 6.0

ipmitool sensor liefert bei einem System mit Firmware 6.0 (dieser Test wurde mit Debian auf einem anderen Modular Server als oben im Beispiel mit Firmware 5.5 durchgeführt):

(none):~# ipmitool sensor
PowerUnitStatus  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Watchdog         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
ACPI State       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
BB Vtt           | 1.096      | Volts      | ok    | na        | 0.895     | na        | na        | 1.499     | na        
BB +1.5V AUX     | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +1.5V         | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.638     | na        
BB +1.8V         | 1.792      | Volts      | ok    | na        | 1.669     | na        | na        | 1.936     | na        
BB +3.3V         | 3.268      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +3.3V STB     | 3.354      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +1.5V ESB     | 1.498      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +5V           | 5.070      | Volts      | ok    | na        | 4.498     | na        | na        | 5.486     | na        
BB +12V AUX      | 12.033     | Volts      | ok    | na        | 10.647    | na        | na        | 13.230    | na        
BB 0.9V          | 0.893      | Volts      | ok    | na        | 0.778     | na        | na        | 1.018     | na        
BB VBat          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Hot Swap         | 0x0        | discrete   | 0x1080| na        | na        | na        | na        | na        | na        
KVM Session      | 0x0        | discrete   | 0x0280| na        | na        | na        | na        | na        | na        
SOL Session      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
SMI Timeout      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Memory Error     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Critical Int     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
DIMM1 Temp       | 75.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM2 Temp       | 71.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM3 Temp       | 78.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM4 Temp       | 74.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM5 Temp       | 81.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM6 Temp       | 75.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM7 Temp       | 77.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM8 Temp       | 63.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM Max Temp    | 81.000     | degrees C  | ok    | na        | na        | na        | na        | na        | na        
P1 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
P2 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
PECI P1C12       | -51.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P1C34       | -53.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C12       | -59.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C34       | -63.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
P1 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P2 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P1 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Proc Max Therm   | -51.000    | degrees C  | ok    | na        | na        | na        | na        | na        | na        
P1_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
CPU Populn Err   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Mezz Card Pres   | 0x0        | discrete   | 0x0480| na        | na        | na        | na        | na        | na        
Attention State  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Slot ID          | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Progress         | 0x0        | discrete   | 0x6489| na        | na        | na        | na        | na        | na        
(none):~# 

Einzelnachweise


Foto Werner Fischer.jpg

Autor: Werner Fischer

Werner Fischer arbeitet im Product Management Team von Thomas-Krenn. Er evaluiert dabei neueste Technologien und teilt sein Wissen in Fachartikeln, bei Konferenzen und im Thomas-Krenn Wiki. Bereits 2005 - ein Jahr nach seinem Abschluss des Studiums zu Computer- und Mediensicherheit an der FH Hagenberg - heuerte er beim bayerischen Server-Hersteller an. Als Öffi-Fan nutzt er gerne Bus & Bahn und genießt seinen morgendlichen Spaziergang ins Büro.


Das könnte Sie auch interessieren

Ethernet Mezzanine Card (Dual Gigabit Ethernet Erweiterungskarte)
FAQs Modular-Server
Passwortänderung im Modular-Server CMM wird nicht übernommen