Processor 5 Proc Max Therm Alarm in VMware ESX mit Modular-Server MFS5000SI Compute Module

Aus Thomas-Krenn-Wiki
Wechseln zu: Navigation, Suche
Hinweis: Bitte beachten Sie, dass dieser Artikel / diese Kategorie sich entweder auf ältere Software/Hardware Komponenten bezieht oder aus sonstigen Gründen nicht mehr gewartet wird.
Diese Seite wird nicht mehr aktualisiert und ist rein zu Referenzzwecken noch hier im Archiv abrufbar.

Bei Intel Modular Servern mit Firmware 5.5 zeigt VMware ESX/ESXi einen Processor 5 Proc Max Therm Alarm bei MFS5000SI Compute Modulen. Sie können einen solchen Alarm ignorieren. Firmware 6.0 behebt dieses Anzeigeproblem.

Fehler

Die Systemstatusanzeige des vSphere Client zeigt einen Alarm für den Sensor Processor 5 Proc Max Therm:

Modular-Server-Processor-5-Proc-Max-Therm-ESXi4.png

Details und Hinweise

Sie können diesen Alarm ignorieren. Zur Warnung kommt es da der IPMI Upper Critical Wert und der IPMI Lower Critical Wert für diesen Sensor mit 0.000 Grad Celsius definiert sind.

Minus-Werte für die Temperatur sind bei diesem Sensor normal und auch erwünscht. Der Wert gibt den Temperatur-Spielraum an, um wieviel die Temperatur noch steigen könnte, bis die CPU die Taktfrequenz verringert oder die CPU abschaltet (per PROCHOT Event).[1][2]

Hier der entsprechende Auszug aus ipmitool sdr -v (aufgerufen auf einem Linux Testsystem, das auf einem Intel MFS5000SI Compute Module installiert ist):

Sensor ID              : Proc Max Therm (0x9f)
 Entity ID             : 3.5 (Processor)
 Sensor Type (Analog)  : Temperature
 Sensor Reading        : -53 (+/- 0) degrees C
 Status                : Upper Critical
 Nominal Reading       : -21.000
 Normal Minimum        : 0.000
 Normal Maximum        : -1.000
 Upper critical        : 0.000
 Lower critical        : 0.000
 Positive Hysteresis   : 1.000
 Negative Hysteresis   : 1.000
 Minimum sensor range  : Unspecified
 Maximum sensor range  : -1.000
 Event Message Control : Per-threshold
 Readable Thresholds   : lcr ucr 
 Settable Thresholds   : lcr ucr 
 Assertions Enabled    : 

Problem behoben

Mit Firmware 6.0 hat Intel das Problem behoben. Ein ipmitool sdr -v zeigt nun korrekte Werte:

Sensor ID              : Proc Max Therm (0x9f)
 Entity ID             : 3.5 (Processor)
 Sensor Type (Analog)  : Temperature
 Sensor Reading        : -51 (+/- 0) degrees C
 Status                : ok
 Nominal Reading       : -21.000
 Normal Minimum        : 0.000
 Normal Maximum        : -1.000
 Positive Hysteresis   : 1.000
 Negative Hysteresis   : 1.000
 Minimum sensor range  : Unspecified
 Maximum sensor range  : -1.000
 Event Message Control : Per-threshold
 Readable Thresholds   : 
 Settable Thresholds   : 
 Assertions Enabled    : 

ipmitool sensor output

Hier zum Vergleich die Ausgaben von ipmitool sensor mit der Firmware 5.5 und 6.0:

Firmware 5.5

ipmitool sensor liefert bei einem System mit Firmware 5.5:

[root@centos54 ~]# ipmitool sensor
PowerUnitStatus  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Watchdog         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
ACPI State       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
BB Vtt           | 1.096      | Volts      | ok    | na        | 0.895     | na        | na        | 1.499     | na        
BB +1.5V AUX     | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +1.5V         | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.638     | na        
BB +1.8V         | 1.802      | Volts      | ok    | na        | 1.669     | na        | na        | 1.936     | na        
BB +3.3V         | 3.268      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +3.3V STB     | 3.354      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +1.5V ESB     | 1.498      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +5V           | 5.070      | Volts      | ok    | na        | 4.498     | na        | na        | 5.486     | na        
BB +12V AUX      | 12.033     | Volts      | ok    | na        | 10.647    | na        | na        | 13.230    | na        
BB 0.9V          | 0.893      | Volts      | ok    | na        | 0.778     | na        | na        | 1.018     | na        
BB VBat          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Hot Swap         | 0x0        | discrete   | 0x1080| na        | na        | na        | na        | na        | na        
KVM Session      | 0x0        | discrete   | 0x0280| na        | na        | na        | na        | na        | na        
SOL Session      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
SMI Timeout      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Memory Error     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Critical Int     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
DIMM1 Temp       | 73.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM2 Temp       | 67.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM3 Temp       | 75.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM4 Temp       | 71.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM5 Temp       | 78.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM6 Temp       | 71.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM7 Temp       | 74.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM8 Temp       | 60.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM Max Temp    | 78.000     | degrees C  | ok    | na        | na        | na        | na        | na        | na        
P1 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
P2 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
PECI P1C12       | -53.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P1C34       | -54.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C12       | -59.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C34       | -63.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
P1 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P2 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P1 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Proc Max Therm   | -53.000    | degrees C  | cr    | na        | 0.000     | na        | na        | 0.000     | na        
P1_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
CPU Populn Err   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Mezz Card Pres   | 0x0        | discrete   | 0x0480| na        | na        | na        | na        | na        | na        
Attention State  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Slot ID          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Progress         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
[root@centos54 ~]#

Firmware 6.0

ipmitool sensor liefert bei einem System mit Firmware 6.0 (dieser Test wurde mit Debian auf einem anderen Modular Server als oben im Beispiel mit Firmware 5.5 durchgeführt):

(none):~# ipmitool sensor
PowerUnitStatus  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Watchdog         | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
ACPI State       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
BB Vtt           | 1.096      | Volts      | ok    | na        | 0.895     | na        | na        | 1.499     | na        
BB +1.5V AUX     | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +1.5V         | 1.482      | Volts      | ok    | na        | 1.326     | na        | na        | 1.638     | na        
BB +1.8V         | 1.792      | Volts      | ok    | na        | 1.669     | na        | na        | 1.936     | na        
BB +3.3V         | 3.268      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +3.3V STB     | 3.354      | Volts      | ok    | na        | 2.958     | na        | na        | 3.612     | na        
BB +1.5V ESB     | 1.498      | Volts      | ok    | na        | 1.326     | na        | na        | 1.646     | na        
BB +5V           | 5.070      | Volts      | ok    | na        | 4.498     | na        | na        | 5.486     | na        
BB +12V AUX      | 12.033     | Volts      | ok    | na        | 10.647    | na        | na        | 13.230    | na        
BB 0.9V          | 0.893      | Volts      | ok    | na        | 0.778     | na        | na        | 1.018     | na        
BB VBat          | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Hot Swap         | 0x0        | discrete   | 0x1080| na        | na        | na        | na        | na        | na        
KVM Session      | 0x0        | discrete   | 0x0280| na        | na        | na        | na        | na        | na        
SOL Session      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
SMI Timeout      | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Memory Error     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Critical Int     | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
DIMM1 Temp       | 75.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM2 Temp       | 71.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM3 Temp       | 78.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM4 Temp       | 74.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM5 Temp       | 81.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM6 Temp       | 75.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM7 Temp       | 77.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM8 Temp       | 63.000     | degrees C  | ok    | na        | 0.000     | na        | na        | 105.000   | na        
DIMM Max Temp    | 81.000     | degrees C  | ok    | na        | na        | na        | na        | na        | na        
P1 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
P2 Status        | 0x0        | discrete   | 0x8080| na        | na        | na        | na        | na        | na        
PECI P1C12       | -51.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P1C34       | -53.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C12       | -59.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
PECI P2C34       | -63.000    | degrees C  | ok    | na        | na        | na        | -10.000   | -5.000    | na        
P1 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P2 Therm Ctrl    | 0.000      | unspecified | ok    | na        | na        | na        | na        | 0.780     | na        
P1 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2 VRD Hot       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Proc Max Therm   | -51.000    | degrees C  | ok    | na        | na        | na        | na        | na        | na        
P1_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
P2_Vcc_Err       | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
CPU Populn Err   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na        
Mezz Card Pres   | 0x0        | discrete   | 0x0480| na        | na        | na        | na        | na        | na        
Attention State  | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Slot ID          | 0x0        | discrete   | 0x0080| na        | na        | na        | na        | na        | na        
Progress         | 0x0        | discrete   | 0x6489| na        | na        | na        | na        | na        | na        
(none):~# 

Einzelnachweise

  1. http://en.wikipedia.org/wiki/Platform_Environment_Control_Interface
  2. http://www.extremetech.com/article2/0,1558,1644462,00.asp


Foto Werner Fischer.jpg

Autor: Werner Fischer

Werner Fischer, tätig im Bereich Communications / Knowledge Transfer bei Thomas-Krenn, hat sein Studium zu Computer- und Mediensicherheit an der FH Hagenberg abgeschlossen. Er ist regelmäßig Autor in Fachzeitschriften und Speaker bei Konferenzen wie LinuxCon, OSDC, OSMC, LinuxTag u.v.m. Seine Freizeit gestaltet er sehr abwechslungsreich. In einem Moment absolviert er seinen Abschluss im Klavierspielen, im anderen läuft er beim Linzmarathon in der Staffel mit oder interessiert sich für OpenStreetMap.


Das könnte Sie auch interessieren

Stromverbrauch Modular-Server
ESX/ESXi Agent Pre-Upgrade Checker Connection Failed
Intel 82576 Netzwerktreiber für X8DT3-F Onboard-NICs für ESX/ESXi 4.0