Mcelog

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen

Hinweis: mcelog ist seit Linux Kernel 4.12 "deprecated". Als Nachfolger soll rasdaemon verwendet werden.

Hinweis: Bitte beachten Sie, dass dieser Artikel / diese Kategorie sich entweder auf ältere Software/Hardware Komponenten bezieht oder aus sonstigen Gründen nicht mehr gewartet wird.
Diese Seite wird nicht mehr aktualisiert und ist rein zu Referenzzwecken noch hier im Archiv abrufbar.

X86 Prozessoren melden Fehler, die sie erkennen, als sogenannte Machine Check Events (MCEs). Bei solchen Fehlern kann es sich beispielsweise um Fehler der CPU Caches oder Speicherfehler handeln. Mögliche Ursachen für solche Fehler sind u.a. kosmische Strahlung oder Probleme mit der Kühlung. Die meisten dieser Fehler können von der CPU korrigiert werden, nicht korrigierbare Fehler führen dagegen zu sogenannten Machine Check Exceptions, die zu einer Kernel Panic führen können. Der User-Space Service mcelog dekodiert Linux Kernel Machine Check Logs auf x86 Systemen und ermöglicht damit eine verbesserte Analyse von derartigen Problemen.

mcelog Installation

Die meisten Linux Distributionen liefern Pakete für mcelog mit. Unter Ubuntu installieren Sie mcelog z.B. einfach mit folgendem Kommando:

$ sudo apt-get install mcelog

Nach der Installation läuft mcelog als Dienst und zeichnet im Falle von Hardwarefehlern Informationen in der Logdatei /var/log/mcelog auf:

$ ps -ef | grep -i mcelog
root     22462     1  0 13:36 ?        00:00:00 /usr/sbin/mcelog --daemon
$ ls -l /var/log/mcelog 
-rw-r--r-- 1 root root 0 Mar 13 13:36 /var/log/mcelog

Beispiel eines dokumentierten Fehlers

Die folgende Ausgabe zeigt einen Fehler, der von mcelog in /var/log/mcelog dokumentiert wurde. In diesem Fall handelt es sich um einen Fehler im Level-2 Cache der CPU:[1]

Hardware event. This is not a software error.
MCE 0
CPU 0 BANK 5 
MISC 178a0000086 ADDR fef873c0 
TIME 1468330671 Tue Jul 12 21:37:51 2016
MCG status:
MCi status:
Error overflow
Uncorrected error
MCi_MISC register valid
MCi_ADDR register valid
Processor context corrupt
MCA: corrected filtering (some unreported errors in same region)
Generic CACHE Level-2 Generic Error
STATUS ee0000000040110a MCGSTATUS 0
MCGCAP c07 APICID 0 SOCKETID 0 
CPUID Vendor Intel Family 6 Model 69

Einzelnachweis

  1. mcelog Hardware Error events (bbs.archlinux.org, 12.07.2016)

Weitere Informationen


Foto Werner Fischer.jpg

Autor: Werner Fischer

Werner Fischer arbeitet im Product Management Team von Thomas-Krenn. Er evaluiert dabei neueste Technologien und teilt sein Wissen in Fachartikeln, bei Konferenzen und im Thomas-Krenn Wiki. Bereits 2005 - ein Jahr nach seinem Abschluss des Studiums zu Computer- und Mediensicherheit an der FH Hagenberg - heuerte er beim bayerischen Server-Hersteller an. Als Öffi-Fan nutzt er gerne Bus & Bahn und genießt seinen morgendlichen Spaziergang ins Büro.


Das könnte Sie auch interessieren

HA Cluster mit Linux Container basierend auf Heartbeat, Pacemaker, DRBD und LXC
Intel i210 Netwerkkartentreiber installieren unter Debian 7.3.0
KSM (Kernel Samepage Merging)