PCIe Bus Error Status 00001100 beheben

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen

Unter Linux kann es auf Systemen mit aktiviertem Active State Power Management (ASPM) zu PCIe Bus Error Meldungen kommen. Die Meldungen beziehen sich auf korrigierte error status/mask=00001100/00002000 Fehler. Sie können diese Probleme vermeiden, indem Sie ASPM mit dem Kernel Parameter pcie_aspm=off deaktivieren. Wie das geht, erfahren Sie in diesem Wiki Artikel.

Problembeschreibung

Der Kernel protokolliert error status/mask=00001100/00002000 Fehler über die PCIe advanced error reporting (AER) Funktion in der Logdatei /var/log/syslog. Die Fehler selbst sind laut den Log-Einträgen zwar behoben (severity=Corrected), die wiederholten Einträge machen jedoch die Logdatei unübersichtlich.

Ein entsprechender Eintrag in /var/log/syslog sieht unter Debian beispielsweise wie folgt aus:

Nov  9 11:20:38 debian kernel: [69300.887669] pcieport 0000:00:02.0: AER: Multiple Corrected error received: id=0010
Nov  9 11:20:38 debian kernel: [69300.887680] pcieport 0000:00:02.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer, id=0010(Transmitter ID)
Nov  9 11:20:38 debian kernel: [69300.889913] pcieport 0000:00:02.0:   device [8086:6f04] error status/mask=00001100/00002000
Nov  9 11:20:38 debian kernel: [69300.892156] pcieport 0000:00:02.0:    [ 8] RELAY_NUM Rollover
Nov  9 11:20:38 debian kernel: [69300.894370] pcieport 0000:00:02.0:    [12] Replay Timer Timeout

Ubuntu zeigt die Meldungen auch direkt auf der Konsole:

PCIe Bus Error unter Ubuntu 16.04.2 LTS

Betroffene Systeme

Von diesem Problem sind laut eines Bugreports bei Ubuntu vor allem Laptops betroffen.[1] Unserer Einschätzung nach kann das Problem potentiell bei jedem System mit aktiviertem ASPM auftreten. Wir haben das Problem bei einem Serversystem mit Ubuntu 16.04.2 LTS und auch mit Debian 9 (Stretch) (mit Linux Kernel 4.9.0.-3-amd64) mit aktiviertem ASPM vor allem dann beobachtet, wenn Netzwerkkarten (z.B. Intel Intel XXV710, Intel X710, Intel X550) installiert waren.

Lösung

Bei unseren Tests konnten wir das Problem durch Setzen des Kernel Paramenters pcie_aspm=off lösen.

Um diese Einstellung dauerhaft zu setzen, führen Sie folgende Schritte aus:

  1. Öffnen Sie die Grub Konfigurationsdatei in einem Editor, z.B. in vi:
    sudo vi /etc/default/grub
  2. Passen Sie die Variable GRUB_CMDLINE_LINUX_DEFAULT folgendermaßen an, speichern Sie die Datei und schließen Sie den Editor:
    GRUB_CMDLINE_LINUX_DEFAULT="quiet pcie_aspm=off"
  3. Nach der Konfigurationsänderung aktualisieren Sie den Grub Bootloader mit folgendem Kommando:
    sudo update-grub
  4. Führen Sie abschließend einen Neustart durch.

Neben dieser Lösungsmöglichkeit wird im Bugreport bei Ubuntu auch die Möglichkeit des Deaktivierens des PCIe Advanced Error Reportings genannt.[1] Wir empfehlen jedoch, PCIe Advanced Error Reporting aktiviert zu lassen, damit auch andere potentielle PCIe Fehler protokolliert werden. Informationen zur vollständigen Liste aller Kernel Boot Paramenter finden Sie in der Kernel Dokumention.[2] Hier sind auszugsweise die Information für pci=noaer und pcie_aspm=off:

pci=option[,option...]	[PCI] various PCI subsystem options:
[...]
		noaer		[PCIE] If the PCIEAER kernel config parameter is
				enabled, this kernel boot option can be used to
				disable the use of PCIE advanced error reporting.
[...]
pcie_aspm=	[PCIE] Forcibly enable or disable PCIe Active State Power
			Management.
		off	Disable ASPM.
		force	Enable ASPM even on devices that claim not to support it.
			WARNING: Forcing ASPM on may cause system lockups.

Einzelnachweise

  1. 1,0 1,1 AER: Corrected error received: id=00e0 (bugs.launchpad.net, Bugreport 1521173)
  2. Kernel-Parameters (kernel.org/doc)

Weitere Informationen


Foto Werner Fischer.jpg

Autor: Werner Fischer

Werner Fischer arbeitet im Product Management Team von Thomas-Krenn. Er evaluiert dabei neueste Technologien und teilt sein Wissen in Fachartikeln, bei Konferenzen und im Thomas-Krenn Wiki. Bereits 2005 - ein Jahr nach seinem Abschluss des Studiums zu Computer- und Mediensicherheit an der FH Hagenberg - heuerte er beim bayerischen Server-Hersteller an. Als Öffi-Fan nutzt er gerne Bus & Bahn und genießt seinen morgendlichen Spaziergang ins Büro.


Das könnte Sie auch interessieren

Anleitung zur einfachen Image-Erstellung mit Clonezilla
Apache Internal Server Error aufgrund htaccess bad flag delimiters beheben
Backup unter Linux mit rdiff-backup