AER Multiple Corrected error received 0000:00:1c.4

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen

Unter Linux kann es nach einem einzigen durch ECC-Mechanismen erfolgreich korrigierten PCIe Fehler zu wiederholten Log Meldungen AER Multiple Corrected error received kommen. Ursache für die wiederholten Meldungen ist, dass der AER Treiber die Meldung nicht löscht. In diesem Artikel zeigen wir, wie Sie durch einen Workaround die wiederholten Meldungen vermeiden.

Betroffene Hardware

Beim Test mit Ubuntu 18.04 LTS (Linux Kernel 5.4) konnten wir mit folgender Hardware die wiederholten Log Meldungen reproduzieren:

  • LES plus v2
  • Azurewave AW-CB161H Mini PCIe half size Wifi Modul

Auszug Log-Datei

Apr  8 08:45:41 ubuntu1804 systemd-networkd[961]: enp2s0: Link UP
Apr  8 08:45:41 ubuntu1804 NetworkManager[1187]: <info>  [1617864341.5616] wifi-nl80211: (wlp3s0): using nl80211 for WiFi device control
Apr  8 08:45:41 ubuntu1804 NetworkManager[1187]: <info>  [1617864341.5618] device (wlp3s0): driver supports Access Point (AP) mode
Apr  8 08:45:41 ubuntu1804 NetworkManager[1187]: <info>  [1617864341.5627] manager: (wlp3s0): new 802.11 WiFi device (/org/freedesktop/NetworkManager/Devices/4)
Apr  8 08:45:41 ubuntu1804 NetworkManager[1187]: <info>  [1617864341.5634] device (wlp3s0): state change: unmanaged -> unavailable (reason 'managed', sys-iface-state: 'external')
Apr  8 08:45:41 ubuntu1804 kernel: [    8.546423] pcieport 0000:00:1c.4: AER: Multiple Corrected error received: 0000:00:1c.4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.546437] pcieport 0000:00:1c.4: AER: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Apr  8 08:45:41 ubuntu1804 kernel: [    8.547307] pcieport 0000:00:1c.4: AER:   device [8086:9d14] error status/mask=00000001/00002000
Apr  8 08:45:41 ubuntu1804 kernel: [    8.548191] pcieport 0000:00:1c.4: AER:    [ 0] RxErr
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549031] pcieport 0000:00:1c.4: AER: Multiple Corrected error received: 0000:00:1c.4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549037] pcieport 0000:00:1c.4: AER: can't find device of ID00e4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549038] pcieport 0000:00:1c.4: AER: Multiple Corrected error received: 0000:00:1c.4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549041] pcieport 0000:00:1c.4: AER: can't find device of ID00e4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549042] pcieport 0000:00:1c.4: AER: Multiple Corrected error received: 0000:00:1c.4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549046] pcieport 0000:00:1c.4: AER: can't find device of ID00e4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549211] pcieport 0000:00:1c.4: AER: Corrected error received: 0000:00:1c.4
Apr  8 08:45:41 ubuntu1804 kernel: [    8.549215] pcieport 0000:00:1c.4: AER: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
Apr  8 08:45:41 ubuntu1804 kernel: [    8.550072] pcieport 0000:00:1c.4: AER:   device [8086:9d14] error status/mask=00000001/00002000
Apr  8 08:45:41 ubuntu1804 kernel: [    8.550954] pcieport 0000:00:1c.4: AER:    [ 0] RxErr

[...]
tk@ubuntu1804:~$ uname -a
Linux ubuntu1804 5.4.0-65-generic #73~18.04.1-Ubuntu SMP Tue Jan 19 09:02:24 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux

Ursache

Laut Bjorn Helgaas, Linux Kernel Entwicklung und PCI Subsystem Maintainer, liegt die Ursache an den wiederholten Log-Einträge darin, dass der AER Treiber die Meldung über den korrigierten Fehler zwar empfängt, jedoch die Meldung danach nicht löscht. Bislang hat niemand diesen Bug behoben. Als Workaround erwähnt er die Möglichkeit, AER zu mit dem Bootparamter "pci=noaer" zu deaktivieren.[1]

Workaround

Um die Meldungen zu unterbinden, deaktivieren Sie die Funktion Advanced Error Reporting via BIOS oder Linux Kernel Parameter. Im BIOS nehmen Sie dazu folgende Einstellung vor:

  • Chipset -> PCH-IO Configuration -> PCI Express Configuration -> mPCI Slot -> Advanced Error Reporting -> Disabled
  • Chipset -> PCH-IO Configuration -> PCI Express Configuration -> mPCI Slot -> ASPM -> Auto

Alternativ:

  • Kernel Parameter "pci=noaer" verwenden.[1][2]

Einzelnachweise

  1. 1,0 1,1 Re: 4.4.x kernel (only) gives pcieport 0000:00:1c.4: AER: Corrected error received: id=00e4 (lore.kernel.org, 15.02.2016) Short story: the AER driver receives the corrected error notification but fails to clear it. Nobody has stepped up to fix the bug yet. You can probably work around it by disabling AER completely by booting with "pci=noaer". (Bjorn Helgaas, Linux PCI subsystem maintainer)
  2. Bug 196183 - AER: Corrected error received: id=00e8 - Comment 5 according to https://bbs.archlinux.org/viewtopic.php?id=232917 (URL hier korrigiert), one could use pci=noaer to just disable AER: "it seems disabling AER should be safe, and you are still left with basic PCIe error reporting capabilities. AER is just for "advanced" error reporting."


Foto Edwin Derr.jpg

Autor: Edwin Derr

Edwin Derr ist seit 2020 im Technischen Support der Thomas-Krenn.AG tätig. In seiner Abteilung kümmert er sich um typische Support-Aufgaben wie den Aufbau von Testsystemen oder die Betreuung der Kunden bei technischen Problemen. Neben seiner Beruflichen Tätigkeit ist er gerne in der Natur unterwegs, reist gerne und trifft sich regelmäßig mit Freunden.


Das könnte Sie auch interessieren

Festplattenbelegung unter Linux in der Konsole mit df und du anzeigen
Linux Filesystem Performance Tests mit dbench
SSD Firmware Update mit storcli