MegaRAID 9341-4i Debian 11 DMAR DRHD handling fault status reg 3

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen

Nach der Installation von Debian 11 auf einem System mit MegaRAID 9341-4i RAID Controller kann es beim Startvorgang zu AVAGO EFI SAS Driver is Unhealthy Meldungen und im System Log zu DMAR: DRHD: handling fault status reg 3 Fehlermeldungen kommen. In diesem Artikel zeigen wir, wie Sie das Problem durch Verwendung der Kernel Parameter intel_iommu=on iommu=pt lösen.

Problembeschreibung

Nach der Installation von Debian 11 kommt es auf einem System mit MegaRAID 9341-4i RAID Controller zu folgenden Problemen:

  • Meldung beim Startvorgang:
    Avago EFI SAS Driver is Unhealthy
  • Meldung im BIOS:
    L2/L3 Cache error was detected on the RAID controller. Please contact technical support to resolve this issue. Press 'X' to continue or else power off the system, replace the controller and reboot.
  • Fehlermeldung im Syslog:
    DMAR: DRHD: handling fault status reg 3

Fehlermeldung im Syslog im Detail:

[ 44.978734] megasas: 07.714.04.00-rc1
[ 44.979059] megaraid_sas 0000:02:00.0: BAR:0x1 BAR's base_addr(phys):0x0000000091300000 mapped virt_addr:0x00000000e2c49ffb
[ 44.979061] megaraid_sas 0000:02:00.0: FW now in Ready state
[ 44.979061] megaraid_sas 0000:02:00.0: 63 bit DMA mask and 32 bit consistent mask
[ 44.979181] megaraid_sas 0000:02:00.0: firmware supports msix : (96)
[ 44.979388] megaraid_sas 0000:02:00.0: requested/available msix 13/13
[ 44.979389] megaraid_sas 0000:02:00.0: current msix/online cpus : (13/12)
[ 44.979390] megaraid_sas 0000:02:00.0: RDPQ mode : (disabled)
[ 44.979391] megaraid_sas 0000:02:00.0: Current firmware supports maximum commands: 272 LDIO threshold: 237
[ 44.979425] megaraid_sas 0000:02:00.0: Configured max firmware commands: 271
[ 44.979686] megaraid_sas 0000:02:00.0: Performance mode :Latency
[ 44.979687] megaraid_sas 0000:02:00.0: FW supports sync cache : Yes
[ 44.979688] megaraid_sas 0000:02:00.0: megasas_disable_intr_fusion is called outbound_intr_mask:0x40000009
[ 45.235288] DMAR: DRHD: handling fault status reg 3
[ 45.235366] DMAR: [DMA Write] Request device [02:00.0] PASID ffffffff fault addr 3ffb0000 [fault reason 05] PTE Write access is not set
[ 45.236414] DMAR: DRHD: handling fault status reg 3
[ 45.236492] DMAR: [DMA Read] Request device [02:00.0] PASID ffffffff fault addr 3ffb0000 [fault reason 06] PTE Read access is not set
[ 46.289908] DMAR: DRHD: handling fault status reg 3
[ 46.289986] DMAR: [DMA Read] Request device [02:00.0] PASID ffffffff fault addr 3ffb0000 [fault reason 06] PTE Read access is not set
[ 47.353019] DMAR: DRHD: handling fault status reg 3
[ 50.542825] dmar_fault: 8 callbacks suppressed ...
[ 291.968323] dmar_fault: 5 callbacks suppressed
[ 291.968327] DMAR: DRHD: handling fault status reg 3
[ 291.973328] DMAR: [DMA Read] Request device [02:00.0] PASID ffffffff fault addr 3ffb0000 [fault reason 06] PTE Read access is not set
[ 293.031635] DMAR: DRHD: handling fault status reg 3
[ 293.034716] DMAR: [DMA Read] Request device [02:00.0] PASID ffffffff fault addr 3ffb0000 [fault reason 06] PTE Read access is not set
[ 294.094631] DMAR: DRHD: handling fault status reg 3
[ 294.098574] DMAR: [DMA Read] Request device [02:00.0] PASID ffffffff fault addr 3ffb0000 [fault reason 06] PTE Read access is not set
[ 295.157716] DMAR: DRHD: handling fault status reg 3
[ 296.988718] megaraid_sas 0000:02:00.0: Init cmd return status FAILED for SCSI host 9
[ 296.994525] megaraid_sas 0000:02:00.0: Failed from megasas_init_fw 6460

Betroffene Systeme

Das Problem trat mit folgender Hardware/Software auf.

Hardware:

  • Supermicro Mainboard X11SCH-LN4F
  • MegaRAID 9341-4i RAID Controller

Software:

  • Debian 11 mit Linux Kernel 5.10.0-11, megaraid_sas Modulversion (via Debian) 07.714.04.00-r, auch neuestes Modul von Broadcom 07.719.04.00 löst Problem nicht

Bei Verwendung von Debian 10 mit Linux Kernel 4.19.0-18, megaraid_sas Modulversion 07.706.03.00-rc1 tritt das Problem nicht auf.

Ursache

Die Fehlermelung DMAR: DRHD: handling fault status reg 3 deutet auf ein Problem im Zusammenhang mit der IOMMU hin. Die Begriffe dabei bedeuten:[1][2]

  • DMAR = DMA Remapping Reporting
  • DRHD = DMA Remapping Hardware Unit Definition

Lösung

Um das Problem zu lösen, aktivieren Sie die Intel IOMMU Funktionen im Linux Kernel und setzen die IOMMU auf pass-through Modus.

Setzen Sie dazu folgende Kernel Parameter (via /etc/default/grub):

  • intel_iommu=on iommu=pt

Weitere Informationen

Einzelnachweise


Foto Werner Fischer.jpg

Autor: Werner Fischer

Werner Fischer arbeitet im Product Management Team von Thomas-Krenn. Er evaluiert dabei neueste Technologien und teilt sein Wissen in Fachartikeln, bei Konferenzen und im Thomas-Krenn Wiki. Bereits 2005 - ein Jahr nach seinem Abschluss des Studiums zu Computer- und Mediensicherheit an der FH Hagenberg - heuerte er beim bayerischen Server-Hersteller an. Als Öffi-Fan nutzt er gerne Bus & Bahn und genießt seinen morgendlichen Spaziergang ins Büro.


Das könnte Sie auch interessieren

Debian 11 Installation bei Fehlermeldung DMAR DRHD handling fault status reg 3
Debian installieren
Raspi-firmware: missing /boot/firmware, did you forget to mount it