EDAC amd64 Node 0 DRAM ECC disabled

Aus Thomas-Krenn-Wiki
Zur Navigation springen Zur Suche springen
Hinweis: Bitte beachten Sie, dass dieser Artikel / diese Kategorie sich entweder auf ältere Software/Hardware Komponenten bezieht oder aus sonstigen Gründen nicht mehr gewartet wird.
Diese Seite wird nicht mehr aktualisiert und ist rein zu Referenzzwecken noch hier im Archiv abrufbar.

Beim Einsatz von Debian 10 mit Linux Kernel 4.19 kommt es auf Systemen mit Supermicro H11SSL-i Mainboard und AMD EPYC Rome 7002 CPUs zu EDAC amd64: Node 0: DRAM ECC disabled Meldungen des EDAC Treibers wenn RAM-Module wie für diese CPUs empfohlen in den Slots C1 / D1 / G1 / H1 bestückt sind. Werden die Module in die Slots A1 / C1 / E1 / G1 montiert (wie für die Vorgänger AMD EPYC Naples 7001 CPUs empfohlen), treten die Meldungen nicht auf.

Die Ursache für die Fehlermeldung liegt im amd64_edac Treiber des Linux Kernels. Mit neueren Linux Kernel Versionen (z.B. Ubuntu 20.04 mit Kernel 5.4.0-58, Fedora 33 mit Kernel 5.9.14) tritt das Problem nicht auf.

DIMM Population Guide für das H11SSL-i Mainboard.[1]

Fehlermeldung

[...]
[    3.532047] ipmi_si dmi-ipmi-si.0: The BMC does not support clearing the recv irq bit, compensating, but the BMC needs to be fixed.
[    3.535042] MCE: In-kernel MCE decoding enabled.
[    3.538331] EDAC amd64: Node 0: DRAM ECC disabled.
[    3.538333] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
                Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
                (Note that use of the override may cause unknown side effects.)
[    3.623501] ipmi_si dmi-ipmi-si.0: Found new BMC (man_id: 0x002a7c, prod_id: 0x1a03, dev_id: 0x20)
[    3.633580] EDAC amd64: Node 0: DRAM ECC disabled.
[    3.633582] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
                Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
                (Note that use of the override may cause unknown side effects.)
[    3.664785] ipmi_si dmi-ipmi-si.0: IPMI kcs interface initialized
[    3.693810] EDAC amd64: Node 0: DRAM ECC disabled.
[    3.693813] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
                Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
                (Note that use of the override may cause unknown side effects.)
[    3.695951] IPMI SSIF Interface driver
[    3.773696] EDAC amd64: Node 0: DRAM ECC disabled.
[    3.773698] EDAC amd64: ECC disabled in the BIOS or no ECC capability, module will not load.
                Either enable ECC checking or force module loading by setting 'ecc_enable_override'.
                (Note that use of the override may cause unknown side effects.)
[...]

Betroffene Systeme

Wir konnten das Problem mit der folgenden Systemkonfiguration nachstellen:

  • Debian GNU/Linux 10.6 mit Linux Kernel 4.19
  • Supermicro H11SSL-i Rev. 2.0 Mainboard
  • AMD EPYC 7002 Rome CPU 7302P
  • RAM: 4x 32GB ECC Registered (RDIMM) DDR4 3200 RAM 2 Rank (ATP X4B32QB4BNWESO-7-TN1) in den Slots:
    • Belegung: C1 / D1 / G1 / H1

Das Problem trat mit anderen Mainbaords (z.B. Supermicro H12SSL-i, ASUS-basiertes System) ebenso auf.

Mit neueren Linux Kernel Versionen (z.B. Ubuntu 20.04 oder Fedora 33) trat das Problem nicht mehr auf.

Workaround für Kernel 4.19

Umstecken der 4 RAM Module in die folgenden Slots:

  • A1 / C1 / E1 / G1

Weitere Informationen

Einzelnachweise


Foto Werner Fischer.jpg

Autor: Werner Fischer

Werner Fischer arbeitet im Product Management Team von Thomas-Krenn. Er evaluiert dabei neueste Technologien und teilt sein Wissen in Fachartikeln, bei Konferenzen und im Thomas-Krenn Wiki. Bereits 2005 - ein Jahr nach seinem Abschluss des Studiums zu Computer- und Mediensicherheit an der FH Hagenberg - heuerte er beim bayerischen Server-Hersteller an. Als Öffi-Fan nutzt er gerne Bus & Bahn und genießt seinen morgendlichen Spaziergang ins Büro.


Das könnte Sie auch interessieren

BIOS-Version unter Linux mittels dmidecode auslesen
CPU Cache Topologie mit likwid anzeigen
Fehlerhafte Helligkeitssteuerung unter Linux beim Thinkpad T410 beheben