Adaptec Controller Timeout Fehler

Aus Thomas-Krenn-Wiki
Wechseln zu: Navigation, Suche

In bestimmten Konfigurationen zeigt ein Adaptec RAID Controller in Linux Log Dateien Fehlermeldungen mit Timeouts, Abort Requests und SCSI Hangs. In diesem Artikel erfahren Sie, wann das Problem auftreten kann und wie Sie es beheben können.

Betroffene Hardware

Ursache

Der Timeout des Standard SCSI Subsystems von Linux beträgt 30 Sekunden. Der Timeout des Adaptec Controllers beträgt hingegen 35 Sekunden. Dadurch wird ein Hängen des Servers von wenigen Sekunden (bis hin zu mehreren Minuten) verursacht. Auf der Console (und in den Log-Dateien) treten dabei folgenden Fehlermeldungen auf:

kern.log:Jul 24 16:54:23 kernel: aacraid: Host adapter abort request (0,0,0,0)
kern.log:Jul 24 16:54:23 kernel: aacraid: Host adapter abort request (0,0,0,0)
kern.log:Jul 24 16:54:23 kernel: aacraid: Host adapter abort request (0,0,0,0)
kern.log:Jul 24 16:54:23 kernel: aacraid: Host adapter abort request (0,0,0,0)
kern.log:Jul 24 16:54:23 kernel: aacraid: Host adapter reset request. SCSI hang ?

Alternativ könnte auch in IRQ Konflikt mit einem anderen Gerät vorliegen oder es wird der IRQ mit einem anderen Gerät geteilt. Dieses äußert sich mit folgenden Fehlermeldungen:

kern.log.1:Jul 16 13:36:07 kernel: Adaptec aacraid driver 1.1-7[28000]-ms
kern.log.1:Jul 16 13:36:07 kernel: aacraid 0000:02:00.0: PCI INT A -> GSI 32 (level, low) -> IRQ 32
kern.log.1:Jul 16 13:36:07 kernel: aacraid 0000:02:00.0: setting latency timer to 64
kern.log.1:Jul 16 13:36:07 kernel: IRQ 32/aacraid: IRQF_DISABLED is not guaranteed on shared IRQs
kern.log.1:Jul 16 13:36:07 kernel: scsi0 : aacraid

Lösung

Durch Erhöhen des Linux Timeouts für SCSI Subsysteme auf einen Wert größer als 35 Sekunden durch z. B.:

echo '45' > /sys/block/sda/device/timeout

sollte das Problem behoben sein. Das Kommando muss natürlich für jedes Device ausgeführt werden (also sda,sdb,sdc,...)

Das Problem mit dem IRQ Konflikt ist entweder durch entsprechende Einstellungen im BIOS zu lösen, durch Deaktivieren von nicht benötigten (Onboard-)Devices, oder durch Verwenden eines anderen PCI- bzw. PCIe-Slots.

Sollten diese Lösungsansätze das Problem nicht lösen, empfehlen wir als nächstes ein Firmware-Update des Controllers und/ eine Aktualisierung der verwendeten Treiber durchzuführen.

Weitere Lösungsmöglichkeit

Durch die Installation eines Treibers werden keine Timeout Meldungen mehr gelistet.

Der Treiber wurde von Adaptec unter folgendem Link zum Download bereitgestellt:

Weitere Informationen

Das könnte Sie auch interessieren

Adaptec RAID Controller
Adaptec Storage Manager arcconf libstdc++.so.5 Fehler
Adaptec Storage Manager arcconf unter Debian verwenden