3ware Fehlermeldungen
Aus Wiki Thomas-Krenn.AG
In diesem Artikel werden verschiedene Fehlermeldungen und Warnhinweise von 3ware S-ATA Controllern erklärt. Die Fehlermeldungen sind bei unixartigen Betriebssystemen meist unter /var/log/messages zu finden.
kernel: 3w-9xxx: scsi0: AEN: ERROR (0x04:0x0002): Degraded unit detected:unit=0, port=1
Ein Disk Array ist nicht mehr länger Fehlertolerant
kernel: 3w-xxx: scsi0: AEN: INFO: Verify started: Unit #0
Ein Verify über die Unit 0 wurde gestartet. Diese Meldung wird unter anderem beim Aufruf von "tw_cli start verify" erzeugt und kann ignoriert werden.
kernel: 3w-xxxx: scsi0: AEN: INFO: Verify started: Unit #0
Ein Verify über die Unit 0 wurde erfolgreich beendet. Diese Meldung wird unter anderem beim Aufruf von "tw_cli start verify" erzeugt und kann ignoriert werden
kernel: 3w-9xxx: scsi1: ERROR: (0x03:x010D): Invalid field in CDB
Laut Knowledgebase von 3ware handelt es sich hierbei um keinen Fehler. Es wurde versucht eine Status Seite aufzurufen, die nicht existiert. Dies deutet weder auf einen defekten Controller noch auf defekte Festplatten hin. Die Meldung kann ignoriert werden.
kernel: 3w-xxxx: scsi3: Command failed: status = 0xc4, flags = 0x43, unit #8
Dieser Fehler wird durch ein einen Befehl verursacht, wie z.b. Auslesen der SMART Werte. Wenn an Port 8 keine Festplatte angeschlossen ist, kann diese Fehlermeldung ignoriert werden.
9xxx: scsi0: AEN: WARNING (0x04:0x0023): Sector repair completed:port=5
Ein fehlerhafter Sektor auf der Festplatte an Port 5 wurde korrigiert. Dies ist lediglich ein Hinweis
kernel: 3w-xxxx: scsi0: AEN: WARNING: Sector repair occured: port #1
Ein fehlerhafter Sektor auf der Festplatte an Port 1 wurde erkannt. Da eine Festplatte mehrere Fehlerkorrektursektoren besitzt, ist diese Meldung nicht weiter tragisch, solang sie nicht öfter auftritt
9xxxx: scsi1: AEN: WARNING (0x04:0x004B): Battery temperature is high
Der Controller hat festgestellt, dass die Temperatur der Battery Backup Unit zu hoch ist und Probleme verursachen könnte.
3w-xxxx: scsi2: AEN: WARNING: Unclean shutdown detected: Unit #6
Dies ist kein Fehler an sich. Der Server wurde nicht sauber heruntergefahren (z.B. durch einen Stromausfall). Sollten Sie diese Fehlermeldung entdecken, empfiehlt es sich trotzdem einen Dateisystem Check zu machen. Es besteht die Möglichkeit das die Daten im Cache des Controllers nicht sauber auf die Festplatten geschrieben wurden.
kernel: 3w-9xxx: scsi0: AEN: INFO (0x04:0x0053): <NULL>:
Diese Meldung ist nicht richtig dokumentiert, deutet aber lediglich auf ein Speichergrößen Problem auf dem Server hin. Diese Meldung kann ignoriert werden.
Spare capacity too small for some units: spare unit=3, RAID unit=2
Die Hotspare Platte des Systems hat zu wenig Speicherplatz um in ein RAID übernommen zu werden.
3w-9xxx: scsi0: AEN: ERROR (0x04:0x0057): Battery charging fault:.
Die Battery Backup Unit des Controllers konnte nicht geladen werden. In diesem Fall kann die BBU mit Tools von 3ware überprüft werden. Sollte sich herausstellen, dass die BBU defekt ist, muss diese getauscht werden.
kernel: 3w-9xxx: scsi1: AEN: WARNING (0x04:0x0039): Buffer ECC error corrected:adress=0x3449700
Die Fehlermeldung deutet auf einen defekten Controller hin. Dieser sollte getauscht werden.
kernel: 3w-9xxx: scsi0: AEN: ERROR (0x04:0x0024): Buffer integrity test failed:error=0x3013
Tauschen Sie den Controller aus.
kernel: 3w-xxxx: scsi1: AEN: ERROR: Drive ECC error detected: Port #0.
Tauschen Sie die Festplatte an Port 0 aus.
kernel: 3w-9xxx: scsi1: AEN: ERROR (0x04:0x005F): Cache synchronization failed; some data lost:unit=1.
Das Dateisystem sollte auf Fehler überprüft und der Controller getauscht werden.
kernel: 3w-9xxx: scsi2: ERROR: (0x03:0x0101): Invalid command opcode:opcode=0x4D
Diese Fehlermeldung taucht auf wenn SMART Werte anstatt von einem physikalischen, von einem logischen Laufwerk angefordert werden.
Überprüfen Sie die Einstellungen in /etc/smartd.conf
