Ausfall HDD

Heute ist mir eine Festplatte des Webservers ausgefallen. Gut dass dieser ein RAID 1 besitzt.

Als ich heute morgen den Blog checken wollte, war der Server nicht erreichbar. Nach einem Reboot hakte er und stürzte andauernd ab. Ich checkte die Logs. Nichts zu sehen. Nach dem 3. Reboot war in den Logs dann endlich was drin:

Jan 26 08:44:39 delta419 kernel: Additional sense: Unrecovered read error – auto reallocate failed
Jan 26 08:44:39 delta419 kernel: end_request: I/O error, dev sda, sector 17552140
Jan 26 08:44:39 delta419 kernel: ata1: status=0x51 { DriveReady SeekComplete Error }
Jan 26 08:44:39 delta419 kernel: ata1: error=0x40 { UncorrectableError }
Jan 26 08:44:39 delta419 kernel: ata1: status=0x51 { DriveReady SeekComplete Error }
Jan 26 08:44:39 delta419 kernel: ata1: error=0x40 { UncorrectableError }
Jan 26 08:44:39 delta419 kernel: ata1: status=0x51 { DriveReady SeekComplete Error }
Jan 26 08:44:39 delta419 kernel: ata1: error=0x40 { UncorrectableError }
Jan 26 08:44:39 delta419 kernel: ata1: status=0x51 { DriveReady SeekComplete Error }
Jan 26 08:44:39 delta419 kernel: ata1: error=0x40 { UncorrectableError }
Jan 26 08:44:39 delta419 kernel: ata1: status=0x51 { DriveReady SeekComplete Error }
Jan 26 08:44:39 delta419 kernel: ata1: error=0x40 { UncorrectableError }
Jan 26 08:44:39 delta419 kernel: sd 0:0:0:0: SCSI error: return code = 0x8000002
Jan 26 08:44:39 delta419 kernel: sda: Current: sense key: Medium Error
Jan 26 08:44:39 delta419 kernel: Additional sense: Unrecovered read error – auto reallocate failed
Jan 26 08:44:39 delta419 kernel: end_request: I/O error, dev sda, sector 17552148
Jan 26 08:44:39 delta419 kernel: md: syncing RAID array md0
Jan 26 08:44:39 delta419 kernel: md: minimum _guaranteed_ reconstruction speed: 1000 KB/sec/disc.
Jan 26 08:44:39 delta419 kernel: md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for reconstruction.
Jan 26 08:44:39 delta419 kernel: md: using 128k window, over a total of 104320 blocks.
Jan 26 08:44:39 delta419 kernel: RAID1 conf printout:
Jan 26 08:44:39 delta419 kernel: — wd:1 rd:2
Jan 26 08:44:39 delta419 kernel: disk 0, wo:0, o:1, dev:sdb3
Jan 26 08:44:39 delta419 kernel: disk 1, wo:1, o:0, dev:sda3
Jan 26 08:44:39 delta419 kernel: RAID1 conf printout:
Jan 26 08:44:39 delta419 kernel: — wd:1 rd:2
Jan 26 08:44:39 delta419 kernel: disk 0, wo:0, o:1, dev:sdb3
Jan 26 08:44:39 delta419 kernel: md: delaying resync of md1 until md0 has finished resync (they share one or more physical units)
Jan 26 08:44:42 delta419 kernel: md: md0: sync done.
Jan 26 08:44:42 delta419 kernel: md: syncing RAID array md1
Jan 26 08:44:42 delta419 kernel: md: minimum _guaranteed_ reconstruction speed: 1000 KB/sec/disc.
Jan 26 08:44:42 delta419 kernel: md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for reconstruction.
Jan 26 08:44:42 delta419 kernel: md: using 128k window, over a total of 77031552 blocks.
Jan 26 08:44:42 delta419 kernel: md: md1: sync done.
Jan 26 08:44:42 delta419 kernel: RAID1 conf printout:
Jan 26 08:44:42 delta419 kernel: — wd:2 rd:2
Jan 26 08:44:42 delta419 kernel: disk 0, wo:0, o:1, dev:sdb1
Jan 26 08:44:42 delta419 kernel: disk 1, wo:0, o:1, dev:sda1
Jan 26 08:44:42 delta419 kernel: RAID1 conf printout:
Jan 26 08:44:42 delta419 kernel: — wd:1 rd:2
Jan 26 08:44:42 delta419 kernel: disk 0, wo:0, o:1, dev:sdb3

Und weg war die Festplatte. Der Support benötigte für die Erfassung des Problems ca 4 Stunden. Nach einer weiteren Stunde war die Festplatte getauscht, das RAID rebuildet und der Server lief wieder.

Filed under: EDV

No comment yet, add your voice below!


Add a Comment

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Comment *
Name *
Email *
Website