我在3ware 9650SE-16ML卡上有一个可悲的RAID阵列。我无法确定的是我是否刚刚经历了双磁盘故障(糟糕!),或者我读错了。的相对输出/c0 show all
是:
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 DEGRADED u0 931.51 GB 1953525168 5QJ07MAH
p1 ECC-ERROR u0 931.51 GB 1953525168 5QJ0DCW9
p2 OK u0 931.51 GB 1953525168 5QJ0DW9C
p3 OK u0 931.51 GB 1953525168 5QJ0CKXJ
失败是(来自show alarms
):
Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 [Sun Nov 20 07:47:23 2011] INFO Rebuild started: unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Drive ECC error reported: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Source drive error occurred: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Rebuild failed: unit=0
c0 [Sun Nov 20 08:20:12 2011] INFO Rebuild paused: unit=0
我认为发生的情况是p0失败,然后p1出现ECC错误(也就是我的数据不见了)。但是...也许不是吗?重建率保持在97%,但无法克服此错误。
据我所知,以前的管理员关闭了定期验证,这使我们进入了这种状态。大多数人都不用担心3Ware RAID这件事!
更新资料
经过几天的殴打之后,我做了IgnoreECC位,并对其进行了重建,但是我的数据已被清除。mm