我在两磁盘软件RAID-1中有一个磁盘,对于该磁盘,最近在SMART状态中出现了“脱机的不可校正扇区”。
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
如果它越来越频繁地出现,这显然仅是磁盘即将发生故障的迹象(并且由于已镜像驱动器,因此也没有很大的实际数据丢失风险)。当时,自检在某些时候也失败了,并且smartd
给了我一封电子邮件以通知我,这当然是应该的。
但是,写入损坏的扇区通常会导致磁盘使用其备用扇区之一,而这显然是这样做的,因为自从我dd
遍历磁盘后,所有自检都可以正常进行。并且badblocks
也没有发现抱怨的理由。
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
[...]
# 5 Extended offline Completed without error 00% 5559 -
# 6 Short offline Completed without error 00% 5540 -
# 7 Short offline Completed: read failure 90% 5524 63273368
故障扇区的数量并没有减少,但实际上不应该减少,因为损坏的扇区仍然存在,即使没有使用。但是,smartd
继续每天晚上向我发送电子邮件:
The following warning/error was logged by the smartd daemon:
Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
这显然很烦人,使我对smartd
邮件的健康恐慌反应麻木了。
该磁盘为Western Digital WD20EARS,smartd
版本为5.41 2011-06-09 r3365。
-U 198+
应该这样做。好发现!