如何使某一个特定的脱机不可纠正扇区关闭?


18

我在两磁盘软件RAID-1中有一个磁盘,对于该磁盘,最近在SMART状态中出现了“脱机的不可校正扇区”。

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

如果它越来越频繁地出现,这显然仅是磁盘即将发生故障的迹象(并且由于已镜像驱动器,因此也没有很大的实际数据丢失风险)。当时,自检在某些时候也失败了,并且smartd给了我一封电子邮件以通知我,这当然是应该的。

但是,写入损坏的扇区通常会导致磁盘使用其备用扇区之一,而这显然是这样做的,因为自从我dd遍历磁盘后,所有自检都可以正常进行。并且badblocks也没有发现抱怨的理由。

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

故障扇区的数量并没有减少,但实际上不应该减少,因为损坏的扇区仍然存在,即使没有使用。但是,smartd继续每天晚上向我发送电子邮件:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

这显然很烦人,使我对smartd邮件的健康恐慌反应麻木了。

该磁盘为Western Digital WD20EARS,smartd版本为5.41 2011-06-09 r3365。

Answers:


23

在某些磁盘上,您可能必须求助于-U 198+(或-U +?)配置文件中。

请注意 如果您不是原始询问者,请仔细阅读整个问题。如果在不需要它的磁盘上使用它,它将取消完全有效的警告。

如果指定为“ +”,则仅在自上次检查循环以来增加的部门数时才打印报告。重新分配坏扇区后,某些磁盘不会重置此属性。另请参见下文“ -v 198,增加”。

smartd.conf(5)

例如,假设您使用中的默认配置smartd.conf。在这种情况下,文件中有很多注释,但是唯一的非注释行在这里:

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

将选项添加到该行的末尾:

DEVICESCAN -U 198+

1
-U 198+应该这样做。好发现!
迈克尔·汉普顿

为此有什么建议吗?
6:03

1
@JIV编辑。我还添加了警告。请妥善保管您的数据:-)。
sourcejedi

0

这些邮件来自两种可能性。smartd能够自行发送邮件,但是很可能没有以这种方式配置,因此我认为这些邮件是通过logcheck发送的。如果这个假设是错误的,那么您无需再阅读任何内容。

如果logcheck认为您应该担心系统上/系统上发生的任何事情,它会扫描日志文件并发送邮件。

您可以选择编写logcheck ignore规则,该规则告诉logcheck不发送与特定模式匹配的消息。

您可以(在基于Debian的系统下)创建一个名为“ /etc/logcheck/ignore.d.server/smartd_own”的文件,其内容如下:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

这样可以过滤掉烦人的邮件,但是如果无法纠正的扇区计数器增加,请再次写信给您。


smartd不幸的是,直接发送消息。显然,改变它总是一个选择。如果没有其他方法,我会考虑的,谢谢!
基督教徒

哦,该死,无论如何,您现在都有一个解决方法。
hennr 2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.