我有一个标志着一个ZFS存储阵列“失败”两次,因为注意到英特尔X-25M驱动器在这里。但是,卸下驱动器后,它似乎可以在其他计算机(Mac,PC,USB机柜等)中进行装载,读取和写入。
有没有确定硬盘当前状态的好方法?我觉得ZFS解决方案先前的失败是错误,错误报告和硬件的融合。不过,似乎此驱动器可能具有一定的生命。
我有一个标志着一个ZFS存储阵列“失败”两次,因为注意到英特尔X-25M驱动器在这里。但是,卸下驱动器后,它似乎可以在其他计算机(Mac,PC,USB机柜等)中进行装载,读取和写入。
有没有确定硬盘当前状态的好方法?我觉得ZFS解决方案先前的失败是错误,错误报告和硬件的融合。不过,似乎此驱动器可能具有一定的生命。
Answers:
检查任何驱动器运行状况的一种很好但并非绝对可靠的方法是检查SMART属性。
以下是使用smartctl v5.41 获取的Intel X25-M G2 160GB磁盘的SMART属性集。(该版本很重要,smartctl的早期版本具有不同的属性名称映射,并且实际上没有正确理解该驱动器的特定表)。
# ./smartctl -data -A /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-2.6.18-194.32.1.el5] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 5
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
3 Spin_Up_Time 0x0020 100 100 000 Old_age Offline - 0
4 Start_Stop_Count 0x0030 100 100 000 Old_age Offline - 0
5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age Always - 1
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 4076
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 67
192 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age Always - 30
225 Host_Writes_32MiB 0x0030 200 200 000 Old_age Offline - 148418
226 Workld_Media_Wear_Indic 0x0032 100 100 000 Old_age Always - 755
227 Workld_Host_Reads_Perc 0x0032 100 100 000 Old_age Always - 49
228 Workload_Minutes 0x0032 100 100 000 Old_age Always - 16956537
232 Available_Reservd_Space 0x0033 099 099 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 098 098 000 Old_age Always - 0
184 End-to-End_Error 0x0033 100 100 099 Pre-fail Always - 0
这表明驱动器有1个重新分配的扇区,已使用了1%的可用保留空间(属性232)和2%的预计编程/擦除周期(属性233)。它已写入148418 * 32MiB(属性225)。
如果驱动器显示大量重新分配的扇区,则可能令人担忧,因为这可能表示闪存芯片出现故障(以相同的方式旋转磁盘上的大量重新分配的扇区通常都指向表面错误) )。端到端也很糟糕-我有一些X25-M G2 160GB磁盘出现故障,报告了大(> 1000)端到端错误。但是,这些磁盘实际上只有两个有用的错误条件属性,因为普通磁盘的大多数有用SMART属性不适用于SSD。
但是,SMART通常不被认为是100%可靠的。Google对磁盘故障的研究发现,尽管各种SMART预警指标与驱动器故障之间具有良好的相关性,但它并不是预测单个驱动器故障的有用工具。因此,我通常使用SMART来证明驱动器是坏的(如果显示错误,它可能很快就会失效),而不是证明驱动器仍然是好的。
HD Tune(和HD Tune Pro)是衡量SSD驱动器的运行状况和性能的出色工具。免费版(HD Tune)具有非常有限的功能集,但是运行状况分析属于其中,所以您很幸运。Pro版本具有15天的试用期,我强烈建议您尝试使用它,它将为您提供关于SSD性能的出色,深入的分析。