如何解释HDD SMART结果?


58

我的笔记本电脑最近变得有点不可靠,由于某种原因,我开始怀疑我的硬盘驱动器开始出现故障。经过一番网上搜索之后,我在系统菜单中找到了Ubuntu的Disk Utility,并从中运行了很长时间的SMART诊断程序。

但是,由于“磁盘工具”的文档非常少(palimpsest?),所以我不确定如何解释结果:

读取错误率的价值超过5000万,但是测试很好吗?

例如,读取错误率超过5000万(!),但评估被评为“良好”。

因此,有人介意向我解释如何解释这些测试的结果(尤其是规范化,最差,阈值和值数)吗?也许告诉我他们如何看待我的硬盘驱动器结果?(谢谢)


“硬件ECC恢复”的值是否与“读取错误率”相同?我的磁盘具有676个电源循环,已通电285天,并且有193M错误。与我的磁盘相比,您的磁盘有太多错误,但是我只是在推测。无论如何,我只是担心自己
danizmax 2011年

是的-两个数字相同!
Marty

Answers:


54

您对SMART在维基百科上的工作方式有很好的描述。但是快速介绍一下:

  • 值:这是控制器报告的原始值。通常,它是一个易于理解的值(例如开机时间或温度),但有时却不是(例如读取错误率)。不同的制造商可以对此数据使用不同的结构和含义。

  • 归一化:这是归一化的上述值,因此值越高越好。因此,读/错误率为114优于113。同样,硬盘驱动器如何将原始数据转换为标准化值是特定于供应商的。

  • 最差:驱动器过去的最差归一化值(99可能是出厂设置)。

  • 阈值:当归一化低于此值时,驱动器可能会发生故障。

因此,您的硬盘似乎没问题。读取错误率的值不是驱动器发生故障的次数,而是取决于磁盘制造商的某些数据结构。


如果特定驱动器未报告标准化值,那么这是否意味着最差阈值将以术语形式报告,或者所有驱动器是否都使用标准化值并且只有某些选择将其标记为“值”?
DeveloperACE

25

是的,读取错误率的原始值通常是无意义的。您要注意的值是重新分配的扇区数,挂起的数和脱机的不可纠正的数。这些是已经,正在等待或无法纠正的坏扇区的计数,那里的原始值通常有意义,并且是扇区的计数。

如果读取扇区失败,它将变为挂起状态。下次您尝试写入该扇区时,驱动器将尝试重写该扇区,如果该扇区工作,一切将恢复正常。如果无法正确写入该扇区,则它将从备用池中重新分配该扇区。如果它不能做到这一点(也许它已经用完了备用池?),那么它将变为offline_uncorrectable并尝试读取或写入它会出错。


1
我有一个几乎只使原始读取错误率失败的驱动器。只有在驱动器运行了一段时间(可能是15分钟)后,测试才失败。在Windows下,症状是任何驱动器访问都会挂起该进程,因此我使用Ubuntu工具来确定问题所在,但是由于读取错误率不正确,所以我对驱动器的问题感到困惑。似乎并不表示驱动器即将发生任何故障-但是驱动器肯定有问题!
迈克尔

我还应该补充一点,测试结果本身是模棱两可的。总体测试表明它失败了,但是尽管读取值错误率测试值(可笑的值(100/100,最差,已归一化)是荒谬的),但仍显示“ Ok”。
2013年

9

psusi钉它。

如果您阅读seagate.com上的数据表(白皮书),您将看到HDD的制造,测试方式以及它们的实际工作方式。没有完美的硬盘,从没有,从没有(历史和事实)。在过去,我们必须从新驱动器盒中的纸质清单中将坏道输入HDD控制器,因此控制器会跳过这些坏道。

现代驱动器具有纠错功能。从第一天开始,行业表现就很糟糕。

因此他们将它们映射出来,这意味着驱动器会跳过坏扇区。实际上,它们是“逻辑上交换出去的”-坏扇区映射到一个新的,良好的备用汽缸扇区(它具有备用汽缸-将汽缸视为轨道)。这对外界是透明的-SMART util除外。

每个制造商都可以按照自己的意愿进行操作,因此即使在制造驱动器后可能会有10个坏扇区,也有一些将错误计数设置为零。

驱动器的固件中有3次规则-它读取3次扇区,如果全部3次都坏,则可能会即时进行“重新校准”,并再读取3次。如果驱动器仍然无法正常运行,它将将该扇区映射到备用扇区之一。这在固件中很深,但在后台连续发生,对用户完全透明。

制造商是否选择在出现3次不良读数时或在校准达到标准后报告原始错误。因此,就像他在上面说的那样,除非您有许多相同类型的驱动器并且看到一些奇怪的趋势,否则这并不重要。

要点2:所有HDD都有自然的读取错误,如果需要,您也可以在Seagate上了解到。但是它们都在运行中出错。并且会再次读取,并且通常会通过CRC错误测试。如果不是,则DRIVE尝试将其换出。如果以凉爽的方式运行磁盘,它将持续很长时间,并且许多磁盘永远都不会用完备用磁盘。但是一定要按照psusi告诉您的那样看!

我在旧PC上键入此代码,运行的是第一个制造的1GB HDD。而且还是不错的。(我备份了)(从来没有缺乏冷却...)热量是第一大杀手,是电涌的原因,我经营一台UPS。欢呼,美好的一天。我希望这有帮助。(曾经见过DatA通用硬盘崩溃吗?并用大量的铝绒,卷曲的线索填充房间吗?那时候很多乐趣……从不乏味。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.