如何检查硬盘的运行状况


122

我的SATA驱动器开始单击,无法访问数据。但是它并没有发出很大的响声,就像已经坏掉的驱动器一样。拧紧与硬盘驱动器的连接后,它停止了单击,我能够再次访问数据。我已经开始将文件从驱动器中移出,但是我认为该驱动器可能仍然状况良好。我没有发现任何数据损坏,也没有访问任何文件的麻烦。我以前从未遇到过SATA驱动器出现故障的情况,因此我认为这可能是导致问题的松散连接。我可以在此驱动器上进行哪些测试以了解其健康状况?

这是有问题的硬盘: HITACHI Deskstar T7K250 HDT722525DLA380(0A31636)250GB 7200 RPM 8MB缓存SATA 3.0Gb / s 3.5英寸硬盘-裸驱动器


1
哦,当我回答时,您没有提到这是一个死亡之星。至少有一些Deskstar系列产品因使用寿命和可靠性而享有很高的声誉。足以使发生故障的驱动器称为“死亡之星”。
Slartibartfast

Answers:


119
sudo smartctl -a /dev/sda | less

这将为您提供有关硬盘驱动器健康状况的大量信息。该工具还允许您启动和监视驱动器的自检。

如果您要进行基准测试/检查所有扇区以查找不良扇区,则可以找到用于此目的的其他工具,但是smartctl是了解驱动器运行状况的第一位。


6
Palimpsest(又名gnome-disk-utility)是一个提供相同信息的光滑GUI应用程序。
Marius Gedminas

2
palimpsest因经常提供误报而臭名昭著。
vtest 2010年

7
需要@vtest引文
mgalgs 2014年

56
对于任何发现他们没有的人smartctl:它可能在您的软件包管理器中,为“ smartmontools”。
Praxeolitic

2
sudo apt-get install smartmontools在Ubuntu 14上
mrgloom

61

badblocks是另一种有用的工具;它显示驱动器上坏块的数量和位置:

sudo badblocks -v /dev/sda

2
与可能发生硬件故障的硬盘驱动器的链接是什么?
tuk0z

4
@lliseil问题是如何检查硬盘的运行状况
Emmanuel

pacman -S e2fsprogs在拱门上
–oddRaven

@Emmanuel会检查硬盘的运行状况... SMART仅被动报告,坏块检查所有扇区,然后坏扇区将显示在智能磁盘上。非常适合检测可能会过早失效的新硬盘。
雷·福斯

2
@Emmanuel是的...但是要增加磨损。例如,Seagate Surveillance驱动器的额定容量约为180TB /年。在10TB的硬盘上进行坏块传输将传输80TB的数据。在开始使用它之前确实有道理。如果某个块特别坏,那么很有可能在只读模式下运行坏块会使该坏块跳闸,并且会在智能设备上得到报告。此外,在WD Red 8TB上运行坏块大约需要96个小时。烦人,特别是如果您断电并且不确定从哪里离开。
雷·福斯

14

如果高清开始给您有关即将发生的故障的物理提示,则没有软件会帮助您。是的,SMART存在,诸如smartctl之类的东西可以为您读取其结果,但是您不应该赌它。SMART可用于检测高温或坏扇区之类的东西,但是,如果您的HD在第一次尝试期间开始点击或没有启动,则是时候

  • 确保您有备份
  • 赶往最近的电脑经销商,购买新的HD并复制其中的所有内容

当HD决定失败时,它将在没有事先警告的情况下做到这一点,墨菲定律说失败将在最不需要的时刻发生。因此,请做好准备并立即备份和更换磁盘,而不要等待灾难。


如果HDD及其主机正确支持SMART,为什么不敢下注呢?@Janne Pikkarainen
tuk0z 2015年

2
墨菲定律只说,只要有足够的时间,任何可能发生的事情都会发生。并不是说它会在最不需要的时候发生。但是,我想您要说的是,人们直到失败真正发生时才意识到失败有多严重。
Yeti,2016年

1
@Yeti:实际上,这是“任何可能出错的地方,都会出错的地方”。其中包括在备份之前发生故障的硬盘驱动器。
naught101 '16

6
这并没有回答OP的问题。这不仅仅是讲课,还是演讲
以太

Murphy's law says that the failure will happen during the most unwanted moment,如果确实是该非答案将是该问题的唯一答案。
Ejaz

9

我看到没有人提到gsmartcontrol哪个是GUI。

在Ubuntu中,您可以使用 $ sudo apt-get install gsmartcontrol

如果启动,sudo gsmartcontrol则会看到计算机中的所有硬盘驱动器。

然后,如果您在设备上单击鼠标右键,然后单击View Details您会看到类似的内容。

您可以在此处的不同选项卡中获得很多详细信息。您也可以在Perform Tests标签中执行测试。

GSmartControl


6

尝试使用SpinRite(它不是免费的),但是我使用了很多工具。大多数工具造成的损害大于帮助,当我说损害时,我的意思是“ 没有妥善保管您的信息 ”。该工具将在将信息移至安全扇区的同时检查驱动器并修复坏扇区。这也是防止硬盘灾难的方法

我强烈建议您冒险购买具有良好背景的经过全面测试的产品,而不要丢失您如此宝贵的信息。


+1对于SpinRite。它是如此之快,轻巧,它已经用重要数据保存了许多硬盘。我建议您放手一搏。
Jose Elera

4

测试环境:Permanent Live Ubuntu 16.04基于线程的USB 如何制作16.04 Persistent Live Ubuntu? 在计算机上连接硬盘。启动到实时Ubuntu。该GUI程序gnome-disks还显示了坏扇区,您可以在其中对光盘及其不同扇区进行基准测试。它类似于smartmontoolsfor 的工具sudo smartctl -a ...。对我的500 GB光盘进行基准测试的示例输出,您可以看到在重负载下读取/写入速度随时间退化

在此处输入图片说明

其他视图:SMART Data&Self-Tests,我在这里进行简短的自检。您可以找到驱动器的温度以及驱动器已开启多少年/月/日。

在此处输入图片说明


是否知道为什么sudo gnome-disks对于具有SMART的磁盘禁用了“ Smart Data and Self-Tests ...”菜单(如所示gsmartcontrol)?
Dan Dascalescu

3

除了已经提到的SMART状态外,重要的是要提到现代硬盘驱动器往往不会正常故障。通常,从一天到第二天,您只会听到喀哒声,或者根本无法访问磁盘。因此,尽管您的问题也可能是由电缆松动引起的,但始终应通过在其他磁盘上进行常规备份来进行准备。


1

HDDScan是用于扫描HDD的非常方便/有用的实用程序。它将最有可能显示任何错误。但是,您还应该尝试使用特定于供应商的工具。(如果您告诉我您的硬盘制造商(和型号),我可以在这里链接它们。)


2
发表在上面。HDDScan看起来像是一个很好的工具,但是Linux是否有类似的东西?
tony_sid 2010年

嗯..您没有添加Linux标签,也没有添加哪种体系结构,基于哪种包等。您可以使用“ e2fsck”扫描硬盘。尝试在控制台中输入“ man fsck” /“ man e2fsck”或“ e2fsck --help”,您将了解如何使用它。
Apache

3
e2fsck代表文件系统检查。
tuk0z


1

我的输出smartctl很难阅读。gnome-disks引入了GNOME,如今,如果没有NetworkManager,GNOME将无法生存。

我找到了我能理解的skdump(的一部分libatasmart。还会产生“漂亮”和“好”列以及总体状态:

Bad Sectors: 0 sectors
Powered On: 7.4 years
Power Cycles: 2144
Average Powered On Per Power Cycle: 1.3 days
Temperature: 33.0 C
Attribute Parsing Verification: Good
Overall Status: GOOD
ID# Name                        Value Worst Thres Pretty      Raw            Type    Updates Good Good/Past
  1 raw-read-error-rate         100    91    51   36          0x240000000000 prefail online  yes  yes 
  3 spin-up-time                 76    76    11   8.0 s       0x181f00000000 prefail online  yes  yes 
  4 start-stop-count             98    98     0   2173        0x7d0800000000 old-age online  n/a  n/a 
  5 reallocated-sector-count    100   100    10   0 sectors   0x000000000000 prefail online  yes  yes 
  7 seek-error-rate             100   100    51   0           0x000000000000 prefail online  yes  yes 
  8 seek-time-performance       100   100    15   n/a         0x072700000000 prefail offline yes  yes 
  9 power-on-hours               87    87     0   7.4 years   0xd1fd00000000 old-age online  n/a  n/a 
 10 spin-retry-count            100   100    51   0           0x000000000000 prefail online  yes  yes 
 11 calibration-retry-count     100   100     0   0           0x000000000000 old-age online  n/a  n/a 
 12 power-cycle-count            98    98     0   2144        0x600800000000 old-age online  n/a  n/a 
 13 read-soft-error-rate        100    91     0   36          0x240000000000 old-age online  n/a  n/a 
183 runtime-bad-block-total     100   100     0   0           0x000000000000 old-age online  n/a  n/a 
184 end-to-end-error            100   100     0   0           0x000000000000 prefail online  n/a  n/a 
187 reported-uncorrect          100   100     0   2540 sectors 0xec0900000000 old-age online  n/a  n/a 
188 command-timeout             100   100     0   0           0x000000000000 old-age online  n/a  n/a 
190 airflow-temperature-celsius  67    53     0   33.0 C      0x21000f210000 old-age online  n/a  n/a 
194 temperature-celsius-2        67    52     0   33.0 C      0x21000f220000 old-age online  n/a  n/a 
195 hardware-ecc-recovered      100   100     0   47099       0xfbb700000000 old-age online  n/a  n/a 
196 reallocated-event-count     100   100     0   0           0x000000000000 old-age online  n/a  n/a 
197 current-pending-sector      100   100     0   0 sectors   0x000000000000 old-age online  n/a  n/a 
198 offline-uncorrectable       100   100     0   0 sectors   0x000000000000 old-age offline n/a  n/a 
199 udma-crc-error-count        100   100     0   0           0x000000000000 old-age online  n/a  n/a 
200 multi-zone-error-rate       100   100     0   0           0x000000000000 old-age online  n/a  n/a 
201 soft-read-error-rate        100   100     0   0           0x000000000000 old-age online  n/a  n/a 

虽然它说“ GOOD”(三星HD103UJ)。在输出中,smartctl我看到有错误的日志,您可以在187(未更正的错误)下看到它们,该错误指示我确实丢失了多少数据。看到7(重新分配的扇区)0对我来说有点意外。


0

免费版本HDTune可以检查HDD运行状况。


9
我在他们的页面上看不到Linux的任何版本。
Suzana 2014年

它还在早期版本(2.55)处停止,并且不适用于需要64位访问(例如4TB)的更新和/或更大的驱动器。
Pysis

-5

您使用的是Linux,但您可以将HDD附加到运行Windows的朋友的计算机上。

您不需要任何复杂的软件即可检查HDD的运行状况。使用Windows的Crystal Disk Info检查您的HDD状况是否良好或是否有任何损坏。

它还将在每个值旁边显示一个SMART数据,并带有一个指示器,因此,如果您发现红色的指示器,则说明硬盘驱动器有问题。


33
确实意识到这里有不错的linux本地SMART软件,对吗?
Journeyman Geek

我还使用了该实用程序,即使在浏览其高级功能之后,也没有找到它可以对驱动器进行表面测试/搜索坏块/扇区。在谈论Windows的同时,为了将更多术语放在可以快速搜索的页面上,我使用了MiniTool Partition Wizard Free进行了表面测试。我不认为HDDRegenerator具有此功能,只能读取CDI之类的SMART数据。
Pysis
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.