smartd是否真的报告此驱动器太热了?


9

“ SMART用法属性:194 Temperature_Celsius从146更改为150”。这是在CentOS 6.6上。

这到底是什么意思?驱动器真的很热吗,或者这可能是软件错误?该驱动器是eSATA 2TB驱动器,摸起来感觉很酷,位于地下室的服务器为70F。

# smartctl -A /dev/sdb
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-504.16.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   134   134   054    Pre-fail  Offline      -       89
  3 Spin_Up_Time            0x0007   123   123   024    Pre-fail  Always       -       507 (Average 505)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       89
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   135   135   020    Pre-fail  Offline      -       26
  9 Power_On_Hours          0x0012   096   096   000    Old_age   Always       -       29541
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       71
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       205
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       205
**194 Temperature_Celsius     0x0002   150   150   000    Old_age   Always       -       40 (Min/Max 20/49)**
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       9

Answers:


13

那只是SMART属性值。不是以任何常规单位表示的温度。(它更像是介于255(实际上非​​常冷)和0(确实非常热)之间的数字,具体取决于驱动器上是什么,什么不是)

如果要查看驱动器的使用温度 smartctl -A /dev/sdx

您将获得如下表:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   107   097   000    Old_age   Always       -       45

RAW_VALUE 是您想要的...(我的驱动器在45°C时非常温暖)

VALUE是属性值,当它低于时THRESH,驱动器已准备好要求更换。(并非所有属性都有阈值,就像我的体温一样)

至于什么是热的,什么不是热的,这实际上取决于驱动器。有一个有些过时文件从谷歌上的驱动器故障率,其中规定,40℃左右的驱动器有故障率最低(至少在谷歌,2007年)。我记得读过另一篇论文(现在找不到),该论文指出,高温对硬盘驱动器来说不是问题。急剧而频繁的温度变化会导致磁盘过早失效。因此,只要驱动器温度非常稳定(您可以使用munin进行监视),就可以了。

smartd正在报告属性的任何更改。这并不意味着有什么问题。


1
谢谢。请参见上面,我使用smartctl输出对此进行了更新。RAW_VALUE是40。即40摄氏度,即104F。那算热吗?还是变热并正在记录它,因为这可能是一个危险的趋势?但是Min / Max是20/49,所以至少
听起来

1
@ Edward_178118更新了答案,希望对您有所帮助。
福克斯

那么阈值150与150C无关吗?
Edward_178118 2015年

究竟。150太热了。对于过热的CPU来说,即使温度太高,也无法保持在80以下。
福克斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.