SATA硬重置链接


1

这是我的dmesg输出:

ata2.00: exception Emask 0x0 SAct 0x2 SErr 0x0 action 0x6 frozen
ata2.00: cmd 60/48:08:6f:13:3a/00:00:01:00:00/40 tag 1 ncq 36864 in
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata2.00: status: { DRDY }
ata2: hard resetting link
ata2: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
ata2.00: configured for UDMA/133
ata2: EH complete
SCSI device sdb: 490350672 512-byte hdwr sectors (251060 MB)
sdb: Write Protect is off
sdb: Mode Sense: 00 3a 00 00
SCSI device sdb: drive cache: write back

这是什么意思?谁能确切地说出此错误代码的问题是什么?...(暂停) - ?还是只是另一个错误..还是此输出中的主要错误?

这是智能输出:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   196   196   051    Pre-fail  Always       -       72539
  3 Spin_Up_Time            0x0027   200   200   021    Pre-fail  Always       -       991
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       16
  5 Reallocated_Sector_Ct   0x0033   199   199   140    Pre-fail  Always       -       1
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   094   094   000    Old_age   Always       -       5010
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       15
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       8
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       7
194 Temperature_Celsius     0x0022   118   100   000    Old_age   Always       -       25
196 Reallocated_Event_Count 0x0032   199   199   000    Old_age   Always       -       1
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

我只能看到一个问题-Reallocated_Event_Count。它是1。dmesg中也只有一个错误。是否可能连接了Reallocated_Event_Count和dmesg中的错误?该磁盘仅使用了5000个小时。在出现相同问题之前……它是Western Digital RE2 250Gb磁盘。


我也有这个问题。发生这种情况时,系统将挂起几秒钟。我有两个硬盘驱动器,分别是WD Caviar Black和Caviar Green,它们是全新的,并且根据SMART的说法,它们的状态良好。当我收到硬性重置链接消息时,Linux仅重置一个链接,有些是黑色,有时是绿色。我拥有ASUS M4N78 PRO主板。根据华硕的说法,它与Linux兼容,但是我认为问题出在主板或芯片组驱动程序上。也许只有在使用突袭时才会发生。这个问题完全是随机的,我无法以任何方式触发它。
VargaD 2011年

Answers:


1

否,Reallocated_Event_Count不应导致dmesg中的错误。dmesg中的错误表示驱动器和主机芯片组之间的通信已锁定,需要重置驱动器。如果这仅发生一次,我认为这并不重要。如果定期发生,我会开始怀疑是要升级驱动器中的固件,还是要查看使用中的SATA电缆是否正确连接。


我已经将此服务器投入生产已有4年了。从那时起,我已经更换了5-6个磁盘。上次出现电缆问题是我想的那样-只有更换电缆后,我才能格式化新驱动器。最初2年安装了Seagate AS serie(AS-是台式机),然后2年没有问题。出现错误之后(我实际上不记得确切的错误,但是99%的错误)我进行了更改并购买了WD RE系列
。RE-

0

当我遇到像您这样的错误时,通常可以通过更换驱动器来解决(即使smart不会报告错误-并非总是100%准确,并且我更希望自己安全)。但是,由于这是一个经常性的问题,因此您应该考虑是电缆(已经更改,因此可能没有更改)还是控制器(尝试添加PCI / PCIe控制器,看是否有帮助?)的可能性。如果由于有缺陷的芯片组支持而丢失中断,也许升级OS内核也会有所帮助。


1
用bonnie ++加载了系统,并收到了很多错误,例如冻结和超时。更换电缆-冻结和超时的结果相同。已将“坏”硬盘连接到其他服务器没有错误..尽管在启动过程中出现了一些挂起。已使用bonnie ++加载系统-没有错误。重新连接回原始服务器错误。已将电源连接器切换至其他PSU线-且无错误!:)所以..问题可能是由于电源连接器/接触不良造成的吗?如果不是真正的磁盘问题,但更像电缆/连接,SMART中是否会记录错误?
user52475 2010年

很高兴您最终能正常使用。我真的不知道smart是否可以报告这些类型的问题(暗流或链接问题),我的猜测可能不是(而且驱动器之间也可能有所不同)。
totaam 2010年

最后两天试图再次得到错误-没有运气:) ..没有错误...我很困惑..今天将磁盘卖给卖方并进行更改。
user52475 2010年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.