更换硬盘驱动器


19

我想知道在使用了若干年之后,要在(相当)系统关键型数据库服务器中更换硬盘驱动器,直到它死掉,是否是个好主意。

例如,我考虑使用3年后更换硬盘驱动器。由于我的服务器上有许多硬盘驱动器,因此我可能会错开更换哪些硬盘驱动器。

这是一个好主意,还是人们只是在等待失败?

Answers:


33

Google对磁盘驱动器进行了研究,发现磁盘寿命与故障之间的关联很小。SMART测试也不会显示失败。

我的本地观测值(> 500台服务器)是相似的。我的新磁盘很快就失效了,而旧磁盘仍在运转。

我的一般规则是,如果我们看到磁盘问题(SMART或系统错误),我们将立即更换它。如果不是,则服务器运行时驱动器将被循环淘汰。

Google研究 http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en/us/archive/disk_failures.pdf


这通常是我在想的,但是想看看其他人在做什么。谢谢
Garfonzo 2011年

2
我同意。与使用10年历史的运行3.5英寸9GB SCSI驱动器的服务器相比,较新的2.5英寸SAS驱动器的故障率要高得多!
James O'Gorman

@ JamesO'Gorman制造过程发生了变化...让我想知道对新驱动器做了什么,作为某些工程“权衡”的一部分。
艾利·佩恩

1
Microsoft Technet上还有一篇关于容错的文章,简要介绍了硬盘驱动器/机械组件的故障(technet.microsoft.com/en-us/library/bb742464.aspx)-他们谈论了机械的“浴缸曲线”组件故障往往随之而来。
voretaq7 2011年

@AveryPayne再新的驱动器,需要注意的是2.5"驱动器具有MUCH更严格的公差-作为曾经被认为是一个结果。‘接受驱动’机械废油3.5"上可导致2.5"驱动器上的灾难性故障也请参阅TechNet文章我联系了浴缸曲线-机械组件通常会承受较高的婴儿死亡率,然后相对稳定,直到它们最终死于“高龄”。2.5英寸硬盘仍处于“婴儿死亡率”领域-根据我的经验至少运作一年。
voretaq7 2011年

13

没有。

更换活动生产服务器上的硬盘驱动器的最大问题之一是,这样做将触发重建。尤其是在使用RAID5的情况下,尤其是在使用大型驱动器的情况下,强制进行重建会带来无法恢复故障的极大风险。在重建过程中丢失阵列的风险远远大于将已使用3年的驱动器保留在原位的风险。

举一个极端的例子,如果您连续替换由2TB磁盘组成的6磁盘RAID5阵列中的每个磁盘,则在一次重建期间发生不可恢复的读取错误的理论风险大约为58%(根据我的餐巾纸数学;请自己动手比较笔记)。换句话说:您的“预防性”磁盘替换实际上是破坏活动。

我唯一考虑在旧服务器中刷新驱动器的时间是在“翻新”它的过程中,例如,从一项任务中退役之后,然后以新角色将其重新投入使用。即使到那时,容量和性能的要求也要比驱动器的寿命更为重要。


1
+1触发重建
gregmac

您能否解释一下为什么风险为58%?如果定期巡查磁盘,为什么还要增加恢复压力呢?
Mircea Vutcovici 2011年

@MirceaVutcovici,因为在RAID-5安排下,所有驱动器在重建过程中将始终处于活动状态,而偶尔在此处或那里进行随机搜索。换句话说,所有驱动器上的“负载”都在增加,这样一来,触发第二个故障驱动器的风险也会增加。
艾利·佩恩

@Avery Payne我知道您在重建期间会对磁盘施加更多压力。我试图理解为什么重建不仅仅对一致性检查造成压力。
Mircea Vutcovici 2011年

@MirceaVutcovici确切的数字(以及如何进行数学运算)值得商,,但最重要的是,您必须读取10 TB的数据六次,而无需使用奇偶校验磁盘来纠正任何读取错误,才能执行此操作。六次重建。读取60 TB数据而没有任何错误的可能性对您不利。
天鹰

3

我还没看 我们将服务器置于保修期内,直到将其停产为止-5年。标准RAID 5可以使您避免磁盘故障,因此我们只需保留几个驱动器,以便我们可以立即在关键服务器上进行重建,包括热备件或使用RAID10。

如果您注意到多个驱动器出现故障最近在服务器中,您可能有背板问题。附近的建筑也可能是新的振动或灰尘。


这并非完全正确。如果大量磁盘来自同一批次,则在增加重建压力时,同时发生故障的风险会更高。如另一个答案所述,RAID5的大小增加在重建期间会增加URE的概率,这会使您的阵列低于raid5有效性阈值。
麦哲伦2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.