如何从RAID 5配置中的驱动器故障中恢复?


15

今天早晨,我们的数据库服务器上的驱动器发生故障。驱动器阵列(3个磁盘)以RAID 5配置设置。

在等待更换驱动器时,我们正在准备恢复策略。用户正在继续在系统上工作,尽管速度非常慢(不知道为什么?)。

如何安装新驱动器-该驱动器的数据将根据奇偶校验自动重建,还是应该遵循另一过程?

编辑: 这是一个硬件RAID控制器。(感谢您到目前为止的回答,不胜感激)


4
顺便说一句,决定关键服务器上的驱动器发生故障时应该采取的措施是关键服务器上的驱动器发生故障之前
David Schwartz

Answers:


15

该系统运行非常缓慢,因为它必须重建丢失的数据,这需要额外的CPU和I / O。

如果RAID-5配置中缺少磁盘,则没有恢复策略。如果另一个磁盘出现故障,您将丢失数据。奔跑,不要走到最近的供应商,您可以从该供应商那里获得兼容零件,该零件包含在当日紧急快递员的陪同下的制造商保修范围。如果您购买阵列的供应商已经在获取零件,请获取两个零件并将另一个作为备用零件存放。

如果您将RAID-5用于生产系统,则应考虑将备用磁盘留在阵列中作为热备用。

新增-如果您的日志不在单独的卷(在物理上是分开的磁盘)上,请将它们移动到单独的一组磁盘上,甚至只是一对镜像对。如果您的数据库有很大的负载,这也将是性能的胜利,因为日志卷上的争用会对性能造成不成比例的负面影响。

如果可能的话,您还可以通过执行以下操作来增强数据库的健壮性:

  1. 关闭数据库。
  2. 备份数据库。
  3. 将日志移动到物理上分开的磁盘集(请确保您重新配置数据库,以便它知道日志已移动到的位置)。
  4. 重新启动数据库和应用程序。

如果您将日志放在单独的卷上,则可以且仅当磁盘故障不会破坏日志时才可以从备份还原并前滚。数据库日志应位于单独的磁盘卷上,其原因如下(其中之一):

  • 日志使用模式主要是顺序的,将日志条目附加到文件的末尾(该文件实际上是环形缓冲区)。这意味着由于几乎没有磁盘头搜索活动,因此可以快速写出大量日志条目。

  • 如果它们共享具有大量随机访问工作负载(例如事务表和索引)的物理磁盘,则由于头搜索活动会破坏顺序写入,它们将不成比例地减慢速度。

  • 将日志放在单独的卷上几乎总是性能上的胜利,并且只需要一对镜像对的日志即可支持相当大的工作量。这意味着要做到这一点的硬件相当便宜,因此以较低的成本获得了巨大的性能和可靠性。

  • 如果您的数据阵列出现故障,日志不会丢失。如果您有适当的备份策略,则可以从备份中还原并从日志中向前滚动。这意味着整个阵列可以在服务器上关闭而不会出现单点故障。日志和数据阵列都必须同时失败以导致数据丢失。


感谢您的回答,特别说明了为什么系统运行缓慢。
菲利普·富里

发现。我什至建议关闭它,直到您安装好替换驱动器为止。就像奈杰尔(Nigel)所说,您没有恢复策略。丢失另一个驱动器,将其全部丢失。
Stu Thompson

嗨,奈杰尔,谢谢您抽出宝贵的时间分享您的专业知识。这确实是一个很好的建议。稍后,我将报告恢复的结果。
菲利普·富里

5

1)备份。

现在没有数据丢失。如果您的备份不是最新的,请立即备份。

2)阅读手册,致电供应商等。

不同的RAID系统具有不同的磁盘更换步骤,如果做错了,您就有可能破坏整个阵列。不知道您拥有哪种RAID硬件/软件,我们只能猜测所需的步骤。

而且,性能下降是因为处于降级状态(即,一个磁盘已耗尽)的RAID 5具有糟糕的读取性能。可怕程度取决于奇偶校验的存储方式和哪个磁盘消亡,但“好消息”是一个磁盘消失后性能下降是一个已知问题,不会引起恐慌。


4

首先,我将阅读您所使用的硬件/软件的手册-故障恢复部分:)

更换磁盘并重建阵列应该是一个简单的问题。

在这种情况下,最重要的一点是应尽快更换磁盘,因为如果另一个磁盘出现故障,则可能会丢失数据。另外,您应该解决失败的原因-是因为磁盘变旧了吗?您是否也应该更换其他的?还是因为电涌,热或振动?


1
可能会丢失数据?绝对肯定会丢失阵列上的所有数据!去监狱,不要通过去。(当然要排除备份。)
Stu Thompson

1

据我了解RAID5,当您更换故障驱动器时,它会根据其他两个驱动器上存储的信息自动重建。是否可以将新驱动器“热交换”到位取决于您的系统-您可能必须先关闭电源。无论哪种方式,考虑到驱动器的成本相对较低以及数据的重要性(首先要决定使用RAID5的决定),您确实应该有一个备用驱动器,放在抽屉中,以备万一。

我最近为自己搭建了一台新的开发PC,并在RAID5下设置了主数据驱动器。我订购了比必要多的驱动器,以便在紧急时刻准备好备用磁盘(我希望不会发生)

现在您问了这个问题,我想最好再读一遍。


对于较小的数据量,镜像对更好,因为它通常比小型RAID-5具有更好的顺序访问速度。如果您想进行热交换,请在诸如scsi4me.com之类的地方查看一些热交换托架系统
ConcernedOfTunbridgeWells

0

完全取决于系统。手册说什么?您的硬件是否完全支持将新驱动器从控制器热插拔到驱动器托架?您最近有备份吗?


0

NXC的帖子很好地总结了这一点。万一您在第二次故障之前不更换故障驱动器,仍然有很大的机会可以通过专门的恢复服务恢复几乎所有内容(有时是所有内容)。数据仍保留在磁盘上,并且故障磁盘通常可以在具有适当设备的专门实验室中恢复使用。但是,这项服务的价格很高。拥有备用磁盘和适当的备份(按照NXC的建议)绝对是将来的方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.