Sobrique解释了手动干预如何使您提出的解决方案达到最佳状态,而ewwhite谈到了各种组件的故障概率。这两个海事组织都提出了很好的观点,应予以认真考虑。
但是,到目前为止,似乎还没有人评论过一个问题,这让我有些惊讶。您建议:
将[当前的热备用主机]用作冷备用,取出硬盘驱动器并将其放入主主机,然后将RAID从1更改为1 + 1。
这不能保护您免受操作系统在磁盘上所做的任何事情。
它仅能真正保护您免受磁盘故障的侵害,通过从镜像(RAID 1)移到镜像(RAID 1 + 1)的镜像,您可以极大地减少开始时的影响。通过增加每个镜像集中的磁盘数量(例如,从2磁盘RAID 1到4磁盘RAID 1),以及在正常操作过程中很有可能提高读取性能,您可以获得相同的结果。
那么,让我们看看这可能会失败的一些方法。
- 假设您正在安装系统更新,并且某些原因导致该过程中途失败;也许是电源和UPS故障,或者您可能是一次怪胎事故并遇到了严重的内核错误(如今,Linux相当可靠,但仍有风险)。
- 也许更新引入了一个您在测试过程中没有发现的问题(您正在测试系统更新,对吗?),需要在修复主系统时将故障转移到辅助系统
- 文件系统代码中的错误可能导致对磁盘的虚假无效写入。
- 也许一个胖乎乎的(甚至是恶意的)管理员执行了
rm -rf ../*
或rm -rf /*
代替了rm -rf ./*
。
- 也许您自己的软件中的错误会导致其严重破坏数据库内容。
- 也许病毒设法潜入。
也许,也许,也许...(而且我敢肯定,您提出的方法还有很多方法可能会失败。)但是,最终,这归结为您的“两组总是保持同步”的“优势”。有时,您不希望它们完全同步。
根据实际发生的情况,您就是希望将热备用或冷备用准备就绪并可以接通和切换到备用备份或适当的备份时。无论哪种方式,如果故障模式除了硬件存储设备故障(磁盘崩溃)之外还涉及很多其他方面,则RAID镜像镜像(或RAID镜像)无法为您提供帮助。诸如ZFS的raidzN之类的东西在某些方面可能会有所改善,而在其他方面则根本没有改善。
对我来说,如果意图是某种灾难故障转移,那么这将使您从一开始就不建议采用这种方法。