快照+ RAID是否算是一个很好的现场备份解决方案?


19

当我将快照和RAID与btrfs一起使用时,我想到的进行备份的两个主要理由似乎已得到解决。(这里所说的RAID是指RAID1或10)

  • 意外删除数据:快照涵盖了这种情况
  • 驱动器故障和位腐烂
    • 完全失败:RAID涵盖了这种情况
    • 驱动器返回错误数据:RAID + btrfs的错误纠正功能涵盖了这种情况

因此,作为现场备份解决方案,这似乎可以很好地工作,甚至不需要单独的数据存储设备!

但是,我听说RAID和快照都没有被认为是正确的备份,所以我想知道我是否错过了任何事情。

除了btrfs还不是一项成熟的技术之外,您能想到我错过的任何东西吗?还是我的想法正确,并且这是有效的现场备份解决方案?


2
我们的工作与您相同:RAID 5和Shadow Copy;但是,我们还有两个非现场USB硬盘驱动器,它们每晚都使用Robocopy进行备份(每周旋转两次驱动器,所以一个总是非现场的)。这也为我们提供了用于灾难恢复的备份,但没有长期归档,而我们的小型组织实际上并不需要这些归档。您应该至少升级到服务器上的数据的异地副本,就像RAID阵列失效一样,快照也将丢失。
奥斯丁“危险”

如果要确定RAID阵列是否整体上可能发生故障,请用大锤砸一个,然后尝试恢复数据。一整类不好的东西可以将整个盒子拿走而又不占用整个站点。就是说,如果您的现场备份只是一种便利,可能会节省您从非现场备份恢复的速度,那么从原理上讲,备份可能会随心所欲。
史蒂夫·杰索普

是的,我们已经有异地备份和更“传统”的异地解决方案。之所以问这个问题,是因为我了解了btrfs和ZFS的功能,并且想知道它是否适合代替现场备份。
小太郎2014年

Answers:


42

不,这不对。

当您的文件系统或RAID卷损坏时,会发生什么?还是您的服务器着火了?还是有人不小心格式化了错误的数组?

您会丢失所有数据以及您认为已拥有的非真实备份。这就是为什么真正的备份与要备份的数据位于完全不同的系统上的原因-因为备份可以防止出现问题的系统发生问题,从而导致数据丢失。将备份与备份保持在同一系统上,该系统上的数据丢失也可能影响“备份”。


既然我经常遇到这个问题,该解决方案如何?两个系统上的本地快照+到另一台服务器(本地或异地)的远程快照+ RAID是否可以代替传统备份?
ewwhite 2014年

5
@ewwhite假设它们已经过还原测试,并且您的数据的完整副本位于远程系统上,那么可以肯定。然后,它基本上是磁盘到磁盘的备份...而且我也很喜欢磁盘到磁盘的备份。
HopelessN00b 2014年

11

对于现场备份,快照可以足够好,前提是您定期“导出”快照作为被动数据存在的其他位置。

并且,定期测试是否可以恢复“出厂快照”。

这就是我对某些服务器实施快速备份的方式:将数据存储在ZFS上,拍摄ZFS快照,将增量发送到另一台服务器,在该服务器上重新创建整个文件系统(减去正在运行的实际服务)。

当然,最好的备份总是在场外。因此,在将快照“运送”到单独的系统之后,请定期对快照进行“磁带备份”。

因此,在我的系统中,接收快照增量的服务器会定期将其所有ZFS池(包括较早的快照)转储到磁带上。

当然,测试您的磁带输出以确保可以恢复。

注意:您希望快照在停顿的磁盘活动期间发生,并且最好与数据库(如果有)协调以确保一致性;否则,治愈可能比疾病还糟。这就是NetApp和EMC“实时快照”功能非常有用的原因:它们将推迟LUN的快照,直到使用LUN的数据库表明可以安全地执行快照为止。


您能否详细说明如何将ZFS快照转储到磁带上?
ewwhite 2014年

@ewwhite您可以随时备份.zfs/snapshots目录,或将快照之一挂载到其他地方进行磁带输出。因此,它是针对不同快照的单独备份。
pepoluan 2014年

实际上,我正在使用zvols进行此操作,因此我没有.zfs目录cd
ewwhite 2014年

@ewwhite啊,我知道...在这种情况下,您可能可以使用zfs send $SNAPSHOT_NAME > $YOUR_TAPE_DEVICE,然后再执行一个zfs receive $RESTORE_NAME < $YOUR_TAPE_DEVICE。但是,老实说,我没有备份zvol的经验,但是……
pepoluan 2014年

8

HopelessN00b说了什么。没有。

正确的备份位于与要备份的设备不同的设备上。当您丢失两个或更多驱动器时会发生什么?当服务器机房烧毁时会发生什么?如果有人不小心破坏了阵列,会发生什么?

(轶事警报:我曾经听说有人将PXE设置为自动安装最新的Fedora。他的UPS发生了故障。停电后,他的服务器重新启动并设置为PXE引导,并且...根据他的数据安装了Fedora。点吗?发生了奇怪的事情。幸运的是,他有适当的备份。

最好至少拥有三份数据副本,其中一份完全存储在异地,以防数据中心烧毁。


6

您的存储必须支持正确实现的快照,因为体面的备份确实会将其用作创建备份作业的第一步。但是,使用快照进行主备份是一个坏主意。原因:

1)快照和后端存储可能会失败。因此,真正的备份必须使用单独的主轴集,否则很有可能同时丢失主要工作集和备份数据。

2)快照“占用”可用空间。对于当前的热数据以及卸载快照和备份,使用昂贵且快速的存储是有意义的,这对于一些便宜且速度较慢的存储来说是冰冷的数据。与1)BTW搭配使用效果很好。

3)快照通常会使整个过程变慢。大多数系统使用写时复制,这种方法会产生碎片。写入重定向速度更快,但占用了大量空间。很少有供应商正确实现了快照。带有WAFL的NetApp和带有CASL的Nimble Storage(我与它们没有任何关系)。几乎每个人都有问题。例如,Dell Equallogic在每更改一个字节后触发15 MB页面更新(和浪费)。这太贵了。


6

是的。这是存储备份的理想方法。别无其他需要,哎呀,即使进行完整性检查也只是浪费时间。

只是为了确认-在我提供更多建议之前...您为我的竞争对手工作,对吧?你真的知道吗?没有?哦。

抱歉,螺母。一点都不。抱歉,伙计

问题是您完全不愿意在(a)系统和(b)操作系统级别中发生任何错误。基本上,您只能防止他人删除某些数据。真好 那是一个经常发生的错误。

您不受保护的是:

  • 电源尖峰擦掉了机器。去过那里,看到了。
  • 光盘上出现故障的RAID控制器或内存写入错误-发生了任何事情。

还有其他很多东西。

这是-自然,除非您为我的竞争对手工作-您始终请备份:

  • 在另一台电脑上
  • 您至少要与电源尖峰隔离(即使您拥有一台USV)。

这就是磁带摇摆的原因-它们没有连接,任何短暂的火灾或洪水都不会伤害它们。功率峰值-磁带读取器甚至是机械手都走了,但不包含在读取器中的磁带不会受到影响。

最好是在异地备份(我是否已经提到过诸如火灾和洪水之类的东西?)(同样,当您为竞争对手工作时-没有建筑物起火之类的东西,就完全不需要了,就像火灾保险一样,请,省钱)。

现在,您可能会认为“哦,洪水永远不会发生”。确保您确定。请参阅,这里是vodaphone数据中心的09.09.09泛滥的视频。我相信您会了解现场/计算机备份的问题所在:

http://www.youtube.com/watch?v=ttcQy3bCiiU



4

从两个RAID-1驱动器彼此半小时内发生故障的过程中吸取了教训:RAID 并不是一种备份机制,无论以任何形式,形式或形式,都不是。

RAID是一种可用性机制,可以减少硬件故障时的停机时间,但在病毒,数据删除/修改或灾难性的硬件故障等根本无法帮助您的情况下。


1
如果某些类别的硬件出现故障。如果RAID卡发生故障,则您的容器不见了。
mfinni 2014年

3

许多经验丰富的管理员都遵循所谓的3-2-1备份规则:

  • 您应该至少拥有三个数据副本,包括主要数据源。即单个备份是足够的,并在同一物理系统中拷贝不计。

  • 您应该至少使用两种不同的备份方法。

  • 您应该至少有一个数据的异地副本。

快照违反了所有三个部分:

  • 您只能使用一台物理计算机。任何影响整个计算机的因素(例如PSU故障)都可能会带走所有数据。

  • 您仅使用一种方法进行备份。如果有任何问题,您将仅在危机情况下还原备份时才能发现。

  • 您没有异地备份。洪水和大火只发生在其他人身上,直到发生在你身上为止。

因此:

  • 您需要在局域网上的另一台计算机上至少有一个备份。

  • 您需要至少有一个不是使用快照生成的备份。也许是一个陈旧的增量tar存档?还是rsync基础副本?

  • 您需要至少有一个远程备份,该备份应尽可能远离当前位置,并且绝对不要在同一建筑物中。

还应该指出,块级快照的一致性保证与拔出计算机上的插头然后在磁盘上进行复制一样。通常,您需要fsck在还原后运行,或者希望日志足够。

文件系统级快照应该更好,但是它们仍不能保证文件的一致性。对于许多应用程序(想到数据库服务器),复制活动实例的文件可能完全没有用,因为它们可能处于不一致状态。您将需要使用他们自己的应用程序级备份机制来确保存在干净副本-3-2-1规则也适用于该副本。

最后,请记住,现在我们只在谈论您当前数据的副本。为了防止一段时间内未被发现的故障(或安全漏洞),您还需要在很长一段时间内保留几个过去的数据副本。


假设就一致性保证而言,btrfs快照就像ZFS快照一样(以及btrfs从ZFS汲取了多少灵感,我不知道为什么不是这样),该快照将表示磁盘瞬间时间数据。因此,如果您回滚到快照,则文件系统将处于一致状态,但是如果数据保留在RAM中并且仅定期刷新,并且需要这些数据来理解磁盘上的内容(例如数据库服务器软件),则这些数据将在回滚之后(或之前!),文件很可能处于不一致状态。
CVn 2014年

2

就其本身而言,它根本不是备份解决方案。这将减少或在某些故障的情况下删除停机时间,但不会保护你在所有从许多其他

当然,它可以是更全面的可用性+备份解决方案中非常有价值的一部分:

  • RAID和快照显示在同一硬件上
  • 在其他硬件上进行现场复制(请记住:有些故障模式会一次性破坏整个设备,控制器,驱动器以及所有设备)
  • 半断开的远程副本
  • 当然还有适当的脱机+异地副本,以应对真正的灾难

另外:确保定期测试备份。发现备份无法正常工作的最糟糕时间是当您需要从备份中检索某些内容时...

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.