您如何备份存储服务器?


14

我正在考虑实现一个非常大的存储服务器,以用作其他几台服务器(均基于Linux)的实时NAS。

总的来说,我的意思是在4TB到20TB之间的可用空间(尽管我们不太可能实际将其变为20TB)。

为了提高数据安全性和性能,存储服务器将使用RAID 10,但我们仍然需要一个备份解决方案,包括异地备份。

我的问题是:您如何备份那么多数据!

并不是说我只能连接便携式硬盘驱动器并传输文件。我们目前没有其他具有如此大存储空间的设备。

我是否需要预算第二个异地存储服务器,还是有更好的解决方案?


5
我将保留关于脱机支持的常规评论。我非常担心备份系统始终“在线和在线”。如果攻击者可以利用您的生产系统和您的备份,那么他们可以在破坏完生产系统后立即破坏您的备份。
埃文·安德森

@Evan我希望两者兼有,从磁带还原可能要花费数小时,但从本地磁盘或直接连接的磁盘还原可能需要几分钟。
汤姆·奥康纳

@蒂姆·奥康纳(Tim O'Connor):D2D2T很棒。请记住,从磁盘磁带还原单个项目可能会非常快。基于磁盘的备份具有快速还原的声誉,但是大多数人都这样说,他们认为“直接从B2D介质访问数据”而不是“还原”。如果您不得不在基于磁盘的备份系统中将几TB的数据还原到替换的SAN(例如在火灾中烧毁)后,复制数据就不会花几分钟。磁盘和高端磁带在数据传输速度方面非常相似。
埃文·安德森

Answers:


13

有许多方法可以处理这种大小的数据。这在很大程度上取决于您的环境以及您愿意花多少钱。通常,有几种总体的“从服务器获取数据”策略:

  • 通过以太网就像包装盒上所说的那样,数据将流式传输到“其他地方”进行处理。要复制1GbE,20TB将花费很长时间,但是可以做到。硬件可以提供帮助(例如10GbE链接,或在某些情况下提供NIC绑定)。
  • 通过存储子系统如果您在光纤通道上,请将其发送到FC网络上的另一台设备。如果您有SAS,请将其发送到连接SAS的设备。通常比以太网快。
  • 将其发送到另一个磁盘阵列将其发送到附加到同一服务器的另一块存储。

那就是100公里的视野。一旦开始放大,事情就会变得更加零散。如前所述,LTO5是专门针对此类高密度负载而设计的磁带技术。另一个相同的存储阵列是一个很好的目标,特别是如果您可以使用GlusterFS或DRBD之类的数据来获取数据。另外,如果您需要备份轮换或者只是在阵列发生故障的情况下保持运行的能力将影响您的安装位置。

一旦确定了100Km的查看方法,下一个重要任务就是进入软件。影响这一点的因素首先是您可以在存储服务器上安装的内容(如果是NetApp,那是一回事,带有一堆存储的Linux服务器完全是另一回事,而带有一堆存储的Windows服务器则完全是另一回事)。 ,选择哪种硬件(例如,并非所有FOSS备份软件包都能够很好地处理磁带库)以及需要哪种备份保留。

您确实需要弄清楚您想要哪种灾难恢复。简单的实时复制比较容易,但是不允许您仅从上周恢复。如果从上周恢复的功能对您来说很重要,那么您需要针对这种情况进行设计。根据法律(在美国和其他地方),某些数据需要保存7年以上。

简单复制是最容易做到的。这就是DRBD的目的。初始副本完成后,它将发送更改。这里的复杂因素是网络位置,如果您的第二个阵列不靠近主要DRBD,则可能不可行。您将需要第二台存储服务器,该服务器至少要具有与第一台相同的存储空间。


关于磁带备份...

LTO5可以保存1.5TB的数据,而无需压缩。喂食这些怪物需要非常快速的联网,即光纤通道或6Gb SAS。由于需要在一次备份中备份超过1.5TB的数据,因此需要研究自动装载器(以下示例:link,HP的24插槽1驱动器自动装载器)。使用支持它们的软件,他们将为您处理中途备份的磁带。他们很棒。您仍然必须拉出磁带才能将其发送到异地,但是比备份整夜在磁带需要时自行加载磁带要好得多。

如果磁带为您提供了“ 遗产,传统 ”,那么虚拟磁带库可能会提高您的速度(例如,来自Quantum:link的速度)。这些伪装成是备份软件的磁带库,同时实际上使用健壮(希望)重复数据删除技术将内容存储到磁盘。如果您喜欢这样的话,更喜欢的人甚至可以为您将虚拟磁带复制到真实磁带,这对于非现场旋转非常方便。


如果您甚至不想弄乱虚拟磁带,但仍然想进行直接磁盘备份,则需要一个足够大的存储阵列来处理20TB的存储,再加上所需的大量净更改数据保持。不同的备份程序包对此的处理方式有所不同。有些重复数据删除技术真的很棒,而另一些则是骇人听闻的。我个人不知道这方面的FOSS备份软件包的状态(我听说过Bacula),但是它们可能就足够了。许多商业备份程序包都具有要安装在服务器上的本地代理,以进行备份,以提高吞吐量,这有很多优点。


感谢您冗长而深思熟虑的回答。您给了我很多思考的机会:-p
安德鲁·

9

LTO-5点唱机?您需要三到十五个磁带来备份该阵列,这并不是一个疯狂的数目。自动存储塔将为您更换磁带,好的备份软件(例如bacula)将跟踪哪个文件在哪个磁带上。

您还需要考虑备份这么大的文件系统所需的时间,因为在此期间FS很可能会更改。为了获得最佳结果,支持快照的文件系统将非常有帮助,因此您可以创建瞬时快照,并针对该快照执行完整或增量备份,而不是针对实时文件系统。


1
我对磁带系统不熟悉。我猜没有办法进行增量备份。此外,这不会花费几个小时并涉及一个接一个地手动更换磁带机吗?那不是理想的,因为我每个月只能有一次这样的时间,而且我们真的不希望一个月的数据价值处于危险之中。我是否缺少某些东西,或者这些只是磁带备份系统的不便/风险/限制?
安德鲁·恩斯利

4
现代的磁带备份系统是高度自动化和机器人化的:)
Phoebus

3
是的,磁带备份通常允许增量备份。良好的备份策略是每月或每半年进行一次完整备份(长,慢,很多磁带),并在此之间进行每日增量或差异备份。
布伦特

磁带机械手价格合理,可容纳许多磁带。至于备份,为什么没有办法进行增量?最后,大多数人会触发备份在非工作时间运行。如果您没有这些,那将是规范的重要组成部分。
Slartibartfast

是的,我们真的没有休息时间。我们有几个小时无法使用系统(例如周六凌晨4点),这是可以接受的,但是受影响的系统将以24/7的速度被数百名用户使用。
安德鲁·恩斯利

5

您可能应该考虑备份到磁盘,因为磁带将花费很长时间,并且要进行顺序访问,恢复将永远花费。

绝对可以利用差异备份或增量备份的优势-仅备份对您有意义的更改。

理想的解决方案可能是在另一位置第二台大小相似的服务器,该服务器定期发送增量备份,并且如果主服务器死机,可以迅速将其交换到位。但是,另一种选择是在现场使用可移动驱动器,然后将其带离现场进行存储。

当您处理大量数据时,将备份分解为较小的备份作业也很有意义,如果不能每天备份所有备份,请错开您的备份,以便A集一天得到备份,并且下一个设置B。

始终在考虑还原过程。当我们不得不从几百个千兆的备份作业中还原文件时,我们就st了一次,这需要大量的内存和大量的时间来重建备份索引和还原。最后,我们一天之内无法完成它,因此不得不构建专用的还原服务器,以使我们的主备份服务器能够继续进行每夜的工作!

- 添加 -

您还想考虑重复数据删除技术,该技术可以通过不多次备份多个用户的相同信息来节省大量空间。许多备份解决方案或文件系统将重复数据删除作为其功能的一部分。


为+1 thinking about the restore procedure。阿们!
史蒂文

很多很棒的技巧。谢谢。我有很多想法要做。
安德鲁·恩斯利

2
我想投票,但是我看不到磁带。如果需要任何显着的保留窗口并与异地存储相结合,则磁带很可能将成为该数据量备份方案的重要组成部分。与可移动硬盘驱动器相比,用于长期异地存储的LTO-5盒带的成本非常诱人。磁带盒还设计用于存档存储,而可移动硬盘驱动器通常不是。
埃文·安德森

@Evan:说句公道话,他确实在第一句话中提到了录音带。
安德鲁·恩斯利

2

首先,列举您要防范的风险。一些常见的风险:

  • 灾难:整个网站都发生了非常不幸的事情。
  • 人为错误(这是_all_the_time_发生的错误):
    • 有人决定以制造商不希望的方式来使用存储服务器的“热交换”功能。
    • 有人运行了一个过程,该过程以静默方式破坏了数据,该数据在发现问题之前已可靠地备份了几个月。
    • 有人删除了一个小时内到期的,价值数千美元的重要报告。

然后评估各种风险规避解决方案的成本,例如:

  • 异地在线备份(远程镜像):不受灾难影响,某些(但不是全部)人为错误(仍然在线)。
  • 异地离线存储(磁带):不受灾难影响,难以快速恢复数据。
  • 现场在线备份(镜像):可以避免某些人为错误,某些硬件故障以及易受灾难的影响。
  • 现场离线备份(更换磁带机中的磁带):可以避免大多数人为错误和大多数硬件故障。

然后评估轮换策略(您希望能够恢复多远,丢失多少数据)。

然后选择您的数据值。


很好分解。我已经对此进行了大部分评估,并使用了非现场在线备份选项。除了明显的人为错误外,备份的目的主要是为了防止灾难。机架位于墨西哥湾沿岸2英里范围内,因此飓风是一个问题。我们只需要通过频繁的完整性检查来尽力防止人为错误。您的回答使我对这个结论感到更好。谢谢。
安德鲁·恩斯利

很高兴能为您提供帮助。关于您选择的解决方案的一些评论:这可能不言而喻,但是备份站点可能应该处于另一种状态,或者应该处于免受飓风侵袭的良好保护中。您可以通过设置较长的“尾巴”(过去各种日期的备份)来缓解腐败问题。使用在线备份,您还需要考虑意外删除数据而不是还原数据的危险。最后,请始终测试您的还原过程。
Slartibartfast

2

我有一个客户,在两个不同的建筑物中有两个类似的12 TB系统,连接速度为1GB。一是生产系统;二是生产系统。它使用强大的rdiff-backup实用程序将备份(带有每日快照)备份到另一个备份中。rdiff-backup必须在标准分发存储库中可用。


1

异地在线备份(远程镜像)

通过ssh使用rsync(仅更改)-第一次备份必须在本地完成,但是根据更改,备份将变得轻而易举

如果您需要保留版本更改-rdiff-backup

http://www.nongnu.org/rdiff-backup/

Linux中的btrfs文件系统听起来很有前途,但仍处于发展阶段


感谢您将我指向rdiff。我已经使用rsync了,这看起来似乎是从此进一步完善的。
安德鲁·恩斯利

1

在计划策略之前,请先查看一下您的实际“内容”及其更改的频率。很多时候,人们只是无缘无故地一次又一次地将相同的数据复制到磁带上。

一些供应商提供的重复数据删除技术可以允许通过快照将您从单个文件还原中解救出来,但您始终需要在异地进行保护。


每天有成千上万的用户输入表格并更新信息,就会使用该系统。这是高度动态的数据。我应该在问题中提到这一点。
安德鲁·恩斯利

如果是我,我将设计具有足够开销或快照功能的系统,除非发生灾难,否则我将不必进行真正的备份。
SpacemanSpiff 2010年

我同意。如前所述,驱动器将安装在RAID 10中,因此在硬盘发生故障的情况下我们将进行介绍,并且我还将提供本地备份/快照。离线备份是在最坏的情况下进行的,例如流星碰到同一地点或某人在存储服务器上意外运行rm -rf / *。
安德鲁·恩斯利

好吧,我指的是有关容量的开销。RAID10很聪明,可以实现最佳的冗余,但是如果性能不是很重要,并且我可以将额外的空间用于更多快照区域,那么我会选择RAID6。可以提供的快照越多,用于文件还原的“备份”就越少。
SpacemanSpiff 2010年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.