我正在考虑实现一个非常大的存储服务器,以用作其他几台服务器(均基于Linux)的实时NAS。
总的来说,我的意思是在4TB到20TB之间的可用空间(尽管我们不太可能实际将其变为20TB)。
为了提高数据安全性和性能,存储服务器将使用RAID 10,但我们仍然需要一个备份解决方案,包括异地备份。
我的问题是:您如何备份那么多数据!
并不是说我只能连接便携式硬盘驱动器并传输文件。我们目前没有其他具有如此大存储空间的设备。
我是否需要预算第二个异地存储服务器,还是有更好的解决方案?
我正在考虑实现一个非常大的存储服务器,以用作其他几台服务器(均基于Linux)的实时NAS。
总的来说,我的意思是在4TB到20TB之间的可用空间(尽管我们不太可能实际将其变为20TB)。
为了提高数据安全性和性能,存储服务器将使用RAID 10,但我们仍然需要一个备份解决方案,包括异地备份。
我的问题是:您如何备份那么多数据!
并不是说我只能连接便携式硬盘驱动器并传输文件。我们目前没有其他具有如此大存储空间的设备。
我是否需要预算第二个异地存储服务器,还是有更好的解决方案?
Answers:
有许多方法可以处理这种大小的数据。这在很大程度上取决于您的环境以及您愿意花多少钱。通常,有几种总体的“从服务器获取数据”策略:
那就是100公里的视野。一旦开始放大,事情就会变得更加零散。如前所述,LTO5是专门针对此类高密度负载而设计的磁带技术。另一个相同的存储阵列是一个很好的目标,特别是如果您可以使用GlusterFS或DRBD之类的数据来获取数据。另外,如果您需要备份轮换或者只是在阵列发生故障的情况下保持运行的能力将影响您的安装位置。
一旦确定了100Km的查看方法,下一个重要任务就是进入软件。影响这一点的因素首先是您可以在存储服务器上安装的内容(如果是NetApp,那是一回事,带有一堆存储的Linux服务器完全是另一回事,而带有一堆存储的Windows服务器则完全是另一回事)。 ,选择哪种硬件(例如,并非所有FOSS备份软件包都能够很好地处理磁带库)以及需要哪种备份保留。
您确实需要弄清楚您想要哪种灾难恢复。简单的实时复制比较容易,但是不允许您仅从上周恢复。如果从上周恢复的功能对您来说很重要,那么您需要针对这种情况进行设计。根据法律(在美国和其他地方),某些数据需要保存7年以上。
简单复制是最容易做到的。这就是DRBD的目的。初始副本完成后,它将发送更改。这里的复杂因素是网络位置,如果您的第二个阵列不靠近主要DRBD,则可能不可行。您将需要第二台存储服务器,该服务器至少要具有与第一台相同的存储空间。
关于磁带备份...
LTO5可以保存1.5TB的数据,而无需压缩。喂食这些怪物需要非常快速的联网,即光纤通道或6Gb SAS。由于需要在一次备份中备份超过1.5TB的数据,因此需要研究自动装载器(以下示例:link,HP的24插槽1驱动器自动装载器)。使用支持它们的软件,他们将为您处理中途备份的磁带。他们很棒。您仍然必须拉出磁带才能将其发送到异地,但是比备份整夜在磁带需要时自行加载磁带要好得多。
如果磁带为您提供了“ 遗产,传统 ”,那么虚拟磁带库可能会提高您的速度(例如,来自Quantum:link的速度)。这些伪装成是备份软件的磁带库,同时实际上使用健壮(希望)重复数据删除技术将内容存储到磁盘。如果您喜欢这样的话,更喜欢的人甚至可以为您将虚拟磁带复制到真实磁带,这对于非现场旋转非常方便。
如果您甚至不想弄乱虚拟磁带,但仍然想进行直接磁盘备份,则需要一个足够大的存储阵列来处理20TB的存储,再加上所需的大量净更改数据保持。不同的备份程序包对此的处理方式有所不同。有些重复数据删除技术真的很棒,而另一些则是骇人听闻的。我个人不知道这方面的FOSS备份软件包的状态(我听说过Bacula),但是它们可能就足够了。许多商业备份程序包都具有要安装在服务器上的本地代理,以进行备份,以提高吞吐量,这有很多优点。
LTO-5点唱机?您需要三到十五个磁带来备份该阵列,这并不是一个疯狂的数目。自动存储塔将为您更换磁带,好的备份软件(例如bacula)将跟踪哪个文件在哪个磁带上。
您还需要考虑备份这么大的文件系统所需的时间,因为在此期间FS很可能会更改。为了获得最佳结果,支持快照的文件系统将非常有帮助,因此您可以创建瞬时快照,并针对该快照执行完整或增量备份,而不是针对实时文件系统。
您可能应该考虑备份到磁盘,因为磁带将花费很长时间,并且要进行顺序访问,恢复将永远花费。
绝对可以利用差异备份或增量备份的优势-仅备份对您有意义的更改。
理想的解决方案可能是在另一位置有第二台大小相似的服务器,该服务器定期发送增量备份,并且如果主服务器死机,可以迅速将其交换到位。但是,另一种选择是在现场使用可移动驱动器,然后将其带离现场进行存储。
当您处理大量数据时,将备份分解为较小的备份作业也很有意义,如果不能每天备份所有备份,请错开您的备份,以便A集一天得到备份,并且下一个设置B。
始终在考虑还原过程。当我们不得不从几百个千兆的备份作业中还原文件时,我们就st了一次,这需要大量的内存和大量的时间来重建备份索引和还原。最后,我们一天之内无法完成它,因此不得不构建专用的还原服务器,以使我们的主备份服务器能够继续进行每夜的工作!
- 添加 -
您还想考虑重复数据删除技术,该技术可以通过不多次备份多个用户的相同信息来节省大量空间。许多备份解决方案或文件系统将重复数据删除作为其功能的一部分。
thinking about the restore procedure
。阿们!
首先,列举您要防范的风险。一些常见的风险:
然后评估各种风险规避解决方案的成本,例如:
然后评估轮换策略(您希望能够恢复多远,丢失多少数据)。
然后选择您的数据值。
异地在线备份(远程镜像)
通过ssh使用rsync(仅更改)-第一次备份必须在本地完成,但是根据更改,备份将变得轻而易举
如果您需要保留版本更改-rdiff-backup
http://www.nongnu.org/rdiff-backup/
Linux中的btrfs文件系统听起来很有前途,但仍处于发展阶段
在计划策略之前,请先查看一下您的实际“内容”及其更改的频率。很多时候,人们只是无缘无故地一次又一次地将相同的数据复制到磁带上。
一些供应商提供的重复数据删除技术可以允许通过快照将您从单个文件还原中解救出来,但您始终需要在异地进行保护。