Questions tagged «backup»

制作数据副本,以便可以将副本用于在数据丢失事件后恢复原始数据,或用于历史保留。

12
是否有备份PB级数据并将其存储的好方法?
我开始看到具有数百TB数据的客户端(在SQL Server安装中)。随着一些企业中数据总量接近PB的有意义的部分,我想在此探讨一下集体知识库,以了解处理这些数据量的人们正在采取哪些措施来保护它。 显而易见的问题是,使用企业级存储,大量甚至是RAID-5,存储这么多数据的多个备份的费用过高。 我看到的选项如下: 在另一个数据中心中创建数据的镜像副本,并不断将差异发送给它(使用适用于您的数据源的任何机制,例如日志传送或使用SQL Server进行数据库镜像) 使用强大的压缩算法进行定期备份(可能仅在数据很容易被严重压缩的情况下才适用) 分段备份数据的关键/更改部分。 不要备份数据并信任腐败神。 我看到默认情况下采用了选项4,作为HA / DR专家,它确实很吓人,但是我建议采取什么替代措施?我认为#1是最好的方法,但是当建议使用除#4和#3以外的任何替代方法时,通常会回答“我不这么认为”。 现在,这当然取决于数据的变化率和关键程度。无需回答这个问题,因为我在Microsoft工作期间曾经负责SQL Server的所有HA功能,因此我精通“取决于”这一论点-这是我的口号:-) 我会很想听到我错过的任何替代方案,或者听到其他人都在同一条船上,并且没有现实的替代方案,那就是花很多钱来增加存储空间。 在此先感谢您-我们将对所有经过深思熟虑和明确表示的答案给予应有的感谢。

4
如何从SQL Server 2008中的备份中排除索引
每晚的完整(和定期差异)备份正变得非常大,这主要是由于表上的索引数量所致。大约一半的备份大小由索引组成。 我们正在使用简单恢复模型进行备份。 有没有办法通过使用FileGroups或其他文件分区方法从备份中排除索引? 如果也可以将其扩展到全文目录,那就太好了。

3
您如何将版本控制,测试和持续集成/部署等开发实践应用于系统管理?
想象一下,您将要使用许多人使用的多种服务来管理许多服务器。现在说您要在这些服务器之一上重新配置或替换某些软件。显然,您不想在生产中的服务器上工作。 如果这是代码更改,那么作为开发人员,我将在本地开发计算机上进行更改,在本地进行测试,然后将更改提交到版本控制系统。然后可以将这些更改部署在登台环境中,进行进一步测试,最后部署在生产环境中。如果需要,我也很容易回滚。 通常,或者具体来说,您如何在系统管理中实现这一目标? (首先想到的是使用虚拟机并将虚拟机映像置于版本控制中,但是我敢肯定,目前尚不了解很多文献和聪明的解决方案。)

3
RDX可移动磁盘是否可以很好地替代LTO磁带?
在三周的时间内,我在客户端站点经历了LTO-1和LTO-2磁带驱动器的六次完全故障。一些机制失败了。其他人则失去了可靠书写的能力。这些是HP Ultrium 232、448和460驱动器。这些单元大多数是在2006年至2008年之间部署的,因此发生故障的时机正确。容量(400GB)适合于应用程序。为了保持一致性,我用等效的设备替换了几个驱动器。一台服务器还发生了SCSI HBA故障,从而进一步延迟了恢复。当时,客户询问是否有任何可用的硬盘解决方案比磁带更好(或花钱少)。 当我开始寻找替代产品时,我发现RDX可移动磁盘存储技术已被主要的服务器制造商(HP,Dell和IBM)采用。从我的角度来看,它看起来像是通过USB2在内部或外部通过USB2连接的对接2.5“ SATA磁盘,容量高达1TB。由于它们是实际磁盘,因此恢复和寻找时间似乎是合理的。但是我有一些疑问实践中的技术。 这里有人能成功使用这些驱动器吗?有什么需要注意的吗? RDX与直接外部USB磁盘有何区别? 在我的应用程序中,磁带的优点之一是驱动器具有硬件压缩功能。这极大地帮助了我必须在Linux系统上备份的高度压缩的数据集。我假设RDX依赖软件压缩是否正确? 由于这些是物理磁盘,因此Linux或Windows中是否存在挂载点问题?磁带的优点之一是它不是已挂载的文件系统,并且通常不受病毒,rootkit,系统崩溃等的影响。 此外,我观看了有关将RDX与Cactus Lone-Tar结合使用的入门知识,并在看到它们使用mkfs命令在RDX驱动器上创建文件系统时感到惊讶/dev/sda。是否有任何设备的重命名/重新排序(从添加SCSI控制器,插入USB密钥等)的机会,或将对接单元在一个特定的设备名称坚持为你更换驱动器? 30兆字节/秒的备份速度是否准确? 我很好奇,因为这可能是一个有趣的选择。一系列磁带机故障的发生是在继续前进之前重新评估其他选项的时候。

5
实时SQL Server备份期间会发生什么?
当我告诉他们我可以在SQL Server数据库仍在运行时对其进行备份时,我的一些同事感到惊讶,并想知道这是怎么可能的。我知道SQL Server可以在仍在线时备份数据库,但是我不确定如何解释它的可能性。我的问题是这对数据库有什么影响? 如果在备份运行时修改了数据(通过插入,更新或删除),那么备份中是否包含这些更改,或者以后将其添加到数据库中? 我假设日志文件在这里起着重要的作用,但是我不确定如何。 编辑:作为一个说明,我的案例涉及在此过程中使用SQL Server Agent备份数据库以及数据库修改的影响。

4
时间机器在做什么?
有时OS X会告诉我,它正在“准备备份...”时间很长。花费的时间似乎与要备份的数据量无关。与“完成备份...”阶段相同。 问题:OS X在“正在准备备份...”和“正在完成备份...”时正在做什么? 我知道它正在弄清楚要备份什么,然后记录更改,但是可以肯定,所需的时间应与更改的数据量成正比。有足够的空间磁盘空间(因此,我认为它不会删除旧的备份)。我正在使用TimeCapsule,如果有任何区别。没问题,我很好奇。

1
从坏扇区到“损坏的文件”-Linux / ext3是否适用,Windows / NTFS是否可以?
当磁盘上的SMART检查报告扇区损坏时,重要的是能够识别出扇区损坏的文件-并从备份中还原文件。在下面,我显示了如何为Linux / ext3 VMWARE服务器执行此操作-但是有人知道对于Windows / NTFS是否可以完成此操作? 这是我在Linux / ext3上执行此操作的方法:首先,我要求驱动器进行硬件表面扫描(低于OS级别,带有驱动器上的SMART电路): vserver:~# smartctl -t long /dev/sdc 我看了一下结果: vserver:~# smartctl -a /dev/sdc ... 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 1 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 9 ... Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended …
17 backup  ntfs  ext3  bad-blocks 

2
双重备份全寿命和效率
我正在尝试为某些客户端制定备份策略,并且倾向于重复进行远程备份(已将rdiff-backup用于内部/位置备份)。 经常需要完整备份是否合理?由于重复性向前递增,因此每个增量备份都依赖于上一个增量,而所有备份都严重依赖于上一个完整备份。万一腐败,坏事就会发生。一个相关的问题:Duplicity是否测试增量备份的一致性? 假设我确实经常需要完整备份,那么重复性如何有效地创建完整备份?它可以/是否检查文件签名并从以前的完整备份/增量中复制未更改的数据?基本上是创建一个新的“完整”存档,以传输新的/更改的数据并合并现有的未更改数据? 现在,我担心的是需要运行完全备份,但是持续使用大带宽的完全备份将使某些客户端不合理。

12
备份服务器应该使用RAID吗?
我被要求使用Symantec Backup Exec设置新的备份服务器,该服务器存储在硬盘而不是磁带上,因为备份大小超出了磁带容量。 我想知道这是否真的有意义,或者备份服务器运行任何形式的RAID是否有任何优势,因为它是“备份”? 对我而言,证明增加成本的好处不是很大。 我很想看看别人的想法。 谢谢!
17 backup  raid 

9
LVM快照作为备份策略
xen domU的定期LVM快照作为备份策略的可行性如何?优点,缺点,任何陷阱? 对我来说,这似乎是快速,轻松地恢复的完美解决方案。在domU成功运行而不会中断的情况下,可以对损坏的逻辑卷进行任何调查。 编辑: 在进行完整的系统备份时,这就是我现在的位置。 domU磁盘的lvm快照 一个新的逻辑卷,其大小等于快照的大小。 dd if = / dev / snapshot = / dev / new_lv 用lvremove处理快照 使用kpartx / mount / ls进行可选验证 现在我需要使它自动化。
17 backup  xen  lvm 

11
使用Rsync备份到外部驱动器
我正在购买一个外部硬盘驱动器来备份我家中的计算机(最终!)。我希望使用rsync。我看过一个确实(或似乎确实)想要的示例。像这样: rsync -aE --delete /path/to/what/I/want/to/backup /Volumes/FW200/Backups 但是,在查看rsync文档和示例等时,事情看上去比这要复杂得多。联网,守护进程和行话,哦,我的天! 我假设只要从计算机到通过火线连接的外部驱动器进行同步,这些东西都不需要。我猜错了吗?事情真的会比那个无害的命令还要复杂吗?
17 backup  rsync 

7
是否有使用inotify的有效Linux备份解决方案?
已锁定。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 需要永远备份。在我们可以信任btrfs或ZFS备份增量快照之前,如果有一个守护进程使用inotify来跟踪实际更改了哪些文件,以便备份运行得更快,那岂不是很好吗?这个程序在哪里? 如何备份Linux机器而不必每次都爬网整个文件系统?我想要一个程序来检测新的或更改的照片,源代码等,并将它们排队复制到我的NAS中。
17 linux  backup  inotify 


8
如何在独立ESXi主机上备份虚拟机?
没有任何vCenter Server的独立ESXi(4.1)主机。 如何尽快备份虚拟机并实现存储友好? 我知道我可以访问ESXi控制台并使用标准的Unix cp命令,但这具有复制整个VMDK文件(不仅是它们实际使用的空间)的缺点。因此,对于仅使用1 GB的30 GB VMDK,备份将占用30个完整GB的空间,并相应地占用时间。 是的,我知道精简配置的虚拟磁盘,但是在进行物理复制时,它们的表现往往很差,并且/或者会达到完全配置的大小。此外,不建议使用它们来提高虚拟机的实际性能。 我可以在备份虚拟机之前先关闭它们(即,我不需要“实时”备份);但是我需要一种有效地复制它们的方法;是的,在进行备份时自动关闭/启动的方法也会有所帮助。 我只有ESXi;没有服务控制台,没有vCenter Server ...处理此任务的最佳方法是什么?另外,还原又如何呢?

3
备份存储在Amazon S3上的数据
我有一个运行Web服务器的EC2实例,该服务器将用户上传的文件存储到S3。这些文件只写入一次,并且永不更改,但偶尔会被用户检索。我们每年可能会积累大约200-500GB的数据。我们希望确保此数据是安全的,尤其是防止意外删除,并且希望能够恢复被删除的文件,无论其原因如何。 我已经阅读了有关S3存储桶的版本控制功能,但是似乎无法找到没有修改历史记录的文件是否可以恢复。有关版本控制,请参见此处的AWS文档: http://docs.aws.amazon.com/AmazonS3/latest/dev/ObjectVersioning.html 在这些示例中,它们没有显示上传数据但从未修改然后删除数据的场景。在这种情况下删除的文件是否可以恢复? 然后,我们认为可以使用对象生命周期管理将S3文件备份到Glacier: http://docs.aws.amazon.com/AmazonS3/latest/dev/object-lifecycle-mgmt.html 但是,这似乎对我们不起作用,因为文件对象没有复制到Glacier而是移到了Glacier(更准确地说,这似乎是一个已更改的对象属性,但无论如何...)。 因此,似乎没有直接的方法来备份S3数据,并且将数据从S3传输到本地服务器可能很耗时,并且随着时间的流逝会产生大量的传输成本。 最后,我们认为我们将每月创建一个新存储桶以用作每月的完整备份,并在第1天将原始存储桶的数据复制到新存储桶。然后使用类似duplicity(http://duplicity.nongnu.org/),我们每晚都会同步备份存储桶。月底,我们将备份存储桶中的内容放入Glacier存储中,并使用原始存储桶的最新副本创建一个新的备份存储桶...并重复此过程。这似乎可行,并且可以最大程度地降低存储/传输成本,但是我不确定双重性是否允许直接进行存储区到存储区传输,而无需先将数据传输到控制客户端。 所以,我想这里有几个问题。首先,S3版本控制是否允许恢复从未修改过的文件?有什么方法可以将S3中的文件“复制”到我错过的Glacier吗?重复性或任何其他工具是否可以直接在S3存储桶之间传输文件以避免传输成本?最后,在备份S3数据的方法上我是否偏离了常规? 预先感谢您提供的任何见解! 更新资料 亚马逊最近宣布版本控制现在可以使用生命周期规则

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.