长期存储业务关键数据


16

这是一个非常棘手的问题,在某种程度上不是技术问题,可能不属于这里,但

服务器故障适用于系统管理员...他们以专业身份管理或维护计算机

我这样做..这是我的任务之一..总之。

假设您有5000张A4双面纸。公司数据,对所有业务至关重要。
您需要以某种方式备份它。到目前为止,建议的解决方案是:

  1. PDF->在线存储
  2. PDF-> DVD /蓝光/磁带
  3. PDF->便携式HDD / SSD /闪存驱动器。
  4. 购买/租赁/租用/“偷”一台大型复印机,然后进行复印。
  5. ???

上面的直接问题:

  1. 如果存储合作伙伴破产了怎么办?
  2. DVD会随着时间的流逝而腐烂。磁带也是如此。
  3. 这些也是随着时间的流逝。
  4. 昂贵。慢。重。不是树友。

问题:

中长期数据保存和归档的黄金标准是什么?您在工作场所解决过类似的问题吗?

初始加载后,有一些要求每月增加大约100页。检索应该很容易,但可能很少。
理想情况下,我想保证该解决方案在离开公司后很长时间就可以使用,并且不需要大量费用即可保持其可维护性,因此存储许多DVD不仅不​​理想,而且也不可行一个好的长期解决方案。

虽然仅打印纸质副本当然是最容易的,但它并不是最环保的方法,而且距离很远。它也不是很容易管理,很难搜索,索引等等。加之笨重,且难以物理存放。

我非常喜欢将所有内容都以电子方式存储的想法,但是执行此操作的实际机制需要透明且容易。我真的不想对这一天一夜的事情负责,在办公室用户忙碌起来并丢失文件时为其提供支持。我也不想依赖单一的存储供应商,如果Dropbox(我们有一个在线备份解决方案ATM,但不是Dropbox。)破产了,或者经历了一场灾难性的事件,那有多少家企业该怎么办?谁在使用他们的服务?

这里有一些预算灵活性,但是我怀疑任何比我们当前的在线备份花费更多的东西(每年2500美元),与将其放在床下的鞋盒中相比,都不会被看好。如果我什么都不做,明天就辞职,那将是毫无疑问的。

有任何想法吗?

-编辑-

这样做的原因有两个。

1)在办公室烧毁的情况下,为业务关键文书提供明智的安全备份。

2)满足企业的数据归档法律WRT uk税法等。

编辑2:

拥有某种索引文档的机制也将非常有用。


我用ghostscript和gocr编写了一个PDF-> Txt的快速脚本。愚蠢地考虑将所有内容都注入SQLlite数据库中,以为数据创建一些有趣的索引。
汤姆·奥康纳

多年来(数字媒体的)冗余和保持冗余可能是您最好的朋友。
Vortico 2012年

Answers:


5

以PDF之类的格式保存数据可能是安全的,因为有免费的读取工具。您正在谈论的数据量很小(每年1,200页),因此即使以300 dpi的扫描分辨率,您每年也只能谈论数十GB。

但是,物理存储设备的问题永远不会消失。无论用于存储电子数据的任何介质(磁带,光学等),最终都需要更新为较新的介质。随着新格式替代旧格式,计划和预算“将数据收集起来”到新格式。

我可能会将光学介质视为首选,只是因为您的数据很少。我还计划刻录所有内容的3x副本,并每2-3年刷新一次媒体。

如果光学介质太小,我会使用LTO磁带,每隔4-5年刷新一次。但是,对于如此少量的数据,这将是非常昂贵的。


DVD?还是蓝光?BR是一种明智的数据格式吗?
汤姆·奥康纳

1
@汤姆·奥康纳:对我来说,它们看起来一样。我会考虑做出这个决定的成本。现在有“档案级”的蓝光空白,因此从技术角度来看,这似乎是一种可行的格式。(制造商说Blu-Ray介质的“额定”寿命为200年并没有给我比那些说归档DVD介质的100年“额定”寿命的人更有信心...)
Evan Anderson

我有大约1998年左右的一些柯达GOLD CD-R,它们仍然可读。我也有一些免费的染料,染料层已经分开,并且被拧紧了。
汤姆·奥康纳

我并不是说档案媒体与非档案媒体没有区别。我只是说Blu-Ray档案级媒体与DVD档案级媒体在我看来并没有太大不同。将档案等级与“ 100锭价格为$ 20.00”媒体进行比较是一个完全不同的故事。
埃文·安德森

固态存储(USB拇指驱动器)未提及的一项是:比光学存储更大,比LTO小。USB可能至少还会出现一到十年,而就归档成本而言,一个16GB或32GB的拇指驱动器(或两个或三个)相当便宜。既然要一次写入多次读取,那么您不必担心SSD单元会用完,因此从理论上讲,您可以将棒保存在防火保管库中5年或更长时间。
voretaq7 2012年

6

有一些特定的系统内部经常使用DVD,并经常将数据迁移到新媒体上。查找数字保存。

由于存储需求增长很快,因此建议每隔几年就切换到一种更新的,更大类型的媒体。

假设您以书面形式获取数据,则需要:

  1. 在邮件输入处列出数据。这可能意味着给每张纸一个唯一的条形码。
  2. 扫描它。使用条形码标识符作为文件名。存档文件。
  3. 存档数据。将数据放在修订版安全归档系统上。文件服务器将不够好,因为如果文件具有可写访问性,则文件可能会发生变化。
  4. 使它可被其他系统读取。

对于客户而言,大型组织的所有发票都必须转移到在线系统(SAP)中。到目前为止,档案存储经历了几次迭代。目前,他们正在转向蓝光。

另一方面,如今一切都进入磁盘,因此遵循这些思路的东西也许是您要走的路:http : //www.eurostor.com/german/iTernity.D.php


请记住,大多数DVD-R(等)仅能使用几年,然后才降级。如果按照说明进行存放,则昂贵的“档案”物品使用寿命更长。
克里斯·S

大多数磁盘,服务器,文件系统或文档格式也是如此。归档意味着移动数据。尝试在20年后阅读pdf。您还记得十年前的标准吗?真的,我们没有什么比纸质更接近。除了复制和粘贴...
Posipiet 2011年

纯文本文档仍然可读性强。
Bart Silverstrim

有免费的工具来阅读PDF。只要它们是“普通香草”,我就不会太担心。TIFF也是一个不错的选择。
埃文·安德森

3

我们的解决方案:扫描到PDF->备份到磁带

我们有一个文档扫描仪,速度约为30页/分钟,并生成OCRed PDF文件。我们将其备份到磁带(特别是LTO4)上,该磁带的保质期为50到100年(在时间范围内查找磁带驱动器可能很困难,但是有一些数据恢复位置仍可以恢复8英寸的软盘)。


2
我不得不谷歌8"软盘....
Holocryptic

我确实保留了Mac OS 7.5上的备份磁带。但是磁盘坏了,备份程序的媒体丢失了。我确实设法重新安装了Mac,但是因为没有备份程序,所以无法读取磁带。坦率地说,我什至不记得它的名字。是的,磁带可能会持续100年。但是读者没有。
Posipiet 2011年

@Holocryptic:仅在几个月前,我投出逐字硬的未开封的箱子扇形8"软盘。
user9517

1
@Holocryptic:NSFW!NSFW !!
Bart Silverstrim

@Posipiet,我想我涵盖了驱动器不会永远持续下去的事实,但是有些公司专门研究从几乎所有常用媒体中恢复数据的情况。
克里斯S

3

我认为,亚马逊的新Glacier服务在这个领域非常有趣。

Amazon Glacier针对不经常访问的数据进行了优化,并且适合几个小时的检索时间。借助Amazon Glacier,客户可以以每月每GB 0.01美元的价格可靠地存储大量数据,与本地解决方案相比,可节省大量资金。


2
检索成本非常高。
汤姆·奥康纳

2

第一步,备份:对文档进行OCR,然后将所有单词重新排列成一系列有关天主教,大主教和圣殿骑士的小说。您应该拥有足够的输入数据,用于大约10部小说,并且每年大约永久保留一本。维护一个查找表,该表包含原始文档中的原始位置(按原始顺序)以及小说中的最终位置。将重复的单词存储在表的一个条目中。确保出版交易并获得数百万本小说的出版。使用图书销售收入为OCR和单词重排操作提供资金。切碎原始文件,并作为仓鼠床上用品出售。如果您发现输入文档中缺少词汇,有时可能需要订购耶稣受难像,反物质或飞机票到异国情调。

第二步,恢复/访问:无需存储数据副本-您只需要查找表和二手书店。

由于查找表是您的单点故障,因此您仍然需要备份该表。由于使用了霍夫曼编码方案,与您的输入文档相比,这将非常小,因此很可能会复制到DVD中。对于异地备份,请坐在壁炉旁,一边看视频一边读出查询表。将您的视频表演作品将艺术与技术融合到泰特现代美术馆中,并进行永久展示。


1

购买还为时过早,但似乎HDS提出了一种基于石英的永久数据存储机制-请读取


1
我已经听过很多次关于永久性的声明,以至于我永远都不会相信它,而且我们每个人都不会活到足以证明这一点。永久性的预测是绝对毫无价值的,并且总是被证明是错误的。
John Gardeniers 2012年

-2

我必须提出Humyo.com(由趋势科技购买-中间名是安全性)

他们对所有用户数据进行加密,并且其服务器位于英国银行的金库中。

相当安全:)


1
我敢打赌他们实际上不在英格兰银行。那里没有空间,到处都是银行家。
汤姆·奥康纳

5
趋势科技,中间名是bloatware ...
Tom O'Connor

我在趋势科技上同意您的意见,但他们只拥有它,而是使用Humyo的软件进行操作
benhowdle89 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.