我的朋友和我都在我们的系统上有结核病。然而,我们都没有任何地理上分布的完整备份,因为在这些数据量下,诸如Dropbox,S3等的解决方案。对我们来说成本过高。但是,我们每个人都有过多的本地存储空间。事实上,每个TB都没有使用过。
我们开始思考:如果我们可以将我们的主机连接到某种形式的分布式文件系统,我们每个人都可以获得完整数据集的地理分布式备份,同时实现更高的存储容量利用率。完美的解决方案......我们认为。
- 我们至少有三个人。如果该项目产量结果肯定是6或更多。
- 我们每个人都有1-2TB的数据,至少还有很多。
- 我们都是通过WAN传播的。
- 我们需要能够让任何主机任意进入和离开云服务。
- 真实(ish)时间同步。否则,我们每周只会见一次啤酒,并在一堆外部硬盘上进行交易。
- F / OSS是必不可少的,但我们有足够的肘部油脂。
- 如果我们可以在这个过程中使用/学习/利用分布式计算平台,那就更好了。
我们开始考虑在OpenStack或Hadoop之上构建一个Dropbox-esque接口,但是我想知道是否还有其他替代方案我们忽略了。也许对于我们的案例,有一个更简单的解决方案?鉴于每个群集的节点数量很少,这样的事情是否可行?
注意:自然地,初始同步/平衡/转移/等至少需要几天,但这是可以接受的。
如果它不需要是FOSS,我怀疑crashplan可以完美地工作。即使它没有,他们也有一些有趣的想法
—
Journeyman Geek