我不是分布式文件系统忍者,但是在将尽可能多的驱动器整合到尽可能少的计算机中之后,我将尝试使用iSCSI将大量计算机连接到一台主机。在那里,我可以将其整合到一个容错存储中。优选地,机器内部(如果驱动器出现故障)和机器之间(如果整个机器关闭电源)的容错能力。
我个人喜欢ZFS。在这种情况下,压缩,重复数据删除和容错的构建将很有帮助。但是,我确信还有许多其他方法可以压缩数据,同时使其具有容错能力。
希望我有一个真正的交钥匙式分布式文件解决方案可以推荐,我知道这确实很麻烦,但我希望它能为您指明正确的方向。
编辑: 我仍然不熟悉ZFS和设置iSCSI,但回想起在德国Sun看到的视频,他们在视频中展示了ZFS的容错能力。他们将三个USB集线器连接到计算机,并在每个集线器中放置四个闪存驱动器。然后,为了防止任何一个集线器关闭存储池,他们制作了一个RAIDz卷,其中每个集线器都有一个闪存驱动器。然后,它们将四个ZFS RAIDz卷分条在一起。这样,只有四个闪存驱动器用于奇偶校验。当然,接下来是拔出的一个集线器,它降级了每个zpool,但是所有数据都可用。在此配置中,最多四个驱动器可能会丢失,但前提是任何两个驱动器不在同一池中。
如果将此配置与每个盒的原始驱动器一起使用,则将保留更多的驱动器用于数据而非奇偶校验。 我听说 FreeNAS可以(或将要)通过iSCSI以“原始”方式共享驱动器,所以我认为Linux可以做到这一点。如我所说,我仍在学习,但是从驱动器奇偶校验的角度来看,这种替代方法比我以前的建议要少浪费。当然,它将依靠使用ZFS,我不知道是否可以接受。我知道,除非您必须学习/学习,否则通常最好还是坚持要了解的内容,否则您将必须进行构建/维护/修理。
希望这会更好。
编辑:做了一些挖掘,找到了我谈论的视频。他们解释将USB闪存驱动器分布在集线器上的部分开始于2分10秒。该视频将演示其存储服务器“ Thumper”(X4500)以及如何在控制器之间分布磁盘,因此,如果硬盘控制器出现故障,您的数据仍然会很好。(我个人认为,这只是一个极客玩的视频。我希望自己能有一个Thumper盒子,但我的妻子不希望我在屋子里用托盘搬运车。:D那是一个大盒子。)
编辑:我记得在一个名为OpenAFS的分布式文件系统中进行通信。我没有尝试过,只读了一些。也许其他人知道它在现实世界中的处理方式。