一堆具有唯一文件名的新文件通常会在一个服务器上“出现” 1。(与每天数百GB的新数据一样,解决方案应可扩展到TB。每个文件的大小为几兆字节,最大为几十兆字节。)
有几台计算机处理这些文件。(数十种,解决方案应可扩展到数百种。)应该可以轻松地添加和删除新机器。
有些备份文件存储服务器上必须复制每个传入文件以进行归档存储。数据不得丢失,所有传入文件都必须最终交付到备份存储服务器上。
每个传入文件都将被传送到一台计算机上进行处理,并且应将其复制到备份存储服务器。
接收方服务器在发送文件后无需存储文件。
请提供一种可靠的解决方案,以上述方式分发文件。解决方案不得基于Java。最好使用Unix-way解决方案。
服务器基于Ubuntu,位于同一数据中心。所有其他内容均可根据解决方案要求进行调整。
1 请注意,我故意省略了有关文件传输到文件系统的方式的信息。原因是如今,文件是由第三方通过几种不同的传统方式发送的(足够奇怪的是,通过scp和ØMQ)。在文件系统级别削减跨集群接口似乎更容易,但是如果一个或另一种解决方案实际上需要某些特定的传输,则可以将旧式传输升级为该传输。