我是一名高中生,正在尝试为一个项目构建linux集群(今年夏天我准备了一堆不错的计算机进行重新映像,因此技术部门基本上会说只要我不破坏它们就可以做任何事情。
无论如何,我对构建集群一无所知,但是我对Linux相当满意。
我需要了解以下内容:-应该使用哪个发行版?有关系吗 -哪些软件可以配置群集?-机载还是分布式FS?-任何可以提供体面的指南或操作方法的网站吗?
我是一名高中生,正在尝试为一个项目构建linux集群(今年夏天我准备了一堆不错的计算机进行重新映像,因此技术部门基本上会说只要我不破坏它们就可以做任何事情。
无论如何,我对构建集群一无所知,但是我对Linux相当满意。
我需要了解以下内容:-应该使用哪个发行版?有关系吗 -哪些软件可以配置群集?-机载还是分布式FS?-任何可以提供体面的指南或操作方法的网站吗?
Answers:
这实际上取决于您要完成的工作以及“分布式计算集群”的含义。我曾经在Uni中使用过时的机器和PVM做过类似的事情,从一堆机器充当一台计算机来并行处理的意义上来说,这就是“集群”-想想Beowulf集群。当然,您将需要编写代码以利用此优势。
一个不错的起点是确定您希望通过该项目学习什么。我建议初学者阅读有关并行计算的维基百科文章,然后根据您想做的事情细化您的需求。
一个简单的工作排队系统(例如gearman)可能足以迅速获得一些不错的结果。
我制作并行计算集群时遇到的问题是,我什么都没做,只是坐在那里,但这是一个有趣的项目,我学到了很多东西。在任何情况下,无论您选择实施哪种方式,您都可能会学到很多东西并同时获得乐趣。
至于发行版的选择,我会选择我最满意的版本,因为您可能需要从源代码安装。一旦您可以轻松设置所有内容,便可以考虑寻找一种更适合您需求的发行版。但是任何分发都可以。
用什么软件配置集群?这完全取决于您创建的集群类型。
车载还是分布式FS?同样,这取决于集群的要求。每个节点都将在其他节点之间来回传递数据吗?他们会以一个主机的身份作为从机运行吗?他们会完全独立运作吗?这些问题将开始告诉您选择。当然,总会有权衡取舍。
一些其他链接可能会证明很有趣:
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/
这是一个非常简单且尚未完善的建议;但也许尝试使用Plan 9集群? http://plan9.bell-labs.com/plan9/