多台服务器的所有硬件都像一个服务器一样运作?[关闭]


12

到目前为止,我有10台用于HPC,面向功率计算的服务器。我的用户需要使用qmake启动多个进程。用户习惯于使用ubuntu 9.10,并且存储库中的软件对他们来说是明智的。

我已将ubuntu 9.10部署到所有10台服务器(pxe岩石)。

到目前为止,我们使用parallel-ssh和cluster-ssh,它们允许向所有服务器启动相同的进程。使用此工具,这些服务器可以保持独立,但具有相同的软件和相同的启动命令。

现在,我们要进行下一步,将所有服务器视为一个服务器,同时将其他9个服务器的资源视为其资源。

在处理时间和设计启动命令的时间上,差异将是巨大的。

关于使用什么软件的任何建议将非常有用?

谢谢


要实现您所暗示的集群类型,将需要重写软件,以便将其设计为在这样的平台上执行。是否在范围内重写了软件?如果没有,我不知道将如何解决您所描述的问题。
克里斯·索普

Answers:


4

您在说什么叫做单系统映像(SSI)。此方案在Linux上最常见的变体是由MOSIX实现的。尽管它确实提供了一些系统管理方面的优势,但是通常情况下,如果不使用某种形式的MPI,进程就无法跨越多个节点。基本上,无论您使用的是运行在gridengine上的“标准”集群还是将系统形成为单个映像,您仍将需要修改所有软件以能够跨越多个节点。


2

群集不是单机性能,fs /内存位置对性能很重要。

在应用程序级别执行操作虽然不那么通用,但是却更节省资源。通过设置distcc可以大大加快您的qmake示例。


2

最后,我使用了Sun Grid Engine。

我已经在私人Wiki中记录了文档,并将其剪切并粘贴到我的博客上。我认为即使不翻译也可能有用。;)

博客条目:http ://suportrecerca.barcelonamedia.org/blog/?p= 240

如果有人想要Wiki代码,请在这里询问。

谢谢。


1

我以前从未实现过,但是听起来beowulf集群可以满足您的尝试。过去,我已经做了很多阅读,对于一些简单的过程,根据您要实现的目标,几乎不需要重新编码。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.