Linux的作业管理和数值模拟[关闭]


1

我正在进行数值模拟,我用参数运行它们,以便它们在几分钟内完成。我想让他们跑得更久,也许是几天。

目前,我已将参数编译到C程序中,但我想我应该创建所有参数命令行参数,以便我可以在启动时更改它们。

但是,我不确定如何将“任务”分发到几台Linux计算机上。它们各有多个核心,但我可能无法安装额外的软件,因为它们是允许SSH的大学计算机,但没有root访问权限。 sshnohupscreen 也许能够把我带到某个地方,但是我想把命令放在一个列表中,比如

run="100-200" mkdir "$run" && cd "$run" && ./main 100 200 && ./plot
run="100-300" mkdir "$run" && cd "$run" && ./main 100 300 && ./plot

如果我可以提供,那就太好了 ./main 100 200 && ./plot 它会将它运行到一个新的工作目录中。

是否有一些调度软件?我需要一些免费的Linux版本。如果我可以将它安装到我的主目录中,可以获得奖励积分。


到目前为止,我找到了TORQUE,我大学的一些人在HTCondor上运行了一个集群。

Answers:


0

在您的服务器上安装Sun Grid Engine(我认为最后免费从Sun获得6.2;自从Oracle购买它以来,下载更新的版本存在一些问题。但是,旧版本对于我们使用的~100个节点来说已经足够了。)。这是一个合适的排队系统。它将为您安排时间安排。相信我会付出这项工作。


我刚检查过它。甲骨文让SGE走了。你可以找到它 gridscheduler.sourceforge.net
Kris_R

SGE做得非常好,但恕我直言,你不能以非root身份安装它。它创建专用用户,需要执行守护进程等等......
mpy

实际上,最好不要使用root帐户安装sge。我在两个集群上都使用了sgeadmin。 deamon - 你可能是对的。
Kris_R
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.