是否可以暂停通过qsub提交的作业?


10

我正在一个小型集群上运行我的工作。我是通过提交的qsub。现在,我的同工比我更需要资源,因此,如果可能的话,我需要杀死我的工作或暂停他们的工作。

是否可以暂停我的工作并释放CPU,RAM等?

我是普通用户(没有root特权)。


1
您可以使用来阻止尚未运行的作业qhold,但这不会影响已经在运行的作业。似乎qmod可以暂停正在运行的作业,但需要root或manager特权。
jofel

假设你有Moab集群:您可以暂停你的工作(如果相应的配置),但只有管理员可以恢复它:docs.adaptivecomputing.com/mwm/Content/topics/jobAdministration/...
奥特Toomet

Answers:


6

如果这些工作尚未开始,您可以使用暂停它们qhold。用qrls重新启动。

qhold <job ID>
qrls <job ID>

如果它们已经在运行,则可以qsig用来挂起和恢复作业(您可能需要额外的权限,请询问管理员)。

qsig -s suspend <job ID>
qsig -s resume <job ID>

恢复工作后,您可能不得不强制其与 qrun

qrun <job ID>

在具有PBSPro 13.0.2.153173的SLES 11 SP4系统上进行了测试,但是我相信它应该可以与其他POSIX兼容的批处理作业提交系统一起使用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.