如何从bash脚本并行运行多个程序?


244

我正在尝试编写同时运行许多程序的.sh文件

我试过了

prog1 
prog2

但这会运行prog1,然后等到prog1结束,然后再启动prog2 ...

那么如何并行运行它们?

Answers:


216
prog1 &
prog2 &

49
不要忘记了wait!是的,在bash中,您可以等待脚本的子进程。
Dummy00001 2010年

5
另一个选择是用来nohup防止程序在外壳挂起时被杀死。
菲利普

@liang:是的,它也可以与三个或更多程序一起使用。
psmears

302

怎么样:

prog1 & prog2 && fg

这将:

  1. 开始prog1
  2. 将其发送到后台,但继续打印其输出。
  3. 开始prog2,并使其保持在前台,以便您可以使用关闭它ctrl-c
  4. 关闭时prog2,您将返回到prog1前景,因此也可以使用关闭它ctrl-c

9
有什么简单的方法可以在终止prog1prog2终止?想一想 node srv.js & cucumberjs
JP

20
只是尝试了一下,却没有达到我的预期。但是,进行了少许修改: prog1 & prog2 ; fg 这是用于一次运行多个ssh隧道。希望这对某人有帮助。
jnadro52 '16

2
@ jnadro52您的解决方案具有以下效果:如果prog2无法立即运行,您将回到prog1前台。如果这是理想的,那就可以了。
Ory Band

3
在SSH的shell上如果执行这样的命令,杀死prog1将很棘手。Ctrl-c对我不起作用。即使杀死整个终端,prog1也会运行。
汞0114

14
@ jnadro52立即终止两个进程的方法是prog1 & prog2 && kill $!
zaboco

79

您可以使用wait

some_command &
P1=$!
other_command &
P2=$!
wait $P1 $P2

它将后台程序PID分配给变量($!是最后启动的进程的PID),然后wait命令等待它们。很好,因为如果您终止脚本,它也会终止进程!


4
以我的经验,杀死等待并不会杀死其他进程。
Quinn Comendant

1
如果我要循环启动后台进程,那么我该如何等待每个后台进程完成,然后再继续执行下一组命令。 #!/usr/bin/env bash ARRAY='cat bat rat' for ARR in $ARRAY do ./run_script1 $ARR & done P1=$! wait $P1 echo "INFO: Execution of all background processes in the for loop has completed.."
Yash

@Yash我认为您可以将进程ID保存到数组中,然后在该数组上调用wait。我认为您必须将${}其插值到字符串列表或类似列表中。
trusktr

最好的答案,对我来说,杀死脚本也会杀死进程!macOS Catalina,zsh控制台
Michael Klishevich

67

使用GNU Parallel http://www.gnu.org/software/parallel/,它很容易:

(echo prog1; echo prog2) | parallel

或者,如果您喜欢:

parallel ::: prog1 prog2

学到更多:


4
值得注意的是,存在parallel具有不同语法的不同版本。例如,在Debian衍生产品上,moreutils软件包包含一个不同的命令parallel,该命令的行为大不相同。
乔尔·克罗斯

4
parallel比使用更好的&
擎天柱

2
@OptimusPrime确实取决于。GNU Parallel引入了一些开销,但作为回报,您可以对正在运行的作业和输出进行更多控制。如果同时打印两个作业,GNU Parallel将确保输出没有混合。
Ole Tange

1
parallel如果作业多于核心,则@OptimusPrime 会更好,在这种情况下&,每个核心一次运行多个作业。(比照鸽孔原理
Geremia

2
@OleTange“ 您的命令行会为此而爱您。 ”我也是。☺–
Geremia

55

如果您希望能够使用轻松运行并杀死多个进程ctrl-c,这是我最喜欢的方法:在(…)子shell中产生多个后台进程,并SIGINT执行陷阱kill 0,这将杀死subshel​​l组中产生的所有东西:

(trap 'kill 0' SIGINT; prog1 & prog2 & prog3)

您可以拥有复杂的流程执行结构,并且所有内容都将以一个关闭ctrl-c(只要确保最后一个流程在前台运行即可,即,不要包含&after prog1.3):

(trap 'kill 0' SIGINT; prog1.1 && prog1.2 & (prog2.1 | prog2.2 || prog2.3) & prog1.3)

到目前为止,这是最好的答案。
尼克

9
#!/bin/bash
prog1 & 2> .errorprog1.log; prog2 & 2> .errorprog2.log

将错误重定向到单独的日志。


13
您必须在重定向后放置“&”号,并省略分号(“&”号也将执行命令分隔符的功能):prog1 2> .errorprog1.log & prog2 2> .errorprog2.log &
已暂停,直至另行通知。

分号执行两个命令,您可以测试de bash使其运行良好;)示例:pwd&2> .errorprog1.log; 回显“ wop”&2> .errorprog2.log,当您将&放置在后台程序并立即执行下一条命令时。
Fermin 2010年

2
它不起作用-错误不会重定向到文件。尝试:ls notthere1 & 2> .errorprog1.log; ls notthere2 & 2>.errorprog2.log。错误进入控制台,并且两个错误文件均为空。正如@Dennis Williamson所说,&是一个分隔符,如;,所以(a)它需要在命令末尾(在任何redirecton之后),并且(b)您根本不需要;:-)
psmears

9

xargs -P <n>允许您<n>并行运行命令。

尽管这-P是一个非标准选项,但GNU(Linux)和macOS / BSD实现均支持该选项。

下面的例子:

  • 一次最多并行运行3个命令,
  • 仅在先前启动的进程终止时才启动其他命令。
time xargs -P 3 -I {} sh -c 'eval "$1"' - {} <<'EOF'
sleep 1; echo 1
sleep 2; echo 2
sleep 3; echo 3
echo 4
EOF

输出看起来像:

1   # output from 1st command 
4   # output from *last* command, which started as soon as the count dropped below 3
2   # output from 2nd command
3   # output from 3rd command

real    0m3.012s
user    0m0.011s
sys 0m0.008s

时间显示命令是并行运行的(最后一个命令仅在原始3个命令中的第一个终止后才启动,但执行速度非常快)。

xargs所有命令完成之前,命令本身不会返回,但是您可以在后台执行该操作&,方法是使用控制操作符终止该命令,然后使用wait内置函数等待整个xargs命令完成。

{
  xargs -P 3 -I {} sh -c 'eval "$1"' - {} <<'EOF'
sleep 1; echo 1
sleep 2; echo 2
sleep 3; echo 3
echo 4
EOF
} &

# Script execution continues here while `xargs` is running 
# in the background.
echo "Waiting for commands to finish..."

# Wait for `xargs` to finish, via special variable $!, which contains
# the PID of the most recently started background process.
wait $!

注意:

  • BSD / MacOS的xargs要求指定命令的计数并行运行明确,而GNU xargs允许你指定-P 0要尽可能多的运行尽可能平行。

  • 并行运行的进程的输出将在生成时到达,因此将无法预料的交错

    • parallelOle的回答中所述(大多数平台都不标准),GNU可以方便地在每个进程的基础上对输出进行序列化(分组),并提供许多更高级的功能。

8

有一个非常有用的程序,调用nohup。

     nohup - run a command immune to hangups, with output to a non-tty

4
nohup本身不会在后台运行任何内容,使用nohup并不是在后台运行任务的必要条件或先决条件。它们通常一起使用,但不能解决问题。
Tripleee '18

8

这是我为了在最大n个进程上并行运行而使用的函数(在示例中,n = 4):

max_children=4

function parallel {
  local time1=$(date +"%H:%M:%S")
  local time2=""

  # for the sake of the example, I'm using $2 as a description, you may be interested in other description
  echo "starting $2 ($time1)..."
  "$@" && time2=$(date +"%H:%M:%S") && echo "finishing $2 ($time1 -- $time2)..." &

  local my_pid=$$
  local children=$(ps -eo ppid | grep -w $my_pid | wc -w)
  children=$((children-1))
  if [[ $children -ge $max_children ]]; then
    wait -n
  fi
}

parallel sleep 5
parallel sleep 6
parallel sleep 7
parallel sleep 8
parallel sleep 9
wait

如果将max_children设置为内核数,则此函数将尝试避免空闲内核。


1
不错的代码段,但是在我的bash中找不到“ wait -n”的解释,它说这是一个无效的选项。错字还是我错过了什么?
伊曼纽尔·德沃

1
@EmmanuelDevaux:wait -n需要bash4.3+和它改变了逻辑等待任何指定/隐含过程的终止。
mklement0

如果其中一项任务失败,那我想结束脚本怎么办?
52coder

@ 52coder可以调整功能以捕获失败的孩子,例如:“ $ @” && time2 = $(date +“%H:%M:%S”)&& echo“整理$ 2($ time1-$ time2 )...“ || 错误= 1&。然后测试“如果”部分中的错误,并在需要时中止该功能
arnaldocan

7

您可以尝试ppss。ppss非常强大-您甚至可以创建一个迷你集群。如果您要执行一系列令人尴尬的并行处理,则xargs -P也可能很有用。


7

最近我有一个类似的情况,我需要同时运行多个程序,将它们的输出重定向到单独的日志文件,然后等待它们完成,最后我得到了类似的结果:

#!/bin/bash

# Add the full path processes to run to the array
PROCESSES_TO_RUN=("/home/joao/Code/test/prog_1/prog1" \
                  "/home/joao/Code/test/prog_2/prog2")
# You can keep adding processes to the array...

for i in ${PROCESSES_TO_RUN[@]}; do
    ${i%/*}/./${i##*/} > ${i}.log 2>&1 &
    # ${i%/*} -> Get folder name until the /
    # ${i##*/} -> Get the filename after the /
done

# Wait for the processes to finish
wait

来源:http : //joaoperibeiro.com/execute-multiple-programs-and-redirect-their-outputs-linux/


4

流程生成经理

当然,从技术上来说,这些是进程,并且该程序实际上应该称为进程生成管理器,但这仅是由于BASH在使用&号进行分叉,使用fork()或clone()系统调用时的工作方式它将克隆到一个单独的内存空间中,而不是像pthread_create()这样共享内存的东西。如果BASH支持后者,则每个“执行序列”将以相同的方式运行,并且可以被称为传统线程,同时获得更有效的内存占用。但是,在功能上它是一样的,尽管有点困难,因为每个工作克隆中都没有GLOBAL变量,因此使用进程间通信文件和基本的群信号量来管理关键部分。从BASH分叉当然是这里的基本答案,但是我觉得好像人们知道这一样,但他们实际上是在设法管理产生的内容,而不是仅仅将其分叉而忘了它。这演示了一种管理最多200个分支进程实例的方法,这些实例都访问单个资源。显然,这太过分了,但是我很喜欢写它,所以我一直坚持下去。相应地增加终端的大小。希望这个对你有帮助。

ME=$(basename $0)
IPC="/tmp/$ME.ipc"      #interprocess communication file (global thread accounting stats)
DBG=/tmp/$ME.log
echo 0 > $IPC           #initalize counter
F1=thread
SPAWNED=0
COMPLETE=0
SPAWN=1000              #number of jobs to process
SPEEDFACTOR=1           #dynamically compensates for execution time
THREADLIMIT=50          #maximum concurrent threads
TPS=1                   #threads per second delay
THREADCOUNT=0           #number of running threads
SCALE="scale=5"         #controls bc's precision
START=$(date +%s)       #whence we began
MAXTHREADDUR=6         #maximum thread life span - demo mode

LOWER=$[$THREADLIMIT*100*90/10000]   #90% worker utilization threshold
UPPER=$[$THREADLIMIT*100*95/10000]   #95% worker utilization threshold
DELTA=10                             #initial percent speed change

threadspeed()        #dynamically adjust spawn rate based on worker utilization
{
   #vaguely assumes thread execution average will be consistent
   THREADCOUNT=$(threadcount)
   if [ $THREADCOUNT -ge $LOWER ] && [ $THREADCOUNT -le $UPPER ] ;then
      echo SPEED HOLD >> $DBG
      return
   elif [ $THREADCOUNT -lt $LOWER ] ;then
      #if maxthread is free speed up
      SPEEDFACTOR=$(echo "$SCALE;$SPEEDFACTOR*(1-($DELTA/100))"|bc)
      echo SPEED UP $DELTA%>> $DBG
   elif [ $THREADCOUNT -gt $UPPER ];then
      #if maxthread is active then slow down
      SPEEDFACTOR=$(echo "$SCALE;$SPEEDFACTOR*(1+($DELTA/100))"|bc)
      DELTA=1                            #begin fine grain control
      echo SLOW DOWN $DELTA%>> $DBG
   fi

   echo SPEEDFACTOR $SPEEDFACTOR >> $DBG

   #average thread duration   (total elapsed time / number of threads completed)
   #if threads completed is zero (less than 100), default to maxdelay/2  maxthreads

   COMPLETE=$(cat $IPC)

   if [ -z $COMPLETE ];then
      echo BAD IPC READ ============================================== >> $DBG
      return
   fi

   #echo Threads COMPLETE $COMPLETE >> $DBG
   if [ $COMPLETE -lt 100 ];then
      AVGTHREAD=$(echo "$SCALE;$MAXTHREADDUR/2"|bc)
   else
      ELAPSED=$[$(date +%s)-$START]
      #echo Elapsed Time $ELAPSED >> $DBG
      AVGTHREAD=$(echo "$SCALE;$ELAPSED/$COMPLETE*$THREADLIMIT"|bc)
   fi
   echo AVGTHREAD Duration is $AVGTHREAD >> $DBG

   #calculate timing to achieve spawning each workers fast enough
   # to utilize threadlimit - average time it takes to complete one thread / max number of threads
   TPS=$(echo "$SCALE;($AVGTHREAD/$THREADLIMIT)*$SPEEDFACTOR"|bc)
   #TPS=$(echo "$SCALE;$AVGTHREAD/$THREADLIMIT"|bc)  # maintains pretty good
   #echo TPS $TPS >> $DBG

}
function plot()
{
   echo -en \\033[${2}\;${1}H

   if [ -n "$3" ];then
         if [[ $4 = "good" ]];then
            echo -en "\\033[1;32m"
         elif [[ $4 = "warn" ]];then
            echo -en "\\033[1;33m"
         elif [[ $4 = "fail" ]];then
            echo -en "\\033[1;31m"
         elif [[ $4 = "crit" ]];then
            echo -en "\\033[1;31;4m"
         fi
   fi
      echo -n "$3"
      echo -en "\\033[0;39m"
}

trackthread()   #displays thread status
{
   WORKERID=$1
   THREADID=$2
   ACTION=$3    #setactive | setfree | update
   AGE=$4

   TS=$(date +%s)

   COL=$[(($WORKERID-1)/50)*40]
   ROW=$[(($WORKERID-1)%50)+1]

   case $ACTION in
      "setactive" )
         touch /tmp/$ME.$F1$WORKERID  #redundant - see main loop
         #echo created file $ME.$F1$WORKERID >> $DBG
         plot $COL $ROW "Worker$WORKERID: ACTIVE-TID:$THREADID INIT    " good
         ;;
      "update" )
         plot $COL $ROW "Worker$WORKERID: ACTIVE-TID:$THREADID AGE:$AGE" warn
         ;;
      "setfree" )
         plot $COL $ROW "Worker$WORKERID: FREE                         " fail
         rm /tmp/$ME.$F1$WORKERID
         ;;
      * )

      ;;
   esac
}

getfreeworkerid()
{
   for i in $(seq 1 $[$THREADLIMIT+1])
   do
      if [ ! -e /tmp/$ME.$F1$i ];then
         #echo "getfreeworkerid returned $i" >> $DBG
         break
      fi
   done
   if [ $i -eq $[$THREADLIMIT+1] ];then
      #echo "no free threads" >> $DBG
      echo 0
      #exit
   else
      echo $i
   fi
}

updateIPC()
{
   COMPLETE=$(cat $IPC)        #read IPC
   COMPLETE=$[$COMPLETE+1]     #increment IPC
   echo $COMPLETE > $IPC       #write back to IPC
}


worker()
{
   WORKERID=$1
   THREADID=$2
   #echo "new worker WORKERID:$WORKERID THREADID:$THREADID" >> $DBG

   #accessing common terminal requires critical blocking section
   (flock -x -w 10 201
      trackthread $WORKERID $THREADID setactive
   )201>/tmp/$ME.lock

   let "RND = $RANDOM % $MAXTHREADDUR +1"

   for s in $(seq 1 $RND)               #simulate random lifespan
   do
      sleep 1;
      (flock -x -w 10 201
         trackthread $WORKERID $THREADID update $s
      )201>/tmp/$ME.lock
   done

   (flock -x -w 10 201
      trackthread $WORKERID $THREADID setfree
   )201>/tmp/$ME.lock

   (flock -x -w 10 201
      updateIPC
   )201>/tmp/$ME.lock
}

threadcount()
{
   TC=$(ls /tmp/$ME.$F1* 2> /dev/null | wc -l)
   #echo threadcount is $TC >> $DBG
   THREADCOUNT=$TC
   echo $TC
}

status()
{
   #summary status line
   COMPLETE=$(cat $IPC)
   plot 1 $[$THREADLIMIT+2] "WORKERS $(threadcount)/$THREADLIMIT  SPAWNED $SPAWNED/$SPAWN  COMPLETE $COMPLETE/$SPAWN SF=$SPEEDFACTOR TIMING=$TPS"
   echo -en '\033[K'                   #clear to end of line
}

function main()
{
   while [ $SPAWNED -lt $SPAWN ]
   do
      while [ $(threadcount) -lt $THREADLIMIT ] && [ $SPAWNED -lt $SPAWN ]
      do
         WID=$(getfreeworkerid)
         worker $WID $SPAWNED &
         touch /tmp/$ME.$F1$WID    #if this loops faster than file creation in the worker thread it steps on itself, thread tracking is best in main loop
         SPAWNED=$[$SPAWNED+1]
         (flock -x -w 10 201
            status
         )201>/tmp/$ME.lock
         sleep $TPS
        if ((! $[$SPAWNED%100]));then
           #rethink thread timing every 100 threads
           threadspeed
        fi
      done
      sleep $TPS
   done

   while [ "$(threadcount)" -gt 0 ]
   do
      (flock -x -w 10 201
         status
      )201>/tmp/$ME.lock
      sleep 1;
   done

   status
}

clear
threadspeed
main
wait
status
echo

0

您的脚本应如下所示:

prog1 &
prog2 &
.
.
progn &
wait
progn+1 &
progn+2 &
.
.

假设您的系统一次可以处理n个工作。使用wait一次只能运行n个作业。


-1

使用bashjhttps://sourceforge.net/projects/bashj/),您不仅应该能够运行多个进程(其他人建议的方式),而且还可以运行多个线程在一个由脚本控制的JVM中运行。但是,当然这需要一个Java JDK。线程比进程消耗更少的资源。

这是一个工作代码:

#!/usr/bin/bashj

#!java

public static int cnt=0;

private static void loop() {u.p("java says cnt= "+(cnt++));u.sleep(1.0);}

public static void startThread()
{(new Thread(() ->  {while (true) {loop();}})).start();}

#!bashj

j.startThread()

while [ j.cnt -lt 4 ]
do
  echo "bash views cnt=" j.cnt
  sleep 0.5
done
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.