在Unix shell上加一列数字


198

给定中的文件列表files.txt,我可以得到它们的大小列表,如下所示:

cat files.txt | xargs ls -l | cut -c 23-30

产生这样的事情:

  151552
  319488
 1536000
  225280

如何获得所有这些数字的总数

Answers:


383
... | paste -sd+ - | bc

是我发现的最短的一个(来自UNIX命令行博客)。

编辑:添加了-可移植性的参数,谢谢@Dogbert和@Owen。


真好 最后需要的-在Solaris太
欧文乙

8
alias sum="paste -sd+ - | bc"添加到外壳完成中,感谢队友
slf 2014年

. . .| x=$(echo <(cat)); echo $((0+${x// /+}+0))如果您一直都想参加bash:
qneill

13
@slf,当心,您只是超载/usr/bin/sum
qneill 2015年

3
当心,bc在某些系统上不可用!awk另一方面,(我认为)要符合POSIX要求。
vktec

154

开始

cat files.txt | xargs ls -l | cut -c 23-30 | 
  awk '{total = total + $1}END{print total}'

34
使用awk是个好主意,但是为什么要保留cut呢?这是一个可预见的列数,所以使用... | xargs ls -l | awk '{total = total + $5}{END{print total}'
dmckee ---前主持人小猫

3
您当然是正确的-将附加到已经存在的内容的末尾比较容易:-)
Greg Reynolds

2
@dmckee的答案中的一个括号太多了:)
Jan-Philip Gehrcke博士

7
为了使这个有点短,你可以使用total+=$1,而不是total = total + $1
vktec

10

除了使用cut来从ls -l的输出中获取文件大小外,还可以直接使用:

$ cat files.txt | xargs ls -l | awk '{total += $5} END {print "Total:", total, "bytes"}'

Awk将“ $ 5”解释为第五列。这是ls -l中的列,它为您提供文件大小。


10

如果文件名中有空格,cat将不起作用。这是一个perl单一代码。

perl -nle 'chomp; $x+=(stat($_))[7]; END{print $x}' files.txt

8
python3 -c"import os; print(sum(os.path.getsize(f) for f in open('files.txt').read().split()))"

或者,如果您只想对数字求和,则输入:

python3 -c"import sys; print(sum(int(x) for x in sys.stdin))"

1
... | python -c'import sys; print(sum(int(x) for x in sys.stdin))'当python 2在今年年底消失时。
同名的

don @ oysters:〜/ Document $猫税| python3 -c“导入系统;打印(sys.stdin中x的sum(int(int)x)))”回溯(最近一次调用):文件“ <string>”,第1行,在<module>中,文件“ <string >”,第1行,在<genexpr> ValueError异常:对于int()与底座10无效字面: '\ N'
不要亮


5

当您拥有stat时,整个ls -l以及随后的cut都是相当复杂的。它也容易受到ls -l确切格式的影响(直到我更改了cut的列号后才起作用)

此外,还修复了cat无用用法

<files.txt  xargs stat -c %s | paste -sd+ - | bc

2
嗯 使用Unix已有32年了,从不知道它与Unix <infile command是一样的(并且比更好)command <infile
卡米尔·古德塞内

5

如果您尚未安装BC,请尝试

echo $(( $(... | paste -sd+ -) ))

代替

... | paste -sd+ - | bc

$( ) <-返回执行命令的值

$(( 1+2 )) <-返回评估结果

echo <-将其回显到屏幕


4

如果只想使用没有awk或其他解释器的shell脚本,则可以使用以下脚本:

#!/bin/bash

total=0

for number in `cat files.txt | xargs ls -l | cut -c 23-30`; do
   let total=$total+$number
done

echo $total

3

我会改用“ du”。

$ cat files.txt | xargs du -c | tail -1
4480    total

如果您只想要数字:

cat files.txt | xargs du -c | tail -1 | awk '{print $1}'

5
磁盘使用率!=文件大小。du报告磁盘使用情况。
0x6adb015

4
我认为-b开关可以使du满足我的需求。
RichieHindle

@ 0x6adb015好的知识。谢谢,我还没有意识到。
MichaelJones

3
对于OP想要添加数字列的特定原因,这是一个有用的答案,但是对于一般的数字添加情况,它不够用。(我本人一直都使用“ du”,但是我来这里是为了寻找命令​​行数学。:
Michael H.

12
files.txt大的时候这是行不通的。如果传递给的参数数量xargs达到某个阈值,则会在多次调用时将其分解du。最后显示的总数是最后一次调用的总数du,而不是整个列表的总数。
马修·西蒙诺


1

管道到鹰嘴:

 cat files.txt | xargs ls -l | cut -c 23-30 | gawk 'BEGIN { sum = 0 } // { sum = sum + $0 } END { print sum }'

1

这是我的

cat files.txt | xargs ls -l | cut -c 23-30 | sed -e :a -e '$!N;s/\n/+/;ta' | bc

6
+1一次证明所有语言都比perl丑陋:)
bdonlan

1
#
#       @(#) addup.sh 1.0 90/07/19
#
#       Copyright (C) <heh> SjB, 1990
#       Adds up a column (default=last) of numbers in a file.
#       95/05/16 updated to allow (999) negative style numbers.


case $1 in

-[0-9])

        COLUMN=`echo $1 | tr -d -`

        shift

;;

*)

        COLUMN="NF"

;;

esac

echo "Adding up column .. $COLUMN .. of file(s) .. $*"

nawk  ' OFMT="%.2f"                                       # 1 "%12.2f"

        { x = '$COLUMN'                                   # 2

          neg = index($x, "$")                            # 3

          if (neg > 0) X = gsub("\\$", "", $x)

          neg = index($x, ",")                            # 4

          if (neg > 1) X = gsub(",", "", $x)

          neg = index($x, "(")                            # 8 neg (123 & change

          if (neg > 0) X = gsub("\\(", "", $x)

          if (neg > 0) $x = (-1 * $x)                     # it to "-123.00"

          neg = index($x, "-")                            # 5

          if (neg > 1) $x = (-1 * $x)                     # 6

          t += $x                                         # 7

          print "x is <<<", $x+0, ">>> running balance:", t

        } ' $*


# 1.  set numeric format to eliminate rounding errors
# 1.1 had to reset numeric format from 12.2f to .2f 95/05/16
#     when a computed number is assigned to a variable ( $x = (-1 * $x) )
#     it causes $x to use the OFMT so -1.23 = "________-1.23" vs "-1.23"
#     and that causes my #5 (negative check) to not work correctly because
#     the index returns a number >1 and to the neg neg than becomes a positive
#     this only occurs if the number happened to b a "(" neg number
# 2.  find the field we want to add up (comes from the shell or defaults
#     to the last field "NF") in the file
# 3.  check for a dollar sign ($) in the number - if there get rid of it
#     so we may add it correctly - $12 $1$2 $1$2$ $$1$$2$$ all = 12
# 4.  check for a comma (,) in the number - if there get rid of it so we
#     may add it correctly - 1,2 12, 1,,2 1,,2,, all = 12   (,12=0)
# 5.  check for negative numbers
# 6.  if x is a negative number in the form 999- "make" it a recognized
#     number like -999 - if x is a negative number like -999 already
#     the test fails (y is not >1) and this "true" negative is not made
#     positive
# 7.  accumulate the total
# 8.  if x is a negative number in the form (999) "make it a recognized
#     number like -999
# * Note that a (-9) (neg neg number) returns a postive
# * Mite not work rite with all forms of all numbers using $-,+. etc. *

1

我喜欢用...

echo "
1
2
3 " | sed -e 's,$, + p,g' | dc 

他们将显示每行的总和...

适用于这种情况:

ls -ld $(< file.txt) | awk '{print $5}' | sed -e 's,$, + p,g' | dc 

总计是最后一个值...


1
cat files.txt | awk '{ total += $1} END {print total}'

您可以使用awk进行相同的操作,甚至跳过非整数

$ cat files.txt
1
2.3
3.4
ew
1

$ cat files.txt | awk '{ total += $1} END {print total}'
7.7

或者您可以使用ls命令并计算可读的输出

$ ls -l | awk '{ sum += $5} END  {hum[1024^3]="Gb"; hum[1024^2]="Mb"; hum[1024]="Kb"; for (x=1024^3; x>=1024; x/=1024) { if (sum>=x) { printf "%.2f %s\n",sum/x,hum[x]; break; } } if (sum<1024) print "1kb"; }'
15.69 Mb

$ ls -l *.txt | awk '{ sum += $5} END  {hum[1024^3]="Gb"; hum[1024^2]="Mb"; hum[1024]="Kb"; for (x=1024^3; x>=1024; x/=1024) { if (sum>=x) { printf "%.2f %s\n",sum/x,hum[x]; break; } } if (sum<1024) print "1kb"; }'
2.10 Mb

您甚至不需要管道:awk '{ total += $1} END {print total}' files.txt更快
bmv

0

我认为,最简单的解决方案是“ expr” unix命令:

s=0; 
for i in `cat files.txt | xargs ls -l | cut -c 23-30`
do
   s=`expr $s + $i`
done
echo $s

0

纯扑

total=0; for i in $(cat files.txt | xargs ls -l | cut -c 23-30); do 
total=$(( $total + $i )); done; echo $total

0
sizes=( $(cat files.txt | xargs ls -l | cut -c 23-30) )
total=$(( $(IFS="+"; echo "${sizes[*]}") ))

或者您可以在阅读尺码时将它们加起来

declare -i total=0
while read x; total+=x; done < <( cat files.txt | xargs ls -l | cut -c 23-30 )

如果您不在乎咬的大小和块,可以

declare -i total=0
while read s junk; total+=s; done < <( cat files.txt | xargs ls -s )

0

如果您有R,则可以使用:

> ... | Rscript -e 'print(sum(scan("stdin")));'
Read 4 items
[1] 2232320

由于我对R感到很满意,所以实际上我对这样的事情有几个别名,因此我可以在bash不记住该语法的情况下使用它们。例如:

alias Rsum=$'Rscript -e \'print(sum(scan("stdin")));\''

让我做

> ... | Rsum
Read 4 items
[1] 2232320

启示:是否有一种方法可以在单个命令中获取数字列表的最小值,最大值,中位数和平均值?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.