我有一个以下格式的大文件:
2 1019 0 12
2 1019 3 0
2 1021 0 2
2 1021 2 0
2 1022 4 5
2 1030 0 1
2 1030 5 0
2 1031 4 4
如果第2列中的值匹配,我想对两行的第3列和第4 列中的值求和,否则仅对唯一行中的值求和。
所以我希望的输出看起来像这样:
2 1019 15
2 1021 4
2 1022 9
2 1030 6
2 1031 8
我能够使用或根据第2列对文件进行排序,并使用来对最后几列求和,但仅适用于单独的行,而不适用于第2 列匹配的两行。awk
sort
awk
1
那第1列呢?
—
格伦·杰克曼(Glenn Jackman)2015年
@glennjackman:在每个文件中,列1的值相同。它用作文件的标识符(我有45个标识符),并将用于某些下游过程。对于我的问题,它也可能会被忽略(或删除),然后再次添加。
—
TomPio
或者,以
—
glenn jackman
$1 $2
键为准。