我的文件包含大约一百万行。在各行中,我有一个名为的字段transactionid
,该字段具有重复值。我需要做的是分别计算它们。
无论一个值重复多少次,都应该只计数一次。
如果您仅可以瞥一眼文件的格式(不一定是数据),就会更容易。
—
Nikhil Mulley 2012年
顺便说一句,您是否希望将该值计算为1,而不考虑它存在多少次,还是希望对出现/重复的次数进行计数?如果您只希望对它进行一次计数,那么如何计算不同的值?您能检查我对您问题的编辑并确认我的口译能力是否正确。
—
Nikhil Mulley 2012年
@Nikhil从问题中可以很清楚地看到:
... No matter of how many times a value is repeated, it should be counted as 1. ...
好的,那么@hesse的回答就可以满足您的需求。
—
Nikhil Mulley,2012年
抱歉,延迟。我无法上网。分隔符为2 |' 字段是字段28。
—
Olgun Kaya 2012年
cat <file_name> | awk -F"|" '{if ((substr($2,0,8)=='20120110')) print $28}' | sort -u | wc -l
if子句用于再次检查日期,似乎很明显:)