我有一个看起来像这样的文件:
ID101 G T freq=.5 nonetype ANC=.1 addinfor
ID102 A T freq=.3 ANC=.01 addinfor
ID102 A T freq=.01 type=1 ALT=0.022 ANC=.02 addinfor
如您所见,每行的列数略有不同。我特别想要第1、2、3、4列和以ANC=
所需的输出:
ID101 G T freq=.5 ANC=.1
ID102 A T freq=.3 ANC=.01
ID102 A T freq=.01 ANC=.02
我通常使用aawk命令来解析文件:
awk 'BEGIN {OFS = "\t"} {print $1, $2, $3, $4}'
有没有简单的方法可以更改此命令以使其在这种情况下工作?
我认为这样可能有效:
awk '{for(j=1;j<=NF;j++){if($j~/^ANC=/){print $j}}}'
但是,如何编辑它也可以打印第一列?
i=5
办?