我有一个看起来像这样的文件:
ID101     G    T     freq=.5     nonetype     ANC=.1     addinfor
ID102     A    T     freq=.3     ANC=.01    addinfor
ID102     A    T     freq=.01     type=1     ALT=0.022    ANC=.02    addinfor如您所见,每行的列数略有不同。我特别想要第1、2、3、4列和以ANC=
所需的输出:
ID101     G    T     freq=.5     ANC=.1
ID102     A    T     freq=.3     ANC=.01
ID102     A    T     freq=.01    ANC=.02我通常使用aawk命令来解析文件:
awk 'BEGIN {OFS = "\t"} {print $1, $2, $3, $4}'有没有简单的方法可以更改此命令以使其在这种情况下工作?
我认为这样可能有效:
awk '{for(j=1;j<=NF;j++){if($j~/^ANC=/){print $j}}}'但是,如何编辑它也可以打印第一列?
i=5办?