我有一个制表符分隔的文件,如下所示:
gene v1 v2 v3 v4
g1 NA NA NA NA
g2 NA NA 2 3
g3 NA NA NA NA
g4 1 2 3 2
每行中的字段数是固定的,并且相同。我想从上述文件中删除那些行,其中从第2列到最后一列的每一行的所有字段均为NA。然后输出应如下所示:
gene v1 v2 v3 v4
g2 NA NA 2 3
g4 1 2 3 2
如果您在进行生物信息学研究,为什么不直接使用R
—
qwr
因为我在上游使用命令行工具来生成该文件,并且如果我不必保存文件以在R中打开,我将更喜欢awk或perl解决方案。当然在R中,
—
user3138373
is.na
如果我认为可以删除它,请检查一下
\s\d
区分“好”行和“坏”行。