如何从文本文件中删除包含特定字符串的所有行?


Answers:


2758

要删除行并将输出打印到标准输出,请执行以下操作:

sed '/pattern to match/d' ./infile

要直接修改文件–不适用于BSD sed:

sed -i '/pattern to match/d' ./infile

相同,但是对于BSD sed(Mac OS X和FreeBSD)–不适用于GNU sed:

sed -i '' '/pattern to match/d' ./infile

要直接修改文件(并创建备份)–与BSD和GNU sed一起使用:

sed -i.bak '/pattern to match/d' ./infile

13
谢谢,但是它似乎并没有从文件中删除它,而是只打印出没有该字符串的文本文件内容。
发条橙

115
@A Clockwork:是的,您需要使用类似的命令将输出重定向到新文件,sed '/pattern to match/d' ./infile > ./newfile或者如果您要进行就地编辑,则可以按那样将-i标志添加到sed sed -i '/pattern to match/d' ./infile。需要注意的是,-i标志要求GNU sed和不可移植
SiegeX

16
对于某些口味的sed;sed的“ -i”标志要求提供扩展名。(例如sed -i.backup '/pattern to match/d' ./infile)使我可以进行就地编辑。
avelis

9
@SiegeX更好的是,不要将命令应用于sed不受版本控制的任何文件。
MatrixFrog

84
Mac OS X用户需要注意的另一点:由于某种原因,-i标志要求传递一个参数,即使它只是一个空字符串,如sed -i '' '/pattern/d' ./infile
geerlingguy

629

除了删除具有特定字符串的行外,还有许多其他方法sed

AWK

awk '!/pattern/' file > temp && mv temp file

红宝石(1.9+)

ruby -i.bak -ne 'print if not /test/' file

佩尔

perl -ni.bak -e "print unless /pattern/" file

Shell(bash 3.2及更高版本)

while read -r line
do
  [[ ! $line =~ pattern ]] && echo "$line"
done <file > o
mv o file

GNU grep

grep -v "pattern" file > temp && mv temp file

当然sed(打印反面比实际删除要快):

sed -n '/pattern/!p' file

4
如何删除带有图案的特定行以及紧接其上方的行?我可以在不同数据之间使用数千条这样的行。
oortcloud_domicile 2013年

1
在OS / X上,shell变体不保留前导空格,但是grep -v变体对我来说效果很好。
Paul Beusterien 2014年

13
sed示例具有不同的行为,只会发生变化!应该是这样的 sed -n -i '/pattern/!p' file
caesarsol 2014年

8
当每一行都与模式匹配时,grep版本不起作用。更好地做:grep -v "pattern" file > temp; mv temp file这可能适用于其他一些示例,具体取决于返回值。
克里斯·梅斯

1
“打印反色比实际删除要快”-不在我的机器上(2012 MacBook Air,OS X 10.13.2)。创建文件:seq -f %f 10000000 >foo.txt。sed d:time sed -i '' '/6543210/d' foo.txt实际0m9.294s。sed!p:time sed -i '' -n '/6543210/!p' foo.txt实数0m13.671s。(对于较小的文件,差异更大。)
jcsahnwaldt说GoFundMonica

252

您可以使用sed替换文件中的行。但是,这似乎比使用grep取反将其慢进第二个文件,然后将第二个文件移到原始文件上要慢得多。

例如

sed -i '/pattern/d' filename      

要么

grep -v "pattern" filename > filename2; mv filename2 filename

无论如何,第一个命令在我的计算机上花费的时间要长3倍。


19
也要投票,只是因为您尝试过性能比较!
anuragw

4
+1用于提供使用grep行覆盖当前文件的选项。
Rhyuk

2
第二个“ grep”解决方案也适用于大文件
simoes 2014年

3
我很好奇性能差异会如何sed '/pattern/d' filename > filename2; mv filename2 filename
皮特2014年

8
(使用ubuntu的/ usr / share / dict / words)grep和mv:0.010秒| sed就位:0.197s | sed和mv:0.031秒
ReactiveRaven

77

使用GNU的简单方法sed

sed --in-place '/some string here/d' yourfile

55
对于不熟悉此Q&A线程并且是Shell脚本新手的其他人来说,这是一个方便的技巧:短选项对于一次在命令行上使用是很好的选择,但是长选项应该在脚本中更可取,因为它们更具可读性。
丹尼斯

3
+1 --in-place标志。我需要在权限保护的文件上进行测试。(必须进行一些用户清理。)
Bee Kay

8
请注意,long选项仅在GNU sed上可用。Mac和BSD用户将需要以这种方式安装gsed。
马特

另一个提示:如果您的正则表达式似乎不匹配,请尝试使用该-r选项(或-E,具体取决于您的版本)。这样就可以使用正则表达式元字符+?{...}(...)
rjh

当磁盘上没有更多空间并且您不能将文本复制到另一个文件时,这是正确的答案。这个命令做了什么质疑?
ferreirabraga

38

您可以考虑使用ex(这是标准的基于Unix命令的编辑器):

ex +g/match/d -cwq file

哪里:

  • +执行给定的Ex命令(man ex),与-c执行wq(写入和退出)相同
  • g/match/d-用ex命令删除给定的行match,请参阅:g的幂

上面的示例是一个POSIX兼容方法,用于按此方式就地编辑文件 Unix.SEPOSIX规范上的ex文章


的不同之sed处在于:

sedS ED,不是文件编辑器。Bash常见问题

除非您喜欢不可移植的代码,否则I / O开销和其他一些不良影响。因此,基本上某些参数(例如in-place / -i)是非标准的FreeBSD扩展,在其他操作系统上可能不可用。


5
这是伟大的......当我做man ex它给我的男人vim,似乎ex是VIM的一部分......如果我理解正确的手段模式语法matchvimregex.com这是类似的,但不同的,以POSIX和PCRE口味?
Anentropic

1
:g POSIX兼容命令,但有一些细微差别。我认为PCRE是基于此的。
kenorb '16

16

我在Mac上为此苦苦挣扎。另外,我需要使用变量替换来做到这一点。

所以我用了:

sed -i '' "/$pattern/d" $file

这里$file又是需要删除的文件,$pattern要匹配的删除模式。

''从此评论中选择了。

这里要注意的一点是使用双引号"/$pattern/d"。当我们使用单引号时,变量将不起作用。


3
Mac sed需要在之后的参数-i,因此,如果您不希望备份,则仍必须添加一个空字符串:-i ''
wisbucky

供外壳使用sed -i "/$pattern/d" $file。谢谢您的回答。
ashwaqar

14

我用一个包含大约345 000行的文件做了一个小的基准测试。的方式grep似乎比速度快15倍sed在这种情况下,方法。

我尝试过在设置LC_ALL = C和不设置LC_ALL = C的情况下,似乎都不会显着改变计时。搜索字符串(CDGA_00004.pdbqt.gz.tar)在文件中间。

以下是命令和时间:

time sed -i "/CDGA_00004.pdbqt.gz.tar/d" /tmp/input.txt

real    0m0.711s
user    0m0.179s
sys     0m0.530s

time perl -ni -e 'print unless /CDGA_00004.pdbqt.gz.tar/' /tmp/input.txt

real    0m0.105s
user    0m0.088s
sys     0m0.016s

time (grep -v CDGA_00004.pdbqt.gz.tar /tmp/input.txt > /tmp/input.tmp; mv /tmp/input.tmp /tmp/input.txt )

real    0m0.046s
user    0m0.014s
sys     0m0.019s

您在哪个平台上?您使用哪个版本的sed / perl / grep?
hagello

我使用的平台是Linux(Gentoo)。sed版本是GNU sed v 4.2.2,perl版本是perl 5(我无法确定测试时使用的是哪个修订版),而grep(GNU)是3.0版。
Jadzia

14

您还可以使用以下命令:

 grep -v 'pattern' filename

这里-v仅打印您的图案以外的内容(这意味着反转匹配)。


如何删除目录中包含特定字符串的行
namannimmo

13

要获得类似结果的结果,grep可以执行以下操作:

echo "$(grep -v "pattern" filename)" >filename

4
这仅对bashshell或类似的东西有用(不适用于tcsh)。
esmit 2015年


4
perl -i    -nle'/regexp/||print' file1 file2 file3
perl -i.bk -nle'/regexp/||print' file1 file2 file3

第一个命令就地编辑文件(-i)。

第二个命令执行相同的操作,但是通过在文件名中添加.bk来保留原始文件的副本或备份(.bk可以更改为任何内容)。


2

echo -e "/thing_to_delete\ndd\033:x\n" | vim file_to_edit.txt


2

万一有人想为字符串的精确匹配做某事,您可以-w在grep-w中使用整个标志。也就是说,例如,如果要删除编号为11的行,而保留编号为111的行:

-bash-4.1$ head file
1
11
111

-bash-4.1$ grep -v "11" file
1

-bash-4.1$ grep -w -v "11" file
1
111

-f如果您想一次排除几个确切的模式,它也可以与该标志一起使用。如果“黑名单”是您要从“文件”中删除的每一行具有多个模式的文件:

grep -w -v -f blacklist file

有点误导。-w, --word-regexp Select only those lines containing matches that form whole words.主场迎战-x, --line-regexp Select only those matches that exactly match the whole line. For a regular expression pattern, this is like parenthesizing the pattern and then surrounding it with ^ and $.
Sai


0

在控制台中显示已处理的文本

cat filename | sed '/text to remove/d' 

将已处理的文本保存到文件中

cat filename | sed '/text to remove/d' > newfile

将已处理的文本信息附加到现有文件中

cat filename | sed '/text to remove/d' >> newfile

处理已处理的文本,在这种情况下,请删除更多已删除的行

cat filename | sed '/text to remove/d' | sed '/remove this too/d' | more

| more会同时显示在一个页面中的文本块。


0

你可以用好老ed编辑文件以类似的方式来回答使用ex。在这种情况下,最大的区别是ed它通过标准输入获取命令,而不是像excan 那样作为命令行参数。在脚本中使用它时,通常的适应方法是使用printf管道将命令传递给它:

printf "%s\n" "g/pattern/d" w | ed -s filename

或带有heredoc:

ed -s filename <<EOF
g/pattern/d
w
EOF
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.