Answers:
要删除行并将输出打印到标准输出,请执行以下操作:
sed '/pattern to match/d' ./infile
要直接修改文件–不适用于BSD sed:
sed -i '/pattern to match/d' ./infile
相同,但是对于BSD sed(Mac OS X和FreeBSD)–不适用于GNU sed:
sed -i '' '/pattern to match/d' ./infile
要直接修改文件(并创建备份)–与BSD和GNU sed一起使用:
sed -i.bak '/pattern to match/d' ./infile
sed '/pattern to match/d' ./infile > ./newfile
或者如果您要进行就地编辑,则可以按那样将-i
标志添加到sed sed -i '/pattern to match/d' ./infile
。需要注意的是,-i
标志要求GNU sed和不可移植
sed -i.backup '/pattern to match/d' ./infile
)使我可以进行就地编辑。
sed
不受版本控制的任何文件。
sed -i '' '/pattern/d' ./infile
。
除了删除具有特定字符串的行外,还有许多其他方法sed
:
awk '!/pattern/' file > temp && mv temp file
ruby -i.bak -ne 'print if not /test/' file
perl -ni.bak -e "print unless /pattern/" file
while read -r line
do
[[ ! $line =~ pattern ]] && echo "$line"
done <file > o
mv o file
grep -v "pattern" file > temp && mv temp file
当然sed
(打印反面比实际删除要快):
sed -n '/pattern/!p' file
sed
示例具有不同的行为,只会发生变化!应该是这样的 sed -n -i '/pattern/!p' file
。
grep -v "pattern" file > temp; mv temp file
这可能适用于其他一些示例,具体取决于返回值。
seq -f %f 10000000 >foo.txt
。sed d:time sed -i '' '/6543210/d' foo.txt
实际0m9.294s。sed!p:time sed -i '' -n '/6543210/!p' foo.txt
实数0m13.671s。(对于较小的文件,差异更大。)
您可以使用sed替换文件中的行。但是,这似乎比使用grep取反将其慢进第二个文件,然后将第二个文件移到原始文件上要慢得多。
例如
sed -i '/pattern/d' filename
要么
grep -v "pattern" filename > filename2; mv filename2 filename
无论如何,第一个命令在我的计算机上花费的时间要长3倍。
sed '/pattern/d' filename > filename2; mv filename2 filename
使用GNU的简单方法sed
:
sed --in-place '/some string here/d' yourfile
-r
选项(或-E
,具体取决于您的版本)。这样就可以使用正则表达式元字符+
,?
,{...}
和(...)
。
您可以考虑使用ex
(这是标准的基于Unix命令的编辑器):
ex +g/match/d -cwq file
哪里:
+
执行给定的Ex命令(man ex
),与-c
执行wq
(写入和退出)相同g/match/d
-用ex命令删除给定的行match
,请参阅:g的幂上面的示例是一个POSIX兼容方法,用于按此方式就地编辑文件 Unix.SE和POSIX规范上的ex
文章。
的不同之sed
处在于:
sed
是S队 ED,不是文件编辑器。Bash常见问题
除非您喜欢不可移植的代码,否则I / O开销和其他一些不良影响。因此,基本上某些参数(例如in-place / -i
)是非标准的FreeBSD扩展,在其他操作系统上可能不可用。
man ex
它给我的男人vim
,似乎ex
是VIM的一部分......如果我理解正确的手段模式语法match
是vimregex.com这是类似的,但不同的,以POSIX和PCRE口味?
我用一个包含大约345 000行的文件做了一个小的基准测试。的方式grep
似乎比速度快15倍sed
在这种情况下,方法。
我尝试过在设置LC_ALL = C和不设置LC_ALL = C的情况下,似乎都不会显着改变计时。搜索字符串(CDGA_00004.pdbqt.gz.tar)在文件中间。
以下是命令和时间:
time sed -i "/CDGA_00004.pdbqt.gz.tar/d" /tmp/input.txt
real 0m0.711s
user 0m0.179s
sys 0m0.530s
time perl -ni -e 'print unless /CDGA_00004.pdbqt.gz.tar/' /tmp/input.txt
real 0m0.105s
user 0m0.088s
sys 0m0.016s
time (grep -v CDGA_00004.pdbqt.gz.tar /tmp/input.txt > /tmp/input.tmp; mv /tmp/input.tmp /tmp/input.txt )
real 0m0.046s
user 0m0.014s
sys 0m0.019s
要获得类似结果的结果,grep
可以执行以下操作:
echo "$(grep -v "pattern" filename)" >filename
bash
shell或类似的东西有用(不适用于tcsh
)。
万一有人想为字符串的精确匹配做某事,您可以-w
在grep-w中使用整个标志。也就是说,例如,如果要删除编号为11的行,而保留编号为111的行:
-bash-4.1$ head file
1
11
111
-bash-4.1$ grep -v "11" file
1
-bash-4.1$ grep -w -v "11" file
1
111
-f
如果您想一次排除几个确切的模式,它也可以与该标志一起使用。如果“黑名单”是您要从“文件”中删除的每一行具有多个模式的文件:
grep -w -v -f blacklist file
-w, --word-regexp Select only those lines containing matches that form whole words.
主场迎战-x, --line-regexp Select only those matches that exactly match the whole line. For a regular expression pattern, this is like parenthesizing the pattern and then surrounding it with ^ and $.
cat filename | grep -v "pattern" > filename.1
mv filename.1 filename
在控制台中显示已处理的文本
cat filename | sed '/text to remove/d'
将已处理的文本保存到文件中
cat filename | sed '/text to remove/d' > newfile
将已处理的文本信息附加到现有文件中
cat filename | sed '/text to remove/d' >> newfile
处理已处理的文本,在这种情况下,请删除更多已删除的行
cat filename | sed '/text to remove/d' | sed '/remove this too/d' | more
该| more
会同时显示在一个页面中的文本块。