用grep在一行中匹配两个字符串


Answers:


189

您可以使用 grep 'string1' filename | grep 'string2'

要么, grep 'string1.*string2\|string2.*string1' filename


5
@AlexanderN确实我不能使它与多工作,那太奇怪了它被接受...
水瓶座电

1
这不是一个多行问题。如果是多行,则grep -P支持Perl样式正则表达式...
Scott Prive 2014年

20
仅当“ string1”和“ string2”都在同一行时才有效。如果要查找带有'string1'或'string2'的行,请参见user45949的答案。
lifeson106

10
第一种选择:将一个grep传递给第二个不会产生OR结果,而产生AND结果。
masukomi 2015年

1
我曾经用过grep -e "string1" -e "string2"
Ravi Dhoriya

197

我认为这是您想要的:

grep -E "string1|string2" filename

我认为这样的答案:

grep 'string1.*string2\|string2.*string1' filename

仅与同时存在两者而不是其中一个或两者都存在的情况匹配。


14
不会grep -e "string1" -e "string2" filename一样吗?
janosdivenyi 2015年

25
这是grep表示string1或string2的方法。问题明确指出他们正在寻找string1和string2。
Orion elenzil 2015年

9
可以肯定的是,这个问题非常精确:How do I match lines that contains *both* strings?
r0estir0bbe

可以用同一行打印吗?
吴毅凡2016年

1
为什么这个答案仍然在这里?这不是问题的答案。
Prometheus

26

要搜索包含所有单词的文件,该单词在任何地方都可以以任何顺序排列:

grep -ril \'action\' | xargs grep -il \'model\' | xargs grep -il \'view_type\'

第一个grep开始进行递归搜索(r),忽略大小写(i)并列出(打印出)与l一个词匹配()的文件的名称('action'与出现在文件中任何位置的带单引号)相同。

后续的搜索将搜索其他术语,以保持不区分大小写并列出匹配的文件。

您将获得的文件的最终列表将是包含这些术语的文件,其顺序为文件中任何位置。


2
同意!我只需要指出,我必须给xargs一个“ -d'\ n'”来处理带有空格的文件名。这在Linux上对我有用: grep -ril 'foo' | xargs -d '\n' grep -il 'bar'
Tommy Harris,

16

如果您有一个针对正则表达式grep-P选项,perl则可以使用

grep -P '(?=.*string1)(?=.*string2)'

这具有使用重叠字符串的优势。使用perlas会更直接一些grep,因为您可以更直接地指定and逻辑:

perl -ne 'print if /string1/ && /string2/'

1
最佳答案。Shell非常简单快捷,但是一旦模式变得复杂,您应该使用Python或Perl(或Awk)。不要试图将头靠在墙上,以证明它可以用纯壳完成(无论如何,这意味着什么)。提醒大家,这些工具可以用“单线”语法使用,这些语法嵌入了现有的shell脚本中。
Scott Prive 2014年

12

您的方法几乎不错,只缺少-w

grep -w 'string1\|string2' filename

1
至少在OS-X和FreeBSD上,它确实有效!我的猜测是您在其他方面(OP尚未定义-希望您不要对除您之外的许多用户给出正确答案)。
狮子座

我在OS-X上。也许我没有正确执行此操作?看看我做了什么:i.imgur.com/PFVlVAG.png
Ariel

1
奇。我希望区别在于没有将文件提取到文件中,但是,如果将我的方法与ls进行管道连接,则会得到您没有的结果:imgur.com/8eTt3Ak.png-两者都在OS-X 10.9.5( “ grep(BSD grep)2.5.1-FreeBSD”)和FreeBSD 10(“ grep(GNU grep)2.5.1-FreeBSD”)。我很好奇你grep -V是什么。
狮子座

1
您的示例对我有用i.imgur.com/K8LM69O.png因此,不同之处在于该方法不会拾取子字符串,它们必须是完整的字符串。我猜您将需要在grep中构造正则表达式来搜索子字符串。像这样的东西:grep -w 'regexp1\|regexp2' filename
Ariel

2
OP通过匹配string1 string2 显示了一个示例,并询问如何匹配包含两个字符串的行。此示例仍然产生OR。
gustafbstrom

7

|正则表达式中的运算符表示或。也就是说,string1或string2将匹配。您可以这样做:

grep 'string1' filename | grep 'string2'

这会将第一个命令的结果通过管道传递给第二个grep。那只会给您同时匹配的行。


1
您的陈述是正确的,但没有回答OP问题
Ben Wheeler

这的确回答了这个问题,这的确是大多数人的写作方式。
彼得·K

7

您可以尝试这样的事情:

(pattern1.*pattern2|pattern2.*pattern1)

4

正如人们所建议的perl和python以及复杂的shell脚本一样,这是一种简单的awk方法:

awk '/string1/ && /string2/' filename

看了对已接受答案的评论:不,这不是多行的;但这也不是问题作者所要的。


3

不要尝试为此使用grep,而应使用awk。要在grep中匹配2个正则表达式R1和R2,您会认为是:

grep 'R1.*R2|R2.*R1'

而在awk中它将是:

awk '/R1/ && /R2/'

但是,如果R2与重叠或为的子集R1呢?该grep命令根本无法工作,而awk命令却可以。假设您要查找包含the和的行heat

$ echo 'theatre' | grep 'the.*heat|heat.*the'
$ echo 'theatre' | awk '/the/ && /heat/'
theatre

您必须为此使用2个抓钩和一个管道:

$ echo 'theatre' | grep 'the' | grep 'heat'
theatre

当然,如果您实际上需要将它们分开,则可以始终使用与grep中所用的相同的regexp来用awk编写,并且有一些替代性的awk解决方案,它们不涉及在所有可能的顺序中重复该regexp。

抛开这些,如果您想扩展您的解决方案以匹配3个正则表达式R1,R2和R3,该怎么办。在grep中,这将是以下较差的选择之一:

grep 'R1.*R2.*R3|R1.*R3.*R2|R2.*R1.*R3|R2.*R3.*R1|R3.*R1.*R2|R3.*R2.*R1' file
grep R1 file | grep R2 | grep R3

而在awk中,它将是简洁,明显,简单,有效的:

awk '/R1/ && /R2/ && /R3/'

现在,如果您实际上想匹配文字字符串S1和S2而不是正则表达式R1和R2,该怎么办?您根本无法在一次调用grep中做到这一点,您必须在调用grep之前编写代码以转义所有RE元字符:

S1=$(sed 's/[^^]/[&]/g; s/\^/\\^/g' <<< 'R1')
S2=$(sed 's/[^^]/[&]/g; s/\^/\\^/g' <<< 'R2')
grep 'S1.*S2|S2.*S1'

或再次使用2抓斗和一根烟斗:

grep -F 'S1' file | grep -F 'S2'

这仍然是一个糟糕的选择,而使用awk时,您仅使用字符串运算符而不是regexp运算符:

awk 'index($0,S1) && index($0.S2)'

现在,如果要在一个段落而不是一行中匹配2个正则表达式怎么办?无法在grep中完成,在awk中是微不足道的:

awk -v RS='' '/R1/ && /R2/'

整个文件怎么样?再次无法在grep和awk中实现微不足道(这一次,为了简洁起见,我将GNU awk用于多字符RS,但是在任何awk中代码都不多,或者您可以选择一个您不会知道的控制字符在RS的输入中执行相同的操作):

awk -v RS='^$' '/R1/ && /R2/'

所以-如果您要在一行,段落或文件中找到多个正则表达式或字符串,则不要使用grep,请使用awk。


是否awk '/R1/ && /R2/'区分大小写?
Prometheus

@Hashim-不 要使其对GNU awk awk -v IGNORECASE=1 '/R1/ && /R2/'和任何awk 都不区分大小写awk '{x=toupper($0)} x~/R1/ && x~/R2/'
Ed Morton


2

找到的行仅以6个空格开头并以:

 cat my_file.txt | grep
 -e '^      .*(\.c$|\.cpp$|\.h$|\.log$|\.out$)' # .c or .cpp or .h or .log or .out
 -e '^      .*[0-9]\{5,9\}$' # numers between 5 and 9 digist
 > nolog.txt

2

假设我们需要在文件testfile中查找多个单词的计数。有两种解决方法

1)使用带有正则表达式匹配模式的grep命令

grep -c '\<\(DOG\|CAT\)\>' testfile

2)使用egrep命令

egrep -c 'DOG|CAT' testfile 

使用egrep时,您不必担心表达式,只需用管道分隔符将单词分开即可。


2

git grep

这是git grep与多种模式一起使用的语法:

git grep --all-match --no-index -l -e string1 -e string2 -e string3 file

你也可以用结合模式的布尔表达式,如--and--or--not

检查man git-grep帮助。


--all-match提供多个模式表达式时,指定此标志可将匹配项限制为具有所有行都匹配的文件

--no-index 搜索当前目录中不受Git管理的文件。

-l/--files-with-matches /--name-only只显示文件名。

-e下一个参数是模式。默认是使用基本的regexp。

要考虑的其他参数:

--threads 要使用的grep工作线程数。

-q/ --quiet/ --silent不匹配的输出线; 匹配时以状态0退出。

要更改图案类型,您还可以使用-G/ --basic-regexp(默认),-F/ --fixed-strings-E/ --extended-regexp-P/ --perl-regexp-f file和其他。

有关:

有关“ 或”运算,请参见:


2
一直认为“ git grep”只能在git存储库中运行。我不知道--no-index选项。感谢您指出!
Kamaraju Kusumanchi '19年

1

将您要grep的字符串放入文件中

echo who    > find.txt
echo Roger >> find.txt
echo [44][0-9]{9,} >> find.txt

然后使用-f搜索

grep -f find.txt BIG_FILE_TO_SEARCH.txt 

1
grep '(string1.*string2 | string2.*string1)' filename

将以任意顺序与string1和string2对齐


至少与前两个答案有何不同?
luk2302

1
grep -i -w 'string1\|string2' filename

这适用于精确的单词匹配和不区分大小写的单词匹配,因为使用-i


0

对于多行匹配:

echo -e "test1\ntest2\ntest3" |tr -d '\n' |grep "test1.*test3"

要么

echo -e "test1\ntest5\ntest3" >tst.txt
cat tst.txt |tr -d '\n' |grep "test1.*test3\|test3.*test1"

我们只需要删除换行符就可以了!


0

您应该grep是这样的:

$ grep 'string1' file | grep 'string2'

1
这执行逻辑与。OP要求逻辑或。
本·惠勒

1
@BenWheeler:从问题开始:“那么我如何只将包含两个字符串的行与grep匹配?”
埃里克一世

0

我经常遇到与您相同的问题,我只是写了一段脚本:

function m() { # m means 'multi pattern grep'

    function _usage() {
    echo "usage: COMMAND [-inH] -p<pattern1> -p<pattern2> <filename>"
    echo "-i : ignore case"
    echo "-n : show line number"
    echo "-H : show filename"
    echo "-h : show header"
    echo "-p : specify pattern"
    }

    declare -a patterns
    # it is important to declare OPTIND as local
    local ignorecase_flag  filename linum header_flag colon result OPTIND

    while getopts "iHhnp:" opt; do
    case $opt in
        i)
        ignorecase_flag=true ;;
        H)
        filename="FILENAME," ;;
        n)
        linum="NR," ;;
        p)
        patterns+=( "$OPTARG" ) ;;
        h)
        header_flag=true ;;
        \?)
        _usage
        return ;;
    esac
    done

    if [[ -n $filename || -n $linum ]]; then
    colon="\":\","
    fi

    shift $(( $OPTIND - 1 ))

    if [[ $ignorecase_flag == true ]]; then
    for s in "${patterns[@]}"; do
            result+=" && s~/${s,,}/"
    done
    result=${result# && }
    result="{s=tolower(\$0)} $result"
    else
    for s in "${patterns[@]}"; do
            result="$result && /$s/"
    done
    result=${result# && }
    fi

    result+=" { print "$filename$linum$colon"\$0 }"

    if [[ ! -t 0 ]]; then       # pipe case
    cat - | awk "${result}"
    else
    for f in "$@"; do
        [[ $header_flag == true ]] && echo "########## $f ##########"
        awk "${result}" $f
    done
    fi
}

用法:

echo "a b c" | m -p A 
echo "a b c" | m -i -p A # a b c

如果愿意,可以将其放在.bashrc中。


0

当两个字符串都按顺序排列时,请在on grep命令之间插入一个模式:

$ grep -E "string1(?.*)string2" file

如果以下行包含在名为的文件中,则为示例Dockerfile

FROM python:3.8 as build-python
FROM python:3.8-slim

要获得包含字符串行:FROM pythonas build-python再利用:

$ grep -E "FROM python:(?.*) as build-python" Dockerfile

然后输出将仅显示包含两个字符串的行:

FROM python:3.8 as build-python

-2

ripgrep

这是使用示例rg

rg -N '(?P<p1>.*string1.*)(?P<p2>.*string2.*)' file.txt

它是最快的grepping工具之一,因为它基于Rust的regex引擎构建该使用有限自动机,SIMD和积极的文字优化来使搜索变得非常快。

使用它,尤其是在处理大数据时。

另请参阅GH-875上的相关功能要求。


1
这个答案不太正确。命名的捕获组是不必要的,并且当string2出现在之前时不会处理这种情况string1。解决此问题的最简单方法是rg string1 file.txt | rg string2
BurntSushi19年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.