Java:获取字符串中匹配项位置的方法?


138
String match = "hello";
String text = "0123456789hello0123456789";

int position = getPosition(match, text); // should be 10, is there such a method?

Answers:


258

执行此操作的方法家族是:

返回指定子字符串的第一个(或最后一个)出现在此字符串中的索引[ 从指定索引处开始向前(或向后搜索)]。


String text = "0123hello9012hello8901hello7890";
String word = "hello";

System.out.println(text.indexOf(word)); // prints "4"
System.out.println(text.lastIndexOf(word)); // prints "22"

// find all occurrences forward
for (int i = -1; (i = text.indexOf(word, i + 1)) != -1; i++) {
    System.out.println(i);
} // prints "4", "13", "22"

// find all occurrences backward
for (int i = text.length(); (i = text.lastIndexOf(word, i - 1)) != -1; i++) {
    System.out.println(i);
} // prints "22", "13", "4"

2
哈哈,刚刚在while循环内实现了一个作业,然后在for循环内发布了作业+1
hhh 2010年

4
@polygenelubricants-您的“查找所有出现的例子”很聪明。但是,如果对代码进行审查,您将获得有关代码可维护性的讲座。
Stephen C

3
你会怎么写?老实说,因为我以前没有专业的代码审查经验。
polygenelubricants 2010年

1
在查找所有出现的情况中,我们可以编写i + = word.length()代替i ++。它应该稍微快一点。

如果匹配一个字符,则第一个循环将无法找到所有位置。for循环的第二条语句不需要+1,因为第三条语句确实在计算i ++ try String text =“ 0011100”的次数。匹配单词char“ 1”它将打印2,4而不是2,3,4
Strauteka

40

这使用正则表达式工作。

String text = "I love you so much";
String wordToFind = "love";
Pattern word = Pattern.compile(wordToFind);
Matcher match = word.matcher(text);

while (match.find()) {
     System.out.println("Found love at index "+ match.start() +" - "+ (match.end()-1));
}

输出:

在索引2-5中找到“爱”

一般规则 :

  • 正则表达式从左到右搜索,并且一旦使用了匹配字符,便无法重复使用。

19
这很棒,但是对于这句话,我得到的输出是“我有男朋友” :-)
Gaurav Pangam,


8

查找单个索引

正如其他人所说,用于text.indexOf(match)查找单个匹配项。

String text = "0123456789hello0123456789";
String match = "hello";
int position = text.indexOf(match); // position = 10

查找多个索引

由于@StephenC对代码可维护性的评论以及我自己在理解@polygenelubricants的答案时遇到的困难,我想找到另一种方法来获取文本字符串中匹配项的所有索引。以下代码(通过此答案进行了修改)做到了:

String text = "0123hello9012hello8901hello7890";
String match = "hello";

int index = text.indexOf(match);
int matchLength = match.length();
while (index >= 0) {  // indexOf returns -1 if no match found
    System.out.println(index);
    index = text.indexOf(match, index + matchLength);
}


2

您只需在while循环内分配很酷的内容即可获得文件中的所有匹配项:

$ javac MatchTest.java 
$ java MatchTest 
1
16
31
46
$ cat MatchTest.java 
import java.util.*;
import java.io.*;

public class MatchTest {
    public static void main(String[] args){
        String match = "hello";
        String text = "hello0123456789hello0123456789hello1234567890hello3423243423232";
        int i =0;
        while((i=(text.indexOf(match,i)+1))>0)
            System.out.println(i);
    }
}

2
你的方式抵消i+1作品,但在一个相当迂回的方式。正如你在这里显示,其报告第一helloi == 1。如果始终使用基于0的索引,它将更加一致。
polygenelubricants 2010年

1
...将窃取您的东西:P谢谢。
hhh 2010年

2
int match_position=text.indexOf(match);

1
请说明您的做法
Fabio 2014年

1
@Fabio getPosition(match,text){int match_position = text.indexOf(match); };返回match_position
赛义德

1
import java.util.StringTokenizer;

public class Occourence {

  public static void main(String[] args) {
    String key=null,str ="my name noorus my name noorus";        
    int i=0,tot=0;

    StringTokenizer st=new StringTokenizer(str," ");
    while(st.hasMoreTokens())
    {   
        tot=tot+1;
        key = st.nextToken();
        while((i=(str.indexOf(key,i)+1))>0)
        {
            System.out.println("position of "+key+" "+"is "+(i-1));
        }
    }

    System.out.println("total words present in string "+tot);
  }
}

1
您能解释一下为什么这样起作用,以及内循环的防护措施如何吗?对于新手读者来说,一个解释可能有用。
Paul Hicks

1
int indexOf(String str,int fromIndex):从指定的索引开始,返回指定子字符串首次出现在此字符串中的索引。如果没有发生,则返回-1。在这里,while的内部循环将能够获取令牌的所有出现(此处由名为“ key”的变量指定)。

1

我有一些大代码,但是工作得很好。

   class strDemo
   { 
       public static void main(String args[])
       {
       String s1=new String("The Ghost of The Arabean Sea");
           String s2=new String ("The");
           String s6=new String ("ehT");
           StringBuffer s3;
           StringBuffer s4=new StringBuffer(s1);
           StringBuffer s5=new StringBuffer(s2);
           char c1[]=new char[30];
           char c2[]=new char[5];
           char c3[]=new char[5];
           s1.getChars(0,28,c1,0);
           s2.getChars(0,3,c2,0);
           s6.getChars(0,3,c3,0); s3=s4.reverse();      
           int pf=0,pl=0;
           char c5[]=new char[30];
           s3.getChars(0,28,c5,0);
           for(int i=0;i<(s1.length()-s2.length());i++)
           {
               int j=0;
               if(pf<=1)
               {
                  while (c1[i+j]==c2[j] && j<=s2.length())
                  {           
                    j++;
                    System.out.println(s2.length()+" "+j);
                    if(j>=s2.length())
                    {
                       System.out.println("first match of(The) :->"+i);

                     }
                     pf=pf+1;         
                  }   
             }                
       }       
         for(int i=0;i<(s3.length()-s6.length()+1);i++)
        {
            int j=0;
            if(pl<=1)
            {
             while (c5[i+j]==c3[j] && j<=s6.length())
             {
                 j++;
                 System.out.println(s6.length()+" "+j);
                 if(j>=s6.length())
                 {
                         System.out.println((s3.length()-i-3));
                         pl=pl+1;

                 }   
                }                 
              }  
           }  
         }
       }

2
在您的代码中添加一些解释/注释将使人们更容易理解您的代码,尤其是长代码:)
himawan_r 2015年

1
//finding a particular word any where inthe string and printing its index and occurence  
class IndOc
{
    public static void main(String[] args) 
    {
        String s="this is hyderabad city and this is";
        System.out.println("the given string is ");
        System.out.println("----------"+s);
        char ch[]=s.toCharArray();
        System.out.println(" ----word is found at ");
        int j=0,noc=0;
        for(int i=0;i<ch.length;i++)
        {
            j=i;

            if(ch[i]=='i' && ch[j+1]=='s')
            {
                System.out.println(" index "+i);
            noc++;  
            }

        }
        System.out.println("----- no of occurences are "+noc);

    }
}

3
尽管此代码可以回答问题,但提供有关如何和/或为什么解决问题的其他上下文将提高​​答案的长期价值。
Peter Brittain

1
    String match = "hello";
    String text = "0123456789hello0123456789hello";

    int j = 0;
    String indxOfmatch = "";

    for (int i = -1; i < text.length()+1; i++) {
        j =  text.indexOf("hello", i);
        if (i>=j && j > -1) {
            indxOfmatch += text.indexOf("hello", i)+" ";
        }
    }
    System.out.println(indxOfmatch);

0

如果您要扫描搜索字符串的'n'个匹配项,建议您使用正则表达式。它们的学习曲线陡峭,但是在进行复杂的搜索时可以为您节省时间。


2
建议:包括一个从正则表达式获取位置的示例。只是“尝试使用正则表达式”是一个相当基本的注释,并不能回答OP的问题。
布拉德·科赫

0

对于多次出现,并且在字符串中找到的字符?是或否

import java.io.BufferedReader;
import java.io.InputStreamReader;

public class SubStringtest {

    public static void main(String[] args)throws Exception {
    BufferedReader br=new BufferedReader(new InputStreamReader(System.in));
     System.out.println("enter the string");
    String str=br.readLine();
    System.out.println("enter the character which you want");
    CharSequence ch=br.readLine();   
    boolean bool=str.contains(ch);
    System.out.println("the character found is " +bool);
    int position=str.indexOf(ch.toString());

    while(position>=0){
        System.out.println("the index no of character is " +position); 
        position=str.indexOf(ch.toString(),position+1);
    }


    }

}

0
public int NumberWordsInText(String FullText_, String WordToFind_, int[] positions_)
   {
    int iii1=0;
    int iii2=0;
    int iii3=0;
    while((iii1=(FullText_.indexOf(WordToFind_,iii1)+1))>0){iii2=iii2+1;}
    // iii2 is the number of the occurences
    if(iii2>0) {
        positions_ = new int[iii2];
        while ((iii1 = (FullText_.indexOf(WordToFind_, iii1) + 1)) > 0) {
            positions_[iii3] = iii1-1;
            iii3 = iii3 + 1;
            System.out.println("position=" + positions_[iii3 - 1]);
        }
    }
    return iii2;
}

希望它可以解决问题,但请在其中添加代码说明,以便用户完全理解他/她真正想要的。
Jaimil Patel
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.