查找字符串中字符的位置


87

我想找到一个字符在字符串中的位置。

说: string = "the2quickbrownfoxeswere2tired"

我希望函数返回424-中的2s的字符位置string


为什么要使用正则表达式?r没有.indexOf()或某物吗?
fge13年

1
我对此表示怀疑。开发人员是Nixers,并假定每个人都知道正则表达式。R的字符串处理有点麻烦。
IRTFM 2013年

Answers:


115

您可以使用 gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE

或者可能str_locate_all从包stringr,其为包装(作为版本1.0)gregexpr stringi::stri_locate_allstringr

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

请注意,您可以简单地使用 stringi

library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

基地的另一种选择R

lapply(strsplit(x, ''), function(x) which(x == '2'))

应该工作(给定字符向量x


我们如何从前3个解决方案返回的列表/对象中提取整数?
3pitt

使用regexpr而不是gregexpr轻松获取整数。或unlist按以下另一个答案所示在输出上使用。
阿兰尼'18


20

您可以使用unlist将输出分别设置为4和24:

unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

2

在str1中找到str2第n次出现的位置(参数与Oracle SQL INSTR的顺序相同),如果找不到,则返回0

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0

2

要仅查找第一个位置,请lapply()与结合使用min()

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

要仅找到最后一个位置,请lapply()与结合使用max()

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.