Answers:
我注意到您%like%
在当前方法中提到了一个函数。我不知道这是否是对%like%
“ data.table” 的引用,但是如果是,则可以按如下方式使用它。
请注意,对象不必是a data.table
(但还请记住,data.frame
s和data.table
s的子集方法并不相同):
library(data.table)
mtcars[rownames(mtcars) %like% "Merc", ]
iris[iris$Species %like% "osa", ]
如果那是您所拥有的,那么也许您只是混合了行和列的位置来设置数据。
如果您不想加载程序包,则可以尝试使用grep()
来搜索要匹配的字符串。这是mtcars
数据集的示例,其中我们匹配所有行名称包含“ Merc”的行:
mtcars[grep("Merc", rownames(mtcars)), ]
mpg cyl disp hp drat wt qsec vs am gear carb
# Merc 240D 24.4 4 146.7 62 3.69 3.19 20.0 1 0 4 2
# Merc 230 22.8 4 140.8 95 3.92 3.15 22.9 1 0 4 2
# Merc 280 19.2 6 167.6 123 3.92 3.44 18.3 1 0 4 4
# Merc 280C 17.8 6 167.6 123 3.92 3.44 18.9 1 0 4 4
# Merc 450SE 16.4 8 275.8 180 3.07 4.07 17.4 0 0 3 3
# Merc 450SL 17.3 8 275.8 180 3.07 3.73 17.6 0 0 3 3
# Merc 450SLC 15.2 8 275.8 180 3.07 3.78 18.0 0 0 3 3
还有另一个示例,使用iris
数据集搜索字符串osa
:
irisSubset <- iris[grep("osa", iris$Species), ]
head(irisSubset)
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 1 5.1 3.5 1.4 0.2 setosa
# 2 4.9 3.0 1.4 0.2 setosa
# 3 4.7 3.2 1.3 0.2 setosa
# 4 4.6 3.1 1.5 0.2 setosa
# 5 5.0 3.6 1.4 0.2 setosa
# 6 5.4 3.9 1.7 0.4 setosa
对于您的问题,请尝试:
selectedRows <- conservedData[grep("hsa-", conservedData$miRNA), ]
grep
支持正则表达式,因此您可能需要grep ^hsa-
代替。
grep
它来自ed命令g / re / p(全局/正则表达式/打印),它仅向正则表达式的掌握者fu展示其真正的力量;-):en.wikipedia.org/ Wiki / Grep
str_detect()
从stringr包中尝试一下,该包可以检测字符串中是否存在模式。
下面是还采用了一种方法%>%
管和filter()
从dplyr包:
library(stringr)
library(dplyr)
CO2 %>%
filter(str_detect(Treatment, "non"))
Plant Type Treatment conc uptake
1 Qn1 Quebec nonchilled 95 16.0
2 Qn1 Quebec nonchilled 175 30.4
3 Qn1 Quebec nonchilled 250 34.8
4 Qn1 Quebec nonchilled 350 37.2
5 Qn1 Quebec nonchilled 500 35.3
...
这会针对“治疗”变量包含子字符串“ non”的行过滤样本CO2数据集(R随附)。您可以调整是str_detect
查找固定匹配项还是使用正则表达式-请参阅stringer软件包的文档。
myDataFrame[str_detect(myDataFrame$key, myKeyPattern),]
LIKE
应该在sqlite中工作:
require(sqldf)
df <- data.frame(name = c('bob','robert','peter'),id=c(1,2,3))
sqldf("select * from df where name LIKE '%er%'")
name id
1 robert 2
2 peter 3
require()
在这里装载R包
require
function 进行加载。
dput(head(conservedData))
。