如何在向量具有重复性的向量中列出这些不同的值?我的意思是,类似于以下SQL语句:
SELECT DISTINCT product_code
FROM data
如何在向量具有重复性的向量中列出这些不同的值?我的意思是,类似于以下SQL语句:
SELECT DISTINCT product_code
FROM data
Answers:
你是说unique
:
R> x = c(1,1,2,3,4,4,4)
R> x
[1] 1 1 2 3 4 4 4
R> unique(x)
[1] 1 2 3 4
如果数据实际上是a,factor
则可以使用该levels()
函数,例如
levels( data$product_code )
如果不是因素,但应该是因素,则可以先使用factor()
函数将其转换为因素,例如
levels( factor( data$product_code ) )
如上所述,另一个选择是unique()
函数:
unique( data$product_code )
两者之间的主要区别(当应用于时factor
)是levels
将按级别顺序返回字符向量,包括已编码但不会出现的任何级别。unique
将factor
按照值首次出现的顺序返回a ,并省略所有未出现的级别(尽管仍包含在levels
返回的因子中)。