在R中的向量中列出不同的值

97

如何在向量具有重复性的向量中列出这些不同的值？我的意思是，类似于以下SQL语句：

SELECT DISTINCT product_code
FROM data

r vector distinct-values r-faq

— 梅珀·帕劳（Mehper C.
source

168

你是说unique：

R> x = c(1,1,2,3,4,4,4)
R> x
[1] 1 1 2 3 4 4 4
R> unique(x)
[1] 1 2 3 4

— csgillespie
source

12

如果数据实际上是a，factor则可以使用该levels()函数，例如

levels( data$product_code )

如果不是因素，但应该是因素，则可以先使用factor()函数将其转换为因素，例如

levels( factor( data$product_code ) )

如上所述，另一个选择是unique()函数：

unique( data$product_code )

两者之间的主要区别（当应用于时factor）是levels将按级别顺序返回字符向量，包括已编码但不会出现的任何级别。unique将factor按照值首次出现的顺序返回a ，并省略所有未出现的级别（尽管仍包含在levels返回的因子中）。

— 伊萨皮尔
source

8

尝试将重复功能与否定运算符“！”结合使用。

例：

wdups <- rep(1:5,5)
wodups <- wdups[which(!duplicated(wdups))]

希望能有所帮助。

— 铝河
source

7

您也可以在R中使用sqldf软件包。

Z <- sqldf('SELECT DISTINCT tablename.columnname FROM tablename ')

— 粘土烧伤
source