如何重命名data.frame中的单个列？

335

我知道如果我有一个多于一列的数据框，我可以使用

colnames(x) <- c("col1","col2")

重命名列。如果只有一栏，该怎么办？表示其中仅包含一列的向量或数据帧。

例：

trSamp <- data.frame(sample(trainer$index, 10000))
head(trSamp )
#   sample.trainer.index..10000.
# 1                      5907862
# 2                      2181266
# 3                      7368504
# 4                      1949790
# 5                      3475174
# 6                      6062879

ncol(trSamp)
# [1] 1
class(trSamp)
# [1] "data.frame"
class(trSamp[1])
# [1] "data.frame"
class(trSamp[,1])
# [1] "numeric"
colnames(trSamp)[2] <- "newname2"
# Error in names(x) <- value : 
#   'names' attribute [2] must be the same length as the vector [1]

r

— 尖叫猫头鹰
source

4

@aix的解决方案适用于1列的data.frame。您可能对drop=TRUE默认参数感到困惑，该默认参数[导致将“ 1列”对象转换为向量...而向量没有colnames。您尝试过的例子将非常有帮助。

— 约书亚·乌尔里希

2

如果您使用“ colnames（x）[1] <-'newname2'”

— 它将起作用-screechOwl 2011年

344

colnames(trSamp)[2] <- "newname2"

尝试设置第二列的名称。您的对象只有一列，因此该命令将引发错误。这应该足够了：

colnames(trSamp) <- "newname2"

— 约书亚·乌尔里希（Joshua Ulrich）
source

1

。@ JoshuaUlrich-如果列名类似于"A,B,C,X,Y,Z"我想将其重命名为Yusing的地方，这似乎不起作用testData[379] <- "Y"。

— Chetan Arvind Patil

576

这是一种通用的方式，您不必记住变量的确切位置：

# df = dataframe
# old.var.name = The name you don't like anymore
# new.var.name = The name you want to get

names(df)[names(df) == 'old.var.name'] <- 'new.var.name'

此代码几乎可以执行以下操作：

names(df) 调查所有的名字 df
[names(df) == old.var.name] 提取您要检查的变量名
<- 'new.var.name' 分配新的变量名称。

— Side_0o_Effect
source

5

我对R也很陌生，喜欢这个解决方案！我实际上已经检查了它的作用，并且我认为值得指定[names(df) == old.var.name]实际上返回一个带有true / false值的向量。因此，如果使用正则表达式，则有可能更改多个列名。

— mikyatope

3

对于正则表达式结果，请使用names(df) = sub('pattern', 'replacement', names(df))。否则，您将尝试将多个列设置为相同的名称。

— 我们都是莫妮卡

40

百感交集……在一个完美的世界里，到处都是完美的编程语言，难道真的需要这么多次击键才能更改单个列的名称吗？我喜欢R，但有时出于某些原因我想勒死它。

— tumultous_rooster

4

在base中怎么没有包装函数呢？

— ifly6'9

1

我们都多么希望！我现在不知道，但是那时基地没有任何包装

— Side_0o_Effect

85

colnames(df)[colnames(df) == 'oldName'] <- 'newName'

— 宗师五街
source

2

我喜欢这种解决方案，因为您可以按名称引用列名，而不是要求知道它是哪个数字列。更适合较大数量的功能。

— 控制论

1

我对这个问题和这个答案做了一个小扩展。我有一个带有一列的数据框，其中包含字母“ snp”。我想将其重命名为'Marker'。但是我想使用正则表达式来做到这一点。显然我的代码存在缺陷：colnames(GWASDATA_RAWSELECTION)[colnames(GWASDATA_RAWSELECTION)=="^snp$"] <- "Marker"，因为该列未重命名。如果我这样做，names(GWASDATA_RAWSELECTION)[names(GWASDATA_RAWSELECTION)=="snp"] <- "Marker"它将被重命名。我想念什么？

— 桑德·范德兰

76

这是一个古老的问题，但是值得注意的是，您现在可以setnames从data.table软件包中使用它。

library(data.table)

setnames(DF, "oldName", "newName")

# or since the data.frame in question is just one column: 
setnames(DF, "newName")

# And for reference's sake, in general (more than once column)
nms <- c("col1.name", "col2.name", etc...)
setnames(DF, nms)

— 里卡多·萨波特塔
source

6

或setNames从R基地开始

— 。– PatrickT

53

也可以使用Hadley的plyr软件包和rename函数来完成此操作。

library(plyr) 
df <- data.frame(foo=rnorm(1000)) 
df <- rename(df,c('foo'='samples'))

您可以按名称重命名（不知道位置），并一次执行多个重命名。例如，进行合并后，您可能会得到以下结果：

  letterid id.x id.y
1       70    2    1
2      116    6    5
3      116    6    4
4      116    6    3
5      766   14    9
6      766   14   13

然后您可以使用以下步骤一步一步重命名：

letters <- rename(letters,c("id.x" = "source", "id.y" = "target"))

  letterid source target
1       70      2      1
2      116      6      5
3      116      6      4
4      116      6      3
5      766     14      9
6      766     14     13

— 倾斜
source

7

rename现在也是dplyr包中的函数。

— 山姆·菲尔克

36

我认为重命名列的最佳方法是使用dplyr包，如下所示：

require(dplyr)
df = rename(df, new_col01 = old_col01, new_col02 = old_col02, ...)

重命名任何数据集中的一列或多列的工作原理相同。

— 路易斯·巴斯克斯（Luis Vazquez）
source

12

我喜欢一种用于逐一重命名数据框列名称的样式。

colnames(df)[which(colnames(df) == 'old_colname')] <- 'new_colname'

哪里

which(colnames(df) == 'old_colname')

通过特定列的索引返回。

— 牧羊人
source

1

为用户提供使用实际旧名称的机会的+1 ：）

1

与@zongshiwujie的解决方案相比有什么区别？

— buhtz

which()没有必要。

— sindri_baldur

12

我发现重命名单个列的最便捷方法是使用dplyr::rename_at：

library(dplyr)
cars %>% rename_at("speed",~"new") %>% head     
cars %>% rename_at(vars(speed),~"new") %>% head
cars %>% rename_at(1,~"new") %>% head

#   new dist
# 1   4    2
# 2   4   10
# 3   7    4
# 4   7   22
# 5   8   16
# 6   9   10

在管道链中效果很好
名称存储在变量中时很方便
使用名称或列索引
清晰紧凑

— Moody_Mudskipper
source

6

您可以rename.vars在gdata包中使用。

library(gdata)
df <- rename.vars(df, from = "oldname", to = "newname")

如果您要更改多个变量名，或者想要在变量名后添加或添加一些文本，则可以执行以下操作：

df <- rename.vars(df, from = c("old1", "old2", "old3", 
         to = c("new1", "new2", "new3"))

有关将文本附加到变量名称的子集的示例，请参见：https : //stackoverflow.com/a/28870000/180892

— 杰罗米·安格利姆
source

这是最简单的，谢谢。dplyr软件包有问题。

— DannyB

4

尝试：

colnames(x)[2] <- 'newname2'

— NPE
source

8

这就是引发OP请求的错误（在他的编辑中）。它不会起作用，因为数据框只有一列。

。@ NPE-如果列名类似于"A,B,C,X,Y,Z"我想将其重命名为Yusing的地方，这似乎不起作用testData[379] <- "Y"。

— Chetan Arvind Patil

4

这可能已经存在，但是我在寻找解决方案并一时兴起尝试时重命名字段。为我的目的而工作。

Table1$FieldNewName <- Table1$FieldOldName
Table1$FieldOldName <- NULL

编辑从这里开始。

这也可以。

df <- rename(df, c("oldColName" = "newColName"))

— 斯科蒂
source

对于任何拒绝我的人来说，这都很好，但是由于我显然不是这样做的新手，所以也许您可以从答案中找到启发。

— Scottieie '17

您的答案没有什么错，除了它不是一个单一的人..那只是一个敌对的SO用户，没有勇气证明自己发脾气。

— COUNT0

谢谢@ count0。拥有一些法力值或对问题进行评论，实际上是有意义的，这是我尚未能够做到的。在某些情况下，随着我学习新技能，跟进问题会很好。再次。TY。

— Scottieie

1

我们需要给所有列命名以使用它。

— Arpit Sisodia

该rename功能来自哪个包？

— 迭戈

3

如果您知道数据框只有一列，则可以使用： names(trSamp) <- "newname2"

3

您也可以尝试从“ Hmisc”包中获取“ upData”。

library(Hmisc)

trSamp = upData(trSamp, rename=c(sample.trainer.index..10000. = 'newname2'))

— 安塞克
source

非常好！也可以一次重命名更多的列：trSamp = upData（trSamp，rename = c（sample.trainer.index..10000。='newname2，AnotherColumnName ='RenameThisColumn'））

— FraNut

0

OP的问题得到了很好的回答。但是，此方法在某些情况下可能有用：列名的部分匹配，无论其在数据框中的位置如何：

名称部分匹配：

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("Reported", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

另一个示例：在存在“标点符号”的情况下进行部分匹配：

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("[[:punct:]]", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

这些是我今天必须处理的示例，我认为可能值得分享。

— 帕特里克·T
source

0

我发现colnames()参数更简单 https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/row%2Bcolnames

从数据框中选择一些列

df <- data.frame(df[, c( "hhid","b1005", "b1012_imp", "b3004a")])

然后按顺序重命名选定的列，

colnames(df) <- c("hhid", "income", "cost", "credit")

检查名称和值以确保

names(df);head(df)

— 塞玛·卡莱（Seyma Kalay）
source

0

我们可以使用rename_with函数来重命名列（stringr例如，函数）。

考虑以下数据df_1：

df_1 <- data.frame(
  x = replicate(n = 3, expr = rnorm(n = 3, mean = 10, sd = 1)), 
  y = sample(x = 1:2, size = 10, replace = TRUE)
)

names(df_1)

#[1] "x.1" "x.2" "x.3" "y"

重命名所有的变量有dplyr::everything()：

library(tidyverse)

df_1 %>% 
  rename_with(.data = ., .cols = everything(.), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "var_4"

通过重命名名称粒子与一些dplyr动词（starts_with，ends_with，contains，matches，...）。

带有.（x变量）的示例：

df_1 %>% 
  rename_with(.data = ., .cols = contains('.'), 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "var_1" "var_2" "var_3" "y"

通过重命名类与类测试的许多功能，如is.integer，is.numeric，is.factor...

is.integer（y）的示例：

df_1 %>% 
  rename_with(.data = ., .cols = is.integer, 
              .fn = str_replace, pattern = '.*', 
              replacement = str_c('var', seq_along(.), sep = '_')) %>% 
  names()

#[1] "x.1"   "x.2"   "x.3"   "var_1"

警告：

警告消息：1：在stri_replace_first_regex（字符串，模式，fix_replacement（替换）中：：较长的对象长度不是较短的对象长度的倍数2：在名称中[cols] <-.fn（names [cols]，...）：要替换的项目数不是替换长度的倍数

这无关紧要，因为这只是seq_along(.)与replace函数的不一致。

— 内夫斯
source

-1

我只需将一个新列添加到数据框即可，其名称为我想要的名称，然后从现有列中获取数据。像这样：

dataf$value=dataf$Article1Order

然后我删除旧列！像这样：

dataf$Article1Order<-NULL

这段代码看起来很愚蠢！但是效果很好...

— 尼卢法尔
source

-1

我只需使用以下代码将列名更改为具有我想要的新名称的数据集： names（dataset）[index_value] <-“ new_col_name”

— 帕提班M
source

-3

library(dplyr)
rename(data, de=de.y)

— 你好，世界
source

补充一点为什么这可以解决OP的问题？

— Guillaume Racicot