加入dplyr时如何指定x和y的列名?
我有两个要使用dplyr加入的数据框。一个是包含名字的数据帧。 test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) 另一个数据框包含Kantrowitz名称语料库的清理版本,用于标识性别。这是一个最小的示例: kantrowitz <- structure(list(name = c("john", "bill", "madison", "abby", "thomas"), gender = c("M", "either", "M", "either", "M")), .Names = c("name", "gender"), row.names = c(NA, 5L), class = c("tbl_df", "tbl", "data.frame")) 我本质上是想test_data使用kantrowitz表从表中查找名称的性别。因为我要将其抽象为一个函数encode_gender,所以我不知道将要使用的数据集中的列的名称,因此,我不能保证它会name像那样被使用kantrowitz$name。 在基本RI中,将以这种方式执行合并: merge(test_data, kantrowitz, by.x = "first_names", …