Questions tagged «plyr»

6
使用dplyr将函数应用于表的每一行?
与plyr我一起工作时,我经常发现将它用于adply必须应用于每一行的标量函数很有用。 例如 data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 4.7 3.2 1.3 0.2 setosa 4.7 4 4.6 3.1 1.5 0.2 setosa 4.6 5 5.0 3.6 1.4 …
121 r  plyr  dplyr 

4
dplyr summarise:等效于“ .drop = FALSE”,以在输出中保留长度为零的组
summarise与with plyr的ddply函数一起使用时,默认情况下会删除空类别。您可以通过添加更改此行为.drop = FALSE。但是,当summarise与结合使用时,这是行不通的dplyr。还有另一种方法可以在结果中保留空类别吗? 这是伪造数据的示例。 library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) # Now add an extra level to df$b that has no corresponding value in df$a df$b = factor(df$b, levels=1:3) # Summarise with plyr, keeping categories with a count of zero plyr::ddply(df, "b", summarise, count_a=length(a), .drop=FALSE) b count_a 1 1 6 …
97 r  dplyr  plyr  tidyr 

6
dplyr:“ n()中的错误:不应直接调用函数”
我试图重现dplyr程序包中的示例之一,但收到此错误消息。我希望看到每个组合出现的频率都会产生一个新的列n。我想念什么?我三重检查该软件包已加载。 library(dplyr) # summarise peels off a single layer of grouping by_vs_am <- group_by(mtcars, vs, am) by_vs <- summarise(by_vs_am, n = n()) n()中的错误:不应直接调用此函数

4
使用dplyr按组计算行数
我正在使用mtcars数据集。我想查找特定数据组合的记录数。与count(*)SQL中的group by子句非常相似。ddply()来自plyr为我工作 library(plyr) ddply(mtcars, .(cyl,gear),nrow) 有输出 cyl gear V1 1 4 3 1 2 4 4 8 3 4 5 2 4 6 3 2 5 6 4 4 6 6 5 1 7 8 3 12 8 8 5 2 使用此代码 library(dplyr) g <- group_by(mtcars, cyl, gear) summarise(g, length(gear)) …
81 r  dplyr  count  plyr 

3
点在R –个人喜好,命名约定或更多内容中意味着什么?
我(可能)不是var1~.在这里指“所有其他变量” 。plyr再次指向我,调查mlply并想知道为什么用这样的前导点定义参数: function (.data, .fun = NULL, ..., .expand = TRUE, .progress = "none", .parallel = FALSE) { if (is.matrix(.data) & !is.list(.data)) .data <- .matrix_to_df(.data) f <- splat(.fun) alply(.data = .data, .margins = 1, .fun = f, ..., .expand = .expand, .progress = .progress, .parallel = .parallel) } <environment: namespace:plyr> …

5
如何在每个组中创建滞后变量?
我有一个data.table: set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b 1 -0.6264538 # 2: b 2 0.1836433 # 3: b 3 -0.8356286 # 4: a 1 1.5952808 # 5: a 2 0.3295078 # 6: a …
69 r  data.table  plyr  dplyr 

2
如何在不自动增加文件大小的情况下并行保存文件?
我有两个完全相同的脚本。 但是一个脚本正在生成3个重82.7 KB的RData文件,另一个脚本正在创建3个重120 KB的RData文件。 第一个没有并行: library("plyr") ddply(.data = iris, .variables = "Species", ##.parallel=TRUE,##Without parallel .fun = function(SpeciesData){ #Create Simple Model ------------------------------------------------------------- Model <- lm(formula = "Sepal.Length~Sepal.Width+Petal.Length+Petal.Width",data = SpeciesData) #Save The Model ------------------------------------------------------------- save(Model, compress = FALSE, file = gsub(x = "Species.RData", pattern = "Species", replacement = unique(SpeciesData$Species))) }) 第二个是并行的: library("plyr") …
9 r  plyr 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.