Questions tagged «r»

R是一种免费的开源编程语言和软件环境,用于统计计算,生物信息学,可视化和通用计算。请提供最少且可复制的示例以及所需的输出。使用`dput()`作为数据,并通过`library()`调用指定所有非基本包。不要为数据或代码嵌入图片,而应使用缩进的代码块。对于统计相关的问题,请使用https://stats.stackexchange.com。


8
每组汇总/汇总多个变量(例如,总和,均值)
从数据帧,是否有聚集(一个简单的方法sum,mean,max同时等c)中多个变量? 以下是一些示例数据: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = data.frame(date, year, month, x1, x2) 我想同时按年份和月份汇总数据框中的x1和x2变量df2。以下代码汇总了x1变量,但是也可以同时汇总x2变量吗? ### aggregate variables by year month df2=aggregate(x1 ~ year+month, data=df1, sum, na.rm=TRUE) head(df2) …

7
dplyr的相对频率/比例
假设我要计算每个组中不同值的比例。例如,使用mtcars数据,我如何一目了然地通过am(自动/手动)计算齿轮数的相对频率?dplyr library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n = n()) # am gear n # 0 3 15 # 0 4 4 # 1 4 8 # 1 5 5 我想实现的目标: am gear n rel.freq 0 3 15 0.7894737 0 4 4 0.2105263 …
153 r  group-by  dplyr  frequency 



5
R的适用范围比句法糖更重要吗?
...关于执行时间和/或内存。 如果不正确,请使用代码段进行证明。请注意,通过矢量化进行的加速不计算在内。增速必须来自apply(tapply,sapply,...)本身。
152 r  apply 

4
1L和1之间有什么区别?
我经常看到的符号1L(或2L,3L等)出现中的R代码。1L和之间有什么区别1? 1==1L评估为TRUE。为什么1L在R代码中使用?
152 r  types 

11
删除重复的行
我已经将CSV文件读入R data.frame。某些行在其中一列中具有相同的元素。我想删除该列中重复的行。例如: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202 16 localhost 1 platform_external_dbus 202 16 users.sourceforge 8 platform_external_dbus 202 16 hughsie 1 我只希望这些行中的一个,因为其他行在第一列中具有相同的数据。
152 r  duplicates  r-faq 

12
使用Homebrew安装R
我正在尝试使用Homebrew安装R。我运行了在SO上其他地方推荐的这些命令: brew tap homebrew/science brew install R 对于brew tap homebrew/science,我收到此错误: Error: Already tapped! 对于第二个命令,我收到以下信息: Error: No available formula for r 有什么建议?
151 r  homebrew 



6
如何通过引用删除data.table中的行?
我的问题与通过引用进行分配而不是在中进行复制有关data.table。我想知道是否可以通过引用删除行,类似于 DT[ , someCol := NULL] 我想知道 DT[someRow := NULL, ] 我猜这是为什么没有此功能的充分原因,因此也许您可以指出一个替代常规复制方法的好方法,如下所示。特别要注意的是,我喜欢example(data.table)中的内容, DT = data.table(x = rep(c("a", "b", "c"), each = 3), y = c(1, 3, 6), v = 1:9) # x y v # [1,] a 1 1 # [2,] a 3 2 # [3,] a 6 3 # …
150 r  data.table 

10
在大数据表中替换NA的最快方法
我有一个很大的data.table,许多缺失值分散在整个〜200k行和200列中。我想将那些NA值尽可能有效地重新编码为零。 我看到两个选项: 1:转换为data.frame,并使用类似以下内容 2:某种很酷的data.table子设置命令 我将对类型1的高效解决方案感到满意,将其转换为data.frame然后再转换为data.table不会花费太长时间。

8
重复data.frame的每一行,在列中指定的次数
df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) 扩展上方data.frame的前两列中的每一行的最简单方法是什么,以使每一行重复在“ freq”列中指定的次数? 换句话说,从此开始: df var1 var2 freq 1 a d 1 2 b e 2 3 c f 3 对此: df.expanded var1 var2 1 a d 2 b e 3 b e 4 c f …
150 r  dataframe  replicate 

6
在ggplot2中的各个方面上注释文本
我想用以下代码在绘图的最后一个方面注释一些文本: library(ggplot2) p <- ggplot(mtcars, aes(mpg, wt)) + geom_point() p <- p + facet_grid(. ~ cyl) p <- p + annotate("text", label = "Test", size = 4, x = 15, y = 5) print(p) 但是此代码在每个方面都对文本进行了注释。如果您指导我如何仅在一个方面获得带注释的文本,我将不胜感激。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.