程序设计 r

9

我正在使用R，并已使用将数据加载到数据帧中read.csv()。如何确定数据框中每一列的数据类型？

153 r dataframe types

8

从数据帧，是否有聚集（一个简单的方法sum，mean，max同时等c）中多个变量？以下是一些示例数据： library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = data.frame(date, year, month, x1, x2) 我想同时按年份和月份汇总数据框中的x1和x2变量df2。以下代码汇总了x1变量，但是也可以同时汇总x2变量吗？ ### aggregate variables by year month df2=aggregate(x1 ~ year+month, data=df1, sum, na.rm=TRUE) head(df2) …

153 r dataframe data.table aggregate r-faq

7

dplyr的相对频率/比例

假设我要计算每个组中不同值的比例。例如，使用mtcars数据，我如何一目了然地通过am（自动/手动）计算齿轮数的相对频率？dplyr library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n = n()) # am gear n # 0 3 15 # 0 4 4 # 1 4 8 # 1 5 5 我想实现的目标： am gear n rel.freq 0 3 15 0.7894737 0 4 4 0.2105263 …

153 r group-by dplyr frequency

6

将data.frame列格式从字符转换为因子

我想将data.frame对象（mydf）的某些列的格式（类）从字符更改为factor。当我按read.table()功能读取文本文件时，我不想这样做。任何帮助，将不胜感激。

153 r dataframe character r-faq

6

我应该使用data.frame还是矩阵？

什么时候应该使用a data.frame，什么时候使用更好matrix？两者都以矩形格式保存数据，因此有时还不清楚。对于何时使用哪种数据类型，是否有一般的经验法则？

152 r matrix dataframe r-faq

5

R的适用范围比句法糖更重要吗？

...关于执行时间和/或内存。如果不正确，请使用代码段进行证明。请注意，通过矢量化进行的加速不计算在内。增速必须来自apply（tapply，sapply，...）本身。

152 r apply

4

1L和1之间有什么区别？

我经常看到的符号1L（或2L，3L等）出现中的R代码。1L和之间有什么区别1？ 1==1L评估为TRUE。为什么1L在R代码中使用？

152 r types

11

删除重复的行

我已经将CSV文件读入R data.frame。某些行在其中一列中具有相同的元素。我想删除该列中重复的行。例如： platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202 16 localhost 1 platform_external_dbus 202 16 users.sourceforge 8 platform_external_dbus 202 16 hughsie 1 我只希望这些行中的一个，因为其他行在第一列中具有相同的数据。

152 r duplicates r-faq

12

使用Homebrew安装R

我正在尝试使用Homebrew安装R。我运行了在SO上其他地方推荐的这些命令： brew tap homebrew/science brew install R 对于brew tap homebrew/science，我收到此错误： Error: Already tapped! 对于第二个命令，我收到以下信息： Error: No available formula for r 有什么建议？

151 r homebrew

2

R中的全局变量

我正在研究手册，我想问社区：我们如何在函数内设置全局变量？

151 r global-variables variable-assignment

8

如何从字符串中删除所有空格？

如此" xx yy 11 22 33 "会成为"xxyy112233"。我该如何实现？

151 regex r string grep r-faq

6

如何通过引用删除data.table中的行？

我的问题与通过引用进行分配而不是在中进行复制有关data.table。我想知道是否可以通过引用删除行，类似于 DT[ , someCol := NULL] 我想知道 DT[someRow := NULL, ] 我猜这是为什么没有此功能的充分原因，因此也许您可以指出一个替代常规复制方法的好方法，如下所示。特别要注意的是，我喜欢example（data.table）中的内容， DT = data.table(x = rep(c("a", "b", "c"), each = 3), y = c(1, 3, 6), v = 1:9) # x y v # [1,] a 1 1 # [2,] a 3 2 # [3,] a 6 3 # …

150 r data.table

10

在大数据表中替换NA的最快方法

我有一个很大的data.table，许多缺失值分散在整个〜200k行和200列中。我想将那些NA值尽可能有效地重新编码为零。我看到两个选项： 1：转换为data.frame，并使用类似以下内容 2：某种很酷的data.table子设置命令我将对类型1的高效解决方案感到满意，将其转换为data.frame然后再转换为data.table不会花费太长时间。

150 r performance dataframe data.table

8

重复data.frame的每一行，在列中指定的次数

df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) 扩展上方data.frame的前两列中的每一行的最简单方法是什么，以使每一行重复在“ freq”列中指定的次数？换句话说，从此开始： df var1 var2 freq 1 a d 1 2 b e 2 3 c f 3 对此： df.expanded var1 var2 1 a d 2 b e 3 b e 4 c f …

150 r dataframe replicate

6

在ggplot2中的各个方面上注释文本

我想用以下代码在绘图的最后一个方面注释一些文本： library(ggplot2) p <- ggplot(mtcars, aes(mpg, wt)) + geom_point() p <- p + facet_grid(. ~ cyl) p <- p + annotate("text", label = "Test", size = 4, x = 15, y = 5) print(p) 但是此代码在每个方面都对文本进行了注释。如果您指导我如何仅在一个方面获得带注释的文本，我将不胜感激。

150 r ggplot2 facet facet-wrap facet-grid

Questions tagged «r»