Questions tagged «r»

R是一种免费的开源编程语言和软件环境,用于统计计算,生物信息学,可视化和通用计算。请提供最少且可复制的示例以及所需的输出。使用`dput()`作为数据,并通过`library()`调用指定所有非基本包。不要为数据或代码嵌入图片,而应使用缩进的代码块。对于统计相关的问题,请使用https://stats.stackexchange.com。

3
如果特定列中的值小于另一列中的值,则仅选择行
我正在使用R,需要选择年龄(死亡年龄)小于或等于漆膜(泌乳期)的行。我试图创建一个新的数据框,使其仅包含行/ id,从而使“ aged”列的值小于其相应的“ laclength”值。 df: id1 id2 laclen aged 9830 64526 26 6 7609 64547 28 0 9925 64551 3 0 9922 64551 3 5 9916 64551 3 8 9917 64551 3 8 9914 64551 3 2 新的数据框应如下所示: dfnew: id1 id2 laclen aged 9830 64526 26 6 7609 64547 28 …
71 select  r  rows 

2
如何将data.table按多列分组?
我正在使用该data.table软件包来加快对数据集的摘要统计收集。 我很好奇是否有一种方法可以将多个列进行分组。我的数据如下所示: purchaseAmt adShown url 15.54 00001 150000001 4.82 00002 150000001 157.99 05005 776300044 ... ... ... 我可以做这样的事情: adShownMedian <- df1[,median(purchaseAmt),by="adShown"] 以获得每个广告的中位数。我怎么会做一些联合收割机adShown和url? 我已经试过了: adShownMedian <- df1[,median(purchaseAmt),by=c("adShown","url")] 但没有运气。 有什么建议?
71 r  group-by  data.table 


5
从数据框中删除行名的显示
我正在使用以下代码创建数据框: df <- data.frame(dbGetQuery(con, paste('select * from test'))) 结果如下: UID BuildingCode AccessTime 1 123456 BUILD-1 2014-06-16 07:00:00 2 364952 BUILD-2 2014-06-15 08:00:00 3 95865 BUILD-1 2014-06-06 09:50:00 然后,我尝试通过使用以下代码删除此处建议的行名(1、2、3等): rownames(df) <- NULL 但是,当我打印出来时,df它仍然显示行名。创建数据框时有没有不包含行名的方法?我找到了一个建议,row.name = FALSE但是当我尝试它时,我只是出现了错误(我可能将其放置在错误的位置)。 编辑:我想做的是将日期框架转换为HTML表,我不希望表中存在行名。

8
将csv数据集导入到R中,但值成为因素
我对R非常陌生,无法访问已导入的数据集。我正在使用RStudio并在导入csv文件并将线从控制台窗口粘贴到源窗口时使用了导入数据集功能。该代码如下所示: setwd("c:/kalle/R") stuckey <- read.csv("C:/kalle/R/stuckey.csv") point <- stuckey$PTS time <- stuckey$MP 但是,数据不是像我惯常使用的整数或数值,而是因数,因此当我尝试绘制变量时,我只会得到直方图,而不是通常的图。在检查数据时,它似乎是有序的,只是因为它是因子形式,所以我无法使用它。
71 r  r-factor  read.csv 



2
控制ggplot2图例显示顺序
有谁知道我如何控制ggplot2中图例的顺序? 从我可以看到的顺序来看,出现的顺序与实际的比例标签有关,而不是与比例尺声明顺序有关。更改比例尺标题会更改顺序。我用菱形数据集做了一个小例子来强调这一点。我正在尝试将ggplot2用于一系列绘图,我想使一个变量出现在所有绘图的右侧。目前,虽然这种情况仅发生在其中的某些情况下,但我在如何执行所需订购的同时保留适当的比例尺标签上一无所知。 library(ggplot2) diamond.data <- diamonds[sample(nrow(diamonds), 1000), ] plot <- ggplot(diamond.data, aes(carat, price, colour = clarity, shape = cut)) + geom_point() + opts(legend.position = "top", legend.box = "horizontal") plot # the legend will appear shape then colour plot + labs(colour = "A", shape = "B") # legend will be colour …
70 r  ggplot2 


2
如何将向量变成R中的矩阵?
我有一个带有49个数值的向量。我想改用7x7的数字矩阵。 我可以使用某种方便的自动转换语句,还是必须将7个正确的向量子集的单独列分配给新矩阵?我希望有类似的东西c(myMatrix),当然可以选择给出我想要的行数和/或列数。
70 r  vector  matrix 

7
R读取zip数据文件而不解压缩
我有一个非常大的zip文件,并且尝试将其读入R而不像这样将其解压缩: temp <- tempfile("Sales", fileext=c("zip")) data <- read.table(unz(temp, "Sales.dat"), nrows=10, header=T, quote="\"", sep=",") Error in open.connection(file, "rt") : cannot open the connection In addition: Warning message: In open.connection(file, "rt") : cannot open zip file 'C:\Users\xxx\AppData\Local\Temp\RtmpyAM9jH\Sales13041760345azip'
70 r 


5
使用dplyr查找重复的元素
我尝试使用此处提供的代码来查找dplyr的所有重复元素,如下所示: library(dplyr) mtcars %>% mutate(cyl.dup = cyl[duplicated(cyl) | duplicated(cyl, from.last = TRUE)]) 如何转换此处显示的代码以使用dplyr查找所有重复的元素?我上面的代码只是抛出错误?甚至更好的是,是否有另一个功能比复杂的x[duplicated(x) | duplicated(x, from.last = TRUE)])方法更简洁地实现此目的?
70 r  dplyr 


4
让R绘图进入LaTeX?
我是R和LaTeX的新手,最近才发现如何使用R绘制标准时间序列图并将其另存为png图像。我担心的是将其另存为图像,然后将其嵌入到LaTeX中会缩放它并使它看起来丑陋。 有没有办法让R的plot()函数输出矢量图形并将其嵌入LaTeX?我都是这两者的初学者,所以请保持谦虚:)代码片段非常受赞赏!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.