Questions tagged «r»

R是一种免费的开源编程语言和软件环境,用于统计计算,生物信息学,可视化和通用计算。请提供最少且可复制的示例以及所需的输出。使用`dput()`作为数据,并通过`library()`调用指定所有非基本包。不要为数据或代码嵌入图片,而应使用缩进的代码块。对于统计相关的问题,请使用https://stats.stackexchange.com。

7
如何为ggplot2对象提取绘图轴的范围?
我有一个物体ggplot2,比如说myPlot,如何确定x和y轴的范围? 它似乎不是数据值范围的简单倍数,因为它可以重新缩放绘图,修改轴的范围等等。 findFn(来自sos)和Google似乎没有找到相关结果,除了如何设置坐标轴的范围。
88 r  ggplot2 


5
替换数据框中的所有特定值
有了数据框,我该如何替换所有行和列中的所有特定值。举例来说,我想用替换所有空记录NA(无需输入位置): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl 100 预期结果: A B 1 NA 12 2 xyz NA 3 jkl 100
88 r  dataframe  replace 

7
了解order()函数
我试图了解该order()功能的工作原理。我的印象是它返回了索引的排列,排序后会对原始向量进行排序。 例如, > a <- c(45,50,10,96) > order(a) [1] 3 1 2 4 我希望这会返回c(2, 3, 1, 4),因为排序的列表将是10 45 50 96。 有人可以帮助我了解此函数的返回值吗?
88 r  sorting  r-faq 


3
如何在Rmarkdown中添加目录?
我正在使用RStudio编写降价文档,并希望在文档顶部添加目录(TOC),以便用户可以单击相关部分进行阅读。在rpubs上有一些相关的例子,但是现在我似乎找不到它们。请注意,我不使用&是&的pandoc新手。有没有不用添加任何TOC的方法?如果必须使用,那么哪些功能是相关的?Rmdknitrpandocpandoc 编辑 这是一个小的示例页面: --- title: "Sample Document" output: html_document: toc: true theme: united --- Header 1 --------------- This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see <http://rmarkdown.rstudio.com>. ## Header 2 When …
88 r  rstudio  r-markdown 

3
如何固定ggplot中的宽高比?
我正在尝试调整绘图的大小以适合我的文档,但是在将绘图绘制成正方形时遇到困难。 例: pdf(file = "./out.pdf", width = 5, height = 5) p <- ggplot(mydata, aes(x = col1, y = col2)) print(p) aux <- dev.off() 尽管x和y的限制相同,但结果中的图不是正方形。我想R使封闭面板的尺寸为5x5“,但是并不关心实际的图表尺寸。 如何解压图表?
88 r  ggplot2 

6
创建一个逗号分隔的向量
我有一个数字向量,我正在尝试将其转换为字符向量,其中每个元素都用逗号分隔。 > one = c(1:5) > paste(as.character(one), collapse=", ") [1] "1, 2, 3, 4, 5" > paste(as.character(one), sep="' '", collapse=", ") [1] "1, 2, 3, 4, 5" 但是,我希望输出看起来像: "1", "2", "3", "4", "5" 我是否在粘贴功能中缺少某些参数?救命!?
88 r 

13
修剪巨大的(3.5 GB)CSV文件以读入R
因此,我有一个数据文件(以分号分隔),该文件包含很多详细信息和不完整的行(导致Access和SQL阻塞)。它是40年的县级数据集,分为多个细分,子细分和子细分(共200个因子)。简而言之,它是巨大的,如果我尝试简单地阅读它,它将不适合内存。 所以我的问题是,考虑到我想要所有的县,但是只有一年(并且只有最高级别的细分……最终导致大约100,000行),什么是最好的方法此汇总到R? 目前,我正在尝试与Python无关的事情,通过一次读取和操作一行来绕过文件大小限制,但是我更喜欢仅R的解决方案(CRAN包可以)。有没有类似的方法可以一次在R中读取文件? 任何想法将不胜感激。 更新: 约束条件 需要使用我的机器,所以没有EC2实例 尽可能仅R。在这种情况下,速度和资源不是问题...只要我的机器不爆炸... 如下所示,数据包含混合类型,稍后我需要对其进行操作 数据 数据为3.5GB,约850万行和17列 几千行(〜2k)格式错误,只有一列而不是17列 这些完全不重要,可以删除 我只需要该文件中的约100,000行(见下文) 数据示例: County; State; Year; Quarter; Segment; Sub-Segment; Sub-Sub-Segment; GDP; ... Ada County;NC;2009;4;FIRE;Financial;Banks;80.1; ... Ada County;NC;2010;1;FIRE;Financial;Banks;82.5; ... NC [Malformed row] [8.5 Mill rows] 我想删掉一些列并从40个可用年(1980-2020年的2009-2010年)中选择两个,以便使数据适合R: County; State; Year; Quarter; Segment; GDP; ... Ada County;NC;2009;4;FIRE;80.1; ... Ada County;NC;2010;1;FIRE;82.5; ... …
87 r  csv 

8
如何将平滑曲线拟合到R中的数据?
我正在尝试在中绘制平滑曲线R。我有以下简单的玩具数据: > x [1] 1 2 3 4 5 6 7 8 9 10 > y [1] 2 4 6 8 7 12 14 16 18 20 现在,当我使用标准命令对其进行绘制时,它当然看起来很坎and和锋利: > plot(x,y, type='l', lwd=2, col='red') 如何使曲线平滑,以便使用估计值对3个边进行舍入?我知道有很多方法可以拟合平滑曲线,但是我不确定哪种方法最适合这种曲线,以及如何编写R。
87 r  plot  curve-fitting 

7
如何添加不同大小和颜色的ggplot2字幕?
我正在使用ggplot2来改善降水量。 这是我想要实现的可复制示例: library(ggplot2) library(gridExtra) secu <- seq(1, 16, by=2) melt.d <- data.frame(y=secu, x=LETTERS[1:8]) m <- ggplot(melt.d, aes(x=x, y=y)) + geom_bar(fill="darkblue") + labs(x="Weather stations", y="Accumulated Rainfall [mm]") + opts(axis.text.x=theme_text(angle=-45, hjust=0, vjust=1), title=expression("Rainfall"), plot.margin = unit(c(1.5, 1, 1, 1), "cm"), plot.title = theme_text(size = 25, face = "bold", colour = "black", vjust …
87 r  ggplot2  subtitle 



3
带条件值的dplyr变异
在具有四列的大型数据帧(“ myfile”)中,我必须添加第五列,其值有条件地基于前四列。 首选使用dplyr和的答案mutate,主要是因为它在大型数据集中的速度很高。 我的数据框如下所示: V1 V2 V3 V4 1 1 2 3 5 2 2 4 4 1 3 1 4 1 1 4 4 5 1 3 5 5 5 5 4 ... 第五列(V5)的值基于一些条件规则: if (V1==1 & V2!=4) { V5 <- 1 } else if (V2==4 & V3!=1) { …
87 r  dplyr  mutate 

9
如何使用ggplot2在轴上仅显示整数值
我有以下情节: library(reshape) library(ggplot2) library(gridExtra) require(ggplot2) data2<-structure(list(IR = structure(c(4L, 3L, 2L, 1L, 4L, 3L, 2L, 1L ), .Label = c("0.13-0.16", "0.17-0.23", "0.24-0.27", "0.28-1" ), class = "factor"), variable = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L), .Label = c("Real queens", "Simulated individuals" ), class = "factor"), value = c(15L, 11L, …
87 r  ggplot2 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.