Questions tagged «r»

R是一种免费的开源编程语言和软件环境,用于统计计算,生物信息学,可视化和通用计算。请提供最少且可复制的示例以及所需的输出。使用`dput()`作为数据,并通过`library()`调用指定所有非基本包。不要为数据或代码嵌入图片,而应使用缩进的代码块。对于统计相关的问题,请使用https://stats.stackexchange.com。

14
统计分析和报告编写工作流程
是否有人对与自定义​​报告编写相关的数据分析工作流有任何智慧?用例基本上是这样的: 客户委托使用数据分析的报告,例如水域的人口估计和相关地图。 分析人员下载一些数据,对数据进行删节并保存结果(例如,为每单位人口增加一列,或根据地区边界对数据进行分组)。 分析人员分析了在(2)中创建的数据,接近了她的目标,但是发现需要更多数据,因此回到(1)。 重复冲洗,直到表格和图形符合QA / QC并满足客户要求。 编写包含表格和图形的报告。 明年,满意的客户会回来并要求更新。这应该很简单,例如通过新的下载来更新上游数据(例如,从去年获得建筑许可),然后按“重新计算”按钮,除非规格更改。 目前,我只是启动一个目录,并尽其所能对其进行临时设置。我想要一个更系统的方法,所以我希望有人能解决这个问题……我使用了电子表格,SQL,ARCGIS,R和Unix工具。 谢谢! PS: 下面是一个基本的Makefile,用于检查对各种中间数据集(带.RData后缀)和脚本(.R后缀)的依赖性。Make使用时间戳检查依赖关系,因此,如果使用touch ss07por.csv,它将看到此文件比依赖它的所有文件/目标都新,并执行给定的脚本以相应地更新它们。这项工作仍在进行中,其中包括将数据放入SQL数据库的步骤以及诸如sweave之类的模板语言的步骤。请注意,Make的语法依赖制表符,因此在剪切和粘贴之前请先阅读手册。享受并给予反馈! http://www.gnu.org/software/make/manual/html_node/index.html#Top R = / home / wsprague / R-2.9.2 / bin / R persondata.RData:ImportData.R ../../DATA/ss07por.csv Functions.R $ R-从-f ImportData.R persondata.Munged.RData:MungeData.R persondata.RData Functions.R $ R --slave -f MungeData.R report.txt:TabulateAndGraph.R persondata.Munged.RData Functions.R $ R --slave -f TabulateAndGraph.R> report.txt

8
如何制作数据帧列表?
如何制作数据帧列表,以及如何从列表中访问每个数据帧? 例如,如何将这些数据框放在列表中? d1 <- data.frame(y1 = c(1, 2, 3), y2 = c(4, 5, 6)) d2 <- data.frame(y1 = c(3, 2, 1), y2 = c(6, 5, 4))
185 r  list  dataframe  r-faq 

12
计算移动平均
我正在尝试使用R计算矩阵中一系列值的移动平均值。但是,普通的R邮件列表搜索并不是很有帮助。R中似乎没有内置函数可以让我计算移动平均值。有任何包装提供吗?还是我需要自己写?
185 r  moving-average  r-faq 

10
在基本图形的绘图区域之外绘制图例?
如标题所述:使用基础图形时,如何在图例区域之外绘制图例? 我考虑过摆弄layout并生成一个仅包含图例的空白图,但是我对仅使用基础图形工具的一种方法感兴趣,例如,par(mar = )在图的右侧获得一些图例空间。 这里是一个例子: plot(1:3, rnorm(3), pch = 1, lty = 1, type = "o", ylim=c(-2,2)) lines(1:3, rnorm(3), pch = 2, lty = 2, type="o") legend(1,-1,c("group A", "group B"), pch = c(1,2), lty = c(1,2)) 产生: 但是如前所述,我希望图例位于绘图区域之外(例如,在图形/绘图的右侧)。
185 r  plot  legend 

5
使用set.seed函数的原因
set.seed在启动程序之前,我已经多次看到R中的功能。我知道它基本上是用于随机数生成的。有什么特殊需要设置吗?
184 r  random 

6
当我的ggplot2语法合理时,如何处理R CMD检查“对全局变量无可见绑定”注释?
编辑:Hadley Wickham指出我误会了。R CMD检查正在抛出注释,而不是警告。对此我感到非常抱歉。这是我的疏忽。 短版 R CMD check每当我在ggplot2中使用明智的绘图创建语法时,都会抛出此注释: no visible binding for global variable [variable name] 我理解为什么R CMD检查可以做到这一点,但是它似乎将其他本来可以理解的语法定为犯罪。我不确定要采取什么步骤使我的包裹通过R CMD check并被CRAN录取。 背景 Sascha Epskamp此前曾发表过关于同一问题的报道。我认为,区别在于手册subset()页上说它是为交互使用而设计的。 就我而言,这个问题还没有结束subset(),但超过的核心功能ggplot2:该data =参数。 我编写的生成这些注释的代码示例 这是我程序包中的一个子功能,可将点添加到绘图中: JitteredResponsesByContrast <- function (data) { return( geom_point( aes( x = x.values, y = y.values ), data = data, position = position_jitter(height = 0, width …
180 r  ggplot2 

12
从线性回归中提取p值和r平方
您如何从简单的线性回归模型中提取p值(对于单个解释变量的系数的重要性为非零)和R平方值?例如... x = cumsum(c(0, runif(100, -1, +1))) y = cumsum(c(0, runif(100, -1, +1))) fit = lm(y ~ x) summary(fit) 我知道可以summary(fit) 显示 p值和R平方值,但是我希望能够将它们粘贴到其他变量中。
179 r 

15
未被充分利用的数据可视化
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案会得到事实,参考或专业知识的支持,但是这个问题可能会引起辩论,争论,民意调查或扩展讨论。如果您认为此问题可以解决并且可以重新提出,请访问帮助中心寻求指导。 8年前关闭。 直方图和散点图是可视化数据以及变量之间关系的好方法,但是最近我一直在想我缺少什么可视化技术。您认为最未被充分利用的情节类型是什么? 答案应该是: 在实践中不是很常用。 无需大量背景讨论就可以理解。 适用于许多常见情况。 包括可复制的代码以创建示例(最好在R中)。链接的图像会很好。

3
在geom_point中标记点
我正在使用的数据来自下面列出的互联网资源 nba <- read.csv("http://datasets.flowingdata.com/ppg2008.csv", sep=",") 我想做的是创建一个2D点图,比较该表中的两个指标,每个玩家代表图中的一个点。我有以下代码: nbaplot <- ggplot(nba, aes(x= MIN, y= PTS, colour="green", label=Name)) + geom_point() 这给了我以下内容: 我想要的是圆点旁边的玩家名称标签。我认为ggplot美学中的标签功能可以为我做到这一点,但事实并非如此。 我还尝试了text()function和textxy()from中的函数library(calibrate),但它们都似乎不适用于ggplot。 如何在这些点上添加名称标签?
178 r  plot  ggplot2  labeling  ggrepel 

2
使用Pandoc从Markdown转换为PDF时设置边距大小
我已经在RStudio中创建了一个RMarkdown文件,并设法使用knitr将其编织为HTML和.md文件。接下来,我使用pandoc将.md文件转换为PDF文件(如果尝试从.html文件转换,则会出现错误)。但是,生成的PDF的边距很大(例如http://johnmacfarlane.net/pandoc/demo/example13.pdf)。如何让Pandoc生产出利润更小的产品?我浏览了Pandoc用户指南,但没有发现任何有用的信息。
178 r  latex  markdown  knitr  pandoc 

10
错误:在R中找不到函数…
这是一个常见问题,请尽可能完整。答案是社区答案,因此,如果您认为缺少某些内容,请随时进行编辑。 该问题已在meta上进行了讨论和批准。 我正在使用R并尝试过,some.function但是出现以下错误消息: Error: could not find function "some.function" 这个问题经常出现。当您在R中遇到此类错误时,如何解决呢?

11
如何在R中选择CRAN镜像
我正在尝试通过R提示符执行以下操作来安装软件包: install.packages('RMySQL') 但是输出如下: --- Please select a CRAN mirror for use in this session --- 没别的!对于这个非常基本的问题,我找不到解决方案。我应该键入什么才能选择CRAN镜像? 编辑: 作业系统:Mac-OS X 10.6.8 R版本:2.15.0
177 r  package  install  cran 

5
dplyr包可以用于条件突变吗?
当突变是有条件的(取决于某些列值的值)时,可以使用突变吗? 这个例子有助于说明我的意思。 structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6, 5, 3), d = c(6, 2, 4, 5, 3, 7, 2, 6), e = c(1, 2, 4, 5, 6, 7, …

5
如何为具有稳定映射的ggplot2中的分类变量分配颜色?
在上个月,我一直在跟上R的发展。 这是我的问题: 为ggplot2中具有稳定映射的分类变量分配颜色的好方法是什么?我需要一组具有不同子集和不同数量类别变量的图形具有一致的颜色。 例如, plot1 <- ggplot(data, aes(xData, yData,color=categoricaldData)) + geom_line() 那里categoricalData有5个等级。 然后 plot2 <- ggplot(data.subset, aes(xData.subset, yData.subset, color=categoricaldData.subset)) + geom_line() 那里categoricalData.subset有3个等级。 但是,两组中的特定级别最终将具有不同的颜色,这使得更难于一起读取图形。 我是否需要在数据框中创建颜色矢量?还是有另一种方法可以将特定的颜色分配给类别?
176 r  ggplot2 


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.