Questions tagged «r»

R是一种免费的开源编程语言和软件环境,用于统计计算,生物信息学,可视化和通用计算。请提供最少且可复制的示例以及所需的输出。使用`dput()`作为数据,并通过`library()`调用指定所有非基本包。不要为数据或代码嵌入图片,而应使用缩进的代码块。对于统计相关的问题,请使用https://stats.stackexchange.com。

8
将值附加到R中的空向量吗?
我正在尝试学习R,但不知道如何添加到列表中。 如果这是Python我会的。。。 #Python vector = [] values = ['a','b','c','d','e','f','g'] for i in range(0,len(values)): vector.append(values[i]) 您如何在R中做到这一点? #R Programming > vector = c() > values = c('a','b','c','d','e','f','g') > for (i in 1:length(values)) + #append value[i] to empty vector
160 r  list  vector  append 

23
如何使用样本功能将数据分为训练/测试集
我刚开始使用R,但不确定如何将我的数据集与以下示例代码合并: sample(x, size, replace = FALSE, prob = NULL) 我有一个数据集需要进行训练(75%)和测试(25%)。我不确定应该在x和大小中输入哪些信息?x数据集文件是多少,大小是多少?
160 r  sample 

2
使用ggplot进行绘图时,just和vjust有什么作用?
每次我使用ggplot进行绘图时,我都会花一些时间尝试在诸如 + opts(axis.text.x = theme_text(hjust = 0.5)) 使轴标签对齐,使轴标签几乎与轴接触,并与轴齐平(可以说与轴对齐)。但是,我不太了解发生了什么。例如,通常会hjust = 0.5产生与截然不同的结果hjust = 0.6,以至于我无法仅仅通过使用不同的值来弄清楚。 谁能指出我对调整和调整选项如何工作的全面解释?
159 r  plot  ggplot2 



11
无痛方式安装新版本的R?
最近,安德鲁·盖尔曼(Andrew Gelman)对R缺乏便捷的升级过程感到遗憾(R在Windows上比Linux更为重要)。从安装软件到复制所有设置/软件包,是否有人有进行升级的好技巧? 该建议包含在评论中,这是我最近一直在使用的建议。首先,您安装新版本,然后在旧版本中运行它: #--run in the old version of R setwd("C:/Temp/") packages <- installed.packages()[,"Package"] save(packages, file="Rpackages") 随后在新版本中: #--run in the new version setwd("C:/Temp/") load("Rpackages") for (p in setdiff(packages, installed.packages()[,"Package"])) install.packages(p)
158 r  upgrade  packages 

5
根据向量以特定顺序对数据帧行进行排序
是否有一种更简单的方法来确保数据框的行根据我在下面的简短示例中实现的“目标”矢量进行排序? df <- data.frame(name = letters[1:4], value = c(rep(TRUE, 2), rep(FALSE, 2))) df # name value # 1 a TRUE # 2 b TRUE # 3 c FALSE # 4 d FALSE target <- c("b", "c", "a", "d") 这似乎有点“复杂”,无法完成工作: idx <- sapply(target, function(x) { which(df$name == x) }) df <- …
158 r  sorting  dataframe 

9
使用字符串向量输入按dplyr中的多列分组
我试图将我对plyr的理解转换为dplyr,但是我不知道如何按多个列进行分组。 # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get the columns we want to average within columns = names(data)[-3] # plyr - works ddply(data, columns, summarize, value=mean(value)) …
157 r  dplyr  r-faq 


2
从完整文件路径查找文件名
有没有一种方法可以从文件完整路径(文件路径的一部分)中提取文件名,而无需麻烦地处理字符串? Java中的等效项为: File f = new File ("C:/some_dir/a") f.getName() //output a f.getFullAbsolutePath() //output c:/some_dir/a
156 file  r  path 

13
单独数据分析师的R和版本控制
我尊重的许多数据分析师都使用版本控制。例如: http://github.com/hadley/ 请参阅http://permut.wordpress.com/2010/04/21/revision-control-statistics-bleg/ 但是,我正在评估采用git之类的版本控制系统是否值得。 简要概述: 我是一位社会科学家,他使用R来分析研究出版物的数据。我目前不生产R包。我的项目R代码通常包括几千行代码,用于数据输入,清理,操作,分析和输出生成。出版物通常使用LaTeX编写。 关于版本控制,我已经读过许多好处,但是它们似乎与单独数据分析师的关系不大。 备份:我已经有一个备份系统。 分叉和倒带:我从没有觉得有必要这样做,但是我可以看到它的用处(例如,您正在基于同一数据集准备多个期刊文章;您正在准备每月更新的报告等) ) 协作:大多数时候,我自己分析数据,因此,我无法获得版本控制的协作优势。 采用版本控制还涉及一些潜在成本: 是时候评估和学习版本控制系统了 与我当前的文件管理系统相比,可能会增加复杂性 但是,我仍然觉得自己缺少一些东西。关于版本控制的一般指南似乎更多地针对计算机科学家而不是数据分析师。 因此,特别是针对与上述情况类似的数据分析人员: 版本控制值得付出努力吗? 采用版本控制的主要利弊是什么? 使用R进行数据分析的版本控制的最佳策略是什么(例如,示例,工作流程构想,软件,指南链接)?
155 git  version-control  r 

9
通过逻辑条件过滤data.frame行
我想data.frame根据逻辑条件从中过滤行。假设我有像 expr_value cell_type 1 5.345618 bj fibroblast 2 5.195871 bj fibroblast 3 5.247274 bj fibroblast 4 5.929771 hesc 5 5.873096 hesc 6 5.665857 hesc 7 6.791656 hips 8 7.133673 hips 9 7.574058 hips 10 7.208041 hips 11 7.402100 hips 12 7.167792 hips 13 7.156971 hips 14 7.197543 hips 15 7.035404 …
155 r  subset  dataframe 

2
使用write.csv时禁止将行名写入文件
命令: t <- data.frame(v = 5:1, v2 = 9:5) write.csv(t, "t.csv") 结果文件: # "","v","v2" # "1",5,9 # "2",4,8 # "3",3,7 # "4",2,6 # "5",1,5 如何防止将具有行索引的第一列写入文件?
154 r  csv 

4
使用XML包将html表刮成R数据帧
如何使用XML包抓取html表? 以巴西足球队的维基百科页面为例。我想在R中阅读它,并获得“巴西与FIFA认可的球队进行的所有比赛的清单”表作为data.frame。我怎样才能做到这一点?
153 html  r  xml  parsing  web-scraping 

5
删除绘图轴值
我只是想知道是否有一种方法可以消除r绘图图中的x轴或y轴值。 我知道这axes = false将摆脱整个轴,但我只想摆脱编号。
153 r  plot  axis-labels 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.