程序设计 r

1

我正在使用lmer()包lme4来估计混合效果模型。这很好用，但是现在我要对固定数量的迭代运行估算过程，然后通过指定由上一个估算过程计算出的起始值来恢复过程。根据帮助，?lmer可以通过设置参数来实现： start-这些是新的起始值，根据帮助，可以ST从拟合模型中提取插槽中的值并使用这些值，即使用x@ST maxiter -作为命名参数提供给 control 因此，例如，假设我要lme使用iris数据来拟合一个，可以尝试一下： library(lme4) # Fit model with limited number of iterations frm <- "Sepal.Length ~ Sepal.Width | Species" x <- lmer(frm, data=iris, verbose=TRUE, control=list(maxIter=1), model=FALSE) # Capture starting values for next set of iterations start <- list(ST=x@ST) # Update model twoStep <- lmer(frm, data=iris, verbose=TRUE, …

69 r lme4 mixed-models lmer

1

knitr / Rmd：n行/ n距离后分页

请允许我说，这可能更适合作为html / css问题，但（a）我不太熟悉这些技术，并且（b）如果可能的话，我希望将其全部保留在家庭（R家族）中。我想使用Rmarkdownknitr编写学术风格的报告（APA 6类型指南）。我已经解决了大部分问题，但没有分页。我可以手动设置分页符，例如： # report ```{r setup, include=FALSE} # set global chunk options opts_chunk$set(cache=TRUE) ``` ------ ## Page 1 ```{r plot1} plot(1:10, 1:10) ``` ------ ## Page 2 在下面的.Rmd中，我想以编程方式设置n行/ n距离后的中断。所以说8英寸或140行之后。 # report ```{r setup, include=FALSE} # set global chunk options opts_chunk$set(cache=TRUE) ``` Initial Text. Yay! ```{r plot1} plot(1:10, …

69 r knitr r-markdown

10

R模型矩阵中因子的所有层次

我有一个data.frame由数字和因子组成的变量，如下所示。 testFrame <- data.frame(First=sample(1:10, 20, replace=T), Second=sample(1:20, 20, replace=T), Third=sample(1:10, 20, replace=T), Fourth=rep(c("Alice","Bob","Charlie","David"), 5), Fifth=rep(c("Edward","Frank","Georgia","Hank","Isaac"),4)) 我想建立一个matrix将虚拟变量分配给因子并仅保留数字变量的方法。 model.matrix(~ First + Second + Third + Fourth + Fifth, data=testFrame) 如预期的那样，在运行时，lm这会将每个因子的一个水平作为参考水平。但是，我想为matrix所有因素的每个层次建立一个带有虚拟/指标变量的。我正在为此建立矩阵，glmnet所以我不必担心多重共线性。有没有一种方法可以model.matrix为每个因子水平创建虚拟对象？

69 r matrix model indicator

6

使用％dopar％时如何打印

我有一个foreach循环，使用%dopar%与doSNOW作为后端。如何让循环在每次迭代中打印出一些内容？我下面的代码是我当前正在使用的代码，但未打印任何内容。 foreach(ntree=rep(25,2),.combine=combine,.packages='randomForest', .inorder=FALSE) %dopar% { print("RANDOM FOREST") randomForest(classForm,data=data,na.action=na.action,do.trace=do.trace,ntree=ntree,mtry=mtry) }

69 r foreach parallel-processing

2

如何告诉CRAN自动安装软件包依赖项？

我在R中开发了一个软件包，当我在本地计算机中检查并构建它时，它可以正常工作。但是，当我在CRAN中尝试时，出现了程序包依赖性错误。我的程序包取决于其他程序包的两个功能。如果我在descriptionusingDepends或之下列出了其他软件包imports，是否会与新软件包一起自动安装？还是我需要install.packages("packagename")在使用其他软件包的函数下显式调用该函数。如果这一切都是错误的，那么解决软件包依赖关系的最佳方法是什么，R以便通过R CMD check和build测试并提交给CRAN？谢谢。

69 r cran r-forge

2

用ggplot绘制函数，等效于curve（）

是否有与基础图形中使用ggplot的curve()命令相对应的方法来绘制函数？我想，替代方法是只创建函数值的向量并绘制一条连接的线，但是我希望有一些更简单的方法。谢谢！

69 r ggplot2 plot

8

不允许重复的“ row.names”错误

我正在尝试加载具有14列的csv文件，如下所示： StartDate, var1, var2, var3, ..., var14 当我发出此命令时： systems <- read.table("http://getfile.pl?test.csv", header = TRUE, sep = ",") 我收到一条错误消息。不允许重复的row.name 在我看来，第一列名称是造成此问题的原因。当我手动下载文件并StartDate从文件中删除名称时，R成功读取该文件并将第一列名称替换为X。有人可以告诉我怎么回事吗？该文件是（逗号分隔）的csv文件。

69 r csv r-faq

2

R图：大小和分辨率

我已经提出了一个问题：我需要绘制DPI = 1200和特定打印尺寸的图像。默认情况下，png看起来不错... png("test.png",width=3.25,height=3.25,units="in",res=1200) par(mar=c(5,5,2,2),xaxs = "i",yaxs = "i",cex.axis=1.3,cex.lab=1.4) plot(perf,avg="vertical",spread.estimate="stddev",col="black",lty=3, lwd=3) dev.off() 但是，当我应用此代码时，图像变得非常糟糕，无法缩放（适合）所需的大小。我错过了什么？如何将图像“适合”绘图？，

69 r png plot

8

R：向空数据框中添加行时丢失列名

我只是从R开始，遇到一个奇怪的行为：在空数据框中插入第一行时，原始列名丢失了。例： a<-data.frame(one = numeric(0), two = numeric(0)) a #[1] one two #<0 rows> (or 0-length row.names) names(a) #[1] "one" "two" a<-rbind(a, c(5,6)) a # X5 X6 #1 5 6 names(a) #[1] "X5" "X6" 如您所见，列名1和2被X5和X6代替。有人可以告诉我为什么会这样吗，并且有正确的方法来做到这一点而又不会丢失列名吗？ shot弹枪解决方案是将名称保存在辅助向量中，然后在完成对数据帧的处理后将其重新添加。谢谢内容：我创建了一个函数，该函数收集一些数据并将它们作为新行添加到作为参数接收的数据帧中。我创建数据框架，遍历数据源，将data.frame传递给每个函数调用以填充其结果。

69 r dataframe names rbind

5

如何在每个组中创建滞后变量？

我有一个data.table： set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b 1 -0.6264538 # 2: b 2 0.1836433 # 3: b 3 -0.8356286 # 4: a 1 1.5952808 # 5: a 2 0.3295078 # 6: a …

69 r data.table plyr dplyr

4

在绘制geom_bar（）时避免ggplot对x轴进行排序

我有以下要使用ggplot绘制的数据： SC_LTSL_BM 16.8275 SC_STSL_BM 17.3914 proB_FrBC_FL 122.1580 preB_FrD_FL 18.5051 B_Fo_Sp 14.4693 B_GC_Sp 15.4986 我要做的是绘制条形图并保持条形的顺序（即从开始SC_LTSL_BM ...B_GC_Sp）。但是ggplot geom_bar的默认行为是对它们进行排序。我该如何避免呢？ library(ggplot2) dat <- read.table("http://dpaste.com/1469904/plain/") pdf("~/Desktop/test.pdf") ggplot(dat,aes(x=V1,y=V2))+geom_bar() dev.off() 当前数字如下所示：

69 r ggplot2

3

将法线曲线叠加到R中的直方图

我设法在线找到了如何在R中将正常曲线叠加到直方图上，但是我想保留直方图的正常“频率” y轴。请参见下面的两个代码段，并注意在第二个y轴中如何用“密度”替换y轴。我如何像第一个图中那样将y轴保持为“频率”。作为奖励：我也想在密度曲线上标记SD区域（最高3 SD）。我怎样才能做到这一点？我试过了abline，但是线延伸到了图形的顶部，看起来很难看。 g = d$mydata hist(g) g = d$mydata m<-mean(g) std<-sqrt(var(g)) hist(g, density=20, breaks=20, prob=TRUE, xlab="x-variable", ylim=c(0, 2), main="normal curve over histogram") curve(dnorm(x, mean=m, sd=std), col="darkblue", lwd=2, add=TRUE, yaxt="n") 请参见上图中的y轴如何显示“密度”。我想让它成为“频率”。

69 r plot histogram gaussian

3

创建两个日期之间全天的向量

R中是否有一种简便的方法可以逐项列出两个指定日期之间发生的所有有效日期？例如，我想要以下输入： itemizeDates(startDate="12-30-11", endDate="1-4-12") 产生以下日期： "12-30-11" "12-31-11", "1-1-12", "1-2-12", "1-3-12", "1-4-12" 我对日期的类和格式很灵活，我只需要一个概念的实现即可。

69 r lubridate

4

“非零退出状态” R 3.0.1“ XML”和“ RCurl”

我在Ubuntu 13.10机器上安装XML和RCurl时遇到了一些麻烦。我今天执行了所有sudo更新和升级。我正在尝试将拨浪鼓用于R。我无法安装使用拨浪鼓所需的“ XML”。这是相当多的这是问同样的问题在这里仅仅一年后和不同的操作系统。以下是我返回的错误消息： > install.packages("RCurl") Installing package into ‘/home/steven/R/x86_64-pc-linux-gnu-library/3.0’ (as ‘lib’ is unspecified) trying URL 'http://cran.rstudio.com/src/contrib/RCurl_1.95-4.1.tar.gz' Content type 'application/x-gzip' length 870915 bytes (850 Kb) opened URL ================================================== downloaded 850 Kb * installing *source* package ‘RCurl’ ... ** package ‘RCurl’ successfully unpacked and MD5 sums checked checking for curl-config... no …

69 xml linux r rcurl install.packages

6

用dplyr拟合多个回归模型

我想使用dplyr每小时拟合一个模型（因子变量），但出现错误，而且我不太确定出什么问题了。 df.h <- data.frame( hour = factor(rep(1:24, each = 21)), price = runif(504, min = -10, max = 125), wind = runif(504, min = 0, max = 2500), temp = runif(504, min = - 10, max = 25) ) df.h <- tbl_df(df.h) df.h <- group_by(df.h, hour) group_size(df.h) # checks out, …

68 r dplyr

Questions tagged «r»