Questions tagged «r»

R是一种免费的开源编程语言和软件环境,用于统计计算,生物信息学,可视化和通用计算。请提供最少且可复制的示例以及所需的输出。使用`dput()`作为数据,并通过`library()`调用指定所有非基本包。不要为数据或代码嵌入图片,而应使用缩进的代码块。对于统计相关的问题,请使用https://stats.stackexchange.com。

5
R中字符串到日期的转换的“标准明确日期”格式是什么?
请考虑以下 $ R --vanilla > as.Date("01 Jan 2000") Error in charToDate(x) : character string is not in a standard unambiguous format 但该日期显然是标准的明确格式。为什么会显示错误消息? 更糟糕的是,一个模棱两可的日期显然没有任何警告或错误就被接受,然后被错误地阅读! > as.Date("01/01/2000") [1] "0001-01-20" 我搜索并在[R]标记中找到包含此错误消息的28个其他问题。所有解决方案和解决方法都涉及指定iiuc格式。这个问题的不同之处在于,我要问的是,标准明确格式在哪里定义,并且可以更改吗?每个人都收到这些消息还是仅仅是我?也许与语言环境有关? 换句话说,是否有比指定格式更好的解决方案? 包含“ [R]标准明确格式”的29个问题 > sessionInfo() R version 2.15.2 (2012-10-26) Platform: x86_64-w64-mingw32/x64 (64-bit) locale: [1] LC_COLLATE=English_United Kingdom.1252 [2] LC_CTYPE=English_United Kingdom.1252 [3] LC_MONETARY=English_United Kingdom.1252 …

11
如何舍入到最接近的10(或100或X)?
我正在写一个函数来绘制数据。我想为y轴指定一个不错的整数,该整数max大于数据集的最大值。 具体来说,我想foo执行以下功能: foo(4) == 5 foo(6.1) == 10 #maybe 7 would be better foo(30.1) == 40 foo(100.1) == 110 我已经达到了 foo <- function(x) ceiling(max(x)/10)*10 舍入到最接近的10,但这不适用于任意舍入间隔。 在R中有更好的方法吗?
93 r  rounding 

4
R中的整数类和数字类有什么区别
我想以说我是绝对的编程初学者作为开头,所以请原谅这个问题的基础。 我试图更好地理解R中的“原子”类,也许这对一般编程中的类都适用。我了解字符,逻辑和复杂数据类之间的区别,但是我一直在努力寻找数值类和整数类之间的根本区别。 假设我有一个简单x <- c(4, 5, 6, 6)的整数向量,将其作为整数类是有意义的。但是当class(x)我知道的时候[1] "numeric"。然后,如果我将此向量转换为整数类x <- as.integer(x)。它返回相同的数字列表,只是类别不同。 我的问题是为什么会这样,为什么一组整数的默认类是数字类,以及将整数设置为数字而不是整数的优缺点是什么?
93 r  class  object  integer  numeric 


5
R使用管道运算符时的条件评估%>%
当使用管道操作符%>%与包,如dplyr,ggvis,dycharts,等,我该怎么办了一步条件?例如; step_1 %>% step_2 %>% if(condition) step_3 这些方法似乎不起作用: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 有很长的路要走: if(condition) { step_1 %>% step_2 }else{ step_1 %>% step_2 %>% step_3 } 有没有所有冗余的更好方法吗?
93 r  dplyr  ggvis  magrittr 

1
ggplot geom_text字体大小控制
我尝试ggplot2通过执行以下操作将条形图的标签的字体更改为10 : ggplot(data=file,aes(x=V1,y=V3,fill=V2)) + geom_bar(stat="identity",position="dodge",colour="white") + geom_text(aes(label=V2),position=position_dodge(width=0.9), hjust=1.5,colour="white") + theme_bw()+theme(element_text(size=10)) ggsave(filename="barplot.pdf",width=4,height=4) 但是结果图像的条形图标签的字体大小超大。 然后我想到geom_text()用这个修改: geom_text(size=10,aes(label=V2),position=position_dodge(width=0.9), hjust=1.5,colour="white") 标签字体更大... 我可以将大小更改为geom_text3,现在看起来像字体10,类似于轴标签。 我想知道发生了什么事?确实theme(text=element_text(size=10))并不适用于标签? 为什么10 in的尺寸与in的尺寸geom_text()不同theme(text=element_text())?
93 r  ggplot2 

9
按列名对数据框的列进行排序
这可能是一个简单的问题,但我不知道如何按字母顺序对列进行排序。 test = data.frame(C = c(0, 2, 4, 7, 8), A = c(4, 2, 4, 7, 8), B = c(1, 3, 8, 3, 2)) # C A B # 1 0 4 1 # 2 2 2 3 # 3 4 4 8 # 4 7 7 3 # 5 …
93 r  sorting  dataset 


10
R中的线性回归和分组依据
我想使用该lm()函数在R中进行线性回归。我的数据是一个年度时间序列,其中一个字段表示年份(22年),另一个字段表示州(50个州)。我想对每个状态进行回归分析,以便最后获得lm响应向量。我可以想象对每个状态进行for循环,然后在循环内进行回归并将每个回归的结果添加到向量中。但是,这似乎不太像R。在SAS中,我将执行“ by”语句,而在SQL中,我将执行“ group by”。R做这件事的方法是什么?


7
如何创建一个空的R向量以添加新项目
我想在Rpy2模块提供的Python中使用R。我注意到R具有非常方便的[]操作,您可以通过该操作提取特定的列或行。如何通过Python脚本实现这样的功能? 我的想法是创建一个R向量并将这些需要的元素添加到该向量中,以便最终向量与R中的向量相同。我创建了一个seq(),但似乎它的起始数字为1,因此最终结果将始终为从数字1开始,这不是我想要的。那么,有没有更好的方法可以做到这一点?
92 python  r  vector  rpy2 


3
geom_smooth()有哪些可用的方法?
我正在使用geom_smooth()中ggplot2。 在Hadley Wickham的书(“ ggplot2-用于数据分析的优雅图形”)中,有一个示例(第51页)method="lm"被使用。在在线手册中,没有method论据。我看到有人在使用Google的其他结果(和此处的问题)method='loess'。 是否有详尽的清单可以解释这些选项? 从我所看到的,'lm'画一条直线,'loess'画一条非常平滑的曲线。我假设还有其他人在参考点之间绘制了更多的锯齿线? 该se示例中的参数也不在帮助或在线文档中。 FWIW这是我的代码。 p <- ggplot(output8, aes(age, myoutcome, group=id, colour=year_diag_cat2)) + geom_line() + scale_y_continuous(limits = c(lwr,upr)) p + geom_smooth(aes(group=year_diag_cat2), method="loess", size=2, se=F)
92 r  ggplot2 

6
按组获取最高值
这是一个示例数据框: d <- data.frame( x = runif(90), grp = gl(3, 30) ) 我想要d包含的行的子集,每个行的的前5个值都x为grp。 使用base-R,我的方法将类似于: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads <- lapply(splits, head) do.call(rbind, heads) ## x grp ## 1.19 0.8879631 1 ## 1.4 0.8844818 1 ## 1.12 0.8596197 1 ## 1.26 0.8481809 1 …
92 r  data.table  dplyr 

5
如何使用grid.arrange排列变量的可变列表?
library(ggplot2) df <- data.frame(x=1:10, y=rnorm(10)) p1 <- ggplot(df, aes(x,y)) + geom_point() plist <- list(p1,p1,p1,p1,p1) # In my real example,a plot function will fit a ggplot to a list of datasets #and return a list of ggplots like the example above. 我想使用grid.arrange()中来安排地块gridExtra。 如果地块数量多,我该怎么办 plist可变,? 这有效: grid.arrange(plist[[1]],plist[[2]],plist[[3]],plist[[4]],plist[[5]]) 但是我需要一个更通用的解决方案。有什么想法吗?
92 r  ggplot2 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.