Questions tagged «r»

对于(a)涉及“ R”作为问题的关键部分或预期答案的任何* on-topic *问题,请使用此标签;&(b)关于如何使用“ R”并非“正当”。

5
在生物学,心理学和医学领域使用lmer进行混合模型分析的示例报告?
由于通常的共识似乎是lmer()在R中使用混合模型而不是经典的ANOVA(由于经常提到的原因,例如不平衡设计,交叉随机效应等),我想尝试一下我的数据。但是,我担心我将这种方法“卖”给我的主管(后者希望最终进行p值的经典分析)或以后再将其“出售”给审稿人。 您能推荐一些使用混合模型或lmer()针对不同设计(例如重复测量)或针对领域生物学,心理学,医学的多个学科内部和学科之间设计的不同设计的发表文章的好例子吗?

1
从模型中删除项后的适当剩余自由度
我正在反思有关该问题的讨论,尤其是弗兰克·哈雷尔(Frank Harrell)的评论,即简化模型(即已测试并拒绝了许多解释变量的模型)中的方差估计应使用Ye的广义自由度。哈雷尔教授指出,与最终模型(其中许多变量已被拒绝)相比,这将更接近原始“完全”模型(包含所有变量)的剩余自由度。 问题1。如果我想对简化模型中的所有标准摘要和统计数据使用适当的方法(但未全面实施广义自由度),一种合理的方法是仅使用来自以下模型的剩余自由度:我的剩余方差估算中的完整模型等? 问题2。如果上述情况是正确的,并且我想在中进行操作R,那么它可能像设置一样简单 finalModel$df.residual <- fullModel$df.residual 在模型拟合练习中的某个时刻,使用lm()或类似函数创建了finalModel和fullModel。之后,诸如summary()和confint()之类的函数似乎可以与所需的df.residual一起使用,尽管返回的错误消息表明有人显然已经对finalModel对象进行了修改。

3
R中的符号计算
我想知道是否可以在R中进行符号计算? 例如, 我希望得到3D高斯分布的符号协方差矩阵的逆矩阵。 我还可以在R中进行符号积分和微分吗?
27 r 

4
使用CART时如何衡量/排列“可变重要性”?(特别是使用R中的{rpart})
当使用rpart(在R中)构建CART模型(特别是分类树)时,通常很有趣的一点是,了解引入模型的各种变量的重要性。 因此,我的问题是: 对于CART模型中的参与变量的排名/衡量变量重要性,存在哪些常用措施?以及如何使用R来计算(例如,使用rpart包时) 例如,下面是一些伪代码,它们是创建的,以便您可以在上面显示解决方案。此示例经过结构设计,很明显变量x1和x2是“重要的”,而(在某种意义上)x1比x2更重要(因为x1应该适用于更多情况,因此对数据结构的影响更大,然后x2)。 set.seed(31431) n <- 400 x1 <- rnorm(n) x2 <- rnorm(n) x3 <- rnorm(n) x4 <- rnorm(n) x5 <- rnorm(n) X <- data.frame(x1,x2,x3,x4,x5) y <- sample(letters[1:4], n, T) y <- ifelse(X[,2] < -1 , "b", y) y <- ifelse(X[,1] < 0 , "a", y) require(rpart) fit <- …

2
使用R的时间序列的STL趋势
我是R和时间序列分析的新手。我试图找到较长的(40年)每日温度时间序列的趋势,并尝试采用不同的近似值。第一个只是简单的线性回归,第二个是Loess的时间序列的季节性分解。 在后者看来,季节性成分大于趋势。但是,如何量化趋势?我只想说一说这个趋势有多强。 Call: stl(x = tsdata, s.window = "periodic") Time.series components: seasonal trend remainder Min. :-8.482470191 Min. :20.76670 Min. :-11.863290365 1st Qu.:-5.799037090 1st Qu.:22.17939 1st Qu.: -1.661246674 Median :-0.756729578 Median :22.56694 Median : 0.026579468 Mean :-0.005442784 Mean :22.53063 Mean : -0.003716813 3rd Qu.:5.695720249 3rd Qu.:22.91756 3rd Qu.: 1.700826647 Max. :9.919315613 …
27 r  time-series  trend 

1
lmer混合效应模型的predict()函数
问题: 我读过其他文章,这些文章predict不适用于lmer[R]中的混合效果{lme4}模型。 我尝试通过玩具数据集探索这个主题... 背景: 数据集是根据此来源改编的,可作为... require(gsheet) data <- read.csv(text = gsheet2text('https://docs.google.com/spreadsheets/d/1QgtDcGJebyfW7TJsB8n6rAmsyAnlz1xkT3RuPFICTdk/edit?usp=sharing', format ='csv')) 这些是第一行和标题: > head(data) Subject Auditorium Education Time Emotion Caffeine Recall 1 Jim A HS 0 Negative 95 125.80 2 Jim A HS 0 Neutral 86 123.60 3 Jim A HS 0 Positive 180 204.00 4 Jim A …

2
如何在聚类中同时使用二进制变量和连续变量?
我需要在k均值中使用二进制变量(值0和1)。但是k均值仅适用于连续变量。我知道有些人仍然在k均值中使用这些二进制变量,而忽略了k均值仅用于连续变量的事实。这对我来说是不可接受的。 问题: 那么在k均值/层次聚类中使用二进制变量的统计/数学正确方法是什么? 如何在SAS / R中实施解决方案?

2
在for循环中生成变量名列表,然后为其分配值
我想知道是否有一种简单的方法可以使用for循环生成变量列表并提供其值。 for(i in 1:3) { noquote(paste("a",i,sep=""))=i } 在上面的代码中,我尝试创建a1,a2,a3,其分配到的值1,2,3。但是,R给出一个错误信息。谢谢你的帮助。
27 r 

3
R Caret和NA
我非常喜欢插入符号的参数调整能力和统一的界面,但是我观察到,即使应用的“裸”模型允许使用NA,它始终需要完整的数据集(即没有NA)。这很麻烦,因为应该使用费力的插补方法,而这些方法一开始并不需要。一个人如何逃避归因并仍然使用插入符号优势?

2
仅当包含交互项时,共线性诊断才有问题
我对美国各县进行了回归分析,并正在检查“独立”变量中的共线性。Belsley,Kuh和Welsch的回归诊断建议考虑条件指数和方差分解比例: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index Variance Decomposition Proportions (Intercept) inc09_10k unins09 sqmi_log pop10_perSqmi_log phys_per100k nppa_per100k black10_pct hisp10_pct elderly09_pct inc09_10k:unins09 1 1.000 0.000 0.000 0.000 0.000 0.001 0.002 0.003 0.002 0.002 0.001 0.000 2 3.130 0.000 0.000 0.000 0.000 0.002 0.053 0.011 0.148 0.231 0.000 …

2
转换变量以在R中进行多元回归
我正在尝试在中执行多元回归R。但是,我的因变量具有以下曲线: 这是一个散点图矩阵,其中包含我所有的变量(WAR是因变量): 我知道我需要对此变量(可能还有自变量?)执行转换,但是我不确定所需的确切转换。有人可以指出我正确的方向吗?我很高兴提供有关自变量和因变量之间关系的任何其他信息。 通过回归分析得出的诊断图形如下: 编辑 使用Yeo-Johnson转换对因变量和自变量进行转换后,诊断图如下所示: 如果我将GLM与日志链接一起使用,则诊断图形为:

6
将正弦项拟合到数据
尽管我读了这篇文章,但我仍然不知道如何将其应用于我自己的数据,并希望有人能帮助我。 我有以下数据: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, 10.950483, 10.522091, 9.346292, 7.014578, 6.981853, 7.197708, 7.035624, 6.785289, 7.134426, 8.338514, 8.723832, 10.276473, 10.602792, 11.031908, 11.364901, 11.687638, 11.947783, 12.228909, 11.918379, 12.343574, 12.046851, 12.316508, 12.147746, 12.136446, 11.744371, 8.317413, 8.790837, 10.139807, 7.019035, 7.541484, 7.199672, 9.090377, 7.532161, 8.156842, 9.329572, 9.991522, …
26 r  regression  fitting 

2
估计向量中值的分位数
我有一组实数。我需要估计一个新数字的分位数。在R中有什么干净的方法可以做到这一点吗?一般来说? 我希望这不是微不足道的;-) 非常感谢您的回复。 PK
26 r 

1
如何在线性回归中解释系数标准误差?
我想知道在R中使用显示功能时如何解释回归的系数标准误。 例如,在以下输出中: lm(formula = y ~ x1 + x2, data = sub.pyth) coef.est coef.se (Intercept) 1.32 0.39 x1 0.51 0.05 x2 0.81 0.02 n = 40, k = 3 residual sd = 0.90, R-Squared = 0.97 更高的标准误差是否意味着更大的意义? 同样对于残留标准偏差,较高的值表示较大的扩展,但是R平方显示出非常接近的拟合度,这不是矛盾吗?

7
测试矩阵列之间的线性相关性
我有一个行列式为零的安全收益相关矩阵。(这有点令人惊讶,因为样本相关矩阵和相应的协方差矩阵在理论上应该是正定的。) 我的假设是,至少一种证券线性依赖于其他证券。R中是否有一个函数可以按顺序测试每个列的线性相关性? 例如,一种方法是一次建立一个安全性的相关矩阵,并在每个步骤计算行列式。当行列式= 0时,请停止运行,因为您已确定证券是其他证券的线性组合。 识别在这样的矩阵中的线性相关性的任何其他技术是可以理解的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.