Questions tagged «mixed-model»

混合(aka多级或分层)模型是线性模型,其中包括固定效应和随机效应。它们用于对纵向或嵌套数据建模。


3
R的lmer备忘单
这个论坛上有很多讨论,涉及使用来指定各种层次模型的正确方法lmer。 我认为将所有信息都放在一个地方会很棒。有几个问题要开始: 如何指定多个级别,其中一个组嵌套在另一个组中:是(1|group1:group2)还是(1+group1|group2)? (~1 + ....)和(1 | ...)和(0 | ...)等之间有什么区别? 如何指定小组级别的互动?

1
交叉与嵌套随机效应:它们有什么不同?如何在lme4中正确指定它们?
这是我对嵌套随机效应与交叉随机效应的理解: 当较低级别的因子仅出现在较高级别的因子的特定级别内时,会发生嵌套随机效应。 例如,班级内的学生在固定的时间点。 在lme4我看来,我们用两种等效方式中的任一种来表示嵌套数据的随机效应: (1|class/pupil) # or (1|class) + (1|class:pupil) 交叉随机效应意味着给定因子出现在上层因子的一个以上水平中。 例如,几年级的班级中有小学生。 在中lme4,我们将这样写: (1|class) + (1|pupil) 但是,当我查看特定的嵌套数据集时,我注意到两个模型公式给出的结果相同(下面的代码和输出)。但是,我看到了其他数据集,其中两个公式产生了不同的结果。那么这是怎么回事? mydata <- read.csv("https://web.archive.org/web/20160624172041if_/http://www-personal.umich.edu/~bwest/classroom.csv") # (the data is no longer at `http://www-personal.umich.edu/~bwest/classroom.csv` # hence the link to web.archive.org) # Crossed version: Linear mixed model fit by REML ['lmerMod'] Formula: mathgain ~ (1 | schoolid) …

2
我们应该对lme4中的收敛警告感到多么恐惧
如果我们重新装上一目了然的眼镜,我们可能会收到一条警告,告知我们该模型正在难以收敛...例如 >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.00389462 (tol = 0.001) @Ben Bolker 在此线程中讨论的另一种检查收敛的方法是: relgrad <- with(model@optinfo$derivs,solve(Hessian,gradient)) max(abs(relgrad)) #[1] 1.152891e-05 如果max(abs(relgrad))可以,<0.001那么事情可能没事...所以在这种情况下,我们得出的结果相互矛盾?我们应该如何在方法之间进行选择,并通过模型拟合感到安全? 另一方面,当我们获得更多极限值时,例如: >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = …

4
如何为混合效果模型选择nlme或lme4 R库?
我使用lme4in 拟合了一些混合效果模型(尤其是纵向模型),R但希望真正掌握这些模型以及它们附带的代码。 但是,在双脚潜水(并购买一些书籍)之前,我想确保自己正在学习正确的图书馆。到目前为止,我已经用完lme4了,因为我发现它比容易得多nlme,但是如果nlme对我的目的更好,那么我应该使用它。 我敢肯定,两者都不是简单化的“更好”,但我会重视一些意见或想法。我的主要标准是: 易于使用(我是一名受过训练的心理学家,并不精通统计学或编码,但我正在学习) 拟合纵向数据的好功能(如果这里有区别,但这是我主要使用它们的目的) 好的(易于解释的)图形摘要,再次不确定这里是否有区别,但是我经常为技术水平不高的人制作图形,因此漂亮的清晰图总是很好的(我非常喜欢网格中的xyplot函数() 为此原因)。 和往常一样,希望这个问题不要太含糊,并在此先感谢您的智慧!

3
什么是“限制最大可能性”,什么时候应使用?
我已阅读的抽象本文认为: “通过修改Patterson和Thompson的变换对Hartley aud Rao的最大似然(ML)程序进行了修改,该变换将似然渲染正态性划分为两个部分,其中一个没有固定影响。最大化这部分会产生所谓的受限最大似然(REML)估算器。” 我还在本文摘要中阅读了REML: “考虑到由于估计固定效应而导致的自由度损失。” 遗憾的是,我无法访问这些论文的全文(如果这样做的话,可能会无法理解)。 此外,REML与ML有何优势?在拟合混合效果模型时,在什么情况下REML优于ML(反之亦然)?请提供适合具有高中(或刚刚毕业)数学背景的人的解释!

5
关于收缩的统一观点:斯坦因悖论,岭回归和混合模型中的随机效应之间有什么关系(如果有)?
考虑以下三种现象。 斯坦因悖论:给定一些来自多元正态分布的数据,样本均值并不是真实均值的很好估计。如果将样本均值的所有坐标都缩小为零(或者如果我理解正确的话,实际上是缩小为任何值),则可以获得具有较低均方误差的估计。Rn,n≥3Rn,n≥3\mathbb R^n, \: n\ge 3 注意:通常斯坦因悖论是通过仅考虑单个数据点而得出的;如果这很关键并且我上面的说法不正确,请纠正我。RnRn\mathbb R^n Ridge回归:给定一些因变量和一些自变量,标准回归趋于过度拟合数据并导致糟糕的样本外性能。通常可以通过将缩小为零来减少过度拟合:。X β = (X ⊤ X )- 1 X ⊤ Ŷ β β = (X ⊤ X + λ 我)- 1 X ⊤ ÿyy\mathbf yXX\mathbf Xβ=(X⊤X)−1X⊤yβ=(X⊤X)−1X⊤y\beta = (\mathbf X^\top \mathbf X)^{-1} \mathbf X^\top \mathbf yββ\betaβ=(X⊤X+λI)−1X⊤yβ=(X⊤X+λI)−1X⊤y\beta = (\mathbf X^\top \mathbf X + \lambda …

3
何时使用广义估计方程与混合效应模型?
我已经很高兴将混合效果模型用于纵向数据已有一段时间了。我希望我能适应lmer中的AR关系(我认为我做不到这一点是对的吗?),但我不认为这非常重要,因此我不必担心太多。 我刚刚遇到了广义估计方程(GEE),它们似乎比ME模型具有更大的灵活性。 冒着问一个笼统的问题的风险,是否有任何建议适合于不同的任务?我看过一些比较它们的论文,它们的形式通常是: “在这个高度专业化的领域,不要将GEE用于X,不要将ME模型用于Y”。 我没有找到更多一般性建议。谁能启发我? 谢谢!
63 mixed-model  gee 

9
如何在lme4混合模型中获得效果的p值(检查显着性)?
我在R中使用lme4来适应混合模型 lmer(value~status+(1|experiment))) 价值是连续的,状态和实验是因素,我得到 Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 -9.548 5.911 19.1 Random effects: Groups Name Variance Std.Dev. experiment (Intercept) 0.065526 0.25598 Residual 0.053029 0.23028 Number of obs: 264, groups: experiment, 10 Fixed effects: Estimate …

5
计量经济学中的“随机效应模型”与计量经济学之外的混合模型有何关系?
我曾经认为计量经济学中的“随机效应模型”对应于计量经济学之外的“带有随机截距的混合模型”,但是现在我不确定。可以? 计量经济学使用的“固定效应”和“随机效应”等术语与混合模型的文献有些不同,这引起了众所周知的混乱。让我们考虑一个简单的情况,其中yyy线性依赖于xxx但是在不同的测量组中截距不同: yit=βxit+ui+ϵit.yit=βxit+ui+ϵit.y_{it} = \beta x_{it} + u_i + \epsilon_{it}. 在这里,每个单位/组iii在不同的时间点观察到ttt。计量经济学家称其为“面板数据”。 在混合模型术语中,我们可以将uiuiu_i视为固定效应或随机效应(在这种情况下,它是随机截距)。把它当作固定装置嵌合β和ü我以最小化均方误差(即运行OLS回归与虚设组变量)。处理它,我们还假定作为随机手段ü 我〜Ñ(Û 0,σ 2 ù),并使用最大可能性,以适应ü 0和σ 2 Ù代替各嵌合ù 我β^β^\hat \betau^iu^i\hat u_iui∼N(u0,σ2u)ui∼N(u0,σu2)u_i\sim\mathcal N(u_0,\sigma^2_u)u0u0u_0σ2uσu2\sigma^2_uuiuiu_i在其自己的。这导致“局部集中”的效应,其中估计ü我得到朝缩水它们的平均ü 0。u^iu^i\hat u_iu^0u^0\hat u_0 R formula when treating group as fixed: y ~ x + group R formula when treating group as random: y ~ x + (1|group) …

3
有关如何在lmer中指定随机效应的问题
我最近通过测量在不同上下文中查看该单词时的ERP(EEG),测量了在反复暴露(练习:第1天到第10天)时如何获取一个新单词的含义。我还控制了上下文的属性,例如,它对发现新词义(高或低)的有用性。我对练习的效果(天)特别感兴趣。由于单独的ERP记录比较嘈杂,因此可以通过对特定条件的试验求平均值来获得ERP组件值。通过该lmer函数,我应用了以下公式: lmer(ERPindex ~ practice*context + (1|participants), data=base) 和 lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 在文献中,我还看到了以下等效随机效应: lmer(ERPindex ~ practice*context + (practice|participants) + (practice|participants:context), data=base) 使用以下形式的随机因子可以完成什么工作participants:context?是否有一个很好的资源可以让对矩阵代数仅有粗略了解的人准确地了解线性混合模型中的随机因素是什么以及应该如何选择它们?

3
对数转换的预测变量和/或响应的解释
我想知道是否仅对因变量(无论是因变量还是自变量)还是仅对自变量进行了对数转换,在解释上是否有所不同。 考虑以下情况 log(DV) = Intercept + B1*IV + Error 我可以将IV解释为百分比增长,但是当我拥有 log(DV) = Intercept + B1*log(IV) + Error 或当我有 DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
使用lmer进行重复测量的线性混合效应模型
编辑2:我本来以为我需要对一个因素进行重复测量的两因素方差分析,但现在我认为线性混合效应模型将对我的数据更好。我想我几乎知道需要做什么,但仍然有些困惑。 我需要分析的实验如下: 将受试者分配到几个治疗组之一 在多天的时间对每个受试者进行测量 所以: 受试者嵌套在治疗中 治疗越过一天 (每个受试者仅被分配一种治疗,并且每天对每个受试者进行测量) 我的数据集包含以下信息: 主题=阻止因素(随机因素) 天=主题或重复测量因子之内(固定因子) 治疗=主观因素之间(固定因素) Obs =测得(因变量) 更新 好,所以我去找统计学家,但他是SAS用户。他认为该模型应为: 治疗+天+受试者(治疗)+天*受试者(治疗) 显然,他的表示法与R语法不同,但是该模型应考虑以下因素: 治疗(固定) 日(固定) 治疗*天互动 受试者嵌套在治疗内(随机) 当天与“治疗中的受试者”交叉(随机) 那么,这是使用正确的语法吗? m4 <- lmer(Obs~Treatment*Day + (1+Treatment/Subject) + (1+Day*Treatment/Subject), mydata) 我特别担心当天与“治疗中的受试者”部分是否正确。是否有任何熟悉SAS的人,或者对他们了解模型中正在发生的事情有信心的人,能够评论我对R语法的可悲尝试是否匹配? 这是我以前建立模型和编写语法的尝试(在答案和评论中讨论): m1 <- lmer(Obs ~ Treatment * Day + (1 | Subject), mydata) 我该如何处理对象嵌套在治疗中的事实?如何m1从不同: m2 <- lmer(Obs …


2
R中lmer()混合效应模型的预测间隔
我想从lmer()模型获得围绕预测的预测间隔。我发现了一些有关此的讨论: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq 但他们似乎并未考虑随机效应的不确定性。 这是一个具体的例子。我在比赛金鱼。我有过去100场比赛的数据。考虑到我的RE估算和FE估算的不确定性,我想预测第101位。我包括鱼的随机拦截(有10种不同的鱼)和重量的固定效应(较轻的鱼更快)。 library("lme4") fish <- as.factor(rep(letters[1:10], each=100)) race <- as.factor(rep(900:999, 10)) oz <- round(1 + rnorm(1000)/10, 3) sec <- 9 + rep(1:10, rep(100,10))/10 + oz + rnorm(1000)/10 fishDat <- data.frame(fishID = fish, raceID = race, fishWt = oz, time = sec) head(fishDat) plot(fishDat$fishID, fishDat$time) lme1 <- lmer(time …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.