Questions tagged «mixed-model»

混合(aka多级或分层)模型是线性模型,其中包括固定效应和随机效应。它们用于对纵向或嵌套数据建模。

1
双胞胎研究数据的线性混合效应建模
假设我有一些响应变量,该变量是从第个家庭中的第个兄弟姐妹测得的。另外,从每个受试者同时收集了一些行为数据。我正在尝试使用以下线性混合效应模型来分析情况: j i x i jyijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} 其中和分别是固定截距和斜率, 是随机斜率,而是残差。α 1 δ 1 我 ε 我Ĵα0α0\alpha_0α1α1\alpha_1δ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} 随机效应和残余的假设是(假设每个家庭中只有两个同胞) ε 我Ĵδ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} δ1 我(ε我1,ε我2)Ť〜dñ(0 ,τ2)〜dñ((0 ,0 )Ť,R )δ1i∼dN(0,τ2)(εi1,εi2)T∼dN((0,0)T,R)\begin{align} \delta_{1i} &\stackrel{d}{\sim} N(0, \tau^2) \\[5pt] (\varepsilon_{i1}, \varepsilon_{i2})^T &\stackrel{d}{\sim} N((0, 0)^T, R) \end{align} 其中是未知方差参数,方差-协方差结构是2 x 2形式的对称矩阵 - …

4
用R中的随机效应估计折断的棒/分段线性模型中的断点[包括代码和输出]
当我还需要估计其他随机效应时,有人可以告诉我如何让R估计分段线性模型中的断裂点(作为固定或随机参数)吗? 我在下面提供了一个玩具示例,该示例适合曲棍球杆/折断的杆回归,其随机点的斜率变化和y轴截距的随机变化为4的断裂点。我想估算断裂点而不是指定断裂点。它可以是随机效果(最好)或固定效果。 library(lme4) str(sleepstudy) #Basis functions bp = 4 b1 <- function(x, bp) ifelse(x < bp, bp - x, 0) b2 <- function(x, bp) ifelse(x < bp, 0, x - bp) #Mixed effects model with break point = 4 (mod <- lmer(Reaction ~ b1(Days, bp) + b2(Days, bp) + (b1(Days, …

3
分析纵向数据集时使用aov()和lme()有什么区别?
谁能告诉我使用aov()和lme()分析纵向数据之间的区别,以及如何解释这两种方法的结果? 下面,我使用aov()和分析相同的数据集,lme()并得到2个不同的结果。使用时aov(),我在治疗交互作用的时间上得到了显着的结果,但是在拟合线性混合模型时,通过治疗交互作用的时间是无关紧要的。 > UOP.kg.aov <- aov(UOP.kg~time*treat+Error(id), raw3.42) > summary(UOP.kg.aov) Error: id Df Sum Sq Mean Sq F value Pr(>F) treat 1 0.142 0.1421 0.0377 0.8471 Residuals 39 147.129 3.7725 Error: Within Df Sum Sq Mean Sq F value Pr(>F) time 1 194.087 194.087 534.3542 < 2e-16 *** time:treat 1 2.077 …

1
复合对称情况下(0 + factor | group)和(1 | group)+(1 | group:factor)随机效应规格的等价关系
道格拉斯·贝茨(Douglas Bates)指出,以下模型是等效的:“如果向量值随机效应的方差-协方差矩阵具有一种特殊形式,称为复合对称”(本演示文稿中的幻灯片91): m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) 具体而言,贝茨使用以下示例: library(lme4) data("Machines", package = "MEMSS") m1a <- lmer(score ~ Machine + (0 + Machine|Worker), Machines) m2a <- lmer(score ~ Machine + (1|Worker) + (1|Worker:Machine), Machines) 具有相应的输出: print(m1a, …

1
方差分析是否依靠矩量法而不是最大似然法?
我在不同地方看到提到ANOVA使用矩量法进行估算。 我对这个说法感到困惑,因为即使我不熟悉矩量法,但我的理解是,它不同于最大似然法,并且不等同于最大似然法。另一方面,方差分析可以看作是具有类别预测变量的线性回归,回归参数的OLS估计是最大可能性。 所以: 什么使方差分析程序符合力矩方法? 鉴于ANOVA等同于带有分类预测变量的OLS,这不是最大可能性吗? 如果这两种方法在常规ANOVA的特殊情况下以某种方式等效,那么当差异变得重要时,是否存在某些特定的ANOVA情况?不平衡的设计?重复措施?混合(学科间+学科内)设计?

1
观测值不独立时的无效推论
我在基本统计中了解到,对于一般的线性模型而言,要使推论有效,观察必须是独立的。发生聚类时,除非考虑到这一点,否则独立性不再可能导致无效的推理。解决这种聚类的一种方法是使用混合模型。我想找到一个示例数据集,无论是否模拟,都可以清楚地说明这一点。我尝试使用UCLA网站上的示例数据集之一来分析聚类数据 > require(foreign) > require(lme4) > dt <- read.dta("http://www.ats.ucla.edu/stat/stata/seminars/svy_stata_intro/srs.dta") > m1 <- lm(api00~growth+emer+yr_rnd, data=dt) > summary(m1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 740.3981 11.5522 64.092 <2e-16 *** growth -0.1027 0.2112 -0.486 0.6271 emer -5.4449 0.5395 -10.092 <2e-16 *** yr_rnd -51.0757 19.9136 -2.565 0.0108 * > m2 <- lmer(api00~growth+emer+yr_rnd+(1|dnum), …

1
对混合效应模型的预测:如何处理随机效应?
让我们考虑这个假设的数据集: set.seed(12345) num.subjects <- 10 dose <- rep(c(1,10,50,100), num.subjects) subject <- rep(1:num.subjects, each=4) group <- rep(1:2, each=num.subjects/2*4) response <- dose*dose/10 * group + rnorm(length(dose), 50, 30) df <- data.frame(dose=dose, response=response, subject=subject, group=group) 我们可以使用lme随机效应模型对响应进行建模: require(nlme) model <- lme(response ~ dose + group + dose*group, random = ~1|subject, df) 我想使用predict该模型的结果来获取例如第1组的一般主题对剂量10的响应: pred <- …

2
具有多个变量的类内相关系数(ICC)
假设我在同胞中测量了一些变量,这些变量嵌套在家庭中。数据结构如下所示: 家庭同胞价值 ------ ------- ----- 1 1 y_11 1 2 y_12 2 1 y_21 2 2 y_22 2 3 y_23 …… 我想知道同一家庭中对兄弟姐妹进行的测量之间的相关性。常用的方法是根据随机拦截模型计算ICC: res <- lme(yij ~ 1, random = ~ 1 | family, data=dat) getVarCov(res)[[1]] / (getVarCov(res)[[1]] + res$s^2) 这等效于: res <- gls(yij ~ 1, correlation = corCompSymm(form = ~ …

3
线性混合效应模型
我通常听说LME模型在准确性数据的分析(即心理学实验)中更为健全,因为它们可以处理传统方法(例如ANOVA)无法实现的二项分布和其他非正态分布。 LME模型的数学基础是什么,这些模型可以使它们合并其他分布,还有一些不太技术的论文对此进行了描述?

1
从混合效应模型(lme4)中提取案例的斜率
我想在混合效果模型中提取每个人的斜率,如下段所述 混合效应模型被用来表征认知摘要测度中各个变化路径的特征,包括年龄,性别和受教育年限等术语作为固定效应(Laird and Ware,1982; Wilson et al。,2000,2002c)。在对年龄,性别和教育程度的影响进行调整后,从混合模型中提取了残差的个体认知下降斜率项。然后将特定于人的调整后的残留斜率用作遗传关联分析的定量结果表型。这些估计值等于个人的斜率与相同年龄,性别和受教育程度的个人的预测斜率之差。 De Jager,PL,Shulman,JM,Chibnik,LB,Keenan,BT,Raj,T.,Wilson,RS等。(2012)。全基因组扫描,寻找影响年龄相关的认知衰退率的常见变异。衰老的神经生物学,33(5),1017.e1-1017.e15。 我已经看过使用该coef函数提取每个人的系数,但是我不确定这是否是正确的方法。 谁能提供一些有关如何执行此操作的建议? #example R code library(lme4) attach(sleepstudy) fml <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) beta <- coef(fml)$Subject colnames(beta) <- c("Intercept", "Slope") beta summary(beta) summary(fm1)
13 r  mixed-model 

2
使用Nakagawa&Schielzeth(2013)R2glmm方法在混合模型中计算
我一直在阅读有关在混合模型中计算值的信息,在阅读了R-sig常见问题解答之后,该论坛上的其他帖子(我会链接一些但我没有足够的声誉)以及其他一些参考资料,我知道使用在混合模型的上下文中,值很复杂。R2R2R^2R2R2R^2 但是,我最近在下面看到了这两篇论文。尽管这些方法对我来说确实很有希望,但我不是统计学家,因此我想知道其他人是否会对他们提出的方法以及与其他提出的方法进行比较有任何见解。 Nakagawa,Shinichi和Holger Schielzeth。“从广义线性混合效应模型获得R2的通用且简单的方法。” 《生态与进化中的方法》 4.2(2013):133-142。 约翰逊,保罗CD。“将Nakagawa&Schielzeth的R2GLMM扩展到随机斜率模型。” 《生态与进化中的方法》(2014年)。 也可以使用MuMIn包中的r.squaredGLMM函数来实现is方法,该方法提供了对该方法的以下描述。 对于混合效应模型,可以分为两种类型。边际代表用固定因子解释的方差,并定义为: 条件R ^ 2被解释为由固定和随机因素(即整个模型)解释的方差,并根据以下公式计算: R_ {GLMM}(c)^ 2 = \ frac {(σ_f ^ 2 + \ sum(σ_l^ 2))} {(σ_f^ 2 + \ sum(σ_l^ 2)+σ_e^ 2 +σ_d^ 2} 其中σ_f^ 2是固定效应分量的方差,并且\ sum (σ_l^ 2)是所有方差分量(组,个体等)的总和,σ_l^ 2R2R2R^2R2R2R^2RGLMM(m)2=σ2fσ2f+∑(σ2l)+σ2e+σ2dRGLMM(m)2=σf2σf2+∑(σl2)+σe2+σd2R_{GLMM}(m)^2 = \frac{σ_f^2}{σ_f^2 + \sum(σ_l^2) + σ_e^2 + σ_d^2}R2R2R^2RGLMM(c)2=(σ2f+∑(σ2l))(σ2f+∑(σ2l)+σ2e+σ2dRGLMM(c)2=(σf2+∑(σl2))(σf2+∑(σl2)+σe2+σd2R_{GLMM}(c)^2= \frac{(σ_f^2 …

1
图解线性混合效应模型结果的图
我一直在使用R中的线性混合效果建模来分析一些数据。我打算用结果制作海报,我只是想知道是否有人对混合效果模型有经验,可以建议使用哪些图表来说明结果?模型。我在考虑残差图,拟合值与原始值的图等。 我知道这很大程度上取决于我的数据,但我只是想尝试一种最佳方法来说明线性混合效应模型的结果。我在R中使用nlme软件包。 谢谢

1
非线性混合模型(NLME)的预测置信区间
我想获得非线性混合nlme模型预测的95%置信区间。由于没有提供任何标准来执行此操作nlme,因此我想知道使用“人口预测间隔”方法是否正确(如Ben Bolker的书章所述,该模型基于最大似然的模型)根据拟合模型的方差-协方差矩阵对固定效应参数进行重采样,基于此模拟进行预测,然后取这些预测的95%百分数得到95%的置信区间? 执行此操作的代码如下:(我在这里使用nlme帮助文件中的“ Loblolly”数据) library(effects) library(nlme) library(MASS) fm1 <- nlme(height ~ SSasymp(age, Asym, R0, lrc), data = Loblolly, fixed = Asym + R0 + lrc ~ 1, random = Asym ~ 1, start = c(Asym = 103, R0 = -8.5, lrc = -3.3)) xvals=seq(min(Loblolly$age),max(Loblolly$age),length.out=100) nresamp=1000 pars.picked = mvrnorm(nresamp, mu = …

2
ICC作为同一组中两个随机抽取的单元之间的预期相关性
在多层次建模中,类内相关性通常是根据随机效应方差分析来计算的 yij=γ00+uj+eijyij=γ00+uj+eij y_{ij} = \gamma_{00} + u_j + e_{ij} 其中ujuju_j是2级残差,而eijeije_{ij}是1级残差。然后,我们得到的估计σ^2uσ^u2\hat{\sigma}_u^2和σ 2 Ë为的方差ü Ĵ和Ë 我Ĵ分别,并将其插入公式如下:σ^2eσ^e2\hat{\sigma}_e^2ujuju_jeijeije_{ij} ρ=σ^2uσ^2u+σ^2eρ=σ^u2σ^u2+σ^e2 ρ = \frac{\hat{\sigma}_u^2}{\hat{\sigma}_u^2 +\hat{\sigma}_e^2} Hox(2002)在第15页上写道 类内相关ρ也可以解释为同一组中两个随机绘制的单元之间的预期相关性 有一个问题在这里,询问了先进的问题(为什么它正好等于这个代替近似相等),并获得了先进的答案。 但是,我想问一个简单得多的问题。 问题:谈论同一组中两个随机绘制的单元之间的相关性甚至意味着什么? 我对类内关联适用于组而不适用于成对的数据这一事实有基本的了解。但是,如果我们只有来自同一组的两个随机抽取的单位,我仍然不知道如何计算相关性。例如,如果我查看Wikipedia页面上ICC的点图,则我们有多个组,每个组中有多个点。

1
默认的lme4优化器需要对高维数据进行大量迭代
TL; DR:lme4优化似乎是线性在默认情况下,模型参数数量,并且是这样慢比等效的glm与组虚拟变量模型。我有什么可以加快速度的吗? 我正在尝试适应一个相当大的分层logit模型(约5万行,100列,50组)。将正常的logit模型拟合到数据(带有用于组的虚拟变量)可以很好地工作,但是层次模型似乎被卡住了:第一个优化阶段可以很好地完成,但是第二个阶段需要进行很多迭代,而无需进行任何更改并且不停止。 编辑:我怀疑问题主要是我有这么多的参数,因为当我尝试将其设置maxfn为较低的值时会给出警告: Warning message: In commonArgs(par, fn, control, environment()) : maxfun < 10 * length(par)^2 is not recommended. 但是,参数估计在优化过程中完全没有改变,因此我仍然对执行该操作感到困惑。当我尝试设置maxfn优化器控件(尽管有警告)时,它似乎在完成优化后挂起。 这是一些重现随机数据问题的代码: library(lme4) set.seed(1) SIZE <- 50000 NGRP <- 50 NCOL <- 100 test.case <- data.frame(i=1:SIZE) test.case[["grouping"]] <- sample(NGRP, size=SIZE, replace=TRUE, prob=1/(1:NGRP)) test.case[["y"]] <- sample(c(0, 1), size=SIZE, replace=TRUE, prob=c(0.05, 0.95)) …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.