Questions tagged «glmm»

广义线性混合(效应)模型通常用于对非独立非正态数据(例如纵向二进制数据)进行建模。

3
如何测试随机效应是否显着?
我试图了解何时使用随机效果以及何时不必要。有人告诉我一个经验法则,就是我是否有4个或更多的小组/个人(15个驼鹿)。其中的一些麋鹿经过2到3次实验,共进行了29次试验。我想知道当它们处于较高风险环境时,它们的行为是否有所不同。因此,我认为我会将个人设为随机效果。但是,现在我被告知,没有必要将个人作为随机效应包括在内,因为他们的反应变化不大。我无法弄清楚的是,在将个人设为随机效果时,如何测试是否确实需要考虑某些因素。也许最初的问题是:如果个人是一个很好的解释变量,并且应该是固定的效果-qq图,我可以做哪些测试/诊断?直方图?散点图?我会在这些模式中寻找什么。 我使用个体作为随机效果运行模型,不使用个体运行,但是随后我阅读了http://glmm.wikidot.com/faq,其中指出: 不要将lmer模型与相应的lm拟合或glmer / glm进行比较;对数似然不相称(即,它们包括不同的加法项) 在这里,我认为这意味着您无法在具有或没有随机效应的模型之间进行比较。但是我真的不知道该如何比较它们。 在具有随机效应的模型中,我还试图查看输出以查看RE具有什么样的证据或意义。 lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv) Linear mixed model fit by maximum likelihood Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) Data: tv AIC BIC logLik deviance REMLdev -13.92 -7.087 11.96 …

3
广义线性模型与广义线性混合模型之间的差异
我想知道混合GLM和未混合GLM之间有什么区别。例如,在SPSS中,下拉菜单允许用户适应以下任一情况: analyze-> generalized linear models-> generalized linear models 和 analyze-> mixed models-> generalized linear 他们对缺失值的处理方式不同吗? 我的因变量是二进制,并且我有几个分类的和连续的自变量。

2
广义线性(混合)模型(特别是残差)的诊断
我目前正在努力为困难计数数据(因变量)找到正确的模型。我尝试了各种不同的模型(对于我的数据,混合效果模型是必需的),例如lmer和lme4(使用对数变换),以及具有各种族(例如高斯或负二项式)的广义线性混合效果模型。 但是,我不确定如何正确诊断结果拟合。我在网络上发现了关于该主题的许多不同意见。我认为关于线性(混合)回归的诊断非常简单。您可以继续进行分析残差(正态),并通过绘制拟合值与残差比较来研究异方差。 但是,您如何针对通用版本正确执行此操作?现在让我们关注负二项式(混合)回归。我在这里看到了关于残差的非常相反的说法: 在第一个答案中指出,在广义线性模型中检查残差的正态性时,对于GLM,普通残差不是正态分布的。我认为这很清楚。但是,然后指出,皮尔逊和偏差残差也不应该是正常的。但是,第二个答案指出,偏差残差应该正态分布(与参考值结合)。 不过,?glm.diag.plots(来自R的boot软件包)的文档中暗示了异常残差应该以正态分布。 在这篇博客文章中,作者首先研究了NB混合效应回归模型中Pearson残差的正态性。不出所料(根据我的诚实观点),残差未显示为正常,因此作者认为此模型不合适。但是,如评论中所述,残差应根据负二项式分布进行分配。我认为,这与事实最接近,因为GLM残差可以具有除正态分布以外的其他分布。它是否正确?如何在此处检查异方差性? Ben&Yohai(2004)强调了最后一点(将残差与估计分布的分位数作图)。目前,这似乎是我要走的路。 简而言之:如何特别针对残差,如何正确研究广义线性(混合)回归模型的模型拟合?

2
尽管数据有些变化,为什么在混合模型中我得到的随机效应的方差为零?
我们使用以下语法运行了混合效果逻辑回归: # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) 主题和项目是随机效果。我们得到一个奇怪的结果,即该主题词的系数和标准偏差均为零; Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) [glmerMod] Family: binomial ( logit ) Formula: GoalEncoding ~ 1 + Group + (1 | Subject) …

2
如何将二项式GLMM(glmer)应用于百分比而不是是-否计数?
我有一个重复测量实验,其中因变量是一个百分比,并且我有多个因素作为自变量。我想glmer从R包中使用lme4它(通过指定family=binomial)作为逻辑回归问题,因为它似乎可以直接容纳此设置。 我的数据如下所示: > head(data.xvsy) foldnum featureset noisered pooldur dpoolmode auc 1 0 mfcc-ms nr0 1 mean 0.6760438 2 1 mfcc-ms nr0 1 mean 0.6739482 3 0 melspec-maxp nr075 1 max 0.8141421 4 1 melspec-maxp nr075 1 max 0.7822994 5 0 chrmpeak-tpor1d nr075 1 max 0.6547476 6 1 chrmpeak-tpor1d nr075 1 …

4
如何评估装有lme4(> 1.0)的二项式GLMM的拟合度?
我有一个具有二项式分布和logit链接函数的GLMM,并且我觉得模型中没有很好地表示数据的重要方面。 为了测试这一点,我想知道数据是否通过对数刻度上的线性函数很好地描述了。因此,我想知道残差是否良好。但是,我无法确定要在哪个残差图上绘制以及如何解释该图。 请注意,我正在使用lme4的新版本(来自GitHub的开发版本): packageVersion("lme4") ## [1] ‘1.1.0’ 我的问题是:如何使用logit链接函数检查和解释二项式广义线性混合模型的残差? 以下数据仅代表我实际数据的17%,但是拟合在我的机器上已经花费了大约30秒,因此我将其保留为: require(lme4) options(contrasts=c('contr.sum', 'contr.poly')) dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif") dat$V1 <- factor(dat$V1) m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial) 最简单的绘图(?plot.merMod)会产生以下结果: plot(m1) 这已经告诉我一些事情了吗?

1
glmer中收敛警告的含义
我正在使用R中包中的glmer函数lme4,并且正在使用bobyqa优化器(即我的默认设置)。我收到警告,我很好奇这意味着什么。 Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a trust region step failed to reduce q 我搜索“信任区域步骤无法减少q”。在minqa程序包中找到了一些信息,上面写着 “请咨询Powell进行解释”。我做到了(如果需要,您也可以!请参见下面的参考资料和指向它们的链接),但是我不明白。实际上,我没有找到关于减少q的任何信息。 MJD Powell(2007)“ NEWUOA在无导数的无约束最小化方面的发展”,剑桥大学,应用数学和理论物理系,数值分析组,报告NA2007 / 05,http: //www.damtp.cam.ac.uk/ user / na / NA_papers / NA2007_05.pdf。 MJD Powell(2009),“没有导数的有界约束优化的BOBYQA算法”,报告号DAMTP 2009 / NA06,英国剑桥大学数学科学中心。http://www.damtp.cam.ac.uk/user/na/NA_papers/NA2009_06.pdf。 附言:我知道我可以更改优化器,并且我将查看是否可以得到没有警告或错误的输出。根据Ben Bolker的评论/答案,我还将检查渐变和粗麻布。我使用的是glmer内dredge从MuMIn,我不知道,如果本的答案没有一些额外的工作,修修补补,但我会在上面工作,一旦我的电脑上完成它在做什么,反正我离题了。 更新资料 …

1
如何拟合响应变量在0到1之间的混合模型?
我正在尝试使用lme4::glmer()二项式广义混合模型(GLMM)来拟合因变量,该因变量不是二进制的,而是介于零和一之间的连续变量。可以将这个变量视为一种可能性;实际上,这是人类受试者报告的概率(在我帮助分析的实验中)。也就是说,它不是 “离散”分数,而是连续变量。 我的glmer()电话无法正常工作(请参阅下文)。为什么?我能做什么? 稍后编辑:我的以下回答比该问题的原始版本更笼统,因此我也将该问题修改为更笼统。 更多细节 显然,不仅可以对二进制DV使用逻辑回归,而且还可以对零和一之间的连续DV使用逻辑回归。的确,当我跑步时 glm(reportedProbability ~ a + b + c, myData, family="binomial") 我收到警告消息 Warning message: In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! 但是非常合理的拟合(所有因素都是分类的,因此我可以轻松地检查模型预测是否接近跨学科平均水平,并且接近)。 但是,我实际要使用的是 glmer(reportedProbability ~ a + b + c + (1 | subject), myData, family="binomial") 它给了我同样的警告,返回了一个模型,但是这个模型显然有很大的缺陷。固定效应的估计值与固定效应的估计值相距甚远glm()。(而且我需要包含glmerControl(optimizer="bobyqa")在glmer通话中,否则它根本不会收敛。)

1
仅观察一次的随机效应将如何影响广义线性混合模型?
我有一个数据集,在该数据集中,我想用作随机效果的变量在某些级别上只有一个观察值。基于对先前问题的回答,我认为原则上可以。 我可以将混合模型与只有1个观察值的对象拟合吗? 随机截距模型-每个科目一次测量 但是,在第二个链接中,第一个答案指出: “ ...假设您没有使用广义线性混合模型GLMM,在这种情况下,过度分散的问题将发挥作用” 我正在考虑使用GLMM,但我真的不了解单次观察的随机效应水平将如何影响模型。 这是我要拟合的模型之一的示例。我正在研究鸟类,我想模拟人口和季节对迁徙期间停留次数的影响。我想将个人用作随机效应,因为对于某些个人,我拥有长达5年的数据。 library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "MA", "NU", "NU", …

1
计算随机效应逻辑回归的ICC
我正在以以下形式运行逻辑回归模型: lmer(response~1+(1|site), family=binomial, REML = FALSE) 通常,我会根据截距和残差方差来计算ICC,但是模型摘要不包括残差方差。我该如何计算?

1
带有偏移的Poisson随机效应模型中的超分散和建模替代方案
使用主题内实验对来自实验研究的计数数据进行建模时,我遇到了许多实际问题。我简要描述了实验,数据以及到目前为止所做的事情,然后提出了我的问题。 依次向受访者展示了四部不同的电影。在每部电影之后,我们进行了一次采访,我们对RQ感兴趣的某些语句(预测计数变量)的出现次数进行了计数。我们还记录了可​​能出现的最大次数(编码单位;偏移量变量)。另外,电影的几个特征以连续的比例进行了测量,其中一个具有因果关系,即电影特征对陈述数量的影响的因果假设,而其他则为控制(预测变量)。 到目前为止采用的建模策略如下: 估计一个随机效应泊松模型,其中因果变量用作协变量,其他变量用作控制协变量。该模型的偏移量等于“ log(单位)”(编码单位)。跨对象产生随机效果(特定于电影的计数嵌套在对象中)。我们发现因果假设得到了确认(因果变量的系数)。在估算中,我们在R中使用了lme4包,特别是功能glmer。 现在我有以下问题。泊松回归中的一个常见问题是过度分散。我知道可以通过使用负二项式回归并评估其色散参数是否可以改善简单泊松模型的模型拟合性来进行测试。但是,我不知道如何在随机效果的情况下这样做。 在我的情况下,我应该如何测试过度分散?我在简单的泊松/负二项式回归(无随机效应)中测试了超分散,我知道该如何拟合。该测试表明存在过度分散。但是,由于这些模型未考虑聚类,因此我认为此测试不正确。此外,我不确定偏移量在过度分散测试中的作用。 是否存在负二项式随机效应回归模型之类的东西,该如何在R中拟合呢? 您是否对我应该尝试使用数据的替代模型有任何建议,即考虑重复测量结构,计数变量和暴露(编码单位)?

2
如何在R中使用lmer()测试泊松GLMM中的过度分散?
我有以下模型: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ...这是摘要输出。 > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random effects: Groups Name Variance Std.Dev. landscape (Intercept) …

1
边际模型与随机效应模型–如何在它们之间进行选择?给外行的建议
在搜索有关边际模型和随机效应模型以及如何在它们之间进行选择的任何信息时,我发现了一些信息,但是它或多或少是数学抽象的解释(例如此处的示例:https://stats.stackexchange .com / a / 68753/38080)。我发现在这两种方法/模型之间的参数估计值之间存在实质性差异(http://www.biomedcentral.com/1471-2288/2/15/),但是Zuur等人则相反。(2009年,第116页;http://link.springer.com/book/10.1007%2F978-0-387-87458-6)。边际模型(广义估计方程法)带来了总体平均参数,而随机效应模型(广义线性混合模型)的输出考虑了随机效应–主体(Verbeke等人,2010年,第49-52页;http:/ /link.springer.com/chapter/10.1007/0-387-28980-1_16)。 我想在非统计学家和非数学家熟悉的语言中,在一些模型(现实生活)示例中看到对这些模型的一些类似外行的解释。 详细来说,我想知道: 什么时候应该使用边际模型,什么时候应该使用随机效应模型?这些模型适合哪些科学问题? 这些模型的输出应如何解释?

2
广义线性混合模型:诊断
我有一个随机截距逻辑回归(由于重复测量),我想做一些诊断,特别是关于异常值和有影响力的观察结果的诊断。 我查看了残差以查看是否有突出的观察结果。但我也想看看类似库克的距离或DFFITS。Hosmer和Lemeshow(2000)说,由于缺乏用于关联数据的模型诊断工具,因此应该只适合常规logistic回归模型而忽略相关性,而应使用可用于常规logistic回归的诊断工具。他们认为这比完全不进行诊断要好。 这本书是2000年出版的,我想知道现在是否有可用的方法用于模型诊断和混合效应逻辑回归?什么是检查异常值的好方法? 编辑(2013年11月5日): 由于缺乏响应,我想知道使用混合模型进行的诊断是否一般而言没有进行,或者在对数据建模时不是很重要的一步。因此,让我重新表述我的问题:一旦找到“良好”的回归模型,您会怎么做?

1
将二项式GLMM(glmer)拟合为比例或分数的响应变量
我希望有人可以帮助解决我认为相对简单的问题,我想我知道答案,但未经证实,这已经成为我无法确定的事情。 我有一些计数数据作为响应变量,我想测量该变量如何随某物的比例存在而变化。 更详细地,响应变量是在多个站点中昆虫物种的存在的计数,因此例如采样一个站点10次,并且该物种可能出现4次。 我想看看这是否与这些地点植物整体群落中一组植物物种的比例存在相关。 这意味着我的数据如下所示(这只是一个示例) Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence 1, 5, 10, 0.5 2, 3, 10, 0.3 3, 7, 9, 0.6 4, 0, 9, 0.1 数据还包括位置的随机效应。 我想到了两种方法,一种是lmer将昆虫转换成一定比例的线性模型(),例如 lmer.model<-lmer(insectCount/NumberOfInsectSamples~ ProportionalPlantGroupPresence+(1|Location),data=Data) 第二个是二项式GLMM(glmer),例如 glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~ ProportionalPlantGroupPresence+(1|Location), data=Data,family="binomial") 我相信二项式聚光镜是正确的方法,但是它们会产生完全不同的结果。我似乎无法在网络上找到明确的答案,而仍然没有一点不确定性,并希望确保自己没有犯错。 任何帮助或对替代方法的见解将不胜感激。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.