Questions tagged «lme4-nlme»

lme4和nlme是用于拟合线性,广义线性和非线性混合效果模型的R包。对于有关混合模型的一般问题,请使用[mixed-model]标签。

3
如何测试随机效应是否显着?
我试图了解何时使用随机效果以及何时不必要。有人告诉我一个经验法则,就是我是否有4个或更多的小组/个人(15个驼鹿)。其中的一些麋鹿经过2到3次实验,共进行了29次试验。我想知道当它们处于较高风险环境时,它们的行为是否有所不同。因此,我认为我会将个人设为随机效果。但是,现在我被告知,没有必要将个人作为随机效应包括在内,因为他们的反应变化不大。我无法弄清楚的是,在将个人设为随机效果时,如何测试是否确实需要考虑某些因素。也许最初的问题是:如果个人是一个很好的解释变量,并且应该是固定的效果-qq图,我可以做哪些测试/诊断?直方图?散点图?我会在这些模式中寻找什么。 我使用个体作为随机效果运行模型,不使用个体运行,但是随后我阅读了http://glmm.wikidot.com/faq,其中指出: 不要将lmer模型与相应的lm拟合或glmer / glm进行比较;对数似然不相称(即,它们包括不同的加法项) 在这里,我认为这意味着您无法在具有或没有随机效应的模型之间进行比较。但是我真的不知道该如何比较它们。 在具有随机效应的模型中,我还试图查看输出以查看RE具有什么样的证据或意义。 lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv) Linear mixed model fit by maximum likelihood Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) Data: tv AIC BIC logLik deviance REMLdev -13.92 -7.087 11.96 …

4
我如何适合用于过度分散泊松结果的多级模型?
我想使用R来拟合具有Poisson分布(过度分散)的多级GLMM。此刻,我正在使用lme4,但是我注意到最近该quasipoisson家族被删除了。 我在其他地方看到过,您可以通过为每个观测值添加一个随机截距来为二项式分布建模加法过度弥散。这也适用于泊松分布吗? 有更好的方法吗?您还有其他推荐的软件包吗?

2
lme和lmer比较
我想知道是否有人可以启发我了解这两个功能之间的当前区别。我发现以下问题:如何为混合效果模型选择nlme或lme4 R库?,但这要追溯到几年前。那是软件界的一生。 我的具体问题是: 有没有(还)任何相关结构,lme即lmer不处理? 可以/建议使用lmer面板数据吗? 道歉,如果这些是一些基本的。 更详细一点:面板数据是我们在不同时间对同一个人进行多次测量的地方。我通常在业务环境中工作,在该环境中,您可能拥有多年的回头客/长期客户数据。我们希望允许随时间的变化,但显然每个月或每年拟合一个虚拟变量效率低下。但是,我不清楚lmer对于这种数据是否合适的工具,或者我是否需要具有的自相关结构lme。

1
anova()命令对lmer模型对象有什么作用?
希望这是一个问题,在这里有人可以为我解答,该问题的本质是根据拟合的混合效应模型lmer(来自lme4 R软件包)分解平方和。 首先,我应该说我已经意识到使用这种方法的争议,在实践中,我更有可能使用自举LRT来比较模型(如Faraway,2006年所建议)。但是,我对如何复制结果感到困惑,因此出于我的理智,我想在这里问一下。 基本上,我正在使用lme4包装所适合的混合效果模型。我知道您可以使用该anova()命令来总结按顺序测试模型中的固定效果。据我所知,这就是Faraway(2006)所说的“预期均方”方法。我想知道的是平方和如何计算? 我知道我可以从特定模型中获取估计值(使用coef()),假设它们是固定的,然后使用有和没有感兴趣因素的模型残差平方和进行测试。这对于包含单个主题内因子的模型来说是很好的。但是,在实施分割图设计时,平方和值I get等于R通过aov()适当的Error()名称使用R生成的值。但是,尽管F比率相同,但这与命令在模型对象上产生的平方和并不anova()相同。 当然这是完全有意义的,因为Error()在混合模型中不需要分层。但是,这必须意味着在混合模型中对平方和进行某种程度的惩罚,以提供适当的F比率。如何实现的?模型如何以某种方式校正图间平方和而不校正图内平方和。显然,这是通过为不同效果指定不同的误差值而实现的经典分割图方差分析所必需的,那么混合效果模型如何做到这一点? 基本上,我希望能够自己复制anova()应用于lmer模型对象的命令的结果,以验证结果和我的理解,但是,目前,我可以针对常规的受试者内部设计实现此目标,而对于拆分主体则无法实现。情节设计,我似乎无法找出为什么是这种情况。 举个例子: library(faraway) library(lme4) data(irrigation) anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation)) Analysis of Variance Table Df Sum Sq Mean Sq F value irrigation 3 1.6605 0.5535 0.3882 variety 1 2.2500 2.2500 1.5782 summary(aov(yield ~ irrigation + variety + Error(field/irrigation), …


2
在多层次模型中,估计与不估计随机效应相关参数的实际含义是什么?
在多层次模型中,估计与不估计随机效应相关参数的实际和解释相关的含义是什么?提出此问题的实际原因是,在R中的lmer框架中,当在参数之间的相关性模型中进行估算时,没有通过MCMC技术估算p值的已实现方法。 例如,看这个例子(下面引用的部分),M2与M3的实际含义是什么。显然,在一种情况下不会估计P5,而在另一种情况下会估计。 问题 出于实际原因(希望通过MCMC技术获得p值),即使P5基本不为零,也可能希望在随机效应之间没有相关性的情况下拟合模型。如果执行此操作,然后通过MCMC技术估算p值,结果是否可以解释?(我知道@Ben Bolker之前曾提到过,“虽然从统计学上讲,将显着性测试与MCMC相结合有点不连贯,尽管我理解这样做的冲动(更容易获得置信区间)”,所以,如果这样做会使您睡得更好在晚上假装我说出置信区间。) 如果一个人无法估计P5,是否等于断言它为0? 如果P5确实非零,那么P1-P4的估计值会受到什么影响? 如果P5确实非零,那么P1-P4的误差估计会受到什么影响? 如果P5确实非零,那么以何种方式无法包含P5的模型解释有缺陷? 借用@Mike Lawrence的答案(比我更了解的人可以随意用完整的模型表示法替换它,我并不完全相信我可以以合理的忠诚度做到这一点): M2 :( V1 ~ (1|V2) + V3 + (0+V3|V2)估计P1-P4) M3 :( V1 ~ (1+V3|V2) + V3估计P1-P5) 可以估计的参数: P1:全局拦截 P2:V2的随机效应截距(即,对于V2的每个级别,该级别的截距与全局截距的偏差) P3:对V3的效果(斜率)的单个全局估计 P4:V2的每个级别内的V3效果(更具体地说,给定级别内的V3效果偏离V3的整体效果的程度),同时使跨级别的截距偏差和V3效果偏差之间的相关性为零V2。 P5:跨V2级别的截距偏差和V3偏差之间的相关性 从足够大和广泛的模拟以及使用lmer的R中附带的代码中得出的答案是可以接受的。

5
在生物学,心理学和医学领域使用lmer进行混合模型分析的示例报告?
由于通常的共识似乎是lmer()在R中使用混合模型而不是经典的ANOVA(由于经常提到的原因,例如不平衡设计,交叉随机效应等),我想尝试一下我的数据。但是,我担心我将这种方法“卖”给我的主管(后者希望最终进行p值的经典分析)或以后再将其“出售”给审稿人。 您能推荐一些使用混合模型或lmer()针对不同设计(例如重复测量)或针对领域生物学,心理学,医学的多个学科内部和学科之间设计的不同设计的发表文章的好例子吗?

3
AIC可以在不同类型的模型之间进行比较吗?
我正在使用AIC(Akaike的信息标准)来比较R中的非线性模型。比较不同类型的模型的AIC是否有效?具体来说,我正在比较glm拟合的模型与glmer(lme4)拟合的带有随机效应项的模型。 如果没有,有没有办法进行这种比较?还是这个想法完全无效?

1
lmer混合效应模型的predict()函数
问题: 我读过其他文章,这些文章predict不适用于lmer[R]中的混合效果{lme4}模型。 我尝试通过玩具数据集探索这个主题... 背景: 数据集是根据此来源改编的,可作为... require(gsheet) data <- read.csv(text = gsheet2text('https://docs.google.com/spreadsheets/d/1QgtDcGJebyfW7TJsB8n6rAmsyAnlz1xkT3RuPFICTdk/edit?usp=sharing', format ='csv')) 这些是第一行和标题: > head(data) Subject Auditorium Education Time Emotion Caffeine Recall 1 Jim A HS 0 Negative 95 125.80 2 Jim A HS 0 Neutral 86 123.60 3 Jim A HS 0 Positive 180 204.00 4 Jim A …


2
我是否在lmer中正确指定了我的模型?
我搜寻了很多帮助站点,但仍然对如何在混合模型中指定更复杂的嵌套术语感到困惑。我也困惑,使用:和/和|在指定的交互,并使用随机因素嵌套lmer()在lme4包中R。 出于这个问题的目的,我们假设我已使用以下标准统计模型准确地描绘了我的数据: 是固定的,并且是随机的。 (隐式)嵌套在中。ÿ我Ĵ ķ= 你+ 站一世+ 拖曳j (我)+ 天ķ+ (站× 天)我ķ+ (拖曳× 天)j (i )kÿ一世Ĵķ=ü+站一世+拖Ĵ(一世)+天ķ+(站×天)一世ķ+(拖×天)Ĵ(一世)ķ Y_{ijk} = u + \text{station}_i + \text{tow}_{j(i)} + \text{day}_k + (\text{station}\times \text{day})_{ik} + (\text{tow}\times\text{day})_{j(i)k} stationtowdayTowstation 换句话说,我希望我的模型包括Station(i,fixed),Tow(j,random,隐式嵌套在Station中),Day(k,random),以及Tow和Day之间的交互以及Day之间的交互和车站。我已经咨询了统计学家以创建我的模型,并且目前认为它可以代表我的数据,但同时也会在我的文章底部添加对我的数据的描述,以免造成混乱。 到目前为止,我能够拼凑的内容如下lmer: lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), data=my.data) 这是否准确地描绘了我的统计模型?如果无法正确阅读我的代码,有什么建议吗? 我已经加粗了我在lmer公式中难以指定的特定术语 #1 当拖曳是随机的且站是固定的时,在站内嵌套的拖曳 我很困惑,但是关于使用:和区分随机的嵌套和交互项/。在上面的示例中,我(1|station:tow)希望读取嵌套在站内的丝束。我在各个网站上都读到了相互矛盾的评论,无论我是应该使用:还是使用/随机(1|...)格式lmer。 …

1
零相关混合模型理论上什么时候听起来正确?
下面的块引用来自混合效果建模领域的领导者,声称在随机效果之间零相关的模型(“ ZCP”模型)中协调模型的移动会更改模型预测。 但是,有人可以详细说明或进一步证明其主张吗? 有问题的陈述来自Bates等人在 2015年发表的论文lme4,使用lme4拟合线性混合效应模型,第7页,第二段(下载链接)。 \newcommand{\slope}{\text{slope}} \newcommand{\int}{\text{int}} \newcommand{\intercept}{\text{intercept}} 以下是他们所写内容的解释: 尽管零相关参数模型用于降低随机斜率模型的复杂性,但是它们具有一个缺点。允许斜率和截距具有非零相关性的模型对于连续预测变量的加法位移是不变的。 当相关性被限制为零时,这种不变性将分解。预测变量的任何变化必然会导致估计的相关性以及模型的可能性和预测发生变化。1例如,我们可以简单地通过将Days [伴随\ slope的预测变量] 移位等于估算的对象间标准偏差乘以估算的相关性的比值即2来消除fm1中的相关性,slopeslope\slope ρslope:intercept×σslopeσinterceptρslope:intercept×σslopeσintercept\rho_{\slope:\intercept}\times\frac{\sigma_{\slope}}{\sigma_{\intercept}} 理想情况下,此类模型的使用应仅限于以比率比例尺测量预测变量的情况(即,比例尺上的零点是有意义的,而不仅仅是通过便利或惯例定义的位置)。 问题: 按照上面的上标编号... 我可以看到,用来测量预测变量的坐标系中的任何偏移都将导致估计的相关性发生变化,从而导致非零相关性。这支持这样的说法,即零相关参数模型在预测变量坐标系中的位移下不是不变的,因此,具有非零随机效应相关性的任何模型都可以通过适当的坐标偏移而转换为具有零相关性的模型。我认为它也支持上面解释的第三段:ZCP模型(和零截距模型-参见下文;但是请在此进行检查)仅适用于使用某些特殊坐标系的模型。 但是为什么要针对此类模型更改坐标预测呢? 例如,坐标的偏移也将更改组平均值的固定效果截距项(请参见下文),但仅更改与预测变量的坐标系的原点变化相称的量。只要将新的坐标系用于已移动的预测变量,此更改就不会影响模型预测。 详细地说,如果与移动的预测变量关联的固定效果斜率为正,并且预测变量坐标系的原点向负方向移动,则固定效果的截距将减少,并且任何相关的随机效应的截距也将更改相应地,在位移坐标系中反映了“原点”(因此是截距)的新定义。顺便说一句,我认为这种推理还意味着零截距模型在这种偏移下也不是不变的。 我认为我有一个合理的解决方案,但得出的答案与贝茨等人 略有不同。我在哪里出错了? 以下是我的答案。接下来是对我如何得出结果的描述。总而言之,我发现如果我将原点负移,那么在新坐标系中,预测变量取值,则新坐标系中的相关性 如果为零,则为零:xxxδ>0δ>0\delta > 0x′=x+δx′=x+δx' = x + \deltaρ′ρ′\rho' δ=ρslope:intercept×σinterceptσslopeδ=ρslope:intercept×σinterceptσslope\delta=\rho_{\slope:\intercept}\times\frac{\sigma_{\intercept}}{\sigma_{\slope}} 这与贝茨等人的结果不同。 我的方法的说明(可选阅读):假设我们具有两个随机效果的相关性,即和(简称),它们都对应于具有水平的相同分组因子(编号为,范围从至)。我们还说,与随机配对的连续预测变量称为,定义为使得乘积生成对水平的拟合值的条件贡献slopeslope\slopeinterceptintercept\interceptintint\intkkkiii111kkkslopeslope\slopexxxx×slopeix×slopeix\times\slope_iy^obsy^obs\hat y_{obs}iii相关的分组因子。尽管实际上MLE算法确定的值以使可能性最大,但我希望下面的表达式应该是确定均匀平移效果的尺寸正确方法,是的随机效果的乘数。。ρρ\rhoxxxslopeslope\slope ρslope:int=Ei[(slopei−slopei¯¯¯¯¯¯¯¯¯¯¯¯)(inti−inti¯¯¯¯¯¯¯¯)]Ei[(slopei−slopei¯¯¯¯¯¯¯¯¯¯¯¯)2]Ei[(inti−inti¯¯¯¯¯¯¯¯)2]−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√ρslope:int=Ei[(slopei−slopei¯)(inti−inti¯)]Ei[(slopei−slopei¯)2]Ei[(inti−inti¯)2]\rho_{\slope:\int} = \frac{E_{i}\big[(\slope_i -\overline {\slope_i})(\int_i -\overline {\int_i})\big]}{\sqrt{E_{i}\big[(\slope_i -\overline {\slope_i})^2\big]E_{i}\big[(\int_i-\overline {\int_i})^2\big]}} 为了得出我的结果,我首先用新的截距值重写了截距的旧值(此处,,即“向左'预测变量原点偏移)。然后,将结果表达式代入的上述公式的分子中,计算的值,该值在新坐标系中的协方差为零。请注意,如上面问题1所述,固定效果拦截项也将以类似的方式更改:。(这里int′=−δ×slope+intint′=−δ×slope+int\int' = -\delta \times …


5
如何测试和避免混合线性模型中的多重共线性?
我目前正在运行一些混合效果线性模型。 我在R中使用软件包“ lme4”。 我的模型采用以下形式: model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect)) 在运行模型之前,我检查了预测变量之间可能的多重共线性。 我这样做是: 建立预测变量的数据框 dummy_df <- data.frame(predictor1, predictor2) 使用“ cor”功能来计算预测变量之间的Pearson相关性。 correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2) 如果“ correl_dummy_df”大于0.80,则我认为预测变量1和预测变量2的相关性太高,因此它们未包含在我的模型中。 在阅读时,将出现更多客观的方法来检查多重共线性。 有人对此有任何建议吗? “方差通胀因子(VIF)”似乎是一种有效方法。 可以使用AED程序包中的函数“ corvif”(非cran)来计算VIF。可以在http://www.highstat.com/book2.htm上找到该软件包。该软件包支持以下书籍: Zuur,AF,Ieno,EN,Walker,N.,Saveliev,AA和Smith,GM2009。《混合效应模型和生态学扩展》 R,第1版。纽约斯普林格。 似乎一般的经验法则是,如果VIF> 5,则预测变量之间的多重共线性较高。 使用VIF是否比简单的Pearson相关性更强大? 更新资料 我在以下位置找到了一个有趣的博客: http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/ 博主提供了一些有用的代码,可为来自lme4软件包的模型计算VIF。 我已经测试了代码,并且效果很好。在随后的分析中,我发现模型的多重共线性不是一个问题(所有VIF值均小于3)。鉴于我之前已经发现某些预测变量之间存在较高的皮尔逊相关性,因此这很有趣。

4
在R中检查假设lmer / lme混合模型
我进行了重复的设计,在三个不同的任务中测试了30位男性和30位女性。我想了解男性和女性的行为有何不同,以及如何取决于任务。我同时使用了lmer和lme4软件包对此进行了研究,但是,我坚持尝试检查两种方法的假设。我运行的代码是 lm.full <- lmer(behaviour ~ task*sex + (1|ID/task), REML=FALSE, data=dat) lm.full2 <-lme(behaviour ~ task*sex, random = ~ 1|ID/task, method="ML", data=dat) 通过将其与没有交互的较简单模型进行比较并运行方差分析,我检查了交互是否是最佳模型: lm.base1 <- lmer(behaviour ~ task+sex+(1|ID/task), REML=FALSE, data=dat) lm.base2 <- lme(behaviour ~ task+sex, random= ~1|ID/task), method="ML", data=dat) anova(lm.base1, lm.full) anova(lm.base2, lm.full2) 问题1:可以在线性混合模型中使用这些分类预测变量吗? 问题2:我是否正确理解结果变量(“行为”)不需要本身正态分布(跨性别/任务)吗? 问题3:如何检查方差的均匀性?对于简单的线性模型,我使用plot(LM$fitted.values,rstandard(LM))。使用plot(reside(lm.base1))足够了吗? Q4:检查正常使用下面的代码好吗? hist((resid(lm.base1) - mean(resid(lm.base1))) / sd(resid(lm.base1)), …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.