Questions tagged «mixed-model»

混合(aka多级或分层)模型是线性模型,其中包括固定效应和随机效应。它们用于对纵向或嵌套数据建模。


2
通过效果包对lmer对象的置信区间的可信度如何?
Effects包提供了一种非常快速和方便的方式来绘制通过lme4包获得的线性混合效应模型结果。该effect函数可以非常快速地计算置信区间(CI),但是这些置信区间的可信度如何? 例如: library(lme4) library(effects) library(ggplot) data(Pastes) fm1 <- lmer(strength ~ batch + (1 | cask), Pastes) effs <- as.data.frame(effect(c("batch"), fm1)) ggplot(effs, aes(x = batch, y = fit, ymin = lower, ymax = upper)) + geom_rect(xmax = Inf, xmin = -Inf, ymin = effs[effs$batch == "A", "lower"], ymax = effs[effs$batch == …

8
在什么情况下应该使用多层次/层次分析?
在哪种情况下,应该考虑使用多级/层次分析而不是更基础/传统的分析(例如,ANOVA,OLS回归等)?在任何情况下都可以认为这是强制性的吗?在某些情况下使用多层次/层次分析不合适吗?最后,对于初学者来说,学习多层/层次分析有哪些好的资源?

2
普通英语中的复合对称是什么?
我最近意识到,将混合模型的相关结构设置为复合对称性时,仅将主体作为随机因素而将其他因素作为固定因素的混合模型等效于ANOVA。 因此,我想知道在混合(即分裂图)方差分析的背景下复合对称是什么意思,充其量只能用简单的英语进行解释。 除了复合对称性以外,lme还提供其他类型的相关结构,例如 corSymm 通用相关矩阵,没有其他结构。 或不同类型的空间相关性。 因此,我有一个相关的问题,关于在设计实验的环境中(对象间和对象内的因素)建议使用其他类型的相关结构? 如果答案能指向一些针对不同相关结构的参考文献,那就太好了。

2
带嵌套的混合效果模型
我从以下组织的实验中收集了数据: 两个站点,每个站点有30棵树。每个部位治疗15例,对照15例。从每棵树中,我们采样了三根茎和三根根,因此每棵树有6个1级样品,由两个因子水平(根,茎)之一表示。然后,从这些茎/根样本中,我们通过解剖样本中的不同组织来获取两个样本,这由组织类型(组织类型A,组织类型B)的两个因子水平之一表示。这些样本作为连续变量进行测量。观测总数为720;2个地点* 30棵树*(三个茎样本+三个根样本)*(一个组织A样本+一个组织B样本)。数据看起来像这样... ï..Site Tree Treatment Organ Sample Tissue Total_Length 1 L LT1 T R 1 Phloem 30 2 L LT1 T R 1 Xylem 28 3 L LT1 T R 2 Phloem 46 4 L LT1 T R 2 Xylem 38 5 L LT1 T R 3 Phloem 103 …

3
如何测试随机效应是否显着?
我试图了解何时使用随机效果以及何时不必要。有人告诉我一个经验法则,就是我是否有4个或更多的小组/个人(15个驼鹿)。其中的一些麋鹿经过2到3次实验,共进行了29次试验。我想知道当它们处于较高风险环境时,它们的行为是否有所不同。因此,我认为我会将个人设为随机效果。但是,现在我被告知,没有必要将个人作为随机效应包括在内,因为他们的反应变化不大。我无法弄清楚的是,在将个人设为随机效果时,如何测试是否确实需要考虑某些因素。也许最初的问题是:如果个人是一个很好的解释变量,并且应该是固定的效果-qq图,我可以做哪些测试/诊断?直方图?散点图?我会在这些模式中寻找什么。 我使用个体作为随机效果运行模型,不使用个体运行,但是随后我阅读了http://glmm.wikidot.com/faq,其中指出: 不要将lmer模型与相应的lm拟合或glmer / glm进行比较;对数似然不相称(即,它们包括不同的加法项) 在这里,我认为这意味着您无法在具有或没有随机效应的模型之间进行比较。但是我真的不知道该如何比较它们。 在具有随机效应的模型中,我还试图查看输出以查看RE具有什么样的证据或意义。 lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv) Linear mixed model fit by maximum likelihood Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) Data: tv AIC BIC logLik deviance REMLdev -13.92 -7.087 11.96 …

3
广义线性模型与广义线性混合模型之间的差异
我想知道混合GLM和未混合GLM之间有什么区别。例如,在SPSS中,下拉菜单允许用户适应以下任一情况: analyze-> generalized linear models-> generalized linear models 和 analyze-> mixed models-> generalized linear 他们对缺失值的处理方式不同吗? 我的因变量是二进制,并且我有几个分类的和连续的自变量。

3
手动计算逻辑回归95%置信区间与在R中使用confint()函数之间为什么会有区别?
亲爱的大家-我注意到我无法解释的怪事,可以吗?总之:在logistic回归模型中计算置信区间的手动方法和R函数confint()得出不同的结果。 我一直在研究Hosmer&Lemeshow的Applied Logistic回归(第二版)。在第3章中,有一个计算比值比和95%置信区间的示例。使用R,我可以轻松地重现模型: Call: glm(formula = dataset$CHD ~ as.factor(dataset$dich.age), family = "binomial") Deviance Residuals: Min 1Q Median 3Q Max -1.734 -0.847 -0.847 0.709 1.549 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -0.8408 0.2551 -3.296 0.00098 *** as.factor(dataset$dich.age)1 2.0935 0.5285 3.961 7.46e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

1
时间序列上混合效应模型的预测值总和的方差
我有一个混合效果模型(实际上是广义加性混合模型),可以为我提供时间序列的预测。考虑到我缺少数据,我使用corCAR1模型来抵消自相关。数据应该给我带来了总的负担,所以我需要对整个预测间隔求和。但我也应该估算出该总负载下的标准误差。 如果所有预测都是独立的,则可以通过以下方式轻松解决: V a r (E [ X i ] )= S E (E [ X i ] )2V一个[R (Σñ我= 1Ë[ X一世] )= ∑ñ我= 1V一个[R (ê[ X一世] )V一种[R(∑一世=1个ñË[X一世])=∑一世=1个ñV一种[R(Ë[X一世])Var(\sum^{n}_{i=1}E[X_i]) = \sum^{n}_{i=1}Var(E[X_i]) withV一个[R (ê[ X一世] )= SË(E[ X一世] )2V一种[R(Ë[X一世])=小号Ë(Ë[X一世])2Var(E[X_i]) = SE(E[X_i])^2 问题是,预测值来自模型,原始数据具有自相关。整个问题导致以下问题: 我是否可以假设将计算得出的预测的SE解释为该预测的期望值的方差根部,这是正确的吗?我倾向于将预测解释为“平均预测”,因此总结了一系列的均值。 如何在这个问题中包含自相关,或者我可以安全地假设它不会对结果产生太大影响? 这是R中的一个例子。我的真实数据集约有34.000个测量值,因此可伸缩性是一个问题。这就是为什么我在每个月内对自相关建模的原因,否则就无法进行计算了。这不是最正确的解决方案,但是最正确的解决方案却不可行。 set.seed(12) require(mgcv) Data <- data.frame( dates = …

4
我如何适合用于过度分散泊松结果的多级模型?
我想使用R来拟合具有Poisson分布(过度分散)的多级GLMM。此刻,我正在使用lme4,但是我注意到最近该quasipoisson家族被删除了。 我在其他地方看到过,您可以通过为每个观测值添加一个随机截距来为二项式分布建模加法过度弥散。这也适用于泊松分布吗? 有更好的方法吗?您还有其他推荐的软件包吗?

1
混合效果模型上的多重比较
我正在尝试使用混合效果模型分析一些数据。我收集的数据代表了一些不同基因型的年轻动物随时间的体重。 我正在使用此处提出的方法:https : //gribblelab.wordpress.com/2009/03/09/repeated-measures-anova-using-r/ 特别是我正在使用解决方案2 所以我有类似 require(nlme) model <- lme(weight ~ time * Genotype, random = ~1|Animal/time, data=weights) av <- anova(model) 现在,我想进行一些比较。使用multcomp我可以做到: require(multcomp) comp.geno <- glht(model, linfct=mcp(Genotype="Tukey")) print(summary(comp.geno)) 而且,当然,我可以随着时间做同样的事情。 我有两个问题: 如何mcp查看时间与基因型之间的相互作用? 我跑步时glht收到以下警告: covariate interactions found -- default contrast might be inappropriate 这是什么意思?我可以放心地忽略它吗?还是应该避免这种情况? 编辑: 我发现此PDF指出: 由于在这种情况下不可能自动确定感兴趣的参数,因此默认情况下,multcomp中的mcp()将仅针对主要效果生成比较,而忽略协变量和交互作用。从版本1.1-2开始,可以指定对交互项进行平均,并分别使用参数interact_average = TRUE和covariate_average = TRUE进行协变量,而早于1.0-0的版本将对交互项进行自动平均。但是,我们建议用户手动编写所需的对比集。每当对默认的对比度量有疑问时,都应该这样做,这通常发生在具有更高阶交互项的模型中。关于这个问题的进一步讨论和例子,我们参考许(1996),第7章,和塞尔(1971),第7.3章。 我没有那些书,但是也许有人在吗?

2
lme和lmer比较
我想知道是否有人可以启发我了解这两个功能之间的当前区别。我发现以下问题:如何为混合效果模型选择nlme或lme4 R库?,但这要追溯到几年前。那是软件界的一生。 我的具体问题是: 有没有(还)任何相关结构,lme即lmer不处理? 可以/建议使用lmer面板数据吗? 道歉,如果这些是一些基本的。 更详细一点:面板数据是我们在不同时间对同一个人进行多次测量的地方。我通常在业务环境中工作,在该环境中,您可能拥有多年的回头客/长期客户数据。我们希望允许随时间的变化,但显然每个月或每年拟合一个虚拟变量效率低下。但是,我不清楚lmer对于这种数据是否合适的工具,或者我是否需要具有的自相关结构lme。

1
anova()命令对lmer模型对象有什么作用?
希望这是一个问题,在这里有人可以为我解答,该问题的本质是根据拟合的混合效应模型lmer(来自lme4 R软件包)分解平方和。 首先,我应该说我已经意识到使用这种方法的争议,在实践中,我更有可能使用自举LRT来比较模型(如Faraway,2006年所建议)。但是,我对如何复制结果感到困惑,因此出于我的理智,我想在这里问一下。 基本上,我正在使用lme4包装所适合的混合效果模型。我知道您可以使用该anova()命令来总结按顺序测试模型中的固定效果。据我所知,这就是Faraway(2006)所说的“预期均方”方法。我想知道的是平方和如何计算? 我知道我可以从特定模型中获取估计值(使用coef()),假设它们是固定的,然后使用有和没有感兴趣因素的模型残差平方和进行测试。这对于包含单个主题内因子的模型来说是很好的。但是,在实施分割图设计时,平方和值I get等于R通过aov()适当的Error()名称使用R生成的值。但是,尽管F比率相同,但这与命令在模型对象上产生的平方和并不anova()相同。 当然这是完全有意义的,因为Error()在混合模型中不需要分层。但是,这必须意味着在混合模型中对平方和进行某种程度的惩罚,以提供适当的F比率。如何实现的?模型如何以某种方式校正图间平方和而不校正图内平方和。显然,这是通过为不同效果指定不同的误差值而实现的经典分割图方差分析所必需的,那么混合效果模型如何做到这一点? 基本上,我希望能够自己复制anova()应用于lmer模型对象的命令的结果,以验证结果和我的理解,但是,目前,我可以针对常规的受试者内部设计实现此目标,而对于拆分主体则无法实现。情节设计,我似乎无法找出为什么是这种情况。 举个例子: library(faraway) library(lme4) data(irrigation) anova(lmer(yield ~ irrigation + variety + (1|field), data = irrigation)) Analysis of Variance Table Df Sum Sq Mean Sq F value irrigation 3 1.6605 0.5535 0.3882 variety 1 2.2500 2.2500 1.5782 summary(aov(yield ~ irrigation + variety + Error(field/irrigation), …


1
如何解释混合效应模型中随机效应的方差和相关性?
希望大家都不要介意这个问题,但是我需要帮助解释线性混合效果模型输出的输出,这是我一直试图在R中学习做的事情。我是纵向数据分析和线性混合效果回归的新手。我有一个模型,我将几周作为时间预测器,并在就业课程中得分作为结果。我用几周(时间)和几个固定影响,性别和种族对分数建模。我的模型包括随机效应。我需要帮助来了解方差和相关性的含义。输出如下: Random effects Group Name Variance EmpId intercept 680.236 weeks 13.562 Residual 774.256 相关系数是.231。 我可以将相关性解释为星期与分数之间存在正相关关系,但我希望能够用“ ...的23%”来表述。 我非常感谢您的帮助。 感谢“来宾”和Macro的答复。抱歉,由于没有回复,我参加了一次会议,现在正在追赶。这是输出和上下文。 这是我运行的LMER模型的摘要。 >summary(LMER.EduA) Linear mixed model fit by maximum likelihood Formula: Score ~ Weeks + (1 + Weeks | EmpID) Data: emp.LMER4 AIC BIC logLik deviance REMLdev 1815 1834 -732.6 1693 1685 Random …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.