Questions tagged «random-effects-model»

与协变量的特定级别相关联的参数有时称为级别的“效果”。如果观察到的水平代表所有可能水平集中的随机样本,则我们将这些效应称为“随机”。


3
R的lmer备忘单
这个论坛上有很多讨论,涉及使用来指定各种层次模型的正确方法lmer。 我认为将所有信息都放在一个地方会很棒。有几个问题要开始: 如何指定多个级别,其中一个组嵌套在另一个组中:是(1|group1:group2)还是(1+group1|group2)? (~1 + ....)和(1 | ...)和(0 | ...)等之间有什么区别? 如何指定小组级别的互动?

3
有关如何在lmer中指定随机效应的问题
我最近通过测量在不同上下文中查看该单词时的ERP(EEG),测量了在反复暴露(练习:第1天到第10天)时如何获取一个新单词的含义。我还控制了上下文的属性,例如,它对发现新词义(高或低)的有用性。我对练习的效果(天)特别感兴趣。由于单独的ERP记录比较嘈杂,因此可以通过对特定条件的试验求平均值来获得ERP组件值。通过该lmer函数,我应用了以下公式: lmer(ERPindex ~ practice*context + (1|participants), data=base) 和 lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 在文献中,我还看到了以下等效随机效应: lmer(ERPindex ~ practice*context + (practice|participants) + (practice|participants:context), data=base) 使用以下形式的随机因子可以完成什么工作participants:context?是否有一个很好的资源可以让对矩阵代数仅有粗略了解的人准确地了解线性混合模型中的随机因素是什么以及应该如何选择它们?

2
随机效应模型,固定效应模型和边际模型之间有什么区别?
我正在尝试扩展我的统计知识。我来自物理科学背景,采用“基于配方”的方法进行统计测试,我们说它是连续的,是否呈正态分布-OLS回归。 在阅读中,我遇到了以下术语:随机效应模型,固定效应模型,边际模型。我的问题是: 简单来说,它们是什么? 它们之间有什么区别? 他们有同义词吗? 传统测试(例如OLS回归,ANOVA和ANCOVA)在哪里分类? 只是尝试决定自学的下一步。


3
如何测试随机效应是否显着?
我试图了解何时使用随机效果以及何时不必要。有人告诉我一个经验法则,就是我是否有4个或更多的小组/个人(15个驼鹿)。其中的一些麋鹿经过2到3次实验,共进行了29次试验。我想知道当它们处于较高风险环境时,它们的行为是否有所不同。因此,我认为我会将个人设为随机效果。但是,现在我被告知,没有必要将个人作为随机效应包括在内,因为他们的反应变化不大。我无法弄清楚的是,在将个人设为随机效果时,如何测试是否确实需要考虑某些因素。也许最初的问题是:如果个人是一个很好的解释变量,并且应该是固定的效果-qq图,我可以做哪些测试/诊断?直方图?散点图?我会在这些模式中寻找什么。 我使用个体作为随机效果运行模型,不使用个体运行,但是随后我阅读了http://glmm.wikidot.com/faq,其中指出: 不要将lmer模型与相应的lm拟合或glmer / glm进行比较;对数似然不相称(即,它们包括不同的加法项) 在这里,我认为这意味着您无法在具有或没有随机效应的模型之间进行比较。但是我真的不知道该如何比较它们。 在具有随机效应的模型中,我还试图查看输出以查看RE具有什么样的证据或意义。 lmer(Velocity ~ D.CPC.min + FD.CPC + (1|ID), REML = FALSE, family = gaussian, data = tv) Linear mixed model fit by maximum likelihood Formula: Velocity ~ D.CPC.min + FD.CPC + (1 | ID) Data: tv AIC BIC logLik deviance REMLdev -13.92 -7.087 11.96 …

5
建模纵向数据,其中时间的影响在个人之间以功能形式变化
内容: 想象一下,您进行了一项纵向研究,该研究每周对200名参与者进行一次为期20周的因变量(DV)测量。尽管我对一般情况感兴趣,但我考虑的典型DV包括录用后的工作表现或临床心理干预后的各种福祉测量。 我知道可以使用多层建模来建模时间与DV之间的关系。您还可以允许系数(例如截距,斜率等)在个体之间变化,并估计参与者的特定值。但是,如果在目视检查数据时发现时间与DV之间的关系为以下任意一种情况,该怎么办: 功能形式不同(也许有些是线性的,有些是指数的,或者有些不连续) 误差方差不同(某些人从一个时间点到下一个时间点更不稳定) 问题: 什么是处理这样的数据建模的好方法? 具体来说,哪种方法擅长识别不同类型的关系,并根据其类型对个人进行分类? R中有哪些实现可用于此类分析? 是否有关于如何执行此操作的参考:教科书或实际应用程序?

2
在多层次模型中,估计与不估计随机效应相关参数的实际含义是什么?
在多层次模型中,估计与不估计随机效应相关参数的实际和解释相关的含义是什么?提出此问题的实际原因是,在R中的lmer框架中,当在参数之间的相关性模型中进行估算时,没有通过MCMC技术估算p值的已实现方法。 例如,看这个例子(下面引用的部分),M2与M3的实际含义是什么。显然,在一种情况下不会估计P5,而在另一种情况下会估计。 问题 出于实际原因(希望通过MCMC技术获得p值),即使P5基本不为零,也可能希望在随机效应之间没有相关性的情况下拟合模型。如果执行此操作,然后通过MCMC技术估算p值,结果是否可以解释?(我知道@Ben Bolker之前曾提到过,“虽然从统计学上讲,将显着性测试与MCMC相结合有点不连贯,尽管我理解这样做的冲动(更容易获得置信区间)”,所以,如果这样做会使您睡得更好在晚上假装我说出置信区间。) 如果一个人无法估计P5,是否等于断言它为0? 如果P5确实非零,那么P1-P4的估计值会受到什么影响? 如果P5确实非零,那么P1-P4的误差估计会受到什么影响? 如果P5确实非零,那么以何种方式无法包含P5的模型解释有缺陷? 借用@Mike Lawrence的答案(比我更了解的人可以随意用完整的模型表示法替换它,我并不完全相信我可以以合理的忠诚度做到这一点): M2 :( V1 ~ (1|V2) + V3 + (0+V3|V2)估计P1-P4) M3 :( V1 ~ (1+V3|V2) + V3估计P1-P5) 可以估计的参数: P1:全局拦截 P2:V2的随机效应截距(即,对于V2的每个级别,该级别的截距与全局截距的偏差) P3:对V3的效果(斜率)的单个全局估计 P4:V2的每个级别内的V3效果(更具体地说,给定级别内的V3效果偏离V3的整体效果的程度),同时使跨级别的截距偏差和V3效果偏差之间的相关性为零V2。 P5:跨V2级别的截距偏差和V3偏差之间的相关性 从足够大和广泛的模拟以及使用lmer的R中附带的代码中得出的答案是可以接受的。


1
在lme中指定多个(单独的)随机效果[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 6个月前关闭。 我正在使用R软件包nlme和lme4进行工作,试图指定具有多个随机效果的模型。我发现,只有nlme允许指定方差的异质结构。因此,我得到一个模型,其中温度(Y)取决于时间(以小时为单位),截距随日期和年份而变化,方差也随年份而变化: fit1 <- lme(Y ~ time, random=~1|year/date, data=X, weights=varIdent(form=~1|year)) 但是,如果我需要添加另一个随机项(时间随日期变化),并指定模型,如下所示: fit2 <- lme(Y ~ time, random=list(~1|year, ~time-1|date, ~1|date), data=X, weights=varIdent(form=~1|year)) 随机效果相互嵌套:日期,年份;然后以日期和年份为日期。 我也试过 one <- rep(1, length(Y)) fit3 <- lme(Y ~ time, random=list(one=pdBlocked(list(pdSymm(~1|year/date), pdSymm(~time-1|year)))), data=X, weights=varIdent(form=~1|year)) 但它给出了一个错误: Error in pdConstruct.pdBlocked(object, form = form, nam = nam, data …

5
在混合模型中将因素视为随机因素有什么好处?
我出于某些原因而无法接受将模型因子标记为随机变量的好处。在我看来,似乎在几乎所有情况下,最佳解决方案都是将所有因素视为固定的。 首先,固定与随机的区别是任意的。标准解释是,如果一个人对特定的实验单位本身感兴趣,则应使用固定效应,而如果一个人对实验单位所代表的种群感兴趣,则应使用随机效应。这没有太大帮助,因为这意味着即使数据和实验设计保持相同,也可以在固定视图和随机视图之间进行切换。同样,此定义引起一种错觉,即如果将因子标记为随机,则从模型得出的推论比将因子标记为固定的情况更适用于总体。最后,盖尔曼(Gelman)表明,固定随机的区别令人困惑 甚至在定义级别,因为还有四个关于固定效应和随机效应的定义。 其次,混合模型的估计非常复杂。与“纯固定”模型相反,有多种方法可以获取p值,在R的lme4程序包中实现REML估计的贝茨教授甚至拒绝完全报告p值。 。 第三,存在一个模糊的问题,即随机因素会引入多少个隐式参数。以下示例是我对Burnham&Anderson,“ 模型选择”和“多模型推理:一种实用的信息理论方法”的改编。从偏差方差折衷的角度来看,随机效应的作用可以说明如下。考虑采用处理和主因子效应的单向方差分析,其中是可估计的。错误项具有分布。如果观察次数固定,则随着的增加,偏差方差折衷将恶化。假设我们说ķ ķ - 1 Ñ(0 ,σ 2)ķ ķKKKKKKK−1K−1K - 1N(0,σ2)N(0,σ2)\mathcal N(0, \sigma^2)KKKKKK主要效果来自分布。相应的模型将具有介于固定(过度拟合)版本和仅包含截距的欠拟合模型之间的复杂性。固定模型中有效参数的数量为N(0,σK)N(0,σK)\mathcal N(0, \sigma_K) 1intercept+(K−1)maineffects+1σ=K+1.1intercept+(K−1)maineffects+1σ=K+1.1 \:\:\mathrm{intercept} + (K - 1) \:\:\mathrm{main\: effects} + 1 \:\:\sigma = K + 1. 随机模型中有效参数的数量至少为三个:。另外,随机模型具有许多“隐藏”参数,这些参数是对主要效果施加的分布(在这种情况下为正常)限制所隐含的。intercept,σ,σKintercept,σ,σK \mathrm{intercept}, \sigma, \sigma_K 尤其是,如果存在一个具有两个水平的因子,则将其称为随机是没有意义的,即使我们确定知道它的水平是从某些人群中随机抽样的也是如此。这是因为固定效果版本具有三个参数,而随机效果版本具有三个以上参数。在这种情况下,随机模型比固定版本具有更高的复杂性。显然,从固定版本到随机版本的切换更适合更大的KKK。但是,随机模型中“隐藏”参数的数量是未知的,因此无法根据信息标准(例如AIC)比较固定版本和随机版本。因此,尽管该示例阐明了随机效应的贡献(更好的偏差-方差权衡的可能性),但它也表明,很难说何时可以合理地将因子从固定重新标记为随机。 “完全固定”模型中没有上述问题。因此,我愿意问: 谁能提供一个示例,说明在使用随机因子(如固定因子)时发生了非常糟糕的事情吗?我认为应该进行一些模拟研究来明确解决该问题。 是否有行之有效的定量方法来决定何时从固定标签转换为随机标签?


4
如何将新向量投影到PCA空间上?
执行主成分分析(PCA)之后,我想将一个新向量投影到PCA空间上(即在PCA坐标系中找到其坐标)。 我已经使用R计算了R语言的PCA prcomp。现在,我应该可以将向量乘以PCA旋转矩阵。该矩阵中的主要成分应该按行还是按列排列?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

4
在实践中,如何在混合效应模型中计算随机效应协方差矩阵?
基本上,我想知道的是如何实施不同的协方差结构,以及如何计算这些矩阵内的值。像lme()这样的函数允许我们选择所需的结构,但是我很想知道它们是如何估算的。 考虑线性混合效应模型。ÿ= Xβ+ Zu + ϵY=Xβ+Zu+ϵY=X\beta+Zu+\epsilon 其中和。此外:ε d 〜 Ñ (0 ,- [R )你〜dñ(0 ,D )u∼dN(0,D)u \stackrel{d}{\sim} N(0,D)ε 〜dñ(0 ,R )ϵ∼dN(0,R)\epsilon \stackrel{d}{\sim} N(0,R) V一个[R (ÿ| X,Z,β,u )= RVar(Y|X,Z,β,u)=RVar(Y|X,Z,\beta,u)=R V一个[R (ÿ| X,β)= Z′d ž+ R = VVar(Y|X,β)=Z′DZ+R=VVar(Y|X,\beta)=Z'DZ+R=V 为了简单起见,我们假设。R = σ2一世ñR=σ2InR=\sigma^2I_n 基本上我的问题是:对于各种参数设置,如何从数据中准确估算?假设我们假设是对角线的(随机效应是独立的)或完全参数化的(目前我比较感兴趣的情况)还是其他各种参数化中的任何一个?有没有简单的估计器/方程式?(毫无疑问,这是迭代估算的。)D DdDDdDDdDD 编辑: 从《方差组件》一书(Searle,Casella,McCulloch 2006),我设法做到以下几点: 如果则更新和计算方差成分,如下所示:D = σ2ü一世qD=σu2IqD=\sigma^2_uI_q σ2 (ķ + …

2
当在混合模型中将组视为随机与固定时,斜率估计存在很大差异
我了解,当我们相信某些模型参数在某些分组因子中随机变化时,我们会使用随机效应(或混合效应)模型。我希望拟合一个模型,该模型的响应已在分组因子上进行了归一化和居中(不完美,但非常接近),但是自变量x没有进行任何调整。这使我进行了以下测试(使用虚构数据),以确保如果确实存在,我会找到所需的效果。我运行了一个带有随机截距的混合效应模型(跨由定义的组f)和另一个以因子f作为固定效应预测因子的固定效应模型。我将R包lmer用于混合效果模型和基本函数lm()对于固定效果模型。以下是数据和结果。 请注意y,无论组如何,其变化都在0左右。并且该x变化与y组内的变化一致,但跨组的变化要大得多。y > data y x f 1 -0.5 2 1 2 0.0 3 1 3 0.5 4 1 4 -0.6 -4 2 5 0.0 -3 2 6 0.6 -2 2 7 -0.2 13 3 8 0.1 14 3 9 0.4 15 3 10 -0.5 -15 4 11 -0.1 -14 …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.