荟萃分析中固定效应与随机效应模型的合理性


10

我已经读过几篇出版物,试图证明固定效果模型的使用是正确的,其陈述类似于“选择固定效果模型是因为异质性较低”。但是,我担心它仍然可能是不合适的数据分析方法。

是否有原因或出版物讨论这是否可能以及为什么会出错?


1
可以说是一个很好的答案:stats.stackexchange.com/questions/156603
amoeba

Answers:


19

注意:如果您想快速回答有关使用异质性测试做出此决定的问题,请向下滚动至“ 哪些理由是合理的? ”。

研究人员在选择固定效应与随机效应的荟萃分析合成时提供了一些理由(比其他理由更多/更少的理由)。在介绍性的荟萃分析教科书(例如Borenstein等人)中对此进行了讨论。(2009),卡(2011)和库珀(2017)。

在不谴责或纵容这些理由中的任何一项(尚未)时,它们包括:

选择固定效应模型的理由

  1. 分析简单性:有些人认为随机效果模型的计算/解释超出了他们的统计学理解,因此坚持使用更简单的模型。使用固定效应模型,研究人员仅需要估计由采样误差驱动的效应量的可变性。无论好坏,这都是Card(2011)中明确鼓励的务实做法。
  2. 没有研究水平变异性/主持人的先前信念:如果研究人员认为其样本中所有效应的大小仅是由于抽样误差而变化-并且没有系统的研究水平变异性(因此没有主持人-将会有)我认为这种合理性与前者有时是相伴而行的,当研究人员认为适合随机效应模型超出了他们的能力范围之后,随后通过声称事实上,他们没有预料到任何真正的研究水平异质性。

  3. 系统性主持人已被详尽考虑:一些研究人员在调查并考虑了他们可以想到的每个主持人之后,可能会使用固定效果分析。这里的基本原理是,一旦研究人员考虑了研究水平变异性的每一个可能/有意义的来源,剩下的就是抽样误差,因此将不需要随机效应模型。

  4. 非显着异质性检验(即统计量)Q:如果研究人员未能拒绝均等效应量样本的零值,则他们可能会更乐于采用固定效应模型。
  5. 进行有限/特定推断的意图:固定效果模型适用于严格在效果样本内讲效果模式。因此,如果研究人员只愿意说出样本中发生的事情,而又不推测自己的评论错过的研究或评论之后的研究中可能发生的情况,那么他们可能会证明拟合固定效果模型是合理的。

选择随机效应模型的理由

  1. 研究水平变异性/主持人的先前信念:与论证2相反(赞成固定效应模型),如果研究人员预期研究水平变异性(因此适度)会有意义,那么他们会默认为指定随机效果模型。如果您来自心理学背景(我愿意),这正在成为一种越来越常规的/鼓励的默认方式来考虑效果大小(例如,参见Cumming,2014年)。

  2. 显着异质性检验(即统计量)Q:就像研究人员可能会使用非显着检验来证明他们选择固定效应模型的理由一样,他们也可能会使用显着检验(拒绝均质效应量的无效值) )以证明他们使用随机效应模型是合理的。QQQ

  3. 分析实用主义:事实证明,如果您拟合随机效应模型并且没有显着的异质性(即不显着),则将得出固定效应估计值。只有在存在明显异质性的情况下,这些估计值才会改变。因此,一些研究人员可能默认使用随机效应模型,该模型表明他们的分析将根据基础数据的质量“确定”他们应采用的方式。Q

  4. 进行广泛/可概括的推论的意图:与固定效应模型不同,随机效应模型允许研究人员(在某种程度上)超出其样本地(在某种程度上)会在更广泛的文献中发挥作用/调节模式。如果研究人员希望这种推断水平,那么他们可能更喜欢随机效应模型。

指定错误模型的后果

尽管不是您问题的明确部分,但我认为必须指出为什么在固定效应和随机效应荟萃分析模型之间进行选择时,对于研究者“正确解决”这一点很重要:它很大程度上取决于估算精度和统计能力

固定效应模型在统计上更强大,但会产生人为精确的估计值。随机效应模型的统计功能较差,但如果存在真正的异质性,则可能更合理。在主持人的测试中,固定效应模型可能会低估误差方差的程度,而随机效应模型会高估误差方差的程度(取决于是否满足或违反了它们的建模假设,参见Overton,1998)。同样,在心理学文献中,越来越多的人认为该领域过分依赖固定效应的荟萃分析,因此,我们使自己对效应的确定性/精确性产生了更大的迷惑(请参阅Schmidt等人)。 (2009年)。

哪些理由是合理的?

为了直接回答您的特定问题,有些人(例如Borenstein等,2009; Card,2001)告诫不要为了确定是指定固定效应模型还是随机效应模型而使用异质性检验统计量(理由4理由7。)。这些作者反而认为您应该主要基于概念上的理由(即辩解2辩护6)做出此决定。为此,统计量的易错性在特别小的(或特别大的)合成情况下也具有一定的直观意义,其中 Q QQQQ 可能不足以检测有意义的异质性(或过度检测微不足道的异质性)。

分析简单性(理由1)似乎是固定效果模型的另一种理由,这种可能性不太可能成功(因为我认为更明显的原因)。另一方面,如果研究人员能够证明他们已经考虑/建模了许多主持人变量,那么在所有情况下争论所有可能的主持人都已筋疲力尽(理由3)。如果他们只编码了几个主持人,则这种辩解可能会被视为似是而非。

让数据通过默认的随机效应模型(理由8)做出决定是我不确定的。这当然不是一个主动/原则性的决定,但是再加上心理学领域倾向于默认使用随机效应模型的事实,这可能是可以接受的(尽管不是特别考虑周全)。

剩下的论据与关于效应分布的先前信念有关(论据2论据6),而与研究人员希望许可进行的推理类型有关的论据(论据5论据9)。)。关于效应分布的先前信念的合理性在很大程度上将取决于您正在合成的研究的特征;正如Cooper(2017)所指出的那样,如果要综合机械/通用过程的效果,从很大程度上相似的情境/样本中收集并在严格控制的环境中进行固定效果分析,则可能是完全合理的。从相同实验的重复中合成结果将是一个很好的例子,说明何时可以采用这种分析策略(请参阅Goh等人,2016年)。但是,如果您正在合成一个领域,其中设计,操作,度量,上下文和样本特征有很大不同,那么似乎很难说服人们正在研究准确在每种情况下都具有相同的效果。最后,一个人希望做出的推断似乎是个人喜好/品味的问题,因此,我不确定只要在理论上可以辩护,该人如何开始主张/反对这一辩护。

参考文献

Borenstein,M.,Hedges,LV,Higgins,JPT和Rothstein,HR(2009)。荟萃分析导论。英国西萨塞克斯郡:威利。

卡德(NA)(2011)。应用荟萃分析进行社会科学研究。纽约,纽约:吉尔福德出版社。

Cooper,H.(2017年)。研究综合和荟萃分析:循序渐进的方法。加利福尼亚州千橡市:鼠尾草。

卡明(G.Cumming)(2014)。新的统计数据:原因和方式。心理科学25(1),7-29。

Goh,JX,Hall,JA,&Rosenthal,R.(2016年)。对您自己的研究进行的迷你荟萃分析:关于“为什么”的一些争论以及关于“如何”的入门知识。社会人格心理学指南针10(10),535-549。

RC,Overton(1998)。比较固定效应模型和混合效应(随机效应)模型进行慢变量效应的荟萃分析测试。心理方法,3(3),354-379。

Schmidt,FL,Oh,IS,&Hayes,TL(2009)。荟萃分析中的固定对随机效应模型:模型属性和结果差异的经验比较。英国数学和统计心理学杂志,62(1),97-128。


4

您特别要求提供参考。

对此的经典参考可能是Hedges和Vevea的文章“ 荟萃分析中的固定效应模型和随机效应模型 ”。

如果您从事卫生工作,那么Cochrane手册中的相关章节可能是必不可少的读物,并且很有意思。特别是它暗示了什么时候根本不应该考虑进行荟萃分析,并且除了清楚地拟合随机效应模型外,还清楚地区分了应对异质性的方法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.