基于精度(即反方差)的加权是否是荟萃分析不可或缺的?


10

基于精度的加权是荟萃分析的核心吗?Borenstein等。(2009)写道,为了使荟萃分析成为可能,所有必要的是:

  1. 研究报告的点估计值可以表示为单个数字。
  2. 可以为该点估计计算方差。

我尚不清楚为什么(2)绝对必要。但是,实际上,所有被广泛接受的荟萃分析方法都依赖于基于精度的(即逆方差)加权方案,这确实需要估算每个研究的效应量的方差。请注意,虽然对冲方法(Hedges&Olkin,1985; Hedges&Vevea,1998)和Hunter and Schmidt's Method(Hunter&Schmidt,2004)基本上都使用样本大小加权,但这些方法仅适用于归一化均值差,因此需要其他地方的标准差。在每个研究中与方差成反比的权重将使总效应量估计器中的方差最小化是有意义的,那么这种加权方案是否是所有方法的必要特征?

是否有可能进行系统的评估而无需访问每种效应量的方差,仍将结果称为荟萃分析?当方差不可用时,样本量似乎有可能替代精度。例如,在一项将效应量定义为原始均值差的研究中,可以使用样本量权重吗?这将如何影响结果平均大小的一致性和效率?


一个好问题。如果您提出明确的特定查询,可能会对读者有所帮助。
Subhash C. Davar

具体来说,我正在寻找一种方法,在方差数据不适用于所有研究的情况下,在我的加权方案中纳入研究间异质性的度量(即随机效应)。我的问题的更早,更具体的版本可以在这里找到:stats.stackexchange.com/questions/155063/…–
珍妮弗(Jennifer)

Answers:


11

这个问题很难回答,因为它表明了很多荟萃分析文献中普遍的困惑和混乱的状况(在这里OP不应该受到指责-它是文献和方法的描述,模型和假设(通常是一团糟)。

但总而言之:不,如果您想结合一堆估计值(量化某种影响,关联程度或其他认为相关的结果),并且明智地合并这些数字,那么您只需取其(未加权)平均值,就可以了。没问题,在进行荟萃分析时通常采用的模型下,这甚至可以为您提供无偏估计(假设估计本身无偏)。因此,不,您不需要抽样方差来组合估计。

那么为什么反方差加权几乎与实际进行荟萃分析同义?这与总体思想有关,即与较小的研究(具有较大的抽样方差)相比,我们对较大的研究(具有较小的抽样方差)具有更高的可信度。实际上,在通常模型的假设下,使用逆方差加权会导致一致的最小方差无偏估计量(UMVUE)-好吧,还是假设无偏估计,并且忽略了采样方差实际上通常不是完全已知,而是自己估计和在随机效应模型中得出的事实,我们还必须估计异质性的方差成分,但是然后我们只是将其视为一个已知常数,这也不完全正确...但是,是的,如果我们只是用力地斜视眼睛而忽略了其中一些,我们就可以使用反方差加权获得UMVUE问题。

因此,关键在于估算器的效率,而不是无偏差本身。但是,即使是未加权平均值也通常不会比使用逆方差加权平均值低很多,尤其是在随机效应模型中以及异质性较大的情况下(在这种情况下,通常的加权方案会导致加权几乎均匀)无论如何!)。但是,即使在固定效果模型中或几乎没有异质性,差异通常也不会太大。

正如您所提到的,您还可以轻松地考虑其他加权方案,例如按样本大小或某些函数进行加权,但这只是一种尝试,使结果接近于逆方差加权(因为抽样方差是在很大程度上取决于研究的样本量)。

但实际上,人们可以而且应该完全“分离”权重和方差的问题。它们实际上是必须考虑的两个独立部分。但这不是文献中通常所呈现的方式。

但是,这里的重点是您确实需要考虑两者。是的,您可以将未加权平均值作为您的组合估计,从本质上讲,这将是一项荟萃分析,但是一旦您想开始基于该组合估计进行推论(例如,进行假设检验,构建置信区间) ),您需要知道采样方差(以及异质性的数量)。这样考虑:如果您结合一堆小型(和/或非常异构)研究,则与结合相同数量的非常大(和/或同类)的点估计相比,精度将大大降低。研究-无论您在计算合并值时如何加权估计。

实际上,当我们开始进行推论统计时,甚至还有一些方法不知道采样方差(以及异质性的数量)。可以考虑基于重采样的方法(例如,引导程序,置换测试),或者即使我们未指定模型的某些部分也能为组合估计产生一致的标准误差的方法,但是这些方法的工作效果需要在一个模型上仔细评估。就事论事。


0

如果您知道一些标准错误,但不是全部,请采取以下解决方案:

(1)假设未知SE是从与已知SE相同的分布中随机抽取的,或者让具有未知SE的论文估计值的SE的分布为自由变量。如果您想花哨的话,可以对这些选项使用模型平均。

(2)通过最大似然估计

如果您的SE未知的研究是“异常值”,则模型将通过以下几种方式来解释异常:

(a)该研究可能具有较高的SE估计值(该研究可能具有较低的功效)

(b)研究可能具有较大的随机效应成分(研究人员选择了可得出非典型结果的数据集或方法等)

实际上,该模型会随着SE变得越来越反常而降低具有未知SE的估计的有效精度。在这方面,将“异常值”包括在内是高度可靠的。同时,如果您添加了许多方差未知但具有典型结果的研究,则SE或最终估计值将下降。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.