我可以在元回归中将效果大小作为自变量包括在内吗?


11

我的问题是,是否可以在元回归中将效应大小用作因变量,将另一个效应大小用作自变量?XY

例如,我对运动对饮酒问题的影响进行了荟萃分析,发现了显着的结果和高度异质性。我想做一个元回归,并使用这些干预措施对焦虑的影响大小作为自变量,并以饮酒问题的影响大小作为因变量(假设每项研究都评估了焦虑和饮酒问题,并且我计算了效果大小为对冲的)。g

你能理解这个吗?


我唯一关心的是您是否需要在回归之前转换效果大小...类似于使用Fisher的z转换来转换r。
ReliableResearch

Answers:


13

负责任地回答这个(好)问题可能需要解决超越传统荟萃回归的荟萃分析主题。我在咨询客户的荟萃分析时遇到了此问题,但尚未找到或开发出令人满意的解决方案,因此此答案不是确定的。在下文中,我用选定的参考文献提及了五个相关的想法。

首先,我将介绍术语和表示法以进行澄清。我假设您已对独立研究的效应量(ES)数据进行配对,例如研究对饮酒问题(DP)的ES估计和对焦虑症的,以及每个估计的条件/采样方差(即标准误的平方),例如和。让我们将研究的两个ES参数(即真实或无限样本ES)表示为和ÿ d ý = 1 2 ... ķ v d v θ d θ μ d = Èθ d τ 2 d = V - [R θ d μ = èθ τkiyDiyAii=1,2,,kvDivAiiθDiθAi。按照传统的随机效应观点,这些ES参数在研究之间随机变化,我们可以将它们的研究间均值和方差表示为和用于DP,和。在常规的分别针对DP和焦虑的荟萃分析中(例如,以精度作为权重),我们可以假设每个ES估计的采样分布是正态的,且具有已知的方差-即和与μD=E(θDi)τD2=Var(θDi)μA=E(θAi)ýd| θdÑθdvdý| θÑθvvdvτA2=Var(θAi)yDi|θDiN(θDi,vDi)yAi|θAiN(θAi,vAi)vDi和已知的-至少对于大型内部研究样本而言。vAi

我们不一定需要对此问题采取随机效应的观点,但是我们应该允许和在研究中有所不同,以使它们之间的关联变得有意义。如果我们对程序和解释谨慎的话,我们也许也可以在异构固定效果框架中做到这一点(例如,Bonett,2009)。另外,我不知道您的ES是否是相关性,(标准化)均值差,(对数)比值比或其他度量,但是ES度量对于我在下面所说的大部分内容都没有太大关系。 θ θDiθAi

现在,介绍五个想法。

1.生态偏差:评估您的两个ES之间的关联是针对研究级别的问题,而不是主题级别的问题题。我见过荟萃分析员不恰当地解释了像您这样的两个ES之间的正相关关系:对其进行干预可以减少焦虑的受试者,其DP降低的倾向会更大。研究级ES数据的分析不支持这样的陈述。这与生态偏见或生态谬误有关(例如,Berlin等,2002; McIntosh,1996)。顺便说一句,如果您从研究中获得了单独的患者/参与者数据(IPD)或某些其他样本估计值(例如,每个组的焦虑与DP之间的相关性),那么您可以解决某些涉及干预的调解或调解的主题级问题,焦虑和DP,例如干预对焦虑-DP关联的影响,或干预通过焦虑对DP的间接影响(例如,干预→交通焦虑 DP)。

2.元回归问题:尽管您可以使用将视为固定的已知协变量/回归变量/预测变量的常规元回归过程对进行回归,但这可能并不完全合适。要了解与此相关的潜在问题,请考虑如果可能的话,我们可能会做些什么:使用普通回归(例如OLS)对上的进行回归,以估算或测试与的平均协变量。如果我们有各自研究的,然后用常规元回归回归上yDiyAiyAiθDiθAiθDiθAiθAiyDiθAi会给我们我们想要的,因为(简单的)研究之间模型是,其中是随机误差。使用相同的方法对上的进行回归,却忽略了两个问题:由于采样误差(例如,由量化)而与不同。由于焦虑和DP之间的主题水平相关性,与的研究内相关性。我怀疑其中一个或两个问题都会扭曲和之间的关联估计θDi=β0+β1θAi+uiuiyDiyAiyAiθAivAiyDiθDiθAi,例如由于回归稀释/衰减偏差。

3.基准风险:几位作者已经针对干预对二元结果的影响进行了荟萃分析,提出了与#2类似的问题。在此类荟萃分析中,通常会担心治疗效果与未治疗人群中结果的概率或发生率会发生变化(例如,对高风险受试者的影响更大)。使用常规的Meta回归从对照组的风险或事件发生率预测治疗效果的尝试很诱人,因为后者代表了基础/人群/基线风险。然而,一些作者已经证明了这种简单策略或提出的替代技术的局限性(例如,Dohoo等,2007; Ghidey等,2007; Schmid等,1998)。其中一些技术可能适合或适应涉及两个多端点ES的情况。

4.双变量荟萃分析:您可以将此视为双变量问题,其中研究对是和条件协方差矩阵这里用逗号分隔列,用分号分隔行。原则上,我们可以使用二元随机效应荟萃分析来估算和研究之间的协方差分量矩阵。即使某些研究仅贡献或仅贡献也可以做到这一点iyi=[yDi,yAi]θi=[θDi,θAi]Vi=[vDi,vDAi;vADi,vAi]μ=[μD,μA]T=[τD2,τDA;τAD,τA2]yDiyAi(例如,Jackson等,2010; White,2011)。除了,您还可以根据和函数来估计焦虑与DP之间的关联的其他度量,例如与,或 -ON-回归斜率。但是,我不确定如何最好地推断出焦虑-DP关联的任何此类测量:我们是否将和视为随机,还是最好地对待了作为固定的(因为我们可能倒退,如果上τDA=τADμTθDiθAiθDiθAiθDiθAiθAiθDiθAi),哪种方法最适合测试,置信区间或其他推论结果(例如,增量法,自举,轮廓似然)?不幸的是,计算条件协方差可能很困难,因为这取决于很少有人报道的焦虑与DP之间的组内关联。在这里,我不会讨论处理此问题的策略(例如Riley等,2010)。vDAi=vADi

5.用于荟萃分析的SEM: Cheung Cheung在将荟萃分析模型公式化为结构方程模型(SEM)方面的一些工作可能会提供解决方案。他提出了使用SEM软件实施多种单变量和多变量固定,随机和混合效应荟萃分析模型的方法,并为此提供了软件:

http://courses.nus.edu.sg/course/psycwlm/internet/metaSEM/index.html

尤其是,Cheung(2009)给出了一个示例,其中一个ES被视为研究水平协变量和另一个ES之间的中介,这比您预测一个ES与另一个ES的情况更为复杂。

参考文献

柏林,JA,桑坦纳,J。,施密德,CH,洛杉矶,洛杉矶,费尔德曼,HI(2002年)。用于研究治疗效果修正因素的个体患者水平与小组水平数据的元回归:生态偏见抬头丑陋。医学统计学, 21,371-387。doi:10.1002 / sim.1023

博内特(Bonett)DG(2009)。荟萃分析区间估计,用于标准化和非标准化均值差异。心理方法,第14卷,第 225-238页。doi:10.1037 / a0016619

张,MW-L。(2009年5月)。使用结构方程模型对多元效应大小进行建模。在哈夫达尔(AR Hafdahl)主持下,多变量线性模型的荟萃分析进展。在加利福尼亚旧金山心理科学协会会议上提出的受邀研讨会。

Dohoo,I.,Stryhn,H.&Sanchez,J.(2007)。荟萃分析中作为异质性来源的潜在风险的评估:对三种模型的贝叶斯和频繁实施的模拟研究。预防兽医学, 81,38-55。doi:10.1016 / j.prevetmed.2007.04.010

Ghidey,W.,Lesaffre,E.和Stijnen,T.(2007)。荟萃分析中基线风险分布的半参数建模。医学统计学, 26,5434-5444。doi:10.1002 / sim.3066

杰克逊(D.)杰克逊(DJ),怀特(IR)和汤普森(SG)(2010)。扩展DerSimonian和Laird的方法,以执行多元随机效应荟萃分析。医学统计学, 29,1282-1297。doi:10.1002 / sim.3602

麦金托什,MW(1996)。在荟萃分析和层次模型中控制生态参数(博士学位论文)。可从ProQuest论文和论文数据库获得。(UMI号9631547)

Riley,RD,Thompson,JR,&Abrams,KR(2008)。当研究内相关性未知时,用于双变量随机效应荟萃分析的替代模型。生物统计学,第9卷,第 172-186页。doi:10.1093 / biostatistics / kxm023

Schmid,CH,Lau,J.,McIntosh,MW,和Cappelleri,JC(1998)。在临床试验的荟萃分析中,控制率作为治疗效果预测指标的效果的实证研究。医学统计学, 17,1923-1942。doi:10.1002 /(SICI)1097-0258(19980915)17:17 <1923 :: AID-SIM874> 3.0.CO; 2-6

怀特(IR)(2011)。多元随机效应元回归:更新为mvmeta。Stata Journal, 11,255-270。


11

基于亚当的答案,我有一些阐述。首先也是最重要的是,很难将关于一种效应大小如何以及为什么预测另一种效应大小的实质性理论概念化。多元荟萃分析通常足以解释效应量之间的关联。如果您对假设效应大小之间的方向感兴趣,则可能对William Shadish的工作感兴趣(Shadish,1992年,1996年; Shadish&Sweeney,1991年)。

正如亚当(Adam)所述,在效应量之间应用元回归存在一些问题。主要问题是效应大小是有条件地以已知方差(和协方差)分布的。结构方程模型(SEM)方法可用于解决此问题(Cheung,2008,2013,印刷中)。我们可以将亚当符号中的“真实”效果大小和公式化为潜在变量。观察到的效果大小是“真实”效果大小的指标:θDiθAi

yDi=θDi+eDi与和Var(eDi)=vDi

yAi=θAi+eAi和。Var(eAi)=vAi

一旦我们制定了这一部分(所谓的测量模型),就可以轻松地在“真实”效果大小之间拟合结构模型:

θDi=β0+β1θAi+uDi

其中是和的剩余异质性是的方差。Var(uDi)=τDi2θDiVar(θAi)=τAi2θAi

由于和与的值有条件地相关,所以最后一步是在模型中包括此条件协方差。提议的模型是:yDiyAivDAi提出的模型

使用常规SEM符号,圆圈和正方形代表潜变量和观察到的变量。三角形代表截距(或均值)。

由于在荟萃分析中已知采样方差和协方差,因此大多数SEM软件包无法用于拟合此模型。我使用在R中实现的OpenMx软件包来适应此模型。如果要使用Mplus,则需要做一些技巧来处理已知的采样方差和协方差(例如,请参见press_a中的Cheung)。

以下示例演示了如何在R中以“ lifecon”作为预测变量,以“ lifesat”作为因变量来拟合模型。它们对应的潜在变量称为“ latcon”和“ latsat”。该数据集位于metaSEM软件包中,网址为http://courses.nus.edu.sg/course/psycwlm/Internet/metaSEM/

## Load the library with the data set  
library(metaSEM)
## OpenMx is loaded automatically after loading metaSEM
## library(OpenMx)

## Select the sample effect sizes and their sampling covariance matrix
my.df <- wvs94a[, 2:6]

## It uses the reticular action model (RAM) specification
## A matrix specifies the asymmetric paths (regression coefficients and factor loadings)
## S matrix specifies the symmetric covariances and variances
## F matrix specifies a selection matrix to select the observed variables   
lat <- mxModel("LifesatOnLifeCon",
               mxData(observed=my.df, type="raw"),
               mxMatrix(type="Full", nrow=4, ncol=4,
                        free=c(F, T, rep(F, 14)),
                        values=c(0, 0.1, 1, rep(0,4), 1, rep(0,8)),
                        labels=c(NA, "beta1", rep(NA, 14)),
                        name="A"),
               mxMatrix(type="Symm", nrow=4, ncol=4,
                        values=0, free=c(T,rep(F,3),T,rep(F,5)),
                        labels=c("Var(LifeCon)",rep(NA,3),"Var(LifeSatError)",rep(NA,2),
                                 "data.lifecon_var", "data.inter_cov", "data.lifesat_var"),                        
                        name="S"),            
               mxMatrix(type="Full", nrow=2, ncol=4,
                        values=c(rep(0,4),1,0,0,1), name="F"),
               mxMatrix(type="Full", nrow=1, ncol=4, free=c(T, T, F, F),
                        values=c(0, 0, 0, 0), labels=c("MeanLifeCon", "beta0", NA, NA), name="M"),
               mxExpectationRAM("A", "S", "F", "M", dimnames=c("latcon", "latsat", "lifecon","lifesat")),
                                mxFitFunctionML())

summary(mxRun(lat))

输出为:LifesatOnLifeCon的摘要

free parameters:
               name matrix row    col     Estimate   Std.Error
1             beta1      A   2      1  0.467619431 0.148202854
2      Var(LifeCon)      S   1      1  0.008413600 0.002537270
3 Var(LifeSatError)      S   2      2  0.002887461 0.001281026
4       MeanLifeCon      M   1 latcon  0.068825735 0.016819615
5             beta0      M   1 latsat -0.030834413 0.015565501

observed statistics:  84 
estimated parameters:  5 
degrees of freedom:  79 
-2 log likelihood:  -161.9216 
number of observations:  42 
Information Criteria: 
      |  df Penalty  |  Parameters Penalty  |  Sample-Size Adjusted
AIC:      -319.9216              -151.9216                       NA
BIC:      -457.1975              -143.2332                -158.8909
Some of your fit indices are missing.
  To get them, fit saturated and independence models, and include them with
  summary(yourModel, SaturatedLikelihood=..., IndependenceLikelihood=...). 
timestamp: 2015-01-20 18:56:09 
Wall clock time (HH:MM:SS.hh): 00:00:00.13 
optimizer:  NPSOL 
OpenMx version number: 2.0.0.4004 
Need help?  See help(mxSummary) 

最后一点,通过将路径更改为表示“真实”效果大小之间的协方差的双箭头,上述模型等效于双变量元分析。双变量荟萃分析可以通过以下方式进行:β1τDA2

library(metaSEM)
summary( meta(y=cbind(lifesat, lifecon),
              v=cbind(lifesat_var, inter_cov, lifecon_var), 
              data=wvs94a) )

输出为:

Call:
meta(y = cbind(lifesat, lifecon), v = cbind(lifesat_var, inter_cov, 
    lifecon_var), data = wvs94a)

95% confidence intervals: z statistic approximation
Coefficients:
              Estimate   Std.Error      lbound      ubound z value  Pr(>|z|)
Intercept1  0.00134985  0.01385628 -0.02580797  0.02850766  0.0974 0.9223946
Intercept2  0.06882574  0.01681962  0.03585990  0.10179159  4.0920 4.277e-05
Tau2_1_1    0.00472726  0.00176156  0.00127465  0.00817986  2.6836 0.0072844
Tau2_2_1    0.00393437  0.00168706  0.00062779  0.00724094  2.3321 0.0196962
Tau2_2_2    0.00841361  0.00253727  0.00344064  0.01338657  3.3160 0.0009131

Intercept1    
Intercept2 ***
Tau2_1_1   ** 
Tau2_2_1   *  
Tau2_2_2   ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Q statistic on the homogeneity of effect sizes: 250.0303
Degrees of freedom of the Q statistic: 82
P value of the Q statistic: 0

Heterogeneity indices (based on the estimated Tau2):
                             Estimate
Intercept1: I2 (Q statistic)   0.6129
Intercept2: I2 (Q statistic)   0.7345

Number of studies (or clusters): 42
Number of observed statistics: 84
Number of estimated parameters: 5
Degrees of freedom: 79
-2 log likelihood: -161.9216 
OpenMx status1: 0 ("0" or "1": The optimization is considered fine.
Other values indicate problems.)

当我们比较这两个模型的-2对数可能性时,它们是完全相同的(-161.9216)。在这种情况下,我们无法通过对效应大小进行荟萃回归获得更多见解-双变量荟萃分析已经足够。

参考文献

张,MW-L。(2008)。一种将固定,随机和混合效应荟萃分析集成到结构方程模型中的模型心理方法,13(3),182-202。doi:10.1037 / a0013163

张,MW-L。(2013)。多元荟萃分析作为结构方程模型结构方程建模:多学科期刊,20(3),429–454。doi:10.1080 / 10705511.2013.797827

张,MW-L。(2014)。使用三级荟萃分析对依赖效应大小进行建模:一种结构方程式建模方法心理方法,19(2),211-29。doi:10.1037 / a0032968。

Shadish,WR(1992)。家庭和婚姻心理治疗会改变人们的行为吗?行为结果的荟萃分析。在TD Cook,H。Cooper,DS Cordray,H。Hartmann,LV Hedges,RJ Light,TA Louis和F. Mosteller(Eds)中,Meta分析进行了解释:案例研究(129-208)。纽约:罗素圣人基金会。

Shadish,WR(1996)。荟萃分析和因果中介过程探索:实例,方法和问题的入门。心理学方法1,47-65。

Shadish,WR和Sweeney,R。(1991)。荟萃分析中的调停者和主持人:我们之所以不让渡渡鸟告诉我们哪些心理治疗方法应该有奖赏是有原因的。咨询和临床心理学59,883-893。


欢迎来到我们的网站,迈克,非常感谢您的贡献。
ub

感谢@Mike,感谢Shadish的重要工作,并详细阐述了我的观点#5。如您所建议,在我的观点#4中,我认为您的5参数结构模型等效于和(例如,,); 解释和可能会更容易。考虑和其他均值和协方差结构很有趣,尤其是在具有更大的效果大小参数的情况下,但是根据实际现象来解释它们可能具有挑战性。Ť β 1 = τ d / τ 2 β 0 = μ d - β 1 μ β 0μTβ1=τDA/τA2β0=μDβ1μAβ0 μ Ťβ1μT
亚当·哈夫达尔
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.