倾向得分与在回归中添加协变量相比有何不同?何时优先选择后者?


41

我承认我在倾向得分和因果分析方面还比较陌生。

作为一个新手,对我而言不明显的一件事是,使用倾向得分的“平衡”在数学上与在回归中添加协变量时发生了什么变化?该操作有何不同,为什么它(或它)比在回归中添加子群体协变量更好?

我看过一些对这些方法进行实证比较的研究,但是我没有看到关于这两种方法的数学性质的很好的讨论,为什么PSM却不适合因果关系而又不包括回归协变量。在这个领域似乎也有很多困惑和争议,这使得事情变得更加难以掌握。

对这个问题有什么想法,或者有什么好的资源/论文可以更好地理解两者之间的区别?(我正在慢慢浏览Judea Pearl的因果关系书,因此无需指出这一点)


3
建议您阅读Morgan和Winship,2007年。第4章和第5章对因果效应识别进行回归和匹配的显式比较和对比。
conjugateprior

1
在检查余额统计信息时,您要确保要比较的治疗组之间没有关于多维协变量空间的外推法。回归只是外推而无需检查,因此外推可能会给出不好的预测。
StatsStudent

Answers:


17

一个很大的不同是,回归以线性方式“控制”了这些特征。通过倾向得分进行匹配可以消除线性假设,但是,由于某些观察结果可能不匹配,因此您可能无法对某些群体说出任何话。

例如,如果您正在研究工人培训计划,则您可能让所有参与者都是男性,但是控制性的非参与者人口是男人和女人。使用回归,您可以将参与指标变量和男性指标的收入进行回归。您将使用所有数据,并可以估算一名女性(如果她参加了该计划)的收入。

如果您要进行匹配,则只能将男人匹配。结果,您将不会在分析中使用任何女性,并且您的结果将与她们无关。

回归可以使用线性假设推断,但匹配不能。回归和匹配之间的所有其他假设基本相同。匹配优于回归的好处是它是非参数的(除非您必须假设自己具有正确的倾向得分,否则这就是匹配的方式)。

有关更多讨论,请参见我的页面,这里的课程重点关注匹配方法。尤其参见因果效应估计策略假设

另外,一定要查阅Rosenbaum和Rubin(1983)概述倾向得分匹配的文章。

最后,自1983年以来,匹配已经走了很长一段路。请查看Jas Sekhon的网页,以了解他的遗传匹配算法。


3
可能是因为我不是统计学家,但是当OP总体上询问回归时,似乎您假设是线性回归。但是我想主旨是,将协变量添加到任何类型的回归变量中都会对输入空间进行一些假设,以便可以将其推断到新的示例中,并且匹配对可以推断出哪种类型的内容更为谨慎。
rrenaud 2012年

2
在估算倾向函数时,您确实会对混杂变量的功能形式做出了一些假设。随后,您还要对具有“接近”倾向值的个人进行匹配,因此我不会立即认为倾向匹配解决了非线性混杂效应的问题。
AdamO'8

2
链接断开。
卡洛斯·辛纳利

11

简短的回答是,倾向得分并没有比等效的ANCOVA模型好,尤其是在因果解释方面。

倾向得分最好理解为一种数据缩减方法。它们是将许多协变量简化为单个分​​数的有效方法,可用于调整一组变量的关注效果。这样,您可以通过调整单个倾向得分而不是多个协变量来节省自由度。当然,这提供了统计上的优势,但仅此而已。

在对倾向性得分进行回归调整时可能会出现的一个问题是,使用倾向性得分而不是对所有用于估计模型中的倾向性得分的协变量进行回归调整是否会有所收获。罗森鲍姆(Rosenbaum)和鲁宾(Rubin)指出,“使用多变量X的协方差调整分析得出的治疗效果的点估计值等于基于X的样本线性判别式的单变量协方差调整获得的估计值。用于协方差调整和判别分析”。因此,两种方法的结果应得出相同的结论。然而,执行两步过程的一个优点是,可以通过交互和高阶项来拟合非常复杂的倾向评分模型。由于此倾向评分模型的目标是获得最佳的治疗分配估计概率,因此不必担心过度参数化该模型。

从:

与非随机控制组进行治疗的偏倚减少倾向性得分方法

D'Agostino(引用Rosenbaum和Rubin)

D'agostino,RB,1998年。倾向评分匹配用于偏倚减少的治疗与非随机对照组的比较。统计医学17:2265–2281。


5
(+1)在这个相关问题中,有一个关于因果关系问题的有趣话题,从统计学的角度来看,一个人是否可以通过观察性研究使用倾向评分来推断因果关系?
chl

3
我同意这个答案的一般前提,但是当一个根据倾向得分进行匹配时,这与将所有协变量放入模型中是不一样的(因此,这不仅仅是降维技术)。如果一个人倾向得分也不同。
Andy W

1
我不同意这个答案。当倾向得分在治疗组和对照组之间达到平衡时,它们的倾向得分是好的,而当得分不得分时,倾向得分是不好的。与回归条件方法一样。它们是否“更好”仅取决于该属性,这将因问题而异。
conjugateprior

1
我不同意,因为虽然平衡标准是相同的,但这两种策略的长处和短处都不同。根据问题,一个方法可能是更好的方法,也可能不是。实际上,在我看来,“ 等效 ANCOVA模型”的定义并不明确。(等价的方式?)
共轭

1
对。现在,我明白了“等效”的含义,但是引语中以“ However”开头的句子引入了相关的区别:实际上是prop。分数估计分别恰恰使他们能够方法比分析模型更粗糙。(并且文章的下一段还有另一个区别,未引用。)
共轭

7

可能是一个晦涩难懂的参考书,但是如果您偶然获得它,我建议您阅读本书的相应章节(Apel和Sweeten,2010年)。它是针对社会科学家的,因此也许在数学上没有您想要的那么严格,但是它应该深入到足以使您的问题得到令人满意的答案的程度。

人们对待倾向得分的方式有几种,可以通过将协变量简单地包含在回归模型中而得出不同的结论。当一个分数匹配时,一个不一定代表所有观察结果都得到共同支持(即,一个观察结果似乎没有机会出现在治疗组中,而某些观察结果总是存在于治疗组中)。人们还可以通过各种方式加权观察结果,从而得出不同的结论。

除了此处的答案外,我还建议您检查出chl引用问题的答案。倾向得分背后的实质不仅仅是实现协变量平衡的统计技巧。您阅读并理解了Rosenbaum和Rubin的被高引用的文章后,将会更清楚地看到为什么该方法与仅在回归模型中添加协变量不同的原因。我认为,对您的问题更满意的答案不一定是倾向得分背后的数学公式,而是逻辑上的分数。


@Andy W请参阅Rosenbaum和Rubin在我更新的帖子中关于带有协变量的回归和倾向得分调整的等价内容。
Brett 2012年

0

我想将PS视为研究的设计部分,与分析完全分开。也就是说,您可能需要考虑设计(PS)和分析(回归等)。另外,PS提供了一种支持二元处理交换性的手段。也许其他人可以评论将协变量包含在结果模型中是否可以实际支持交换性,或者是否有人在将协变量包括在结果模型中之前就假定了可交换性。


-3

统计方法医学研究。2016年4月19日

在倾向得分调整后的非线性回归模型中对偏差的评估。

倾向评分方法通常用于在观察研究中评估条件治疗效果时调整观察到的混淆。一种流行的方法,即回归模型中倾向得分的协变量调整,已通过经验证明在非线性模型中存在偏差。但是,没有提出令人信服的潜在理论原因。我们提出了一个新的框架来研究非线性模型中倾向得分调整后的治疗效果的偏倚和一致性,该框架使用一种简单的几何方法在倾向得分估算器的一致性和非线性模型的可折叠性之间建立了联系。在此框架下,我们证明了对结果模型中倾向得分的调整会导致观察到的协变量分解为倾向得分和剩余项。从不可折叠的回归模型中省略该剩余项会导致对条件优势比和条件危险比的估计偏差,但对条件比率的影响则不成立。通过仿真研究,我们进一步表明,随着治疗效果大小的增加,协变量效果的增加以及治疗模型与结果模型中协变量系数之间的相异性增加,这些倾向得分调整后的估算器中的偏差也会增加。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.