倾向得分加权对平均治疗效果的置信区间?


9

我试图使用倾向评分权重(特别是IPTW)从观察数据中估计平均治疗效果。我想我正在正确计算ATE,但是我不知道如何在考虑逆倾向得分权重的同时计算ATE的置信区间。

这是我用来计算平均治疗效果的方程式(参考Stat Med。2010年9月10日; 29(20):2137–2148。): 其中受试者总数,治疗状态,结果状态,倾向得分。

ATE=1N1NZiYipi1N1N(1Zi)Yi1pi
N=Zi=Yi=pi=

有人知道R包会考虑权重来计算平均治疗效果的置信区间吗?可以在survey这里包帮助吗?我想知道这是否行得通:

library(survey)
sampsvy=svydesign(id=~1,weights=~iptw,data=df)
svyby(~surgery=='lump',~treatment,design=sampsvy,svyciprop,vartype='ci',method='beta')

#which produces this result:
  treatment surgery == "lump"      ci_l      ci_u
   No         0.1644043 0.1480568 0.1817876
   Yes         0.2433215 0.2262039 0.2610724

我不知道从哪里可以找到比例之间的差异的置信区间(即平均治疗效果)。


我无法具体回答,但是调查包的作者写的《复杂的调查:使用R进行分析的指南》一书确实涵盖了IPTW,并且可能会有所帮助。books.google.com/...
kaz_yos

Answers:


11

您不需要survey包装或任何复杂的东西。Wooldridge(2010年,第920页起)“横截面和面板数据的计量分析”有一个简单的过程,您可以从中获取标准误差以构建置信区间。

假设您已正确指定了倾向得分(我们将其表示为,请根据倾向得分估算(即您的首次logit或概率回归定义得分)为 然后让 就像您在上面的表达式中一样。然后使用这两个表达式的样本类似物,并在上回归p(xi,γ)

di=γp(xi,γ)[Zip(xi,γ)]p(xi,γ)[1p(xi,γ)]
ATEi=[Zip(xi,γ)]Yip(xi,γ)[1p(xi,γ)]
ATE^id^i。确保在此回归中包括截距。假设是该回归的残差,则的渐近方差就是。因此,您的ATE的渐近标准误差为 eiN(ATE^ATE)Var(ei)
[1Ni=1Nei2]12N

然后,您可以按照通常的方式计算置信区间(例如,有关代码示例,请参见此处答案的注释)。您无需再次调整倾向得分权重的置信区间,因为此步骤已包含在标准误差的计算中。

不幸的是我不是R家伙,所以我不能为您提供特定的代码,但是上面概述的过程应该很直接。附带说明,这也是treatrewStata中命令的工作方式。该命令由Cerulli(2014)编写并引入Stata Journal中。如果您无权访问该文章,则可以查看他的幻灯片,其中还概述了根据逆倾向得分加权计算标准误差的过程。在这里,他还讨论了通过logit或probit估计倾向得分之间的一些细微的概念差异,但是出于这个答案的考虑,它并不是太重要,因此我省略了这一部分。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.