多次插补后的倾向得分匹配


34

我指的是这篇文章:Hayes JR,Groner JI。 “使用多个归因和倾向评分,通过创伤登记数据来测试汽车座椅和安全带的使用对伤害严重性的影响。” J Pediatr外科。2008年5月; 43(5):924-7。

在这项研究中,进行了多次插补以获得15个完整的数据集。然后为每个数据集计算倾向得分。然后,对于每个观察单位,从完成的15个数据集中的一个数据集中随机选择一个记录(包括相关的倾向得分),从而创建一个最终的数据集,然后通过倾向得分匹配对其进行分析。

我的问题是:在多次插补之后执行倾向得分匹配的有效方法吗?有其他替代方法吗?

对于上下文:在我的新项目中,我旨在比较使用倾向得分匹配的两种治疗方法的效果。缺少数据,我打算使用MICER中的包来估算缺失值,然后twang进行倾向得分匹配,然后lme4分析匹配的数据。

更新1:

我发现这个纸,它采用不同的方法:米特拉,Robin和莱特尔,杰罗姆P.缺少经由迭代协变量(2011)倾向评分匹配,顺序的多个插补[工作文件]

在本文中,作者计算了所有估算数据集的倾向得分,然后通过平均将其合并,这符合使用鲁宾规则进行点估算的多次插补的精神-但这真的适用于倾向得分吗?

如果CV上的任何人都可以对这两种不同的方法和/或任何其他方法提供评论并给出答案,那真是太好了。

Answers:


20

首先要说的是,对我而言,方法1(采样)似乎没有太多优点-正如Stas所提到的,它正在舍弃多重插补的好处,并为每个观察结果简化为单一插补。我看不到使用它的任何优势。

在Hill(2004)中,围绕缺少数据的倾向得分分析问题进行了精彩的讨论:Hill,J. “减少因缺少数据而 引起的观察研究中治疗效果估计中的偏差”, ISERP工作论文,2004年。在这里

本文考虑了使用多重插补的两种方法(以及其他处理缺失数据的方法)和倾向得分:

  • 多次插补后平均倾向得分的平均值,然后进行因果推断(上面文章中的方法2)

  • 使用来自多个估算的每组倾向得分进行因果推断,然后对因果估计值求平均。

此外,本文还考虑了结果是否应作为归因模型纳入预测模型中。

希尔断言,尽管多重插补优于其他处理丢失数据的方法,但通常没有先验条件为什么偏爱其中一种技术而不是另一种。但是,可能有理由更喜欢平均倾向得分,特别是在使用某些匹配算法时。希尔在同一篇论文中进行了模拟研究,发现在将因果推断中的结果包括在归因模型中之前,对均分进行平均后,就均方误差而言得出最佳结果,然后对均值进行平均,但没有结果在插补模型中,就平均偏差(估计和实际治疗效果之间的绝对差)而言,产生了最佳结果。通常,建议将结果包括在插补模型中(例如,请参见此处)。

因此,看来方法2是可行的方法。


1
我了解方法2,但是我对如何在R中实现方法感到迷惑。是否有人引用我?
萨姆

2
cobalt标题为“使用钴与复杂数据一起使用” 的包装的小插图中提供了这两种方法的R代码。您可以在此处访问它:CRAN.R-project.org/package=cobalt
Noah

13

可能存在两个范式的冲突。多重插补是一种基于模型的严重贝叶斯解决方案:正确插补的概念实质上表明,您需要从数据的明确定义的后验分布中进行采样,否则就会陷入困境。倾向得分匹配是一个半参数过程:计算了倾向得分后(无论如何,您都可以使用内核密度估计,而不必使用logit模型),其余的就可以完成通过简单地获取具有相同倾向得分的已处理观测值和未处理观测值之间的差异,现在这已经是非参数了,因为没有模型可以控制其他协变量。我不Abadie和Imbens(2008)讨论了在某些匹配情况下不可能正确地获得标准误差)。我会更信任更平滑的方法,例如通过逆倾向进行加权。我最喜欢的参考书是无害的计量经济学”,副标题为“经验主义者”,针对的是经济学家,但我认为这本书应该是其他社会科学家,大多数生物统计学家和非生物统计学家的必读材料。他们知道其他学科如何进行数据分析。

无论如何,每次观察仅使用15条模拟的完整数据行中的一条等效于一次插补。结果,与所有15个完整的数据集相比,您将失去效率,并且无法正确估计标准误差。从任何角度看,这对我来说都是一个不足的过程。

当然,我们很高兴在假设所有正确的变量具有所有正确的函数形式的意义上,多重插补模型和倾向模型都是正确的这一假设。几乎没有办法检查(尽管我很乐意听到关于这两种方法的诊断措施的其他信息)。


(+1)特别是因为我对匹配的字面实现引入的不连续感不满意(找到具有最接近倾向得分的值的控件,而忽略其余部分)。无论如何,倾向得分一直令我印象深刻。
红衣主教2012年

@cardinal,请参阅更新。
StasK 2012年

实际上,我对IPTW的批评比通过其他方法进行匹配要多(我需要阅读)。参见按倾向得分进行加权回归(Freedman&Berk,2008年),应用示例参见Bjerk,2009年。我不太确定为什么您在这里推荐“ 无害计量经济学”,但这对于对观测研究感兴趣的人还是一个很好的建议。
安迪W

@ Andy,Freedman&Berk的文章似乎可以处理更为简单的情况,您可以在逻辑回归中对所有模型进行建模。我的理解是,当您有更多协变量时,像PSM这样的方法将在更混乱的情况下应用,并且您对模型的信任程度不足以假定模型已正确指定。他们注意到,这种情况有利于加权,但是与其他可能的方法相比,我认为这对模型是有利的。
StasK 2012年

2
因为您的数据不是iid,并且关于逆Hessian和梯度的外积相等的最大极大似然定理不再成立,而且它们都不是方差的一致估计。人们需要在调查统计中使用三明治方差估计器(又称为线性化估计器),在计量经济学中使用怀特鲁棒估计器。
StasK 2012年

10

我不能真正讲这个问题的理论方面,但是我将提供使用PS / IPTW模型和多重插补的经验。

  1. 我从未听说有人使用多个估算数据集和随机抽样来构建单个数据集。这并不一定意味着它是错误的,而是一种奇怪的使用方法。数据集还不够大,您需要发挥创造力来解决3-5个模型的问题,而不仅仅是一个模型,以节省时间和计算量。
  2. 鲁宾的规则和合并方法是一个非常通用的工具。鉴于可以仅使用方差和估计值来计算合并的乘积推算结果,因此没有理由我不能将其用于您的项目-创建推算数据,对每个集合执行分析,然后合并。这是我做过的事情,也是我看过的事情,除非您有特定的理由不这样做,否则我真的看不到选择更具异国情调的东西的理由-尤其是如果您不了解那是什么继续该方法。

+1这是一个非常专业的论文,很难回答一个很好的问题。但是,除了声称失去对先前类似问题的赏金外,OP还提出了一个问题,要求乞求已迁移到meta的解决方案。我在这里的回答与您的评论类似。对于来自多重估算数据集的样本,我尤其有疑问。
Michael R. Chernick 2012年

谢谢 !您是否对使用方法2有任何参考?
乔·金

@JoeKing可悲的是,我的头还没跳。
Fomite 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.