为什么要在差异中使用控制变量?


10

我对使用以下标准方程式的“差异中的差异”方法有疑问: 这里treat是治疗组和岗位的虚拟变量。

y=a+b1treat+b2post+b3treatpost+u

现在,我的问题很简单:为什么大多数论文仍然使用其他控制变量?我认为,如果平行趋势假设是正确的,那么我们就不必担心额外的控制措施。我只能想到使用控制变量的2个可能原因:

  1. 没有它们,趋势将不会平行
  2. 因为DnD规范将治疗时治疗组和对照组之间趋势的任何差异归因于干预措施(即,交互作用术语*治疗后)-当我们不控制其他变量时,交互作用系数可能会超过-/低估了

有人可以阐明这个问题吗?我的理由1)或2)完全有意义吗?我对DnD中控制变量的使用不完全了解。


是否需要其他控制变量取决于该治疗组是从较大的组中随机选择,其余的作为对照组,还是(由于事后分析中更常见),因为某些特定功能。
亨利

Answers:


5

没有它们[即其他变量],趋势将不会平行

恩,那就对了。除非您向模型中添加随时间变化的变量,否则可能并没有考虑到特定于单位的趋势。

即使没有其他变量也能满足并行趋势假设,与其他回归一样,添加其他变量也可以提高估计的精度。我认为这是Michael Chernick想到的一部分。

大多数情况下,无害计量经济学会进行有益的讨论,可能会有所帮助。尤其请参见第236-37页。


1

有时,当我们通过计算治疗前与治疗后反应的差异来查看治疗效果时,我们会说患者充当自己的对照。提供对照组的目的是解决所谓的安慰剂效应。有时,即使不进行治疗,也会有积极的改变。因此,我们要确定的效果是高于“安慰剂效果”的平均增长。


嗨,迈克尔,谢谢您的回答。我想我理解为什么我们需要控制组。对照组被纳入我的回归方程式,因为那些人​​没有得到治疗= 1。因此,这实际上不是问题。问题是,为什么有些论文在上述方程式的顶部使用其他控制变量。如果您可以回答这个问题,或者其他人也可以。谢谢你们!
sachin 2012年

为什么将附加变量称为控制变量?我可以看到在模型中包括其他变量的唯一原因是,这些变量可以解释响应中的某些变化,而模型中的其他变量无法解释这些变化。
Michael R. Chernick

好吧,这基本上是我的问题:假设并行趋势假设成立时,为什么要包含这些变量(即包含控制变量,因为正如您所说,它们可以解释我们声称的处理方法可以解释的内容)?我只能假设包括进一步的控制意味着放宽该假设-即即使在控制其他变量时,也能看到治疗可以解释多少。这可能是由于无法完全测试平行趋势假设而导致的,并且可能使读者对治疗的效果更具说服力。但不确定这一点
sachin 2012年

对反应的影响不必仅来自治疗。我是说其他变量可能能够解释与治疗无关的反应差异。它与治疗之间没有任何关系。
Michael R.


1

继续迈克尔的回答,您想提供尽可能多的证据,证明E [u | treat] =0。这是一个假设,永远无法直接验证,但是您想向读者提供尽可能多的信任,因为您已经想到了为什么可能成立。有效地添加控件开始分解u。而且,某些控件可能无法满足您的所有需求,但可以使您了解一些您不必担心的事情。例如,如果您有一个智商控制,那么这可能有助于减轻对能力上遗漏变量的担忧。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.