什么是差异中的差异?


43

长期以来,差异一直作为非实验性工具而流行,尤其是在经济学中。有人可以对以下有关差异的问题提供清晰且非技术性的答案。

什么是差异估算器?
为什么使用差异中差异估算器?
我们真的可以相信差异差异估计吗?


有谁知道如何估算gretl中差异回归的差异?我必须使用OLS或面板数据吗?

3
@Pyca听起来好像不恰当地使用评论。您应该参考此问题发布一个新问题。
chl

Answers:


66

什么是差异估算器
差异差异(DiD)是一种工具,用于比较治疗前后的治疗结果与对照组之间的治疗效果,以估计治疗效果。通常,我们有兴趣估算治疗(例如,工会状况,药物等)对结局(例如,工资,健康状况等)的影响,如 其中是个体固定效应(个体特征不会随时间变化),是时间固定效应,是随年龄变化的协变量,例如个人的年龄,以及DiYi

Yit=αi+λt+ρDit+Xitβ+ϵit
αiλtXitϵit是一个错误术语。个人和时间分别由和索引。如果固定效果和之间存在相关性,则在不控制固定效果的情况下,通过OLS估算此回归将存在偏差。这是典型的省略的可变偏差itDit

为了了解治疗的效果,我们想知道一个人在接受治疗的世界与未接受治疗的世界之间的区别。当然,实际上只有其中之一是可观察到的。因此,我们寻找预后趋势相同的患者。假设我们有两个周期和两组。然后,假设在不进行任何治疗的情况下,治疗组和对照组的趋势将与以前一样,我们可以将治疗效果估计为 t=1,2s=A,B

ρ=(E[Yist|s=A,t=2]E[Yist|s=A,t=1])(E[Yist|s=B,t=2]E[Yist|s=B,t=1])

图形上看起来像这样: 在此处输入图片说明

您可以简单地手工计算这些均值,即获得两个时期组的平均结果并取它们的差。然后获得两组在两个时期的平均结局并取其差值。然后采取差异,这就是治疗效果。但是,在回归框架中执行此操作更为方便,因为这使您可以AB

  • 控制协变量
  • 获得治疗效果的标准误,以查看其是否显着

为此,您可以采用两种等效策略之一。如果一个人在组中,则生成一个等于1 的控制组哑元;否则,则生成0;如果,则生成一个时间哑元等于1;否则,则生成0。然后回归 treatiAtimett=2

Yit=β1+β2(treati)+β3(timet)+ρ(treatitimet)+ϵit

或者,您只是生成一个虚拟,如果某人在治疗组中并且该时间段是治疗后的时间段,则它等于1,否则为零。然后您将 Tit

Yit=β1γs+β2λt+ρTit+ϵit

其中再次是对照组的虚拟对象,而是时间虚拟变量。这两个回归为您提供两个周期和两组的相同结果。第二个方程式更为通用,因为它很容易扩展到多个组和多个时间段。在这两种情况下,您都可以通过这种方式估算差异参数的差异,以便可以包含控制变量(我从上述等式中省略了这些变量,以免造成混乱,但您可以简单地包含它们)并获得标准误差进行推断。γsλt

为什么差异估算器中的差异有用?
如前所述,DiD是一种利用非实验数据估算治疗效果的方法。这是最有用的功能。DiD也是固定效果估算的一种形式。固定效果模型假设,DiD做出了类似的假设,但在组级别,。因此,此处结果的期望值是组和时间效应的总和。那有什么区别呢?对于DiD,只要重复的横截面是从相同的聚合单位绘制出来的,则不一定需要面板数据。与需要面板数据的标准固定效果模型相比,这使DiD适用于更广泛的数据数组。E(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts

我们可以相信差异吗?
DiD中最重要的假设是平行趋势假设(请参见上图)。永远不要相信没有以图形方式显示这些趋势的研究!1990年代的论文也许已经摆脱了这一点,但是如今,我们对DiD的理解要好得多。如果没有令人信服的图表显示治疗组和对照组的治疗前结果有平行趋势,请保持谨慎。如果并行趋势假设成立,并且我们可以可靠地排除可能混淆治疗的其他任何时变变化,那么DiD是一种值得信赖的方法。

在处理标准错误时,还应注意另一点。使用多年的数据,您需要调整标准误差以进行自相关。过去,这一点一直被忽略,但自Bertrand等人以来一直没有(2004)“我们应该信任差异估计中的多少?” 我们知道这是一个问题。在本文中,它们为处理自相关提供了几种补救措施。最简单的方法是在单个面板标识符上进行聚类,从而允许各个时间序列之间的残差任意相关。这可以同时校正自相关和异方差。

有关更多参考,请参阅WaldingerPischke的这些讲义。



0

它是计量经济学中广泛使用的一种技术,用于检查时间序列中任何外来事件的影响。您选择两组独立的数据,分别与研究的事件之前和之后有关。了解更多信息的不错参考是Wooldridge 撰写的《计量经济学概论》


2
作为一个简洁的非技术性答案,这是对Andy答案的补充,但我不认为它涵盖了“我们真的可以相信差异差异估计吗?”
Silverfish

0

小心:

还有两点值得注意。首先,原始的92篇DD论文中有80篇存在分组误差项的潜在问题,因为观察单位比变化水平更为详细(Donald和Lang [2001]讨论了这一点)。这些论文中只有36篇通过聚类标准错误或聚合数据解决了这个问题。其次,使用了几种技术(或多或少非正式地)来处理干预变量的可能内生性。例如,三篇论文在等式(1)中包含滞后因变量,七篇论文包含特定于治疗状态的时间趋势,十五篇绘制一些图表以检查治疗效果的动态,三篇检查之前是否存在“效果”法律,两个测试效果是否持久,通过寻找另一个对照组,进行了11次正式尝试做三倍差(DDD)。在Bertrand,Duflo和Mullainathan [2002]中,我们证明了大多数这些技术都不能缓解序列相关性问题。

(Bertrand,Duflo和Mullainathan 2004,253)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.