差异数据设置


9

使用差异回归模型中的差异哪种设置正确

ÿ一世sŤ=α+γsŤ+λdŤ+δŤdŤ+ϵ一世sŤ

如果观察到的是治疗组,则T是一个等于1的假人,而d是在发生治疗后的时间段中等于1的假人。

1)每个组和时间的随机样本(即4个随机样本)

要么

2)在两个时间段内跟踪相同单位的面板数据?

有关系吗?如果没有,在任何情况下都可以使用OLS吗?


1
我还没有看到(1)完成-分析似乎总是=(2)。不知道为什么要这么做(1)。但是我还没有看过很多DID研究。
2013年

1
1的示例在Wooldridge入门计量经济学节13.2
B_Miner 2013年

Answers:


19

差异差异(DID)的一个关键假设是,两组在治疗前的结果变量中都有共同的趋势。这很重要,因为要得出这样的观点,即治疗组的变化是由于治疗而不是因为两组开始时彼此已经不同。

如果您在治疗前后对不同的人进行抽样,除非您从治疗组和对照组抽样的样本实际上是随机且庞大的,否则这将削弱论点。因此,很可能有人会问您:“您如何确保效果是由于治疗而不仅仅是因为您对不同的人进行了采样?” -这将很难回答。您可以通过使用面板数据来避免这个问题,因为随着时间的推移,您会跟踪相同的统计单位,通常这是更可靠的方法。

要回答您的最后一个问题:是的,数据很重要,但是您可以肯定地使用OLS来估算上面的方程。过去经常被忽略的重要事情是对标准误差的正确估计。如果您不对它们进行校正,那么序列相关会低估它们,即使您可能不希望这样做,也会发现明显的影响。有关如何处理此问题的参考和建议,请参见Bertrand等。(2004)“我们应该信任差异估计中的多少?”

最后,如果您拥有汇总数据(例如在州一级),或者可以轻松汇总数据,并且想要使用比DID更新的计量经济学方法,则可能需要看看Abadie等人。(2010)“比较案例研究的综合控制方法”。合成控制方法在当今的研究中越来越多地使用,并且对于R和Stata存在着有据可查的例程。也许这对您也很有趣。


这是伟大的安迪!我可以总结一下,两种数据设置都是可以接受的,但面板数据更容易提出假设?两者都可以通过OLS进行拟合,但是由于可能的串行相关性,(尤其是我认为的面板数据设置)的标准误差值得怀疑。Newey West SE的面板设置会是一个好的解决方案吗?
B_Miner 2013年

6
是的,对于第一种数据类型,您需要更多且强有力的假设。对于标准误差,Newey West校正应起作用。实际上,它类似于Bertrand等人提出的一种校正方法。(它们使用聚类标准错误)。最新的方法使用引导程序,该引导程序工作得很好(请参阅rbnz.govt.nz/research_and_publications/seminars_and_workshops/…)。希望这可以帮助!
安迪
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.