为什么要使用滞后DV作为工具变量?


12

我继承了一些数据分析代码,尽管我不是计量经济学家,但我一直难以理解。一个模型使用以下Stata命令运行工具变量回归

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

该数据集是一个针对该组变量具有多个顺序观察值的面板。

为什么此代码将DV的滞后值用作工具?据我了解(从深入研究旧教科书中),当由于回归变量与误差项相关而出现问题时,使用了IV估计。但是,没有提到选择DV的滞后作为工具。

此行代码的注释中提到“因果关系”。欢迎大家弄清楚这里的目标是什么。


根据您的问题,您可能正在阅读代码,但略有错误。语法使用差异作为“工具”来估计因变量的滞后。
安迪W

劳拉:您能编辑问题,以简单的方式解释已删除的Stata代码的含义吗?
user603 2010年

Answers:


7

编辑:鉴于下面由Andy W提供的stata代码的说明,我更改了答案以更好地解决该问题。您会在当前答案的下面找到我的答案的旧版本。

看来您的代码是对Arellano-Bond估计量进行DIY的笨拙尝试(假设使用2SOLS进行ivreg估计)。你可以找到在A / B估计的使用和逻辑更多的细节在这美好的综述文章,以及在这个更广泛的介绍。

简而言之,在3行之内:尽管A / B估计量确实是一个(广义的)IV估计量,但它并不用于解决因果关系问题。在此上下文中,IV用于在面板数据的上下文中提供AR系数的有效估计。

我建议不要在这里重新发明轮子,而应该使用现成的工具箱来进行这种估算。对于stata,可以使用XTABOND2(如果正在运行STAT11,则使用XTABOND)包。


旧的回应:

xtytxtytxtytytxt

ytxt1xt

ytxt1xt1ytxy

ytxt1I(0)


+1同意这种解释,就像DIY Arellano-Bond一样。注意:我发现Arellano-Bond仅在横截面单元的数量非常大时(例如数百个)才是值得信赖的。Arellano在他的文章和教科书中暗示了一致性,即截面单位的数量,并且收敛速度并不是那么快。
Cyrus S

5

我不了解Stata,因此无法对特定模型发表评论。但是,在一般情况下处理同时性偏差,尤其是创建工具变量时,使用滞后变量是一种相当普遍的方法。

假设您在模型中的两个变量之间有反馈:自变量(例如价格)和因变量(例如数量)。然后两者都是内生的(其原因来自模型内部),误差项的扰动将影响两个变量。

为了解决这个问题,您希望使自变量(价格)是外生的,以便误差中的扰动仅影响因变量(数量)。这是通过按价格对模型中的其他外生变量进行回归来创建新的外生变量来实现的。这些新的外生变量是您的工具变量(IV)。IV来自外生项,因此与误差无关。

但是要做到这一点,您需要找出哪些变量是外生的,以便可以将它们用于导出IV。我们可以注意到,滞后变量在过去“发生”,因此无法与当前错误相关联。因此,滞后变量是外生变量,并成为导出IV的方便候选者。(但是,请注意,当错误与自相关时,前面的参数会失败。)

入门的计量经济学是一个很好的介绍和参考 Wooldridge 的现代方法


5

对于不熟悉Stata的以下代码段的人,OP提供了

ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)

这个等式可以读成

Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t1)

Y~t1

Y~t1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)

(即IV方程的第一阶段在Stata代码的括号内)

增量表示二阶,三阶和四阶差异,它们被用作排除工具以估计因变量的滞后。

L.t1D.D2.

最初,我无法想到有人会这样做的任何逻辑推理。但是Kwak指出(参考本文),Arellano-Bond方法使用差异作为工具来估计模型的自回归分量。(最初我还假设,如果系列是非平稳的,差异只会产生影响,邦德在那篇链接论文中指出,只有在系列是随机游走的情况下,差异才是微弱的工具,第21页) )

作为进一步阅读材料作为工具变量简介的建议,

回应中的另一位张贴者(查理)与他准备的一些我喜欢的幻灯片相关联,并建议寻找工具变量简介。我还建议这个简报的一位我的教授也准备为一个研讨会做介绍。作为对学习更多有关工具变量感兴趣的任何人的最后建议,您应该查阅Joshua Angrist的著作。

这是我最初的答案


L.t1D.D2.

在我所看到的所有应用程序中,人们都使用变量的滞后作为估计因变量的滞后的工具(由于ars谈到的原因)。但这是基于这样的假设:在应用变量的时间段内,滞后自变量对于误差项是外生的。

我不知道有什么理由会将因变量的差异视为外生的。据我所知,仅对等式的一侧求差是不可接受的,并且会产生相当不合逻辑的结果(是一篇论文,对某人的相反情况提出了批评,在这种情况下,他们将变量水平作为预测的变量。如果您重新排列IV方程中的项,则实际上看起来类似于增强的Dickey Fuller检验。

虽然最简单的答案是问编写代码的人,但是有人可以举例说明此过程可以接受,还是在任何情况下该过程将返回有意义的结果?因为我不能想到任何逻辑上的理由,除非系列是非平稳的,否则差异为什么会对水平产生影响。


嗨,安迪。我不知道Stata代码。这就是为什么我不提及我的答案中的代码被截断的原因,必须将其理解为对用英语表达的问题部分的答复。
user603 2010年

@kwak-我不是在批评您的帖子,我同意您所说的一切。我只是想知道是否有人对为什么我将差异用作我不知道的工具有某种逻辑。我无法想象在任何情况下差异都可以满足此类程序的任何要求。
安迪W

嗨,安迪:>我没有以评论家的身份接受你的评论。您的帖子强调了Rob和我(诚然)都不了解的问题的关键方面。如果有的话,它说明了协作的重要性。
user603 2010年

+1。较早之前没有看到所有这些内容-感谢您注意到此问题以及有关stata符号的崩溃/迷你课程。我接受您的第一条评论,暗示该解释是错误的,并且在很一般的意义上得到了回答。我很高兴您能更加坚持不懈,而郭某知道了。
ARS
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.