在回归中包含滞后因变量


26

我对在回归模型中包含滞后因变量是否合法感到非常困惑。基本上,我认为,如果该模型关注Y的变化与其他自变量之间的关系,那么在右侧添加滞后因变量可以确保其他IV之前的系数与Y的先前值无关。

有人说,包含LDV将使其他IV的系数下降。还有一些人说可以包含LDV,它可以减少串行相关性。

我知道这个问题在哪种回归方面都相当普遍。但是我的统计知识是有限的,而且当焦点是Y随时间的变化时,我真的很难确定是否应将滞后因变量包括在回归模型中。

还有其他方法来处理Xs对Y随时间的变化的影响吗?我也尝试了与DV不同的变化评分,但是在那种情况下R平方非常低。


1
您希望通过模型实现什么?最大化R平方很少是一个好的模型选择标准。
Michael Bishop

该模型将用于预测。的确,尽管R平方相差很大,但使用Y或Y的变化预测值实际上是相同的。但是,鉴于使用Y的变化作为DV的R平方值较低,是否意味着当前的IV集不能很好地解释这一变化,并且必须有一些省略的变量吗?
user22109 2013年

Answers:


19

在模型中包括滞后因变量的决定实际上是一个理论问题。如果您希望DV的当前级别在很大程度上取决于其过去的级别,则最好包括一个滞后的DV。在这种情况下,不包括滞后的DV将导致遗漏变量偏差,并且结果可能不可靠。在这种情况下,包括滞后的DV,将消除您的很多差异,并可能使其他DV的影响降低(这意味着使较小,而标准误差较大)。但是,您可以做的就是说那些仍然会影响您结果的IV具有控制DV过去值的效果。一种替代方法是使用周期t时结果变量之间的差βŤ作为周期 t的DV。Ť-1个Ť

但是,执行任何这些操作都意味着回答一个重要问题:您的DV正确的延迟结构是什么?您可以通过观察你的结果变量之间本身具有不同的滞后值(例如,相关Y和Y之间的相关性得到一些有关此信息,Y和Y 牛逼- 2等)。Ť-1个Ť-2


12

我推荐两篇文章:

  1. Achen CH(2001)为什么滞后因变量可以抑制其他自变量的解释能力(链接
  2. Keele,L.和Kelly NJ(2005)动态理论的动态模型:滞后因变量的来龙去脉(link)。

结果是,包含滞后因变量可能会对其余变量的系数产生很大影响。有时这是适当的(对于Keele和Kelly的动力学模型),有时则不合适。正如其他人所说,考虑正在建模的过程很重要。


4

包括滞后因变量可以减少模型不合规格引起的自相关的发生。因此,考虑滞后因变量可以帮助您捍卫模型中自相关的存在。过去的值会影响模型中的当前值,需要理论基础,并根据需要最好地拟合模型。


不确定我对最后一句话是否公正;如果含义可以澄清,请进行编辑。欢迎使用交叉验证的BTW!
尼克·斯汤纳

1
自相关可能是数据收集方式的产物。我通过数字化图表获得数据,这意味着对数据进行了排序。这种分类和非线性关系导致了残差的自相关。
Tony Ladson

2

让我对这个问题感兴趣的是,他们对模型的规格或模型的估算技术一无所知。我提到,因为尽管在IV中使用滞后的DV在理论上很重要并且在方法上是必要的,但它也可能会在模型中引入一定数量的内生性风险,具体取决于变量和时间单位之间的实质关系以及AR模型中可能存在的顺序。除非您(和我们)对变量和估计有更多详细信息,否则除非您正在考虑某种工具变量技术或诸如Arellano-Bond估计之类的方法,否则我不建议将DV落后。

请给我们提供更多详细信息,以便我们更好地了解我们所讨论的模型。


0

是的,您应该警惕小T大N情况下的Nickell偏见(Nickell,S。(1981年)。具有固定影响的动态模型中的偏差。Econometrica:计量经济学学会杂志,1417-1426。)

您可能希望查看动态面板数据模型,例如Arellano-Bond或Blundell-Bond估计量。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.