为什么使用横截面数据来推断/预测纵向变化是一件坏事?


11

我正在寻找希望存在的论文,但不知道是否存在。这可能是一组案例研究,和/或概率论的一个论据,关于为什么使用横截面数据来推断/预测纵向变化可能是一件坏事(即不一定如此,但可以如此)。

我已经从很多方面看到了这个错误:有人推断,由于英国的富人出行更多,所以随着社会的富裕起来,整个人口的出行也将增加。事实证明,这种推论在很长一段时间内都是不正确的-超过十年。这与家庭用电情况类似:横截面数据表明随着收入的增加而大量增加,这种增加不会随着时间的推移而显现。

有几件事发生,包括队列效应和供应方约束。

拥有一个参考文献来汇编这样的案例研究将非常有用;和/或使用概率论来说明为什么使用横截面数据来推断/预测纵向变化会产生非常非常的误导。

是否存在这样的论文,如果存在,那是什么?


2
我相信经济学家会将这些现象视为一种一般的均衡效应。统计人员称这违反稳定单位治疗价值假设。我认为面板vs横截面问题有点让人讨厌。
Dimitriy V. Masterov 2015年

Answers:


2

您要求“纵向”更改来部分回答自己的问题。之所以称其为横截面数据,是因为它们可以及时捕捉快照,从字面上看,它是从一个具有多种关系的,时变的社会中切出的。因此,您希望做的最好的推论是在假设您正在研究的内容是时不变的,或者至少已经得出结论的。

另一方面,您要查找的数据是经济学家的纵向数据或面板数据。

解释主要方法,但也凸显了经济学两个突出的例子一个很好的参考是在这里。例2.1给出了公司投资率。

第3节比较理论,但有很多见识:面板数据模型可以是

yi,t=αyi,t1+xi,tγ+ηi+vi,t.

现在,这种类型的模型可以捕获状态依赖性,这是(除了未观察到的异质性之外)人们为什么行为不同的常见解释。因此,如果仅观察在给定时间点旅行的人,您的将不会被识别,这意味着您不知道他们昨天的旅行对他们再次旅行的决定有多大影响。α

现在,暂时关闭时间依赖性,但请记住,这个方程可能是真实的模型。

现在在横截面模型中,您将完全删除下标因为您只有一个时期的数据。因此,您也无法考虑以下事实:数据集中的每个人都可能具有完全不同的,这至少在真实模型是动态的情况下通常会使您的回归偏向上。这可能是高估的原因,因为您未测量但未观察到的个体效应(也很常见),但这反映在您的横断面研究中。tηis

现在,再次输入面板数据。我们可以做的是减去每个变量随时间的平均值,如果的平均值随时间恒定,则将消除此项。这种转换(其他转换也是可能的)使您可以只关注动态(实际上您会丢失任何时不变的回归变量)。ηi

现在,这是横截面和面板数据之间的主要区别。您可以消除时不变效应的事实是因为您拥有时变,因此可以消除横截面估计无法检测到的某些偏差。因此,在您考虑更改政策(例如,因为希望人们出行而希望获得更多政府收入)而提高旅行税率之前,几年来看到这种现象很有用,这样可以确保您不会捕获样本中未观察到的异质性,您将其解释为旅行的倾向。

要估算这些模型,最好参考一下。但要注意:关于人们行为的不同假设将使不同的估计程序可否接受。

我希望这有帮助!


1

这听起来很像非遍历过程的定义(实现过程中的度量不等于时间过程中的度量)。可悲的是,现实世界中很少有有趣的现象是遍历的。我猜这可能是更精细采样和推断的情况,其中可能会进行某些简化。我正在考虑较小的时间或空间尺度的示例,其中未观察到混沌行为,因此可以线性化预测变量。但是我只是在这里闲逛。恐怕我也无法为您提供有关该主题的特定文献。抱歉:/但是有趣的问题

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.