何时使用固定效果与使用集群SE?


19

假设您具有单个数据横截面,其中个人位于组内(例如,学校内的学生),并且您希望估计以下形式的模型:Y_i = a + B*X_i其中X是个人水平特征和a常数的向量。

在这种情况下,假设未观察到的组间异质性会使您的点估计B及其SE产生偏差,因为它与您所关注的独立变量相关。

一种选择是按小组(学校)对SE进行聚类。另一个是要包括FE组。另一个是同时使用。在这些选项之间进行选择时应该考虑什么?尤其不清楚为什么要按组将SE聚类并使用FE组。在我的特定情况下,我有35个小组,每个小组中有5,000个人。我已经按照本pdf中的讨论进行了讨论,但是对于为什么以及何时可以同时使用群集SE和固定效果尚不清楚。

(请讨论集群式SE与FE的优缺点,而不是建议我只采用多层次模型。)

Answers:


22

两种使用组固定效应和/或群集调整后的标准误差的方法都考虑到了与群集(或面板)数据有关的不同问题,我将清楚地将它们视为不同的方法。通常,您想同时使用它们:

首先,除非您愿意作进一步的假设,否则群集调整后的标准误差说明了群集内相关性或异方差,除非您愿意作进一步的假设,否则固定影响估计器不会考虑这些误差。和长面板和与这个问题有关的各种问题。Cameron和Miller也有一篇有关此主题的新颖论文:《集群健壮推断的从业者指南》可能对您很有趣。如果您不想对方差-协方差矩阵建模,并且怀疑存在集群内相关性,我建议您使用集群鲁棒标准误差,因为您的SE中的偏差可能很严重(比异方差问题多得多,请参见Angrist&Pischke第III.8章讨论了该主题。但是您需要足够的集群(Angrist和Pischke说40-50作为经验法则)。群集调整后的标准误差考虑了标准误差,但您的点估计值保持不变(标准误差通常会上升)!

固定效果估算考虑了未观察到的时不变异质性(如您所述)。这可能是好是坏:一方面,您需要较少的假设来获得一致的估计。另一方面,您会抛弃很多可能有用的差异。像安德鲁·盖尔曼(Andrew Gelman)这样的人更喜欢分层建模而不是固定效果,但是这里的观点有所不同。固定效果估计将同时改变点估计和间隔估计(此处标准误差通常也会更高)。

综上所述:如果您不想打扰集群间和集群内相关性的建模(并且有足够的集群可用),那么集群健壮的标准错误是解决集群数据相关问题的一种简便方法。固定效果估算将仅使用某些变化,因此是否要基于较小的变化进行估算取决于模型。但是,如果没有进一步的假设,固定效应估计将无法解决与方差矩阵的集群内相关性相关的问题。聚类鲁棒性标准误差也不会考虑与使用固定效应估计有关的问题。


2
反应良好。剩下的关键问题是为什么一个人都想要。Imbens和Wooldridge在某种程度上涵盖了这一点。
QuestionAnswer

13

固定效果用于消除数据中不同组之间的未观察到的异质性。

我不同意接受的答复中的含义,即使用有限元模型的决定取决于您是否要使用“较少变化”。如果因变量受面板中各组之间系统地变化的不可观察变量的影响,则与该变化相关的任何变量的系数都会产生偏差。除非您的X变量是随机分配的(并且它们永远不会与观测数据一起使用),否则通常很容易使省略变量的参数产生偏差。你可能能够通过一系列好的控制变量来控制一些被省略的变量,但是如果您的首要目标是强力识别,那么即使是大量的控制措施,也可能会给关键读者留下怀疑的余地。在这些情况下,通常最好使用固定效果模型。

聚类标准误差用于说明每个组之内的观察值没有iid(独立且相同分布)的情况。

一个典型的例子是,如果您在一段时间内对一组公司有很多观察。您可以考虑公司级别的固定效应,但是因变量中仍可能存在一些无法解释的变化,这些变化会随时间变化。通常,在使用时间序列数据时,通常可以安全地假设组中误差项具有时间序列相关性。这些情况是集群式SE的最明显的用例。

一些说明性示例:

如果您拥有实验数据,可以在其中随机分配治疗方法,但是随着时间的推移对每个个体/组进行重复观察,则可以省略固定效应,但希望将SE聚类。

或者,如果您每组中有许多非实验数据的观察值,但是组内的每个观察值都可以视为来自其较大组的同义引诱(例如,您有来自许多学校的观察结果,但是每个组都是随机抽取的子集的学生),您可能希望包括固定效果,但不需要集群式SE。


2

这些答案很好,但是Abadie等人提供了最新最好的答案。(2019)“何时应调整聚类的标准错误?” 具有固定效果时,群集的主要原因是您在群集之间的治疗效果上存在异质性。还有其他原因,例如,集群(例如,公司,国家)是否是总体中集群的子集(您要推断出这些集群)。聚类是设计中的主要问题。不要盲目地做。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.