Mundlak固定效应程序是否适用于假人的逻辑回归?


12

我有一个包含8000个聚类和400万个观测值的数据集。不幸的是xtlogit,即使使用10%的子样本,我的统计软件Stata在使用其面板数据函数进行logistic回归时运行也相当缓慢。

但是,使用非面板logit功能时,结果会更快出现。因此,我可能会受益于使用logit修正后的数据来解决固定效应。

我相信该程序是“ Mundlak固定效应程序”的创造(Mundlak,Y。1978年。时间序列和横截面数据的合并。Econometrica,46(1),69-85)。

我在Antonakis,J.,Bendahan,S.,Jacquart,P.,&Lalive,R.(2010)的论文中找到了对此过程的直观解释关于提出因果主张:审查和建议。《领导力季刊》 21(6)。1086-1120。我引用:

解决遗漏固定效应问题并仍然包含2级变量的一种方法是将所有1级协变量的聚类均值包括在估计模型中(Mundlak,1978)。聚类平均值可以作为回归变量包括在内,也可以从1级协变量中减去(即聚类平均居中)。聚类均值在聚类内是不变的(并且在聚类之间有所不同),并且允许对一级参数进行一致的估计,就像已包含固定效应一样(参见Rabe-Hesketh和Skrondal,2008年)。

因此,聚类平均居中似乎是解决我的计算问题的理想选择。但是,这些论文似乎是针对线性回归(OLS)的。

这种聚类平均居中的方法是否也适用于“复制”固定效应二进制逻辑回归?

一个更技术性的问题应该得出相同的答案:当数据集B是数据集A的均值中心版本时,数据集A是否xtlogit depvar indepvars, fe等于logit depvar indepvars数据集B?

我在这种聚类均值居中发现的另一个困难是如何应对假人。由于虚拟变量为0或1,它们在随机效应和固定效应回归中是否相同?他们不应该“居中”吗?

Answers:


9

在像logit这样的模型中,无法进行初次求差或像确定性这样的变换,因为在非线性模型的情况下,这种技巧无法消除未观察到的固定效应。即使您有一个较小的数据集,可以在其中包含N-1个虚拟变量来直接估计固定效果,但除非数据的时间维度较大,否则这将导致估计偏差。因此,消除面板logit中的固定效果既不区分也不贬低,并且仅由于logit功能形式才有可能。如果您对这些细节感兴趣,可以在Söderbom的PDF页面30(解释为什么贬低/首次区分logit / probit无效的原因)和第42页(介绍面板logit估计器)中查看这些说明

另一个问题是,xtlogit面板logit模型通常不会直接估计计算边际效应所需的固定效应。没有这些,解释您的系数将非常尴尬,在运行模型数小时后,这些系数可能会令人失望。

有了如此大的数据集,以及前面提到的有限元专家组logit在概念上的困难,我将坚持线性概率模型。我希望这个答案不会令您失望,但是有很多充分的理由提供这样的建议:LPM更快,系数可以直接解释(尤其是在模型中具有交互作用的情况下,因为对它们的解释非线性模型中的系数发生变化!),固定效果易于控制,您可以为自相关和聚类调整标准误差,而估计时间不会超出合理范围。我希望这有帮助。


1
这不是解决方案,而是答案。谢谢:)
汤姆

1
小点:这些幻灯片中的p20可以说明问题,但是p47上描述了Mundlak校正(又称“相关随机效应”)模型,似乎没有任何警告。
conjugateprior

1

我相信有条件的logit(Stata上为“ clogit”),它是一种固定效果的logit面板估算器。

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf


5
欢迎光临本站!我认为这不是一个可以接受的答案,因为问题实际上是:如何通过修改横截面逻辑回归来避免条件(固定效应)逻辑回归,以加快估算速度。正如您的参考资料指出(在第3页的顶部),“我们可以使用Stataclogit命令或该xtlogit, fe命令进行固定效果的logit分析。两者都给出相同的结果。(实际上,我相信xtlogit, fe实际上调用了clogit。)” OP已经xtlogit, fe根据倒数第二段知道了。
Randel 2013年

0

艾莉森(Allison)在艾莉森(2009),“固定效应回归模型”,第32f页中讨论了此问题。

艾莉森认为,不可能以最大的可能性来估计无条件模型。这是因为模型由于“附带参数问题”而变得有偏差。相反,他建议使用条件对数模型(Chamberlain,1980)。这是通过对每个人观察到的事件数量调节似然函数来实现的。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.