我想知道面板数据分析和混合模型分析之间的区别。据我所知,面板数据和混合模型都使用固定和随机效应。如果是这样,为什么它们有不同的名称?还是它们的同义词?
我阅读了以下文章,其中描述了固定,随机和混合效应的定义,但并不能完全回答我的问题:固定效应,随机效应和混合效应模型之间有什么区别?
如果有人可以向我介绍有关混合模型分析的简短参考(约200页),我也将不胜感激。补充一点,无论软件处理如何,我都希望使用混合建模参考。主要是混合建模的理论解释。
我想知道面板数据分析和混合模型分析之间的区别。据我所知,面板数据和混合模型都使用固定和随机效应。如果是这样,为什么它们有不同的名称?还是它们的同义词?
我阅读了以下文章,其中描述了固定,随机和混合效应的定义,但并不能完全回答我的问题:固定效应,随机效应和混合效应模型之间有什么区别?
如果有人可以向我介绍有关混合模型分析的简短参考(约200页),我也将不胜感激。补充一点,无论软件处理如何,我都希望使用混合建模参考。主要是混合建模的理论解释。
Answers:
面板数据和混合效应模型数据都处理双索引随机变量。第一个索引用于组,第二个索引用于组内的个人。对于面板数据,第二个索引通常是时间,并且假定我们随时间观察个体。当时间是混合效应模型的第二个指标时,该模型称为纵向模型。最好根据2级回归来理解混合效应模型。(为便于说明,仅假设一个解释变量)
一级回归如下
简单地解释为每个组的个体回归。第二级回归试图解释回归系数的变化:
β 我 = δ 0 + ž 我2 δ 1 + v 我
当您将第二个方程式替换为第一个方程式时,会得到
固定效果是什么是固定的,这个装置。随机效应是u i和vi i。
现在,对于面板数据而言,术语发生了变化,但是您仍然可以找到共同点。面板数据随机效应模型与混合效应模型相同
β 我 = δ 0
与模型成为
这里是随机效应。
面板数据计量经济学中的固定效应和随机效应术语背后有很多历史,我省略了。我个人认为,这些模型可以在Wooldridge的“ 横截面和面板数据的计量分析 ”中得到最好的解释。据我所知,混合效应模型中没有这样的历史,但另一方面,我来自计量经济学背景,所以我可能会误会。
我了解您正在寻找描述混合建模理论而不参考软件包的文本。
我会推荐“ 多级分析”,这是Tom Snijders和Roel Bosker撰写的有关基本和高级多级建模的简介,大约250pp。它的最后一章是关于软件的一章(现在已经有些过时了),但是其余的是非常平易近人的理论。
我必须说,尽管我同意上述建议,但索菲娅·拉贝·赫斯凯斯(Sophia Rabe-Hesketh)和安德斯·斯克朗达尔(Anders Skrondal)提出了使用“ Stata的多层次和纵向模型”的建议。这本书是非常理论性的,软件组件实际上只是大量教材的不错的补充。我通常不使用Stata,而是将文字放在我的桌子上,并且觉得文字写得非常好。但是,它比200pp长得多。
以下文本均由该领域的当前专家撰写,对希望了解有关这些技术的更多信息的人很有用(尽管它们不完全符合您的要求):[我无法链接到这些,因为我是新手。用户,对不起]
Hoox,Joop(2010年)。多级分析,技术和应用。
Gelman,A.和Hill,J.(2006)使用回归和多层次/层次模型进行数据分析。
Singer,J.(2003)应用纵向数据分析:建模变化和事件发生
Raudenbush,SW和Bryk,A.,S.(2002)。分层线性模型:应用程序和数据分析方法
卢克·道格拉斯(2004)。多层次建模
我还要引用上面提到的Wooldridge的文本以及R文本,并且布里斯托大学多层建模中心提供了大量的教程和信息
@mpiktas已经给出了彻底的答案。我也建议阅读R中的plm软件包文档的第7章。作者关于混合模型和面板数据之间差异的讨论值得一读。
根据我的经验,使用“面板计量经济学”的理由是可以使用面板“固定效应”估计量来控制各种形式的遗漏变量偏差。
但是,可以使用Mundlak类型的方法在多级模型中执行这种类型的估计,即,将组均值包括为额外的回归变量。这种方法消除了误差项和潜在基团水平遗漏因素之间的相关性,从而揭示了“内”系数。但是,由于我不知道的原因,在应用研究中通常不会这样做。这些幻灯片和本文档提供了详细说明。