面板数据与混合模型之间的差异


14

我想知道面板数据分析和混合模型分析之间的区别。据我所知,面板数据和混合模型都使用固定和随机效应。如果是这样,为什么它们有不同的名称?还是它们的同义词?

我阅读了以下文章,其中描述了固定,随机和混合效应的定义,但并不能完全回答我的问题:固定效应,随机效应和混合效应模型之间有什么区别?

如果有人可以向我介绍有关混合模型分析的简短参考(约200页),我也将不胜感激。补充一点,无论软件处理如何,我都希望使用混合建模参考。主要是混合建模的理论解释。



Answers:


22

面板数据和混合效应模型数据都处理双索引随机变量。第一个索引用于组,第二个索引用于组内的个人。对于面板数据,第二个索引通常是时间,并且假定我们随时间观察个体。当时间是混合效应模型的第二个指标时,该模型称为纵向模型。最好根据2级回归来理解混合效应模型。(为便于说明,仅假设一个解释变量)yij

一级回归如下

yij=αi+xijβi+εij.

简单地解释为每个组的个体回归。第二级回归试图解释回归系数的变化:

β = δ 0 + ž 2 δ 1 + v

αi=γ0+zi1γ1+ui
βi=δ0+zi2δ1+vi

当您将第二个方程式替换为第一个方程式时,会得到

yij=γ0+zi1γ1+xijδ0+xijzi2δ1+ui+xijvi+εij

固定效果是什么是固定的,这个装置。随机效应是u ivi iγ0,γ1,δ0,δ1uivi

现在,对于面板数据而言,术语发生了变化,但是您仍然可以找到共同点。面板数据随机效应模型与混合效应模型相同

β = δ 0

αi=γ0+ui
βi=δ0

与模型成为

yit=γ0+xitδ0+ui+εit,

这里是随机效应。ui

xij

uiviεijxijzixijzixijxitui

yit=γ0+xitδ0+ui+εit,

xituiδ0

yity¯i.=(xitx¯i.)δ0+εitε¯i.,

ui

面板数据计量经济学中的固定效应和随机效应术语背后有很多历史,我省略了。我个人认为,这些模型可以在Wooldridge的“ 横截面和面板数据的计量分析 ”中得到最好的解释。据我所知,混合效应模型中没有这样的历史,但另一方面,我来自计量经济学背景,所以我可能会误会。


...+xijvi+ui+εij

这个解释太棒了!非常感谢您竭尽全力给我这样一个精彩的博览会,只想问一件事。2级回归是什么意思?
Beta

2
@Ari,第二级回归是第​​一级回归的回归系数的回归。第一级回归试图解释组内的变异,而第二级回归试图解释组间的变异。这种划分是人为的,但我喜欢它,因为至少对我来说这很自然。这种划分方式也用于分层贝叶斯模型中。
mpiktas 2012年

δ0

3

我了解您正在寻找描述混合建模理论而不参考软件包的文本。

我会推荐“ 多级分析”,这是Tom Snijders和Roel Bosker撰写的有关基本和高级多级建模的简介,大约250pp。它的最后一章是关于软件的一章(现在已经有些过时了),但是其余的是非常平易近人的理论。

我必须说,尽管我同意上述建议,但索菲娅·拉贝·赫斯凯斯(Sophia Rabe-Hesketh)和安德斯·斯克朗达尔(Anders Skrondal)提出了使用“ Stata的多层次和纵向模型”的建议。这本书是非常理论性的,软件组件实际上只是大量教材的不错的补充。我通常不使用Stata,而是将文字放在我的桌子上,并且觉得文字写得非常好。但是,它比200pp长得多。

以下文本均由该领域的当前专家撰写,对希望了解有关这些技术的更多信息的人很有用(尽管它们不完全符合您的要求):[我无法链接到这些,因为我是新手。用户,对不起]

Hoox,Joop(2010年)。多级分析,技术和应用。

Gelman,A.和Hill,J.(2006)使用回归和多层次/层次模型进行数据分析。

Singer,J.(2003)应用纵向数据分析:建模变化和事件发生

Raudenbush,SW和Bryk,A.,S.(2002)。分层线性模型:应用程序和数据分析方法

卢克·道格拉斯(2004)。多层次建模

我还要引用上面提到的Wooldridge的文本以及R文本,并且布里斯托大学多层建模中心提供了大量的教程和信息


谢谢Playitagain!这是非常有用的信息。即使您的名字也很有趣:)
Beta

2

我也想知道两者之间的区别,最近又找到了关于该主题的参考资料,我知道“面板数据”是数据集的传统名称,该数据集代表“横截面或一组被定期调查的人群”给定的时间跨度”。因此,“面板”是数据集中的一个组结构,拥有这样一个组,分析这种类型数据的最自然的方法是通过混合建模方法。

关于混合效果建模的一个很好的参考(无论是否“说” R)是道格拉斯·贝茨(Douglas Bates)即将出版的(?)书的草稿lme4:使用R进行混合效果建模)。


1
谢谢ils供参考!但是问题仍然存在。
Beta


1

如果您使用Stata,那么Sophia Rabe-Hesketh和Anders Skrondal撰写的使用Stata的多层次和纵向模型将是一个不错的选择。根据您的实际兴趣,大约200页是正确的。


感谢Dimitriy提供的参考。但不幸的是我不使用STATA。我主要使用SAS,有时也使用R。但是还是要感谢。
Beta


感谢Dimitriy!这看起来确实很有希望。提出问题而不是闲聊的好处是您会得到非常好的结果:)
Beta

1

根据我的经验,使用“面板计量经济学”的理由是可以使用面板“固定效应”估计量来控制各种形式的遗漏变量偏差。

但是,可以使用Mundlak类型的方法在多级模型中执行这种类型的估计,即,将组均值包括为额外的回归变量。这种方法消除了误差项和潜在基团水平遗漏因素之间的相关性,从而揭示了“内”系数。但是,由于我不知道的原因,在应用研究中通常不会这样做。这些幻灯片和本文档提供了详细说明。


(+1)社会学家通常将组的意思解释为上下文效应(尽管嵌套横截面数据比时间序列面板数据更常见)。我需要阅读相关笔记Manski(1993)PDF在此处)的一篇文章,该文章显示如何经常不识别这种上下文影响。对于“没有做到这一点的理由”,我怀疑社会科学实践之间的差异与其他事物一样多,这可能是一个很好的问题。
Andy W
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.