在这个答案中,我想详细介绍一下Matthew关于计量经济学文献所说的随机效应估计器的GLS观点的+1答案。
GLS观点
考虑线性模型
如果认为我们可以简单地通过合并OLS来估计模型,这等于忽略面板数据结构,并将所有观测值汇总在一起。
yit=α+Xitβ+uiti=1,…,m,t=1,…,T
E(uit|Xit)=0n=mT
我们使用误差分量模型对进行建模uit
uit=ηi+ϵit
用矩阵表示法,模型可以表示为
,其中和是向量,典型元素和,是虚拟变量的(每单位一列)矩阵。是这样的:如果一行对应于属于单元的观察值,则在第列中有一个,其他为0,。
y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,…,m
我们进一步假设
E(ϵϵ′)=σ2ϵI
特定于个人的效果必须独立于。随机效应估计器,不同于固定效应(再次,计量经济学术语)之一,然而另外需要较强的假设,即
在这种假设下,汇集OLS是无偏的,但是我们可以得出GLS估计量。假设是均值为零且方差为 IID 。ηϵit
E(ηi|X)=0
ηiσ2η
这个假设解释了术语随机效应。此外,假设这两个错误分量是独立的,则很容易看出
Var(uit)Cov(uit,uis)Cov(uit,ujs)=σ2η+σ2ϵ=σ2η=0for all i≠j
然后,我们得到以下方差-协方差矩阵:
这里,
其中是1的向量。因此,我们可以
为GLS估计量
编写
我们需要。为此,让,n×nΩ
Ω=⎛⎝⎜⎜⎜⎜ΣO⋮OOΣ⋮O⋯⋯⋯OO⋮Σ⎞⎠⎟⎟⎟⎟
Σ=σ2ηιι′+σ2ϵIT
ιTΩ=σ2η(Im⊗ιι′)+σ2ϵ(Im⊗IT)
β^RE=(X′Ω−1X)−1X′Ω−1y
Ω−1JT=ιι′J¯T=JT/TET=IT−J¯T。然后,写
或,收集术语具有相同的矩阵,
的幂等性和然后允许我们显示
其中。
Ω=Tσ2η(Im⊗J¯T)+σ2ϵ(Im⊗ET)+σ2ϵ(Im⊗J¯T)
Ω=(Tσ2η+σ2ϵ)(Im⊗J¯T)+σ2ϵ(Im⊗ET)
P=Im⊗J¯TQ=Im⊗ETΩ−1=1σ21P+1σ2ϵQ=−σ2ησ21σ2ϵ(Im⊗ιι′)+1σ2ϵ(Im⊗IT),
σ21=Tσ2η+σ2ϵ
高斯-马尔可夫逻辑然后解释了为什么随机效应估计可能是有用的,因为它是一种更有效的估计超过所述给定的假设下混合OLS或固定效应(提供,这是一种若在许多面板数据应用非常大,即确实与回归变量无关。简而言之,GLS效率更高,因为在此模型中误差协方差矩阵不是同方差矩阵。ηi
可以证明,可以通过对部分除污的数据运行OLS来获得GLS估计值:
其中。当将获得固定效果(“内”)估计量。对于可以得到“介于”估计值。GLS估计量是两者之间的加权平均值。(对于将获得汇总的OLS估计量。)
(yit−θy¯i⋅)=(Xit−θX¯i⋅)β+(uit−θui⋅),
θ=1−ση/σ1θ=1θ→−∞θ=0
可行的GLS
为了使FGLS方法可行,我们需要和估计量。Baltagi,《面板数据的计量经济学分析》,第2页。第16版(引自第3版)讨论了如何进行以下操作。σ21σ2ϵ
假设首先我们观察。然后,uit
σ^21=T1m∑i=1mu¯2i⋅
和
可以很好地估计其参数,其中的时间平均值对应于单位的观测值。
σ^2ϵ=1m(T−1)∑i=1m∑t=1T(uit−1m∑i=1mu¯i⋅)2
u¯i⋅i
在华莱士和侯赛因(1969)的方法包括替代的用混合OLS回归(其中,毕竟,仍然是无偏的和本假设下一致)的残留物。u
在雨宫(1971)的方法建议使用FE(或LSDV)残差来代替。作为计算问题,我们施加了的限制来规避虚拟变量陷阱,以便能够获得其中表示LSDV残差和的平均数。∑iηi=0α^=y¯⋅⋅−X¯′⋅⋅β^FE⋅⋅itu^=y−α^−Xβ^FE
默认的Swamy and Arora(1972)方法估计
和
在这里,。
σ^2ϵ=[y′Q(I−X(X′QX)−1X′Q)y]/[m(T−1)−K]
σ^21=[y′P(I−Z(Z′PX)−1Z′P)y]/[m−K−1]
Z=(ιmTX)
所述Nerlove(1971)的方法估计从,其中是来自固定效应回归的虚拟变量,而是根据该回归得出的残差平方和之内的,其中分母为。σ2η∑mi=1(η^i−η^¯)2/(m−1)η^iσ^2ϵmT
正如Randel的计算所显示的那样,它们产生如此巨大的变化,我也感到非常惊讶!
编辑:
关于差异,错误分量的估计值可能会在plm
程序包中检索,并且确实返回了截然不同的结果,从而解释了的点估计值的差异(根据@Randel的回答,抛出了我没有尝试过的错误)固定):βamemiya
> ercomp(stackY~stackX, data = paneldata, method = "walhus")
var std.dev share
idiosyncratic 21.0726 4.5905 0.981
individual 0.4071 0.6380 0.019
theta: 0.06933
> ercomp(stackY~stackX, data = paneldata, method = "swar")
var std.dev share
idiosyncratic 0.6437 0.8023 0.229
individual 2.1732 1.4742 0.771
theta: 0.811
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
var std.dev share
idiosyncratic 0.5565 0.7460 0.002
individual 342.2514 18.5000 0.998
theta: 0.9857
我怀疑在我的姊妹线程示例中,错误分量的估计量也不一致,在此示例中,我旨在使用个体效应和相关的数据来证明FE和RE之间的差异。(实际上,它们不可能如此,因为根据RE是FE的加权平均值以及在估计与误差分量估计所确定的权重之间的事实,它们最终使FE估计远离了RE估计。因此,如果RE不是一致,这最终必须归因于这些估算值。)X
如果您替换该示例的“违规”功能,
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
简单地说,
alpha = runif(n)
因此,与不相关的随机效应,对于所有估计误差分量的变量,您可以获得 RE点估计非常接近真实值。Xββ=−1
参考文献
Amemiya,T.,1971年,方差成分模型中方差的估计,《国际经济评论》第 12期,第1-13页。
Baltagi,BH,面板数据的计量经济学分析,Wiley。
Nerlove,M.,1971a,《从横截面的时间序列估计动态经济关系的进一步证据》,《计量经济学》,第 39卷,第359-382页。
Swamy,PAVB和SS Arora,1972年,误差分量回归模型中系数估计量的精确有限样本性质,Econometrica 40,261–275。
Wallace,TD和A. Hussain,1969,使用误差分量模型结合横截面和时间序列数据,《计量经济学》 37,55-72。