计量经济学中的“随机效应模型”与计量经济学之外的混合模型有何关系?


56

我曾经认为计量经济学中的“随机效应模型”对应于计量经济学之外的“带有随机截距的混合模型”,但是现在我不确定。可以?

计量经济学使用的“固定效应”和“随机效应”等术语与混合模型的文献有些不同,这引起了众所周知的混乱。让我们考虑一个简单的情况,其中y线性依赖于x但是在不同的测量组中截距不同:

yit=βxit+ui+ϵit.

在这里,每个单位/组i在不同的时间点观察到t。计量经济学家称其为“面板数据”。

  • 在混合模型术语中,我们可以将ui视为固定效应或随机效应(在这种情况下,它是随机截距)。把它当作固定装置嵌合βü以最小化均方误差(即运行OLS回归与虚设组变量)。处理它,我们还假定作为随机手段ü ÑÛ 0σ 2 ù,并使用最大可能性,以适应ü 0σ 2 Ù代替各嵌合ù β^u^iuiN(u0,σu2)u0σu2ui在其自己的。这导致“局部集中”的效应,其中估计ü得到朝缩水它们的平均ü 0u^iu^0

    R formula when treating group as fixed:    y ~ x + group
    R formula when treating group as random:   y ~ x + (1|group)
  • 用计量经济学术语,我们可以将整个模型视为固定效应模型或随机效应模型。第一种选择等效于上述固定效应(但计量经济学在这种情况下有其自己的估计方式β,称为"within" estimator)。我曾经以为第二种选择等同于上面的随机效应。例如@JiebiaoWang在他对“随机效应”,“固定效应”和“边际模型”之间有何区别的高度评价中

    在计量经济学中,随机效应模型可能仅指生物统计学中的随机拦截模型

好的---让我们测试一下这种理解是否正确。这是@ChristophHanck在回答固定效应模型,随机效应模型和混合效应模型之间有什么区别时产生的一些随机数据(我将这些数据放在不使用R的用户的pastebin上):

在此处输入图片说明

@Christoph使用计量经济学方法进行了两种拟合:

fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

第一个产生的beta估计等于-1.0451,第二个0.77031(是,正!)。我试图用lm和复制它lmer

l1 = lm(stackY ~ stackX + as.factor(unit), data = paneldata)
l2 = lmer(stackY ~ stackX + (1|as.factor(unit)), data = paneldata)

第一个-1.045与上面的内部估计量完全吻合。凉。但是第二个收益率-1.026距随机效应估计器相距几英里。?到底是怎么回事?实际上,与一起调用时,plm甚至在做什么 model = "random"

无论它在做什么,都可以通过混合模型的角度以某种方式理解它吗?

做什么之后的直觉是什么?我在几个计量经济学地方读到,随机效应估计量是固定效应估计量与加权平均数之间的加权平均值,"between" estimator如果我们根本不在模型中包含组同一性的话,则该回归斜率或多或少是回归斜率(在这种情况下,这种估计强烈为正情况下,4)。例如@Andy 在这里写道

然后,随机效应估算器使用数据变化范围之内和之间的矩阵加权平均值。[...]这使随机效果更有效[。]

为什么?我们为什么要这个加权平均值?特别是为什么我们要使用它而不是运行混合模型?


8
哇,不到24小时就提出了20多个赞誉和六个启发性的答案,但它们都集中在思考的计量经济学方面。到目前为止,尚无答案与混合模型建立联系。
变形虫说莫妮卡(Monica)恢复


Answers:


16

简介:计量经济学中的“随机效应模型”和“随机拦截混合模型”确实是相同的模型,但是它们的估算方法不同。计量经济学方法是使用FGLS,混合模型方法是使用ML。有多种执行FGLS的算法,其中一些(在此数据集上)产生的结果非常接近ML。


1.估计方法之间的差异 plm

我将使用@ChristophHanck生成的数据在plm(..., model = "random")和上lmer()进行测试,以作答。

根据plm软件包手册,有四个选项random.method:用于估计随机效应模型中方差分量的方法。@amoeba使用默认值swar(Swamy和Arora,1972)。

对于随机效应模型,通过将random.method设置为“ swar”(Swamy和Arora(1972))(默认),“ amemiya”(Amemiya(1971)),“ walhus”( Wallace和Hussain(1969))或“ nerlove”(Nerlove(1971))。

我使用相同的数据测试了这四个选项,得到了一个误差amemiya,并且对该变量进行了三个完全不同的系数估计stackX。using random.method='nerlove'和'amemiya'的lmer()值与-1.029和-1.025和-1.026的值几乎相等。它们与“固定效果”模型-1.045中获得的结果也没有太大差异。

# "amemiya" only works using the most recent version:
# install.packages("plm", repos="http://R-Forge.R-project.org")

re0 <- plm(stackY~stackX, data = paneldata, model = "random") #random.method='swar'
re1 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='amemiya')
re2 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='walhus')
re3 <- plm(stackY~stackX, data = paneldata, model = "random",  random.method='nerlove')
l2  <- lmer(stackY~stackX+(1|as.factor(unit)), data = paneldata)

coef(re0)     #    (Intercept)   stackX    18.3458553   0.7703073 
coef(re1)     #    (Intercept)   stackX    30.217721   -1.025186 
coef(re2)     #    (Intercept)   stackX    -1.15584     3.71973 
coef(re3)     #    (Intercept)   stackX    30.243678   -1.029111 
fixef(l2)     #    (Intercept)   stackX    30.226295   -1.026482 

不幸的是,我现在没有时间,但是有兴趣的读者可以找到这四个参考文献,以检查他们的估计程序。弄清楚它们为什么会产生这种变化将非常有帮助。我希望在某些情况下,plm使用lm()on转换后的数据进行估算的过程应等同于中使用的最大似然过程lmer()

2. GLS和ML的比较

plm软件包的作者确实在其论文的第7节中比较了两者:Yves Croissant和Giovanni Millo,2008年,《 R:plm软件包》中的Panel Data Econometrics

计量经济学主要处理非实验数据。重点放在规范程序和误规范测试上。因此,模型规格趋于非常简单,而注意力集中在回归变量的内生性,误差的依存性结构和偏离正态性的估计量的鲁棒性上。首选方法通常是半参数或非参数方法,并且异方差一致性技术正在成为估计和测试中的标准实践。

由于所有这些原因,计量经济学中的面板模型估计大部分是在基于艾特肯定理的广义最小二乘框架中完成的。与此相反,在纵向数据模型nlmelme4由(限制或无限制)的最大似然估计。[...]

计量经济学的GLS方法具有可由标准线性代数计算的封闭形式的解析解,尽管后者有时会在计算机上增加计算量,但估算器的表达式通常相当简单。相反,纵向模型的ML估计基于没有封闭形式解的非线性函数的数值优化,因此取决于近似值和收敛标准。


3.混合模型更新

我非常感谢@ChristophHanck提供了有关所random.method使用的四个的详尽介绍,plm并解释了为什么它们的估算值如此不同。根据@amoeba的要求,我将对混合模型(基于似然性)及其与GLS的联系添加一些想法。

T=ni

该模型为 与。

yit=xitβ+ηi+ϵiti=1,,m,t=1,,ni
ηiN(0,ση2),ϵitN(0,σϵ2)

对于每个, 因此,对数似然函数为i

yiN(Xiβ,Σi),Σi=ση21ni1ni+σϵ2Ini.
const12ilog|Σi|12i(yiXiβ)Σi1(yiXiβ).

当所有方差都已知时,如Laird和Ware(1982)所示,MLE为 与GLS由@ChristophHanck派生。因此,关键差异在于方差的估计。鉴于没有封闭形式的解决方案,有几种方法:

β^=(iXiΣi1Xi)1(iXiΣi1yi),
β^RE
  • 使用优化算法直接最大化对数似然函数;
  • 期望最大化(EM)算法:存在闭式解,但是的估计量涉及随机截距的经验贝叶斯估计。β
  • 以上两种方法的组合,即期望/条件最大化算法(ECME)(Schafer,1998; R package lmm)。通过不同的参数设置,存在(如上所述)和闭式解。用于溶液可以写成其中被定义为并且可以在EM框架中进行估算。βσϵ2σϵ2
    σϵ2=1inii(yiXiβ^)(ξ^1ni1ni+Ini)1(yiXiβ^),
    ξση2/σϵ2

总而言之,MLE具有分布假设,并且是通过迭代算法估算的。MLE和GLS之间的关键区别在于方差的估计。

Croissant and Millo(2008)指出,

在正常情况下,同方差和误差的无序列相关性OLS也是最大似然估计器,在所有其他情况下也存在重要差异。

我认为,就分布假设而言,正如参数方法和非参数方法之间的差异一样,当假设成立时,MLE会更有效,而GLS会更可靠。


我会怀疑错误消息的问题与我将变量生成为矢量有某种关系吗?也许plm希望数据以不同的方式存储?
克里斯多夫·汉克

1
nerlove在这里效果很好,但不适用于不平衡面板,因为我从最后一个面板中删除了1个观察值并尝试运行所有方法,发现了这一点。
变形虫说恢复莫妮卡

2
@ChristophHanck @amoeba 对于我来说,发生的plm错误random.method="amemiya"是他们可能应该使用X[, -1, drop=FALSE]而不是X[, -1]保留X[, -1]模型中只有一个协变量的矩阵格式。无论如何,我试图通过在公式中添加标准的标准变量来克服这一问题。amemiya重现结果,估计值为-1.02,它也适用于不平衡数据。
兰德尔

3
@ jiebiao-wang @ChristophHanck @amoeba plm的当前开发版本运行良好random.method="amemiya":var std.dev share idiosyncratic 0.6360 0.7975 0.002个人313.6510 17.7102 0.998 theta:0.9841
Helix123 '17

1
您好@JiebiaoWang。我发现更新之后,您的回答确实可以令人满意地回答我的问题。我自由地进行了一些编辑,amemiya并在ML vs GLS上插入了有关的更新和报价。我将其标记为已接受,并将奖励它。干杯。
变形虫说莫妮卡(Monica)恢复

17

这个答案没有对混合模型发表评论,但是我可以解释一下随机效应估计器的作用以及为什么将其固定在该图上。

摘要:随机效应估计器假设,在此示例中不正确。E[uix]=0


随机效应估算器在做什么?

假设我们有模型:

yit=βxit+ui+ϵit

我们有两个变化的维度:组和时间。要估算我们可以:itβ

  1. 使用时间序列变化。这就是固定效应估算器的作用(这就是为什么它也经常被称为内部估算器的原因。)
  2. 如果是随机的,则只能使用组的时间序列平均值之间的横截面变化。这称为中间估计器。ui

    具体来说,对于每个组,取上述面板数据模型随时间的平均值即可得出:i

    y¯i=βx¯i+vi where vi=ui+ϵ¯i

    如果运行此回归,则将获得间估计。如果效应是与不相关的随机白噪声,则观察到这是一个一致的估计。如果是这种情况,那么将组间的变异完全抛弃(就像我们对固定效果估算器所做的那样)是无效的。uix

计量经济学的随机效应估计器以最大化效率的方式组合了(1)估计器(即固定效应估计器)和(2)之间的估计器。它是广义最小二乘的一种应用,其基本思想是逆方差加权。为了最大化效率,随机效应估计器将计算为内部估计器与中间估计器之间的加权平均值。β^

该图中发生了什么...

只要看一下该图,您就可以清楚地看到发生了什么:

  • 在每个组(即相同颜色的点),较高的与较低的相关联ixityit
  • 较高的组较高。ix¯iui

的随机效应假设显然不满足。分组效应与不正交(从统计意义上来说),相反,分组效应与具有明显的正相关关系。E[uix]=0uixx

之间的估算器假设。之间的估算器说:“确保我可以通过使正数来施加!”E[uix]=0E[uix]=0β^

然后,由于它是内部估算器与中间估算器之间的加权平均值,因此随机效应估算器处于关闭状态。


+1,谢谢马修。不知道为什么有人拒绝您的回答。我正在寻找建立与混合模型的连接的答案,所以我不会接受您的答案,但是我仍然认为这对本次讨论很有帮助。如果您可以在此处详细介绍如何应用和计算GLS和逆方差加权,那么它将非常有用。
变形虫说恢复莫妮卡

16

在这个答案中,我想详细介绍一下Matthew关于计量经济学文献所说的随机效应估计器的GLS观点的+1答案。

GLS观点

考虑线性模型 如果认为我们可以简单地通过合并OLS来估计模型,这等于忽略面板数据结构,并将所有观测值汇总在一起。

yit=α+Xitβ+uiti=1,,m,t=1,,T
E(uit|Xit)=0n=mT

我们使用误差分量模型对进行建模uit

uit=ηi+ϵit

用矩阵表示法,模型可以表示为 ,其中和是向量,典型元素和,是虚拟变量的(每单位一列)矩阵。是这样的:如果一行对应于属于单元的观察值,则在第列中有一个,其他为0,。

y=αιmT+Xβ+Dη+ϵ
yϵnyitϵitDn×mDiDii=1,,m

我们进一步假设

E(ϵϵ)=σϵ2I

特定于个人的效果必须独立于。随机效应估计器,不同于固定效应(再次,计量经济学术语)之一,然而另外需要较强的假设,即 在这种假设下,汇集OLS是无偏的,但是我们可以得出GLS估计量。假设是均值为零且方差为 IID 。ηϵit

E(ηi|X)=0
ηiση2

这个假设解释了术语随机效应。此外,假设这两个错误分量是独立的,则很容易看出

Var(uit)=ση2+σϵ2Cov(uit,uis)=ση2Cov(uit,ujs)=0for all ij

然后,我们得到以下方差-协方差矩阵: 这里, 其中是1的向量。因此,我们可以 为GLS估计量 编写 我们需要。为此,让,n×nΩ

Ω=(ΣOOOΣOOOΣ)
Σ=ση2ιι+σϵ2IT
ιT
Ω=ση2(Imιι)+σϵ2(ImIT)
β^RE=(XΩ1X)1XΩ1y
Ω1JT=ιιJ¯T=JT/TET=ITJ¯T。然后,写 或,收集术语具有相同的矩阵, 的幂等性和然后允许我们显示 其中。
Ω=Tση2(ImJ¯T)+σϵ2(ImET)+σϵ2(ImJ¯T)
Ω=(Tση2+σϵ2)(ImJ¯T)+σϵ2(ImET)
P=ImJ¯TQ=ImET
Ω1=1σ12P+1σϵ2Q=ση2σ12σϵ2(Imιι)+1σϵ2(ImIT),
σ12=Tση2+σϵ2

高斯-马尔可夫逻辑然后解释了为什么随机效应估计可能是有用的,因为它是一种更有效的估计超过所述给定的假设下混合OLS或固定效应(提供,这是一种若在许多面板数据应用非常大,即确实与回归变量无关。简而言之,GLS效率更高,因为在此模型中误差协方差矩阵不是同方差矩阵。ηi

可以证明,可以通过对部分除污的数据运行OLS来获得GLS估计值: 其中。当将获得固定效果(“内”)估计量。对于可以得到“介于”估计值。GLS估计量是两者之间的加权平均值。(对于将获得汇总的OLS估计量。)

(yitθy¯i)=(XitθX¯i)β+(uitθui),
θ=1ση/σ1θ=1θθ=0

可行的GLS

为了使FGLS方法可行,我们需要和估计量。Baltagi,《面板数据的计量经济学分析》,第2页。第16版(引自第3版)讨论了如何进行以下操作。σ12σϵ2

假设首先我们观察。然后,uit

σ^12=T1mi=1mu¯i2
和 可以很好地估计其参数,其中的时间平均值对应于单位的观测值。
σ^ϵ2=1m(T1)i=1mt=1T(uit1mi=1mu¯i)2
u¯ii

华莱士和侯赛因(1969)的方法包括替代的用混合OLS回归(其中,毕竟,仍然是无偏的和本假设下一致)的残留物。u

雨宫(1971)的方法建议使用FE(或LSDV)残差来代替。作为计算问题,我们施加了的限制来规避虚拟变量陷阱,以便能够获得其中表示LSDV残差和的平均数。iηi=0α^=y¯X¯β^FEitu^=yα^Xβ^FE

默认的Swamy and Arora(1972)方法估计 和 在这里,。

σ^ϵ2=[yQ(IX(XQX)1XQ)y]/[m(T1)K]
σ^12=[yP(IZ(ZPX)1ZP)y]/[mK1]
Z=(ιmTX)

所述Nerlove(1971)的方法估计从,其中是来自固定效应回归的虚拟变量,而是根据该回归得出的残差平方和之内的,其中分母为。ση2i=1m(η^iη^¯)2/(m1)η^iσ^ϵ2mT

正如Randel的计算所显示的那样,它们产生如此巨大的变化,我也感到非常惊讶!

编辑:

关于差异,错误分量的估计值可能会在plm程序包中检索,并且确实返回了截然不同的结果,从而解释了的点估计值的差异(根据@Randel的回答,抛出了我没有尝试过的错误)固定):βamemiya

> ercomp(stackY~stackX, data = paneldata, method = "walhus")
                  var std.dev share
idiosyncratic 21.0726  4.5905 0.981
individual     0.4071  0.6380 0.019
theta:  0.06933  
> ercomp(stackY~stackX, data = paneldata, method = "swar")
                 var std.dev share
idiosyncratic 0.6437  0.8023 0.229
individual    2.1732  1.4742 0.771
theta:  0.811  
> ercomp(stackY~stackX, data = paneldata, method = "nerlove")
                   var  std.dev share
idiosyncratic   0.5565   0.7460 0.002
individual    342.2514  18.5000 0.998
theta:  0.9857  

我怀疑在我的姊妹线程示例中,错误分量的估计量也不一致,在此示例中,我旨在使用个体效应和相关的数据来证明FE和RE之间的差异。(实际上,它们不可能如此,因为根据RE是FE的加权平均值以及在估计与误差分量估计所确定的权重之间的事实,它们最终使FE估计远离了RE估计。因此,如果RE不是一致,这最终必须归因于这些估算值。)X

如果您替换该示例的“违规”功能,

alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))

简单地说,

alpha = runif(n)

因此,与不相关的随机效应,对于所有估计误差分量的变量,您可以获得 RE点估计非常接近真实值。Xββ=1


参考文献

Amemiya,T.,1971年,方差成分模型中方差的估计,《国际经济评论》第 12期,第1-13页。

Baltagi,BH,面板数据的计量经济学分析,Wiley。

Nerlove,M.,1971a,《从横截面的时间序列估计动态经济关系的进一步证据》,《计量经济学》,第 39卷,第359-382页。

Swamy,PAVB和SS Arora,1972年,误差分量回归模型中系数估计量的精确有限样本性质Econometrica 40,261–275。

Wallace,TD和A. Hussain,1969,使用误差分量模型结合横截面和时间序列数据,《计量经济学》 37,55-72。


4
+1。感谢Christoph,这很有帮助,我很高兴能最终在此线程中看到一些数学细节。最好查看plmRandel中实现和列出的四种方法如何工作,并用一些评论来更新您的答案。如果没有详细说明,那么至少要对发生的事情做一些简短的说明。您认为您可以查找吗?我很高兴为此提供赏金:-)我幼稚的方法是从固定效果解决方案中估算两个西格玛。它对应于“命名”方法之一吗?
变形虫说恢复莫妮卡

@amoeba,我提供了一些有关如何估计误差分量模型中方差的注释。您的建议似乎与Amemiya的建议密切相关。
克里斯多夫·汉克

很好,谢谢。内尔洛夫(Nerlove)还在对假人使用回归吗?实际上,我不太了解Amemiya和Nerlove之间的区别。我的“天真”建议是拟合虚拟回归,使用残差方差作为的估计,并使用虚拟系数方差作为的估计。看来那是Nerlove在做什么。我不确定我会了解Amemiya在做什么以及它与众不同。(而且我同意,为什么在这种情况下这些方法会产生如此大的差异仍是一个巨大的问题。)σϵση
变形虫说恢复莫妮卡

是的,两者都对傻瓜使用回归。据我了解,Amemiya和Nerlove之间的差异是自由度校正的分母。另一个是我不确定估计的虚拟系数的方差是否与残差的方差相同。另一个关键之一是Nerlove直接目的是估计,而你必须通过回退估计的三个人,并且这些方法的一个已知缺点是无法保证它们是非负的。σ 2 1 - σ 2 ε/ Ťση2(σ^12σ^ϵ2)/T
克里斯多夫·汉克

1
谢谢。我进行了编辑以为提供更明确的公式,您可能需要仔细检查(但我认为这是正确的)。我开始了赏金计划,以奖励您的答案。但是,我仍在寻找一个答案,该答案将与混合模型建立联系,将GLS与MLE进行对比,并说明为什么和何时应该偏爱哪种方法(当前的答案都没有,所以我目前没有答案)勾选为“已接受”)。有趣的是,MLE(由实现)产生的方差估计非常接近Nerlove的方差估计。Ω1lmer
变形虫说莫妮卡(Monica)恢复

11

我对R并不是很熟悉,无法对您的代码发表评论,但是简单的随机截距混合模型应该与RE MLE估计器相同,并且非常接近RE GLS估计器,除非总小且数据不平衡。希望这对诊断问题很有用。当然,所有这些都假设RE估计量合适。N=iTi

这是一些显示等效性的Stata(需要esttabeststo来自SSC):

set more off
estimates clear
webuse nlswork, clear
eststo, title(mixed): mixed ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure || id: // Mixed estimator
eststo, title(MLE): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) mle // MLE RE estimator 
eststo, title(GLS): xtreg ln_w grade age c.age#c.age ttl_exp tenure c.tenure#c.tenure, i(id) re // GLS RE estimato
esttab *, b(a5) se(a5) mtitle 

这是最后一行的输出:

. esttab *, b(a5) se(a5) mtitle 

------------------------------------------------------------
                      (1)             (2)             (3)   
                    mixed             MLE             GLS   
------------------------------------------------------------
main                                                        
grade            0.070790***     0.070790***     0.070760***
              (0.0017957)     (0.0017957)     (0.0018336)   

age              0.031844***     0.031844***     0.031906***
              (0.0027201)     (0.0027202)     (0.0027146)   

c.age#c.age   -0.00065130***  -0.00065130***  -0.00065295***
             (0.000044965)    (0.000044971)    (0.000044880)   

ttl_exp          0.035228***     0.035228***     0.035334***
              (0.0011382)     (0.0011392)     (0.0011446)   

tenure           0.037134***     0.037134***     0.037019***
              (0.0015715)     (0.0015723)     (0.0015681)   

c.tenure#c~e   -0.0018382***   -0.0018382***   -0.0018387***
             (0.00010128)    (0.00010128)    (0.00010108)   

_cons             0.14721***      0.14721***      0.14691** 
               (0.044725)      (0.044725)      (0.044928)   
------------------------------------------------------------
lns1_1_1                                                    
_cons            -1.31847***                                
               (0.013546)                                   
------------------------------------------------------------
lnsig_e                                                     
_cons            -1.23024***                                
              (0.0046256)                                   
------------------------------------------------------------
sigma_u                                                     
_cons                             0.26754***                
                              (0.0036240)                   
------------------------------------------------------------
sigma_e                                                     
_cons                             0.29222***                
                              (0.0013517)                   
------------------------------------------------------------
N                   28099           28099           28099   
------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

在您的数据中,由于组效应与x明显相关,因此不满足使用RE估计量的假设,因此您得到的估计值非常不同。GLS RE估算器实际上是广义矩量法(GMM)估算器,它是估算器之间和估算器之间的矩阵加权平均值。此处的内部估计量可以,但是之间的关系将被深深地搞砸,显示出X的较大正效应。因此,GLS将主要是中间的估计量。MLE RE是使随机效应模型的可能性最大化的MLE。他们不再期望产生相同的答案。在这里,混合估算器给出的结果非常接近FE“内”估算器:

. esttab *, b(a5) se(a5) mtitle 

----------------------------------------------------------------------------
                      (1)             (2)             (3)             (4)   
                    mixed             GLS             MLE          Within   
----------------------------------------------------------------------------
main                                                                        
x                -1.02502***      0.77031**       3.37983***     -1.04507***
               (0.092425)       (0.26346)       (0.20635)      (0.093136)   

_cons             30.2166***      18.3459***      0.49507         30.3492***
                (5.12978)       (2.31566)             (.)       (0.62124)   
----------------------------------------------------------------------------
lns1_1_1                                                                    
_cons             2.87024***                                                
                (0.20498)                                                   
----------------------------------------------------------------------------
lnsig_e                                                                     
_cons            -0.22598**                                                 
               (0.077195)                                                   
----------------------------------------------------------------------------
sigma_u                                                                     
_cons                                             2.40363                   
                                                (1.28929)                   
----------------------------------------------------------------------------
sigma_e                                                                     
_cons                                             4.23472***                
                                                (0.37819)                   
----------------------------------------------------------------------------
N                      96              96              96              96   
----------------------------------------------------------------------------
Standard errors in parentheses
* p<0.05, ** p<0.01, *** p<0.001

这是上表的Stata代码:

clear
set more off
estimates clear

input int(obs id t) double(y x)
1      1           1  2.669271  0.5866982
2      1           2  1.475540  1.3500454
3      1           3  4.430008  0.6830919
4      1           4  2.162789  0.5845966
5      1           5  2.678108  1.0038879
6      1           6  3.456636  0.5863289
7      1           7  1.769204  2.3375403
8      1           8  3.413790  0.9640034
9      2           1  4.017493  1.5084121
10     2           2  4.218733  2.8982499
11     2           3  4.509530  3.2141335
12     2           4  6.106228  2.0317799
13     2           5  5.161379  2.1231733
14     2           6  2.724643  4.3369017
15     2           7  4.500306  1.9141065
16     2           8  4.119322  2.8667938
17     3           1  9.987779  2.3961969
18     3           2  7.768579  3.5509275
19     3           3  9.379788  3.3284869
20     3           4 10.035937  2.2997389
21     3           5 11.752360  2.8143474
22     3           6  9.500264  2.1825704
23     3           7  8.921687  5.0126462
24     3           8  8.269932  3.4046339
25     4           1 12.101253  3.2928033
26     4           2 11.482337  3.1645218
27     4           3 10.648010  4.8073987
28     4           4  9.687320  5.3394193
29     4           5 12.796925  3.1197431
30     4           6  9.971434  4.6512983
31     4           7 10.239717  4.7709378
32     4           8 12.245207  2.7952426
33     5           1 18.473320  5.8421967
34     5           2 19.097212  4.9425391
35     5           3 19.460495  4.9166172
36     5           4 18.642305  4.9856035
37     5           5 17.723912  5.0594425
38     5           6 16.783248  4.8615618
39     5           7 16.100984  6.2069167
40     5           8 18.851351  3.8856152
41     6           1 19.683171  7.5568816
42     6           2 21.104231  6.7441900
43     6           3 22.115529  6.4486514
44     6           4 22.061362  5.3727434
45     6           5 22.457905  5.8665798
46     6           6 21.424413  6.0578997
47     6           7 23.475946  4.4024323
48     6           8 24.884950  4.1596914
49     7           1 25.809011  7.6756255
50     7           2 25.432828  7.7910756
51     7           3 26.790387  7.3858301
52     7           4 24.640850  8.2090606
53     7           5 26.050086  7.3779219
54     7           6 25.297148  6.8098617
55     7           7 26.551229  7.6694272
56     7           8 26.669760  6.4425772
57     8           1 26.409669  8.3040894
58     8           2 26.570003  8.4686087
59     8           3 29.018818  7.2476785
60     8           4 30.342613  4.5207729
61     8           5 26.819959  8.7935557
62     8           6 27.147711  8.3141224
63     8           7 26.168568  9.0148308
64     8           8 27.653552  8.2081808
65     9           1 34.120485  7.8415520
66     9           2 31.286463  9.7234259
67     9           3 35.763403  6.9202442
68     9           4 31.974599  9.0078286
69     9           5 32.273719  9.4954288
70     9           6 29.666208 10.2525763
71     9           7 30.949857  9.4751679
72     9           8 33.485967  8.1824810
73    10           1 36.183128 10.7891587
74    10           2 37.706116  9.7119548
75    10           3 38.582725  8.6388290
76    10           4 35.876781 10.8259279
77    10           5 37.111179  9.9805046
78    10           6 40.313149  7.7487456
79    10           7 38.606329 10.2891107
80    10           8 37.041938 10.3568765
81    11           1 42.617586 12.1619185
82    11           2 41.787495 11.1420338
83    11           3 43.944968 11.1898730
84    11           4 43.446467 10.8099599
85    11           5 43.420819 11.2696770
86    11           6 42.367318 11.6183869
87    11           7 43.543785 11.1336555
88    11           8 43.750271 12.0311065
89    12           1 46.122429 12.3528733
90    12           2 47.604306 11.4522787
91    12           3 45.568748 13.6906476
92    12           4 48.331177 12.3561907
93    12           5 47.143246 11.7339915
94    12           6 44.461190 13.3898768
95    12           7 46.879044 11.4054972
96    12           8 46.314055 12.3143487
end

eststo, title(mixed): mixed y x || id:, mle // Mixed estimator
eststo, title(GLS): xtreg y x, i(id) re     // GLS RE estimato
eststo, title(MLE): xtreg y x, i(id) mle    // MLE RE estimator 
eststo, title(Within): xtreg y x, i(id) fe  // FE Within estimator 
eststo, title(Between): xtreg y x, i(id) be // Between estimator 

esttab *, b(a5) se(a5) mtitle 

+1。谢谢Dimitriy,在同一玩具数据集上查看Stata的输出绝对有帮助。我对MLE估算器有疑问。我认为混合模型方法(mixed在Stata和lmerR中)也是最大似然性,有时也是“受限最大似然性”(我可以lmer通过设置REML=T或来使用两者,REML=F并且它们给出几乎相同的结果)。然而,混合模型方法给出了非常明智和正确的结果,而在这种情况下,Stat称为“ MLE”的结果却是胡说八道。有什么区别?Stat的“ MLE”到底指的是什么?
变形虫说恢复莫妮卡

2
@amoeba mixed, mle和和xtreg, mle都是MLE估计量,但是似然函数有些不同。见这里对于前者,并在这里为后者。我不太了解该mixed模型为何如此强大。
Dimitriy V. Masterov

xtmixed是在旧版本的Stata中称为mixed的东西。对于您的数据,正如手册所建议的那样,对等显然不成立,而对我的数据而言成立。
Dimitriy V. Masterov

ssc install estout尽管我记得它在不同版本中具有不同的功能,并且无法向后兼容。
StasK

1
@StasK让我与Stata技术支持联系,他们说这很可能是的错误xtreg, mle“总的来说,结果应该是相同的。当模型参数的估计中存在识别问题时,通常会出现这种差异。我实际上检查了条件数的方差由这两个计算得出的-协方差矩阵对于-xtreg,mle-和该数字基本上是无限的,对于-mixed,mle-则超过4000。开发人员将评估问题以确定是否需要一个固定的代码。”
变形虫说莫妮卡(Monica)恢复

9

让我更加困惑的事情:


计量经济学-固定效应方法计量经济学中针对面板数据的“固定效应”方法是一种通过“绕过”各个效应变量的存在来估计斜率系数(β)的方法,因此并非对它是“固定”还是“随机”进行任何假设。这就是“第一差异”估算器(使用数据的第一差异)和“内部”估算器(使用与时间平均值的偏差)的作用:他们设法仅估算beta。αi

对于确实将单个效果(“截距”)明确视为常量的更传统的方法,我们使用最小二乘虚拟变量(LSDV)估计器,该估计器还提供的估计值:注意:在线性模型中,关于beta的估计值,三个估计器在代数上重合-但仅在线性模型中。αi

讨论(部分摘自课堂笔记)

“固定效应方法的主要优点是,我们无需对单个效应的性质做任何假设。只要我们怀疑后者与一个或多个回归变量相关,就应该应用它。忽略这种相关性的存在并在集合模型上天真地应用OLS会产生不一致的估计值,尽管基于我们需要对单个效应做出最小假设的吸引力,固定效应方法还是有一定的局限性:第一,时间系数由于这些变量与不可观察的个体效应是不同的,因此无法估计不变的回归变量。(除非我们将时间维度设为无穷大,否则无法一致地估计单个效果(如果使用LSDV估算器)。”


计量经济学-随机效应方法在“传统”计量经济学随机效应方法中,我们假设单个“拦截”是“永久随机分量”,而“通常”误差项是“暂时”误差分量。αi

在一个有趣的扩展中,附加的随机性是由随机时间效应的存在引起的,该效应对于所有横截面都是通用的,但随时间变化,并伴随着固定的(恒定)个体效应和误差项。例如,这种“时间效应”可能代表整个经济范围内的总冲击,平均冲击所有家庭。确实观察到了此类总扰动,因此这似乎是一个现实的建模选择。

此处,“随机效应”估计器是广义最小二乘(GLS)估计器,用于提高效率。

现在,另一个设想的估计器“介于”估计器对时间平均观测值执行OLS。作为代数问题,已经表明,GLS估计量可以作为内部和中间估计量的加权平均值获得,其中权重不是任意的,而是与两者的VCV矩阵有关。

...还有“不相关随机效应”和“相关随机效应”模型的变体。

我希望以上帮助与“混合效果”模型形成对比。


+1,谢谢Alecos。这是有帮助的,但是我对所有这些与混合模型方法的关系仍然不清楚。我开始怀疑也许没有任何关系。估计方式之间和内部(并且内部等于类虚拟变量)很清楚;我的困惑只在于随机效应方法。
变形虫说恢复莫妮卡
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.