如何在固定效果模型中保持时间不变变量


15

我有一家大型意大利公司10年以上员工的数据,我想看看随着时间的推移,男女收入差距中的性别差异是如何变化的。为此,我运行池OLS: ,其中y是每年的对数收入,X i t包括因个体和时间而异的协变量,d t是年份假人,如果工人是男性,则m a l e i等于1,否则为零。

yit=Xitβ+δmalei+t=110γtdt+εit
yXitdtmalei

现在,我担心某些协变量可能与未观察到的固定效应相关。但是,当我使用固定效应(内部)估算器或初次差异时,我失去了性别虚拟对象,因为该变量不会随时间变化。我不想使用随机效应估计器,因为我经常听到人们说它提出的假设非常不现实,不太可能成立。

有什么方法可以同时保持性别虚拟和控制固定效果?如果有办法,我是否需要对性别变量的假设检验进行聚类或照顾其他带有错误的问题?

Answers:


22

有几种可能的方法可以让您在固定效果回归中保持性别虚拟。

内估计
假设你相比,你汇集OLS模型,其是具有类似的模型

yit=β1+t=210βtdt+γ1(malei)+t=110γt(dtmalei)+Xitθ+ci+ϵit
变量如前所述。现在注意,β1β1+γ1(malei)不能被识别,因为估计器内不能从固定效果区分它们ci。鉴于β1为基准年截距t=1γ1是在此期间收益的性别影响。我们可以在这种情况下,确定是γ2,...,γ10,因为它们与你的时间假人相互作用和它们测量在你的性别变量相对于所述第一时间段的部分的效果的差异。这意味着如果你观察你的增长γ2,...,γ10随着时间的推移,这是对男性和女性之间的收入差距的扩大的指示。

一阶差分估计
如果你想知道随着时间的推移,男女之间的差别的整体效果,你可以试试下面的模式:

yit=β1+t=210βtdt+γ(tmalei)+Xitθ+ci+ϵit
其中变量t=1,2,...,10与时不变性别假人互动。现在,如果你把第一差β1ci退出你得到 然后 γ e i[ t 1 m a
yityi(t1)=t=310βt(dtd(t1))+γ(tmalei[(t1)malei])+(XitXi(t1))θ+ϵitϵi(t1)
和可以识别性别差异在收益 γ。因此最终回归方程将是: Δ Ŷ = 10 Σ= 3 β Δ d + γ γ(tmalei[(t1)malei])=γ[(t(t1))malei]=γ(malei)γ ,你会得到你感兴趣的效果。令人高兴的是,这可以在任何统计软件中轻松实现,但会浪费一段时间。
Δyit=t=310βtΔdt+γ(malei)+ΔXitθ+Δϵit

Hausman-Taylor估计器
此估计器区分您可以认为与固定效应不相关的回归变量和可能与固定效应c i相关的回归变量。它进一步区分时变变量和时变变量。假设1表示与c i不相关的变量,而2表示与c i不相关的变量,并且假设您的性别变量是唯一的时间不变变量。在豪斯曼-泰勒估计器然后应用随机效应变换: Ŷ = X ' 1 + X 'ci1ci2 ,其中波浪线表示法手段X 1=X1 - θ ¯ X 1其中 θ是用于随机效应转化和 ¯ X 1

y~it=X~1it+X~2it+γ(male~i2)+c~i+ϵ~it
X~1it=X1itθ^iX¯1iθ^iX¯1i是每个人的平均时间。这与您要避免使用的通常的随机效应估计器不同,因为使用了第组变量以消除与c i的相关性。对于X 2 Ť仪器是X 2 - ¯ X 2 。这同样适用于时间不变的变量完成的,因此,如果指定性别变量与固定的效果它被用仪器进行潜在相关¯ X 1 ,所以你必须有更多的时间变比不随时间变化的变量。2ciX~2itX2itX¯2iX¯1i

所有这一切听起来可能有些复杂,但是该估算器有固定的包装。例如,在Stata中,相应的命令是xthtaylor。有关此方法的更多信息,您可以阅读Cameron和Trivedi(2009)“使用Stata的微观计量经济学”。否则,您可以坚持使用之前的两种方法,它们会更容易一些。

推论
对于假设检验,除了在固定效应回归中无论如何都需要考虑的地方之外,不需要考虑太多其他内容。您需要注意错误中的自相关,例如,通过对各个ID变量进行聚类。这允许在处理自相关的聚类(个体)之间建立任意的相关结构。作为参考,请再次参见Cameron和Trivedi(2009)。


4

保持性别虚拟的另一种潜在方法是Mundlak(1978)的方法,该模型具有时间不变变量。Mundlak的方法将假定性别效应可以投影到时变变量的组均值上。

Mundlak,Y. 1978:关于时间序列和横截面数据的合并。计量经济学46:69-85。


2

另一种方法是使用平均误差作为因变量来估算第二阶段方程式中的时不变系数。

β and γt. For simplicity, let's forget about the year-effects. Define the estimation error u^it as before:

u^ityitXitβ^

The linear predictor u¯i is:

u¯it=1Tu^iT=yit¯x¯iβ^

Now, consider the following second stage equation:

u¯i=δmalei+ci

Assuming that gender is uncorrelated with unobserved factors ci. Then, the OLS estimator of δ is unbiased and time-consistent (this is, it is consistent when T).


To prove the above, replace the original model into the estimator u¯i:

u¯i=x¯iβx¯iβ^+δmalei+ci+t=1TϵitT

The expectation of this estimator is:

E(u¯i)=x¯iβx¯iE(β^)+δmalei+E(ci)+t=1TE(ϵit)T

If assumptions for FE consistency hold, β^ is an unbiased estimator of β, and E(ϵit)=0. Thus:

E(u¯i)=δmalei+E(ci)

This is, our predictor is an unbiased estimator of the time-invariant components of the model.

Regarding consistency, the probability limit of this predictor is:

plimTu¯i=plimT(x¯iβ)plimT(x¯iβ^)+plimTδmalei+plimTci+plimT(t=1TϵitT)

Again, given FE assumptions, β^ is a consistent estimator of β, and the error term converges to its mean, which is zero. Therefore:

plimTu¯i=δmalei+ci

Again, our predictor is a consistent estimator of the time-invariant components of the model.


1

Mundlak Chamberlain设备是实现此目的的理想工具。它通常被称为相关随机效应模型,因为它使用随机效应模型隐式估计时变变量的固定效应,同时还估计时变变量的随机效应。

但是,在统计软件中,您可以像随机效应模型一样实现它,但是必须添加所有时变协变量的均值。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.