条件均值独立性意味着OLS估计量的无偏性和一致性


10

考虑以下多元回归模型:

(1)Y=Xβ+Zδ+U.

这里是列向量; a矩阵; a列向量; Z a n \ times l矩阵;\增量升\次1个的列向量; 和U,误差项,n \ times1列向量。Yn×1Xn×(k+1)β(k+1)×1Zn×lδl×1Un×1


我的讲师是《计量经济学概论》教科书,第三版。 詹姆斯·H·斯托克(James H. Stock)和马克·沃森(Mark W.Watson)281,和《计量经济学:荣誉考试复习会》(PDF),第2页。7,向我表达了以下内容。

  1. 如果我们假设所谓的条件平均独立性,根据定义,这意味着
    (2)E(U|X,Z)=E(U|Z),
  2. 并且如果满足最小二乘假设,条件均值零假设(因此,我们假设)(请参阅1 -3以下),E(U|X,Z)=0E(U|X,Z)=E(U|Z)0

  3. 然后,在这个较弱的假设集合下,中的OLS估计量保持无偏一致。β^β(1)

我如何证明这一主张?即,1和2以上意味着OLS估计给了我们一个公正的和一致的估计?是否有任何研究文章证明这一主张?ββ


评论

最简单的情况是通过考虑线性回归模型给出并证明了OLS估计的如果每个,则是无偏的。

Yi=β0+β1Xi+β2Zi+ui,i=1,2,,n,
β 1 β 1 È û | X Ž = È û | Ž β^1β1E(ui|Xi,Zi)=E(ui|Zi)i

证明无偏的假设和共同正态分布UiZi

定义,然后和因此,可以重写为通过,得出现在,由于和共同为正态分布,因此正态分布的理论请参见。推导多元正态分布的条件分布,表示(实际上,我们不需要假设联合正态性,而只需假设此同一性)对于某乘矢量V=UE(U|X,Z)U=V+E(U|X,Z)

(*)E(V|X,Z)=0.
(1)
(3)Y=Xβ+Zδ+E(U|X,Z)+V.
(2)
(4)Y=Xβ+Zδ+E(U|Z)+V.
UiZi È Ú | Ž = Ž γ1γ0
(**)E(U|Z)=Zγ
l1γ0

现在变为对于模型所有最小二乘假设均已满足,因为误差项满足条件假设。均值为零。这意味着OLS估计的将是公正的,因为如果我们让,并让是由的组成的矩阵和,则OLS估计中是通过考虑以下给出:(4)

(5)Y=Xβ+Z(δ+γ)+V.
(5)Vβ β ρ = δ + γ w ^ = X Ž Ñ ķ + 1 + X ž β 5 β Ťρ Ť Ťβ^βρ=δ+γW=(X,Z)n(k+1)+lXZβ(5)
(β^T,ρ^T)T=(WTW)1WTY=(WTW)1WT(W(βT,ρT)T+V)=(βT,ρT)T+(WTW)1WTV

因此,第二行后跟。因此是一个有条件无偏估计由于OLS估计给出模型与对模型给出coinicides。现在,根据总期望定律因此是用于一个无偏估计。

E((β^T,ρ^T)T|W)=(βT,ρT)T+(WTW)1WsTE(V|W)=(βT,ρT)T+(WTW)1WT0=(βT,ρT)T,
() β β15 ë ββ^β(1)(5)
E(β^)=E(E(β^|W))=E(β)=β,
β ββ^β

(可能会注意到,因此上的系数不一定是无偏的。)E(ρ^)=ρ=δ+γδZ

但是,上面的特殊情况假设和联合正态分布,如果没有这个假设,我怎么证明这个命题?UiZi

当然,假设总是足够的(请参阅),但是我应该仅使用和最小二乘假设(不包括条件均值零假设)(见下文)。E(U|Z)=Zγ()(2)

关于一致性

我认为通过注意到在回归模型所有最小二乘假设都满足,包括(新的)误差项满足以下假设,我也可以看到估计值与是一致的。有条件的平均零假设(请参阅并参见下文)。β^β(5)V()

稍后,我可能会添加一致性证明,该证明基于《计量经济学概论》(第三版)中的一系列练习由James H. Stock和Mark W. Watson合着。18.但是,这种证明很长。但是这里的要点是,练习中提供的证明是假设,所以我仍然想知道假设是否真的足够。()(2)

子查询1

《计量经济学概论》中,第3版。据说,詹姆斯·H·斯托克和马克·沃森 300,可以使用非线性回归理论“放松” 假设。这是什么意思?()

最小二乘假设

在这里,我排除了的条件均值零假设,因为我们试图证明的命题允许。这些是例如与相关的情况。cf. 计量经济学:荣誉考试复习会(PDF),第2页。7E(U|X,Z)=0E(U|X,Z)0ZU

最小二乘假设如下。

  1. 的联合分布,被IID,其中是:在第i个元素并且其中和是:在第i行向量和。(Yi,Xi,Zi)i=1,2,,n,YiiYXiZiiXZ

  2. 不可能有较大的异常值,即,对于每个,和具有有限的第四矩,其中是第个元素。iXi,ZiUiUiiU

  3. (X,Z)W T W具有完整的列秩(即,没有完美的多重共线性;这确保的可逆性)。WTW

  4. 扩展的最小二乘假设:虽然我认为这不是必需的(并且有人告诉我没有这个必要),但我们也可以假设是同方差,即每个,并且给定的的条件分布对于每个是正态的(即,我们有正态误差)。Var(Ui|Xi,Zi)=σU2iUi(Xi,Zi)i

术语说明

在,条件均值为零的假设是的假设。但是,条件平均独立假设是的假设。(1)E(U|X,Z)=0E(U|X,Z)=E(U|Z)

该术语在例如《计量经济学概论》(第三版)中使用。詹姆斯·H·斯托克(James H. Stock)和马克·沃森(Mark W.Watson)281;和横截面和面板数据,第1版的计量分析。杰弗里·伍尔德里奇(Jeffrey M. 607.有关类似讨论,另请参阅《条件独立限制:测试和估计》。

其他思路和子问题2

我认为与James H. Stock和Mark W. Watson相反,条件均值独立性不能确保 OLS估计无偏。这是因为可以采用非线性的形式像其中,是在一个多项式,或,其中是尚待估计的参数(这里我使用矩阵指数),然后,我认为必须应用非线性回归,这通常会使我们有偏差的估计。此外,(1)中的OLS估计甚至可能与的OLS估计不一致βE(U|Z)E(U|Z)=p(Z)p(Z)ZE(U|Z)=exp(Zγ)γβ β 4 ë Û | Ž ββ在式如果呈现某些非线性形式。(从心理上讲,我也认为Stock&Watson在书中所作的陈述太好了,难以置信。)(4)E(U|Z)

因此,另一个问题是,是否存在与条件均值独立性导致无偏的OLS估计这一命题的反例?

子查询3

大多数无害计量经济学中, Angrist&Pischke在3.3小节中指出。68--91,在条件独立性(CI)下,即在给定情况下与无关(我想这是一个比上面给出的条件平均独立性假设更强的条件),匹配估计之间存在紧密联系的效果上和对系数中的回归上和这种想法会促使该CI下OLS上估计系数的在YXWXYXYXWX(1) 与CI不成立(其他所有条件都相等)相比,它的偏见要小。

现在,这个想法可以以某种方式用于回答我的主要问题吗?


@西安是什么意思?这是在我的书给定的条件均值独立性的定义:如果我们的线性回归有,那么我们说,我们有条件的均值独立性。我只是认为我的写作方式比较笼统。 È Yi=β0+β1Xi+β2Zi+uiE(ui|Xi,Zi)=E(ui|Zi)
埃里亚斯

@西安在这种情况下,您将如何定义“有条件的独立性”?我认为,“条件独立”是一个不同于“条件平均独立”的概念。它们可能在概念上链接也可能不链接。
埃里亚斯

@西安这就是我理解概念的方式:条件独立性只是,但条件均值独立性是。ë |Ç = È | C ^ P(AB|C)=P(A|C)P(B|C)E(A|B,C)=E(A|C)
伊莱亚斯(Elias)

西安在哪里评论?
Michael R. Chernick

@MichaelChernick他的评论是第一个。我想他一定已经删除了。我记得,他说并不意味着条件独立,我回答。E(U|X,Z)=E(U|Z)
伊莱亚斯(Elias)

Answers:


4

是错的 正如您所观察到的,如果您仔细阅读Stock和Watson,他们实际上并不赞同在条件均值独立性下OLS对于是无偏的说法。他们赞同一个更弱的说法,即如果,OLS对于是无偏的。然后,他们对非线性最小二乘法说得有些含糊。β È Û | X Ž = ž γββE(u|x,z)=zγ

等式(4)包含您需要查看的声明为假的内容。通过OLS估算方程式(4),而忽略变量则会导致省略变量偏差。您可能还记得,遗漏变量的偏项(当遗漏变量的系数为1时)由以下辅助回归的系数控制: 从此回归来看 ,原始回归的偏差为,而的偏差为。如果与相关控制之后,线性ë Û | Ž = X α 1 + ž αE(u|x,z) βα1γα2XëÚ|ŽŽα1

E(u|z)=xα1+zα2+ν
βα1γα2xE(u|z)z,则将为非零值,并且OLS系数将存在偏差。α1

这是证明这一点的示例:

ξF(),ζG(),νH()all independentz=ξx=z2+ζu=z+z2E(z+z2)+ν

看看的公式,很显然 看看辅助回归,很显然(缺少某些偶然选择)不会为零。E u | x zu˚F G ^ ħ α 1E(u|x,z)=E(u|z)=z+z2E(z+z2)F,G,Hα1

这是一个非常简单的示例R,说明了这一点:

set.seed(12344321)
z <- runif(n=100000,min=0,max=10)
x <- z^2 + runif(n=100000,min=0,max=20)
u <- z + z^2 - mean(z+z^2) + rnorm(n=100000,mean=0,sd=20)
y <- x + z + u

summary(lm(y~x+z))

# auxiliary regression
summary(lm(z+z^2~x+z))

请注意,第一次回归为您提供了的系数,该系数向上偏移了0.63,这反映了 “在其中具有一些 ”和的事实。还要注意,辅助回归为您提供的偏差估计约为0.63。x z 2 E u | z xxz2E(u|z)

那么,Stock和Watson(以及您的讲师)在谈论什么呢?让我们回到方程式(4):

y=xβ+zγ+E(u|z)+v

一个重要的事实是,省略的变量只是的函数。好像我们可以很好地控制,即使可能与相关联,也足以消除回归中的偏差。ž X üzzxu

假设我们使用非参数方法来估计函数或使用正确的函数形式来估计下面的方程。如果我们使用正确的函数形式,我们将通过非线性最小二乘估计(解释关于NLS的神秘评论): 这样就可以为提供一个一致的估计值,因为不再存在遗漏的变量问题。 f()ý = X β + ˚F ż + v βf(z)=zγ+E(u|z)

y=xβ+f(z)+v
β

或者,如果我们有足够的数据,我们可以``一直''控制。我们可以查看的数据子集,然后运行回归: 这将为提供无偏,一致的估计量,除了当然,截距将被污染。显然,您还可以通过仅对数据点运行该回归来获得(不同)一致,无偏的估计量。还有一个用于的点。等等,那么您将拥有许多不错的估算器,例如,可以通过某种方式将它们平均在一起,就可以做出出色的估算器。zŸ = X β + v β ˚F 1 Ž = 2 ž = 3z=1

y=xβ+v
βf(1)z=2z=3

后一种思想是匹配估计量的启发。因为我们通常没有足够的数据来字面上仅运行回归或甚至对点,其中的是相同的,我们不是运行点回归,其中是``足够接近'到是相同的。z zz=1zz


3

您无法证明此结果,因为它在一般性陈述中不正确。从等式中的模型开始。(4)

Y=Xβ+Zδ+(E(U|Z)+V)

其中大括号表示实际误差项(对条件期望还没有假设)。定义残差生成者或灭者矩阵,该矩阵 对称,等幂,并且我们也有。 中号ž ž = 0MZ=IZ(ZZ)1ZMZZ=0

通过“分区回归结果”,我们得出

β^OLSβ=(XMZX)1XMZZδ+(XMZX)1XMZE(UZ)+(XMZX)1XMZV

右边的第一项已经为零。始终采用期望值,然后将塔属性应用于条件期望,则第三项也将为零(使用较弱形式的条件均值独立性)。但这远是这个较弱的假设带给我们的,因为我们将被遗弃

E(β^OLS)β=E[(XMZX)1XMZE(UZ)]

对于无偏, 我们希望右边为零。这将举行,如果是的线性函数(你也发现),因为我们将再次获得零。但是否则,直接假设整个期望值为零是完全任意的。 我们不必假定联合规范,但必须假定此条件期望的线性(其他分布也具有此属性)。因此,无偏的必要假设是E(UZ)ZMZZ
β

E(UX,Z)=E(UZ)=Zγ

与所有回归变量的严格外生性相比,我不能说它是否真的“较弱”(因为严格严格的外生性是针对所有分布假设的均值独立性来表示的,而在这里,我们必须限制和跟随)。UZ

不难证明在这种线性假设下也将是一致的。β^OLS


好答案!我很久以前就读过这篇文章,以为以后再考虑。我有一些问题:如何证明分区回归结果?我至少希望能有所借鉴。另外,和什么?中号žMZMz
伊莱亚斯

1
@Monir和只是一个错字-已修复。有关分区回归结果(非常古老且标准的结果),请参阅例如Greene撰写的《计量经济学》教科书,该章讨论了普通最小二乘估计的代数方面。它包括证明。žZz
Alecos Papadopoulos
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.