推导OLS估计量的假设


14

有人可以为我简要解释一下,为什么要计算OLS估计量需要六个假设中的每一个?我只发现了多重共线性-如果存在多重共线性,则无法求反(X'X)矩阵,进而无法估计总体估计量。其他的怎么样(例如,线性度,零均值误差等)?



1
您是在寻找概念上的解释,还是需要数​​学上的证明?
gung-恢复莫妮卡

4
普通最小二乘法是一个数值过程,除可逆性外,您不需要太多假设即可计算。需要这些假设的理由推断此基础上,我看到昨天的回答:stats.stackexchange.com/questions/148803/...
的Kjetil b HALVORSEN

1
您指的是“六个假设”?您只提到三个。
whuber

我指的是1)线性2)不存在多重共线性3)零均值误差4)球面误差(均方差和非自相关)5)非随机回归和6)正态分布。因此,正如我从下面的答案中所了解的那样,只有前三个是导出估算器的必要条件,而其他仅用于确保估算器为BLUE?
伊娃

Answers:


23

除了具有完美的多重共线性的情况之外,您始终可以计算OLS估计量。在这种情况下,您的X矩阵确实具有完美的多线性相关性。因此,由于可逆性问题,无法满足完整等级假设,并且您无法计算OLS估计量。

从技术上讲,您不需要其他OLS假设即可计算OLS估计量。但是,根据高斯-马尔可夫定理,您需要满足OLS假设(clrm假设),才能使估计量成为BLUE。

您可以在这里找到有关高斯-马尔可夫定理及其数学推导的广泛讨论:

http://economictheoryblog.com/2015/02/26/markov_theorem/

此外,如果您正在寻找OLS假设的概述,即有多少个,它们需要什么以及如果您违反单个OLS假设会发生什么,可以在这里进行详尽的讨论:

http://economictheoryblog.com/2015/04/01/ols_assumptions/

希望对您有所帮助!


14

以下内容基于简单的横截面,对于时间序列和面板,有所不同。

  1. 在总体中(因此在样本中),模型可以表示为: 这是线性假设,其有时被误解。该模型应该是线性的参数-即βķ。您可以随意使用xi自己做任何事情。对数,平方等。如果不是这种情况,则无法通过OLS估算模型-您需要其他非线性估算器。
    Y=β0+β1x1++βkxk+u=Xβ+u
    βkxi
  2. 随机样本(用于横截面)这对于推理和样本属性是必需的。对于OLS的纯粹机制而言,这是无关紧要的。
  3. 没有完美的共线性这意味着之间不会存在完美的关系。这是假定可以确保X ' X 是非奇异的,使得X ' X - 1存在。xi(XX)(XX)1
  4. 零条件均值:。这意味着您已经正确地指定了模型,使得:没有遗漏的变量,并且您估计的功能形式相对于(未知)种群模型是正确的。对于OLS,这始终是有问题的假设,因为无法知道它是否真正有效。E(u|X)=0
  5. 误差项的方差是恒定的,在所有的条件V - [R Ú | X = σ 2 同样,这意味着什么为OLS的力学,但它确保通常的标准误差是有效的。XiVar(u|X)=σ2
  6. 常态; 误差项U是独立的的,并遵循Ü Ñ 0 σ 2。再次,这是无关OLS的力学,但确保了的采样分布β ķ是正常的,^ β ķÑ XiuN(0,σ2)βkβk^N(βk,Var(βk^))

现在来说明一下。

  1. 在1-6(经典线性模型假设)下,OLS是BLUE(最佳线性无偏估计量),在最小方差意义上最好。在所有线性估计器以及使用x的某些函数的所有估计器中,它也是有效的。更重要的是,在1-6下,OLS也是最小方差无偏估计量。这意味着在所有无偏估计量(不仅是线性估计量)中,OLS的方差最小。OLS也是一致的。

  2. 在1-5(高斯-马尔可夫假设)下,OLS是蓝色且高效(如上所述)。

  3. 在1-4下,OLS是无偏且一致的。

实际上,在比弱的假设下,OLS也是一致的,即:1 E u = 02 C(4)(1) E(u)=0。与假设4的不同之处在于,在此假设下,您无需完美地把握功能关系。(2) Cov(xj,u)=0


我认为您对零均值状况的描述太暗了。如果有偏差,则尽量减少偏差平方的总和也不会做相应的事情,但在另一方面,你可以通过移动回归方程(吸收偏置到捕捉偏置),然后你有平均0。换句话说,4既无法核实,并容易被忽视。β0
user3697176

对不起,但我不同意。也许我只是误解了你?您可以发表意见还是提供参考。
Repmat 2015年

我说的不是故意失真估计(如岭回归),我相信OP不是在感兴趣。我说的是以下形式的模型其中---一些奇怪的原因---剩余ε具有平均α 0。在这种情况下,它是很容易做到的正式变换到Ŷ = α + βy=β0+β1x1++βxxn+ϵϵα0,其中的平均 η是零。y=α+β0+β1x1++βxxn+ηη
user3697176

@ user3697176您编写的内容不正确。我刚刚发布了一个答案来解释原因。
Alecos Papadopoulos'5

如果不满足假设1,我们是否仍不能使用OLS来估计总体协方差(即使我们知道没有线性关系)?
最大

7

对另一个问题的评论引起了对条件的重要性的怀疑,认为条件E uX= 0可以通过在回归规范中包含一个常数项来进行校正,因此“可以很容易地忽略它”。E(uX)=0

事实并非如此。如果我们假设该条件均值已经是常数而不是回归函数的话,则在回归中包含常数项将吸收误差项的可能非零的条件均值。是必须与我们是否包括一个常数项无关地做出的关键假设:

E(uX)=const.

如果这成立,那么非零均值将成为一个令人讨厌的问题,我们可以通过包含一个常数项来简单地解决。

但是,如果这不成立,(即条件均值不是零或非零常数),则包含常数项并不能解决问题:在这种情况下,其“吸收”的是一个量级这取决于回归器的特定示例和实现。实际上,与一系列误差相关的未知系数实际上不是常数而是可变的,取决于误差项通过非常数条件均值的回归值。

这意味着什么? 为了简化,假设最简单的情况,其中索引的观察),但È û | X = ^ h X。也就是说,误差项与回归变量的均值无关,但与同期变量无关(在X中,我们包括一系列的)。E(uiXi)=0iE(uixi)=h(xi)X

假设我们用一个常数项(一系列的回归)来指定回归。

y=a+Xβ+ε

和压缩符号

y=Zγ+ε

其中ž = [ 1X ]γ = β'ε = û -a=(a,a,a...)Z=[1:X]γ=(a,β)ε=ua

然后,OLS估算器将为

γ^=γ+(ZZ)1Zε

对于无偏,我们需要。但E[εZ]=0

E[εixi]=E[uiaxi]=h(xi)a

对于所有,它不能为零,因为我们检查h x i不是常数函数的情况。所以ih(xi)

E[εZ]0E(γ^)γ

如果,那么即使我们在回归中包括一个常数项,OLS估计量也不会是无偏的。 ,这也意味着高斯-马尔可夫效率的结果丢失了E(uixi)=h(xi)h(xj)=E(ujxj)

εii.

But this means that even if the error term ui is assumed normal, then the distribution of the sampling error γ^γ will be normal but not zero-mean mormal, and with unknown bias. And the variance will differ. So

If E(uixi)=h(xi)h(xj)=E(ujxj), then even if we include a constant term in the regression, Hypothesis testing is no longer valid.

In other words, "finite-sample" properties are all gone.

We are left only with the option to resort to asymptotically valid inference, for which we will have to make additional assumptions.

So simply put, Strict Exogeneity cannot be "easily ignored".


I'm not completely sure I understand this. Isn't assuming that the mean is a not a function of the regressors equivalent to assuming homoscedasticity?
Batman

@Batman To what part of my post are you referring to?
Alecos Papadopoulos

When you say "The inclusion of a constant term in the regression will absorb the possibly non-zero conditional mean of the error term if we assume that this conditional mean is already a constant and not a function of the regressors. This is the crucial assumption that must be made independently of whether we include a constant term or not." Isn't assuming that the conditional mean isn't a function of the regressors exactly what we're assuming when we assume homoscedasticity?
Batman

@Batman Homoskedasticity is an assumption about the variance. Assuming mean -independence does not imply that E(uj2x) is also a constant, which is also needed for conditional homoskedasticity. In fact, mean-independence, E(ux)=const. together with conditional heteroskedasticity, E(u2x)=g(x) is a standard model variant.
Alecos Papadopoulos
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.