你不是需要对OLS估计量的一致性第四时刻假设,但你做的高阶矩需要假设和ε的渐近正态性,并始终如一地估计渐近协方差矩阵是什么。xϵ
从某种意义上讲,这是数学上的技术要点,而不是实践上的要点。为了使OLS在某些情况下可以在有限样本中正常工作,它需要的不仅仅是达到渐近一致性或正态性所需的最小假设。n→∞
足够的一致性条件:
如果您具有回归方程:
yi=x′iβ+ϵi
OLS估算器可以写为:
b^
b^=β+(X′Xn)−1(X′ϵn)
为了保持一致性,您需要能够应用Kolmogorov的大数定律,或者在具有序列依赖性的时间序列的情况下,应用诸如Karlin和Taylor的Ergodic定理这样的方法:
1nX′X→pE[xix′i]1nX′ϵ→pE[x′iϵi]
其他需要的假设是:
- E[xix′i]是完整等级,因此矩阵是可逆的。
- 回归变量是预先确定的或严格为外生的,因此。E[xiϵi]=0
然后,您会得到(X′Xn)−1(X′ϵn)→p0b^→pβ
如果要应用中心极限定理,则需要对更高的矩进行假设,例如,其中。中心极限定理是给您渐近正态性并让您谈论标准误差的原因。对于第二个存在,您需要和的第四个矩存在。您想证明哪里E[gig′i]gi=xiϵib^E[gig′i]xϵn−−√(1n∑ix′iϵi)→dN(0,Σ)Σ=E[xix′iϵ2i]。为此,必须是有限的。Σ
Hayashi的计量经济学中给出了一个很好的讨论(激发了这篇文章的动机)。(另请参见第149页的第4时刻并估计协方差矩阵。)
讨论:
第四时刻的这些要求可能是一个技术要点,而不是实践要点。在日常数据中存在问题的地方,您可能不会遇到病理分布?是为了让OLS更常见或其他假设出错。
毫无疑问,Stackexchange的其他地方回答了一个不同的问题,即有限样本需要多少样本才能接近渐近结果。从某种意义上说,奇异的异常值会导致收敛缓慢。例如,尝试估计具有很高方差的对数正态分布的均值。样本均值是总体均值的一致,无偏估计量,但是在这种对数正态情况下,出现了疯狂的超峰度等。
有限与无限是数学中极为重要的区别。那不是您在日常统计中遇到的问题。实际问题更多地在小类别与大类别中。方差,峰度等...是否足够小,以便在给定样本量的情况下我可以实现合理的估计?
OLS估计量一致但渐近不正常的病理示例
考虑:
yi=bxi+ϵi
其中但来自具有2个自由度的t分布,因此。OLS估计的概率收敛到但是OLS估计的样本分布不是正态分布。以下是的经验分布,该分布基于10000个观测值的回归的10000个模拟。
xi∼N(0,1)ϵiVar(ϵi)=∞bb^b^
的分布不正常,尾巴太重。但是,如果将自由度增加到3,以使的第二力矩存在,那么将应用中心限制,并且您将得到:
b^ϵi
生成它的代码:
beta = [-4; 3.7];
n = 1e5;
n_sim = 10000;
for s=1:n_sim
X = [ones(n, 1), randn(n, 1)];
u = trnd(2,n,1) / 100;
y = X * beta + u;
b(:,s) = X \ y;
end
b = b';
qqplot(b(:,2));