在异方差下OLS渐近有效


9

我知道在线性回归设置下,OLS是无偏的,但在异方差下效率不高。

在维基百科

http://en.wikipedia.org/wiki/Minimum_mean_square_error

MMSE估计量是渐近无偏的,并且其分布收敛到正态分布: ,其中I(x)是x的Fisher信息。因此,MMSE估计器是渐近有效的。ñX^-Xdñ0一世-1个X

MMSE被认为是渐近有效的。我在这里有些困惑。

这是否意味着OLS在有限样本中无效,但在异方差下渐近有效?

对当前答案的批评:到目前为止,提出的答案还没有解决限制分布的问题。

提前致谢


那是一篇很长的维基百科文章。此外,由于这些内容可能会发生变化,因此您会介意这段文字引起混乱吗?
hejseb 2015年

1
Fisher信息是从似然函数得出的。因此,这暗示着正确指定了可能性。即,您所引用的语句假定,如果存在任何异方差,则对回归进行加权,以便正确指定异方差。请参阅en.wikipedia.org/wiki/Least_squares#Weighted_least_squares。在实践中,我们通常不知道异方差的形式,因此我们有时会接受效率低下的问题,而不是通过错过指定加权方案来偏向回归的机会。
Zachary Blumenfeld 2015年

@ZacharyBlumenfeld在文章中没有假设x的分布。我们如何最终获得Fisher信息?
Cagdas Ozgenc

1
请参阅en.wikipedia.org/wiki/Fisher_information。 该文章暗含了在定义部分中期望时和上的分布。请注意,从来没有假设过同质性。在OLS的上下文中,同质性假设 ,是单位矩阵。异规性允许 ,任何对角线正半定数。使用将产生与使用不同的Fisher信息。ËXËÈÑ 0 d d d σ Ëñ0σ一世一世Ëñ0dddσ一世
Zachary Blumenfeld

在哪里可以看到“ MMSE的分布收敛到正态分布”这一事实的证据?
哈吉

Answers:


3

该文章在定义中从未假设过同性恋。把它在文章的上下文中,同方差会说 在哪里Ñ × Ñ单位矩阵,σ是一个标量正数。异方差允许

Ë{X^-XX^-XŤ}=σ一世
一世ñ×ñσ

Ë{X^-XX^-XŤ}=d

任何固醇为正定。本文以最通用的方式将协方差矩阵定义为某些隐式多元分布的中心二阶矩。我们必须知道的多变量分布Ë获得的渐近有效和一致的估计X。这将来自似然函数(这是后验的强制性组成部分)。例如,假设ë Ñ 0 Σ (即Ë { X - X X - X dËX^Ëñ0Σ。然后隐含似然函数是 日志[ 大号] = 日志[ φ X - X Σ ] 其中 φ是多元正态pdf文件。Ë{X^-XX^-XŤ}=Σ

日志[大号]=日志[ϕX^-XΣ]
ϕ

费舍尔信息矩阵可以写成 有关更多信息,请参见en.wikipedia.org/wiki/Fisher_information。从这里我们可以得出

一世X=Ë[X日志[大号]2|X]
上述利用二次损失函数但并假设方差齐性。
ñX^-Xdñ0一世-1个X

在OLS的上下文中,我们在x上对进行回归,我们假设 E { y | X } = X ' β 隐含的可能性是 日志[ 大号] = 日志[ φ ÿ - X ' β σ ] 其中可以方便地重写为 日志[ 大号] = Ñ Σ= 1个日志[ φ ÿ -ÿX

Ë{ÿ|X}=Xβ
日志[大号]=日志[ϕÿ-Xβσ一世]
φ单变量正常PDF。Fisher信息然后 β = [ σ X X ' - 1 ] - 1
日志[大号]=一世=1个ñ日志[φÿ-Xβσ]
φ
一世β=[σXX-1个]-1个

β

日志[大号]=日志[ϕÿ-Xβd]
β 1个ñ一世-1个β

感谢您一直以来的投入。但是我认为Wiki条目完全是废话。MMSE不会提高效率,也没有规定对样本进行适当加权的方法。而且,即使我们假设样本是加权的,除非分布是高斯分布(也未指定),否则它仍然不是有效的估计量。
Cagdas Ozgenc

@CagdasOzgenc我谨不同意。本文以一般的贝叶斯方式表述,其中可能包括回归分析,但也包括许多其他模型(它似乎更针对Kalman滤波器)。似然是已知时最有效的估计器,这是似然的基本属性。您的说法严格适用于回归模型的一个子集(尽管在应用最广泛的模型中),在推导一阶条件时假定正态性。
Zachary Blumenfeld

1
你自己说的 不幸的是,本文不是关于似然估计的。它是最小均方估计量,在满足某些条件时有效。
Cagdas Ozgenc

好吧,我同意不同意:)在最频繁回归中如何使用MMSE以及在更贝叶斯环境中如何应用MMSE,也许与MMSE的定义存在冲突。也许他们应该为此发明一个新的名字。然而,当对每个平方余数取独立的期望时,隐含了可能性(或其他非参数估计)。特别是在贝叶斯环境中(否则我们将如何估算?)。谷歌搜索后,我发现了很多与Wikipedia上相似的结果。无论如何,我同意滥用术语。
Zachary Blumenfeld

2

不,OLS在异方差下效率不高。如果估计量在其他可能的估计量之间具有最小方差,则可以获得估计量的效率。不管估计量的限制分布如何,都会做出有关OLS中效率的陈述。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.