Stein的示例显示,如果均值且方差为则正态分布变量的最大似然估计是不允许的(在平方损失函数下)iff。有关精巧的证明,请参见Bradley Effron撰写的《大规模推理:估计,测试和预测的经验贝叶斯方法》的第一章。nμ1,…,μn1n≥3
一开始这对我来说是非常令人惊讶的,但是背后有一些直觉,为什么人们可能会期望标准估计值是不可接受的(最明显的是,如果,那么,如Stein的原始论文所述(链接到下面)。x∼N(μ,1)E∥x∥2≈∥μ∥2+n
我的问题是:缺少\ mathbb {R} ^ 2的n维空间(对于n≥3)具有什么特性,这有助于Stein的示例?可能的答案可能是关于n球的曲率,或者是完全不同的东西。R2n
换句话说,为什么在\ mathbb {R} ^ 2中允许MLE R2?
编辑1:响应@mpiktas对1.30之后的1.31的关注:
Eμ(∥z−μ^∥2)=Eμ(S(N−2S)2)=Eμ((N−2)2S).
μi^=(1−N−2S)zi
所以
Eμ(∂μi^∂zi)=Eμ(1−N−2S+2z2iS2).
因此,我们有:
2∑i=1NEμ(∂μi^∂zi)=2N−2Eμ(N(N−2)S)+4Eμ((N−2)S)=2N−Eμ2(N−2)2S.
编辑2:在本文中,斯坦因证明了MLE对于N = 2是可接受的N=2。