这个答案强调了可估计性的验证。最小方差属性是我的次要考虑因素。
首先,按照线性模型的矩阵形式总结信息,如下所示:
,其中(为了讨论可估计性,不需要球度假设。但是要讨论Gauss-Markov性质,我们确实需要假设的球度。 è(
Y:=⎡⎣⎢⎢⎢Y1Y2Y3Y4⎤⎦⎥⎥⎥=⎡⎣⎢⎢⎢1111010−1−1−1−1−1⎤⎦⎥⎥⎥⎡⎣⎢θ1θ2θ3⎤⎦⎥+⎡⎣⎢⎢⎢ε1ε2ε3ε4⎤⎦⎥⎥⎥:=Xβ+ε,(1)
εE(ε)=0,Var(ε)=σ2Iε
如果设计矩阵具有最高等级,则原始参数允许唯一的最小二乘估计。因此,任何参数,定义为线性函数的是可估计的,即它可以明确地由数据经由最小二乘估计估计作为。β β = (X ' X )- 1 X ' Ý φ φ (β )β β φ = p ' βXββ^=(X′X)−1X′Yϕϕ(β)ββ^ϕ^=p′β^
当不具有完整等级时,就会产生微妙之处。为了进行深入的讨论,我们首先在下面修复一些符号和术语(我遵循线性模型的无坐标方法的约定,第4.8节。某些术语听起来不一定是技术性的)。另外,该讨论适用于具有和的一般线性模型。ÿ = X β + ε X ∈ [R Ñ × ķ β ∈ [R ķXY=Xβ+εX∈Rn×kβ∈Rk
- 甲回归歧管是作为均值向量的集合变化超过:
- [R ķ中号= { X β :β ∈ [R ķ } 。βRk
M={Xβ:β∈Rk}.
- 甲参数官能 是直链的官能,
β φ (β )= p ' β = p 1 β 1个 + ⋯ + p ķ β ķ。ϕ=ϕ(β)β
ϕ(β)=p′β=p1β1+⋯+pkβk.
如上所述,当,并不是每个参数函数都是可估计的。但是,等等,技术上可估算的术语的定义是什么?不打扰一些线性代数似乎很难给出明确的定义。我认为最直观的一种定义如下(来自相同的前述参考文献):ϕ (β )rank(X)<kϕ(β)
定义1.参数函数如果由唯一地确定,则意味着每当满足。X β φ (β 1)= φ (β 2)β 1,β 2 ∈ [R ķ X β 1 = X β 2ϕ(β)Xβϕ(β1)=ϕ(β2)β1,β2∈RkXβ1=Xβ2
解释。上面的定义规定,从回归流形到的参数空间的映射必须是一对一的,这在(即,当本身是-一对一)。当,我们知道存在使得。上面的可估计定义实际上排除了那些结构不足的参数函数,即使在上具有相同的值,它们本身也会导致不同的值,这自然是不合理的。另一方面,可估计参数函数φ 秩(X )= ķ X 秩(X )< ķ β 1 ≠ β 2 X β 1 = X β 2中号φ (⋅ )φ (β 1)= φ (β 2)β 1 ≠ β 2 X β 1 = X β 2Mϕrank(X)=kXrank(X)<kβ1≠β2Xβ1=Xβ2Mϕ(⋅)只要满足条件确实允许情况与。ϕ(β1)=ϕ(β2)β1≠β2Xβ1=Xβ2
在相同的参考命题8.4中,还存在其他等效条件来检查参数函数的可估计性。
在进行了如此详尽的背景介绍之后,让我们回到您的问题。
:本身是不可估计的,因为,这意味着与。尽管以上定义是针对标量泛函给出的,但很容易将其泛化为矢量值泛函。秩(X )< 3 X β 1 = X β 2 β 1 ≠ β 2βrank(X)<3Xβ1=Xβ2β1≠β2
B.是不可估计的。到机智,考虑和,这使但。β 1 = (0 ,1 ,0 )” β 2 = (1 ,1 ,1 )' X β 1 = X β 2 φ 1(β 1)= 0 + 0 =ϕ1(β)=θ1+θ3=(1,0,1)′ββ1=(0,1,0)′β2=(1,1,1)′Xβ1=Xβ2ϕ1(β1)=0+0=0≠ϕ1(β2)=1+1=2
C.是可估计的。因为意味着,即。X β 1 = X β 2 θ (1 ) 1 - θ (1 ) 3 = θ (2 ) 1 - θ (2 ) 3 φ 2(β 1)= φ 2ϕ2(β)=θ1−θ3=(1,0,−1)′βXβ1=Xβ2θ(1)1−θ(1)3=θ(2)1−θ(2)3ϕ2(β1)=ϕ2(β2)
D.是也可估。从到也是微不足道的。X β 1 = X β 2 φ 3(β 1)= φ 3(β 2)ϕ3(β)=θ2=(0,1,0)′βXβ1=Xβ2ϕ3(β1)=ϕ3(β2)
在证明了可估计性之后,有一个定理(命题8.16,相同的参考文献)声称的高斯-马尔可夫性质。根据该定理,选项C的第二部分不正确。最佳线性无偏估计为,根据以下定理。ˉ Ý = (Ý 1 + ý 2 + ý 3 + ý 4)/ 4ϕ(β)Y¯=(Y1+Y2+Y3+Y4)/4
定理。让是可估计的参数的功能,那么它的最佳线性无偏估计(又名,高斯-马尔可夫估计)是对于任何溶液到正规方程。ϕ(β)=p′βϕ(β^)β^X′Xβ^=X′Y
证明如下:
证明。直接计算表明,正态方程为
其中,简化后,是
即。
⎡⎣⎢40−4020−404⎤⎦⎥β^=⎡⎣⎢10−111−110−11−1−1⎤⎦⎥Y,
⎡⎣⎢⎢ϕ(β^)θ^2/2−ϕ(β^)⎤⎦⎥⎥=⎡⎣⎢Y¯(Y2−Y4)/4−Y¯⎤⎦⎥,
ϕ(β^)=Y¯
因此,选项D是唯一正确的答案。
附录:可估计性和可识别性的联系
当我在学校时,一位教授简短地提到了参数函数的可估计性与模型可识别性相对应。那时,我认为这一主张是理所当然的。但是,需要更明确地阐明等效性。ϕ
根据AC Davison的专着《统计模型》第 144页,
定义2.每个参数生成不同分布的参数模型称为 identifiable。θ
对于线性模型,无论球度条件,都可以将其重新表示为
(1)Var(ε)=σ2I
E[Y]=Xβ,β∈Rk.(2)
这个模型很简单,我们只指定了响应向量的第一矩形式。当,模型是可识别的,因为暗示(原始定义中的单词“ distribution”自然会为“ mean” ”(在模型)。Yrank(X)=k(2)β1≠β2Xβ1≠Xβ2(2)
现在假设和给定的参数函数,我们如何协调定义1和定义2?rank(X)<kϕ(β)=p′β
好了,通过操纵符号和单词,我们可以证明(“证明”相当琐碎)可估计性等同于模型在通过参数参数化时是可识别的。(设计矩阵可能会相应地更改)。为了证明,假设是可估计的,那么意味着,根据定义,这是,因此模型是可识别的使用索引时。相反,假设模型是可识别的,ϕ(β)(2)ϕ=ϕ(β)=p′βXϕ(β)Xβ1=Xβ2p′β1=p′β2ϕ1=ϕ2(3)ϕ(3)Xβ1=Xβ2意味着,这很简单地。ϕ1=ϕ2ϕ1(β)=ϕ2(β)
直观地,当降阶时,带有的模型是参数冗余的(参数太多),因此可能会进行非冗余的低维重新参数化(可能由线性函数的集合组成)。这样的新表示何时可能出现?关键是可估计性。Xβ
为了说明以上陈述,让我们重新考虑您的示例。我们已经验证了参数函数和是可估计的。因此,我们可以根据重新参数化的参数来重写模型,如下所示
ϕ2(β)=θ1−θ3ϕ3(β)=θ2(1)(ϕ2,ϕ3)′
E[Y]=⎡⎣⎢⎢⎢1111010−1⎤⎦⎥⎥⎥[ϕ2ϕ3]=X~γ.
显然,由于已完成排名,因此可以识别带有新参数的模型。X~γ
self-study
标签,否则有人会来并关闭您的问题。