参数可估计性问题


13

令和为四个随机变量,使得,其中是未知参数。还假设,那哪个是真的?Y1,Y2,Y3Y4E(Y1)=θ1θ3;  E(Y2)=θ1+θ2θ3;  E(Y3)=θ1θ3;  E(Y4)=θ1θ2θ3θ1,θ2,θ3Var(Yi)=σ2i=1,2,3,4.

:是可估计的。θ1,θ2,θ3

B.是可估计的。θ1+θ3

C.是可估计的,是的最佳线性无偏估计。θ1θ312(Y1+Y3)θ1θ3

D.是可估计的。θ2

给出的答案是C,它对我来说看起来很奇怪(因为我得到了D)。

为什么我得到D?由于。E(Y2Y4)=2θ2

为什么我不明白C可以作为答案?好的,我可以看到是的无偏估计量,并且其方差小于。 θ1-θ3ÿ1+ÿ3Y1+Y2+Y3+Y44θ1θ3Y1+Y32

请告诉我我在哪里做错了。

也发布在这里:https : //math.stackexchange.com/questions/2568894/a-problem-on-estimability-of-parameters


1
放入self-study标签,否则有人会来并关闭您的问题。
卡尔,

@Car完成了,但是为什么呢?
Stat_prob_001

它们是网站的规则,而不是我的规则,网站规则。
卡尔,

是吗?Y1Y3
卡尔,

1
@Carl您可以这样思考:其中是一个rv,均值为,方差为。并且,其中是均值为且方差为的rvε 1 0 σ 2 Ŷ 3 = θ 1 - θ 3 + ε 3 ε 3 0 σ 2Y1=θ1θ3+ϵ1ϵ10σ2Y3=θ1θ3+ϵ3ϵ30σ2
Stat_prob_001

Answers:


8

这个答案强调了可估计性的验证。最小方差属性是我的次要考虑因素。

首先,按照线性模型的矩阵形式总结信息,如下所示: ,其中(为了讨论可估计性,不需要球度假设。但是要讨论Gauss-Markov性质,我们确实需要假设的球度。 è

(1)Y:=[Y1Y2Y3Y4]=[101111101111][θ1θ2θ3]+[ε1ε2ε3ε4]:=Xβ+ε,
εE(ε)=0,Var(ε)=σ2Iε

如果设计矩阵具有最高等级,则原始参数允许唯一的最小二乘估计。因此,任何参数,定义为线性函数的是可估计的,即它可以明确地由数据经由最小二乘估计估计作为。β β = X ' X - 1 X ' Ý φ φ β β β φ = p ' βXββ^=(XX)1XYϕϕ(β)ββ^ϕ^=pβ^

当不具有完整等级时,就会产生微妙之处。为了进行深入的讨论,我们首先在下面修复一些符号和术语(我遵循线性模型的无坐标方法的约定,第4.8节。某些术语听起来不一定是技术性的)。另外,该讨论适用于具有和的一般线性模型。ÿ = X β + ε X [R Ñ × ķ β [R ķXY=Xβ+εXRn×kβRk

  1. 回归歧管是作为均值向量的集合变化超过: - [R ķ中号= { X β β ∈ [R ķ } βRk
    M={Xβ:βRk}.
  2. 参数官能 是直链的官能, β φ β = p ' β = p 1 β 1个 + + p ķ β ķϕ=ϕ(β)β
    ϕ(β)=pβ=p1β1++pkβk.

如上所述,当,并不是每个参数函数都是可估计的。但是,等等,技术上可估算的术语的定义是什么?不打扰一些线性代数似乎很难给出明确的定义。我认为最直观的一种定义如下(来自相同的前述参考文献):ϕ β rank(X)<kϕ(β)

定义1.参数函数如果由唯一地确定,则意味着每当满足。X β φ β 1= φ β 2β 1β 2[R ķ X β 1 = X β 2ϕ(β)Xβϕ(β1)=ϕ(β2)β1,β2RkXβ1=Xβ2

解释。上面的定义规定,从回归流形到的参数空间的映射必须是一对一的,这在(即,当本身是-一对一)。当,我们知道存在使得。上面的可估计定义实际上排除了那些结构不足的参数函数,即使在上具有相同的值,它们本身也会导致不同的值,这自然是不合理的。另一方面,可估计参数函数φ X = ķ X X < ķ β 1β 2 X β 1 = X β 2中号φ φ β 1= φ β 2β 1β 2 X β 1 = X β 2Mϕrank(X)=kXrank(X)<kβ1β2Xβ1=Xβ2Mϕ()只要满足条件确实允许情况与。ϕ(β1)=ϕ(β2)β1β2Xβ1=Xβ2

在相同的参考命题8.4中,还存在其他等效条件来检查参数函数的可估计性。

在进行了如此详尽的背景介绍之后,让我们回到您的问题。

:本身是不可估计的,因为,这意味着与。尽管以上定义是针对标量泛函给出的,但很容易将其泛化为矢量值泛函。X < 3 X β 1 = X β 2 β 1β 2βrank(X)<3Xβ1=Xβ2β1β2

B.是不可估计的。到机智,考虑和,这使但。β 1 = 0 1 0 β 2 = 1 1 1 ' X β 1 = X β 2 φ 1β 1= 0 + 0 =ϕ1(β)=θ1+θ3=(1,0,1)ββ1=(0,1,0)β2=(1,1,1)Xβ1=Xβ2ϕ1(β1)=0+0=0ϕ1(β2)=1+1=2

C.是可估计的。因为意味着,即。X β 1 = X β 2 θ 1 1 - θ 1 3 = θ 2 1 - θ 2 3 φ 2β 1= φ 2ϕ2(β)=θ1θ3=(1,0,1)βXβ1=Xβ2θ1(1)θ3(1)=θ1(2)θ3(2)ϕ2(β1)=ϕ2(β2)

D.是也可估。从到也是微不足道的。X β 1 = X β 2 φ 3β 1= φ 3β 2ϕ3(β)=θ2=(0,1,0)βXβ1=Xβ2ϕ3(β1)=ϕ3(β2)

在证明了可估计性之后,有一个定理(命题8.16,相同的参考文献)声称的高斯-马尔可夫性质。根据该定理,选项C的第二部分不正确。最佳线性无偏估计为,根据以下定理。ˉ Ý = Ý 1 + ý 2 + ý 3 + ý 4/ 4ϕ(β)Y¯=(Y1+Y2+Y3+Y4)/4

定理。让是可估计的参数的功能,那么它的最佳线性无偏估计(又名,高斯-马尔可夫估计)是对于任何溶液到正规方程。ϕ(β)=pβϕ(β^)β^XXβ^=XY

证明如下:

证明。直接计算表明,正态方程为 其中,简化后,是 即。

[404020404]β^=[111101011111]Y,
[ϕ(β^)θ^2/2ϕ(β^)]=[Y¯(Y2Y4)/4Y¯],
ϕ(β^)=Y¯

因此,选项D是唯一正确的答案。


附录:可估计性和可识别性的联系

当我在学校时,一位教授简短地提到了参数函数的可估计性与模型可识别性相对应。那时,我认为这一主张是理所当然的。但是,需要更明确地阐明等效性。ϕ

根据AC Davison的专着《统计模型》第 144页,

定义2.每个参数生成不同分布的参数模型称为 identifiableθ

对于线性模型,无论球度条件,都可以将其重新表示为 (1)Var(ε)=σ2I

(2)E[Y]=Xβ,βRk.

这个模型很简单,我们只指定了响应向量的第一矩形式。当,模型是可识别的,因为暗示(原始定义中的单词“ distribution”自然会为“ mean” ”(在模型)。Yrank(X)=k(2)β1β2Xβ1Xβ2(2)

现在假设和给定的参数函数,我们如何协调定义1定义2rank(X)<kϕ(β)=pβ

好了,通过操纵符号和单词,我们可以证明(“证明”相当琐碎)可估计性等同于模型在通过参数参数化时是可识别的。(设计矩阵可能会相应地更改)。为了证明,假设是可估计的,那么意味着,根据定义,这是,因此模型是可识别的使用索引时。相反,假设模型是可识别的,ϕ(β)(2)ϕ=ϕ(β)=pβXϕ(β)Xβ1=Xβ2pβ1=pβ2ϕ1=ϕ2(3)ϕ(3)Xβ1=Xβ2意味着,这很简单地。ϕ1=ϕ2ϕ1(β)=ϕ2(β)

直观地,当降阶时,带有的模型是参数冗余的(参数太多),因此可能会进行非冗余的低维重新参数化(可能由线性函数的集合组成)。这样的新表示何时可能出现?关键是可估计性。Xβ

为了说明以上陈述,让我们重新考虑您的示例。我们已经验证了参数函数和是可估计的。因此,我们可以根据重新参数化的参数来重写模型,如下所示 ϕ2(β)=θ1θ3ϕ3(β)=θ2(1)(ϕ2,ϕ3)

E[Y]=[10111011][ϕ2ϕ3]=X~γ.

显然,由于已完成排名,因此可以识别带有新参数的模型。X~γ


如果您需要选项C第二部分的证明,我将补充我的答案。
詹雄

2
谢谢!如此详细的答案。现在,关于C的第二部分:我知道“最佳”与最小方差有关。那么,为什么不是“最佳”呢?14(Y1+Y2+Y3+Y4)
Stat_prob_001

2
哦,我不知道为什么我认为它是C中的估算器。实际上是最佳估算器。将编辑我的答案(Y1+Y2+Y3+Y4)/4
詹雄

6

应用定义。

我将提供详细信息来演示如何使用基本技术:您不需要了解有关估计的任何特殊定理,也不需要假设有关的(边际)分布的任何信息。我们将需要就它们的共同分布时刻提供一个缺失的假设。Yi

定义

对于常数所有线性估计的形式均为。

tλ(Y)=i=14λiYi
λ=(λi)

的估计量在且仅当其期望值为才是无偏的。通过期望的线性,θ1θ3θ1θ3

θ1θ3=E[tλ(Y)]=i=14λiE[Yi]=λ1(θ1θ3)+λ2(θ1+θ2θ3)+λ3(θ1θ3)+λ4(θ1θ2θ3)=(λ1+λ2+λ3+λ4)(θ1θ3)+(λ2λ4)θ2.

比较未知量显示θi

(1)λ2λ4=0 and λ1+λ2+λ3+λ4=1.

在线性无偏估计的情况下,“最佳” 始终表示方差最小。 的方差为tλ

Var(tλ)=i=14λi2Var(Yi)+ij4λiλjCov(Yi,Yj).

取得进展的唯一方法是对协方差添加一个假设:最有可能的是,要规定它们全部为零的问题。(这并不意味着是独立的。此外,可以通过对那些协方差规定一个共同的乘法常数的假设来解决该问题。解决方案取决于协方差结构。)Yi

由于我们得到Var(Yi)=σ2,

(2)Var(tλ)=σ2(λ12+λ22+λ32+λ42).

因此,问题是在约束约束下最小化。(2)(1)

约束允许我们仅通过的两个线性组合来表示它们。令和(线性独立)。这些确定和而约束确定和。我们要做的就是最小化,可以将其写成(1)λiu=λ1λ3v=λ1+λ3λ1λ3λ2λ4(2)

σ2(λ12+λ22+λ32+λ42)=σ24(2u2+(2v1)2+1).

没有约束适用于。假设(这样变量不仅是常量)。因为仅当时和才最小,所以很显然唯一解是(u,v)σ20u2(2v1)2u=2v1=0

λ=(λ1,λ2,λ3,λ4)=(1/4,1/4,1/4,1/4).

选项(C)为假,因为它没有给出最佳的无偏线性估计量。选项(D)尽管没有提供完整的信息,但它是正确的,因为

θ2=E[t(0,1/2,0,1/2)(Y)]

是线性估计量的期望。

很容易看出(A)和(B)都不正确,因为线性估计量的期望空间是由而没有或在该空间中。θ 1θ 3θ 1 + θ 3{θ2,θ1θ3}θ1,θ3,θ1+θ3

因此,(D)是唯一的正确答案。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.