在统计中定义完整性是不可能从其形成无偏估计


21

在经典统计中,有一个定义是将一组数据的统计量定义为对于参数是完整的,因此不可能从中简单地形成的无偏估计量。也就是说,使所有的唯一方法是几乎肯定地使为。Ty1,,ynθ0Eh(T(y))=0θh0

这背后有直觉吗?似乎这是一种比较机械的定义方式,我知道以前已经有人问过这个问题,但是我想知道是否存在一种非常容易理解的直觉,这会使入门级学生更容易地消化材料。


2
这是一个非常好的问题,我必须亲自研究一下。事实证明,它是这么机械的定义,对于像我这样的标准执业者而言,似乎没有直观意义,原因是它主要用于证明数学统计学的基本贡献。特别是,我的简短搜索显示,莱曼-谢夫定理和巴苏定理要求统计的完整性才能成立。这些是1950年代中期的贡献。我不能为您提供一个直观的解释-但如果你真的想建立一个,也许证明associ
赫雷米亚斯ķ

Answers:


18

我将尝试添加到其他答案。首先,完整性是一个技术条件,主要由使用它的定理证明。因此,让我们从发生它们的一些相关概念和定理开始。

X=(X1,X2,,Xn)表示IID数据,这是我们建模为具有分布的矢量f(x;θ),θΘ其中参数θ管辖数据是未知的。T=T(X)足够的,如果的条件分布XT不依赖于该参数θV=V(X)如果 V的分布不依赖于 θ(在族 f x ; θ ), V X 辅助的如果U = U X 的期望值为零,则它是零的无偏估计量,而与 θ无关。如果基于 S的零的任何无偏估计量都等于零,即 E g X ), S = S X 是一个完整的统计量。Vθf(x;θ)U=U(X)θS=S(X)SEg(S)=0(for all θ)g(S)=0 ae(对于所有θ)。

现在,假设您有两个基于充分统计量T的不同的θ的无偏估计量,g 1T g 2T 。也就是说,在符号 E g 1T = θ中Tg1(T),g2(T)

Eg1(T)=θ,Eg2(T)=θ
并且P(g1(T)g2(T))>0(对于所有θ)。然后g1(T)g2(T)是零的无偏估计,这是不相同的零,这证明T是不完整的。因此,足够大的统计量T完备性使我们知道,确实只有一个唯一的θ的无偏估计量θ基于T。这已经非常接近Lehmann–Scheffé定理。

让我们看一些例子。假设X1,,Xn现在在区间(θ,θ+1)上是均匀的。我们可以证明(X(1)<X(2)<<X(n)是阶次统计量)对(X(1),X(n))就足够了,但是并不完整,因为差异X(n)X(1)是辅助的,我们可以计算它的期望,让它成为c(这是一个功能n只),然后X(n)X(1)c将是无偏的零估计器不等于零。因此,在这种情况下,我们足够的统计数据并不完整也不足够。我们可以看到这意味着什么:存在足够统计量的函数,这些函数不能提供有关θ的信息θ(在模型的上下文中)。如果没有足够完整的统计数据,就不可能发生这种情况。从某种意义上说,它具有最大的指导意义,因为它的功能都不是指导性的。在另一方面,如果在最低限度足够的统计有预期为零,这可以被看作是一个的一些功能噪声项,在车型干扰/噪音方面有预期为零。因此我们可以说,不完整的足够统计量确实包含一些噪声

在该范围再看看R=X(n)X(1)在这个例子中。由于其分布不依赖于θ,它没有自身单独包含有关的任何信息θ。但是,加上足够的统计数据,它确实可以!怎么样?看一下观察到R=1的情况,然后在我们的模型(已知为真)的情况下,我们对θ有了完备的知识!即,我们可以确定地说θ=X(1)。您可以检查θ的任何其他值θ然后在假定模型下导致X(1)X(n)是不可能的观察。另一方面,如果我们观察到R=0.1,则θ的可能值范围相当大(练习...)。

从这个意义上讲,辅助统计量R确实包含一些有关精度的信息,我们可以根据此数据和模型估算θ。在本示例及其他示例中,辅助统计量R “承担了样本量的作用”。通常,置信区间等需要样本大小n,但是在本示例中,我们可以使条件置信区间仅使用R而不是n(运动)来计算。这是费舍尔的一个想法,即推论应基于条件一些辅助统计。

现在,巴苏定理:如果T完全足够,则它独立于任何辅助统计量。也就是说,基于完全足够的统计量进行的推断更为简单,因为我们无需考虑条件推断。当然,对独立于T的统计数据的条件不会改变任何东西。

然后,最后一个例子给出更多的直觉。改变我们的均匀分布例如对间隔的均匀分布(θ1,θ2)(与θ1<θ2)。在这种情况下,统计量(X(1),X(n)) 完整且充分的。发生了什么变化?我们可以看到完整性确实是模型的属性。在前一种情况下,我们的参数空间有限。此限制通过在订单统计信息中引入关系破坏了完整性。通过消除此限制,我们就可以做到完整性!因此,从某种意义上说,缺乏完整性意味着参数空间不够大,并且通过扩大它,我们可以希望恢复完整性(并因此更容易推断)。

其他一些例子,其中由于参数空间的限制而导致缺乏完整性,

  • 请参阅我的回答: Fisher信息是什么信息?

  • X1,,XnCauchy(θ,σ)(位置比例模型)。然后订单统计足够但不完整。但是,现在扩大这种模式到完全非参数模型,仍然IID但记者从一些完全未指定分配F。这样,订单统计就足够完整了。

  • 对于具有规范参数空间(即,尽可能大)的指数族,最小统计量也是完整的。但是在许多情况下,像弯曲的指数族一样,对参数空间引入限制会破坏完整性。

一篇非常相关的论文是《完整性的解释》和《巴苏定理》。


7

从最佳(最小方差)无偏估计量理论中可以得到一些直觉。

如果然后w ^是一个最好的无偏估计τ θ 当且仅当w ^是不相关为零所有无偏估计。EθW=τ(θ)Wτ(θ)W

证明:令为与所有零的无偏估计量不相关的无偏估计量。让w ^ '是另一估计器,使得Ë θ w ^ ' = Ë θ w ^ = τ θ 。写w ^ ' = w ^ + w ^ ' - w ^ 。由假设,V - [R θ w ^ ' = V - [R θ w ^ + V - [R θWWEθW=EθW=τ(θ)W=W+(WW)。因此,对于任何 w ^ ' V - [R θ w ^ 'V - [R θ w ^VarθW=VarθW+Varθ(WW)WVarθWVarθW

现在假设是最佳无偏估计量。让我们有一些其他的估计üË θ ü = 0ϕ a= W + a U对于τ θ 也是无偏的。我们有 V - [R θ φ 一个= V - [R θ w ^ + 2 一个ç Ô v θw ^ Ú + 一个2WUEθU=0ϕa:=W+aUτ(θ) 如果有一个 θ 0Θ,使得 Ç Ò v θ 0w ^ Û < 0,我们将获得 V - [R θ φ 一个 < V - [R θ w ^一个0 - 2 ç Ò v θ 0W U / V a

Varθϕa:=VarθW+2aCovθ(W,U)+a2VarθU.
θ0ΘCovθ0(W,U)<0Varθϕa<VarθW因此,W可能不是最佳的无偏估计量。优质教育a(0,2Covθ0(W,U)/Varθ0U)W

直观地讲,结果表明,如果估算器是最佳的,则不可能仅通过向其添加一些噪声来改善它,就其与平均仅为零的估算器相结合(即零的无偏估算器)而言)。

不幸的是,很难描述所有零的无偏估计量。情况变得更简单,如果零本身是零的唯一无偏估计,因为任何统计满足Ç Ò v θw ^ 0 = 0。完整性描述了这种情况。WCovθ(W,0)=0

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.