在经典统计中,有一个定义是将一组数据的统计量定义为对于参数是完整的,因此不可能从中简单地形成的无偏估计量。也就是说,使所有的唯一方法是几乎肯定地使为。
这背后有直觉吗?似乎这是一种比较机械的定义方式,我知道以前已经有人问过这个问题,但是我想知道是否存在一种非常容易理解的直觉,这会使入门级学生更容易地消化材料。
在经典统计中,有一个定义是将一组数据的统计量定义为对于参数是完整的,因此不可能从中简单地形成的无偏估计量。也就是说,使所有的唯一方法是几乎肯定地使为。
这背后有直觉吗?似乎这是一种比较机械的定义方式,我知道以前已经有人问过这个问题,但是我想知道是否存在一种非常容易理解的直觉,这会使入门级学生更容易地消化材料。
Answers:
我将尝试添加到其他答案。首先,完整性是一个技术条件,主要由使用它的定理证明。因此,让我们从发生它们的一些相关概念和定理开始。
令表示IID数据,这是我们建模为具有分布的矢量其中参数管辖数据是未知的。是足够的,如果的条件分布不依赖于该参数。 如果 V的分布不依赖于 θ(在族 f (x ; θ )内),则 V (X )是辅助的。如果U = U (X )的期望值为零,则它是零的无偏估计量,而与 θ无关。如果基于 S的零的任何无偏估计量都等于零,即 E g (X ),则 S = S (X )是一个完整的统计量。则 ae(对于所有)。
现在,假设您有两个基于充分统计量T的不同的的无偏估计量,g 1(T ),g 2(T )。也就是说,在符号
E g 1(T )= θ中,
让我们看一些例子。假设现在在区间上是均匀的。我们可以证明(是阶次统计量)对就足够了,但是并不完整,因为差异是辅助的,我们可以计算它的期望,让它成为(这是一个功能只),然后将是无偏的零估计器不等于零。因此,在这种情况下,我们足够的统计数据并不完整也不足够。我们可以看到这意味着什么:存在足够统计量的函数,这些函数不能提供有关θ的信息(在模型的上下文中)。如果没有足够完整的统计数据,就不可能发生这种情况。从某种意义上说,它具有最大的指导意义,因为它的功能都不是指导性的。在另一方面,如果在最低限度足够的统计有预期为零,这可以被看作是一个的一些功能噪声项,在车型干扰/噪音方面有预期为零。因此我们可以说,不完整的足够统计量确实包含一些噪声。
在该范围再看看在这个例子中。由于其分布不依赖于,它没有自身单独包含有关的任何信息。但是,加上足够的统计数据,它确实可以!怎么样?看一下观察到的情况,然后在我们的模型(已知为真)的情况下,我们对有了完备的知识!即,我们可以确定地说。您可以检查θ的任何其他值然后在假定模型下导致或是不可能的观察。另一方面,如果我们观察到,则的可能值范围相当大(练习...)。
从这个意义上讲,辅助统计量确实包含一些有关精度的信息,我们可以根据此数据和模型估算。在本示例及其他示例中,辅助统计量 “承担了样本量的作用”。通常,置信区间等需要样本大小,但是在本示例中,我们可以使条件置信区间仅使用而不是(运动)来计算。这是费舍尔的一个想法,即推论应基于条件一些辅助统计。
现在,巴苏定理:如果完全足够,则它独立于任何辅助统计量。也就是说,基于完全足够的统计量进行的推断更为简单,因为我们无需考虑条件推断。当然,对独立于的统计数据的条件不会改变任何东西。
然后,最后一个例子给出更多的直觉。改变我们的均匀分布例如对间隔的均匀分布(与)。在这种情况下,统计量 是完整且充分的。发生了什么变化?我们可以看到完整性确实是模型的属性。在前一种情况下,我们的参数空间有限。此限制通过在订单统计信息中引入关系破坏了完整性。通过消除此限制,我们就可以做到完整性!因此,从某种意义上说,缺乏完整性意味着参数空间不够大,并且通过扩大它,我们可以希望恢复完整性(并因此更容易推断)。
其他一些例子,其中由于参数空间的限制而导致缺乏完整性,
请参阅我的回答: Fisher信息是什么信息?
设为(位置比例模型)。然后订单统计足够但不完整。但是,现在扩大这种模式到完全非参数模型,仍然IID但记者从一些完全未指定分配。这样,订单统计就足够完整了。
对于具有规范参数空间(即,尽可能大)的指数族,最小统计量也是完整的。但是在许多情况下,像弯曲的指数族一样,对参数空间引入限制会破坏完整性。
一篇非常相关的论文是《完整性的解释》和《巴苏定理》。
从最佳(最小方差)无偏估计量理论中可以得到一些直觉。
如果然后w ^是一个最好的无偏估计τ (θ )当且仅当w ^是不相关为零所有无偏估计。
证明:令为与所有零的无偏估计量不相关的无偏估计量。让w ^ '是另一估计器,使得Ë θ w ^ ' = Ë θ w ^ = τ (θ )。写w ^ ' = w ^ + (w ^ ' - w ^ )。由假设,V 一- [R θ w ^ ' = V 一- [R θ w ^ + V 一- [R θ(。因此,对于任何 w ^ ', V 一- [R θ w ^ ' ≥ V 一- [R θ w ^。
现在假设是最佳无偏估计量。让我们有一些其他的估计ü用Ë θ ü = 0。ϕ a:= W + a U对于τ (θ )也是无偏的。我们有 V 一- [R θ φ 一个:= V 一- [R θ w ^ + 2 一个ç Ô v θ(w ^ ,Ú )+ 一个2 如果有一个 θ 0 ∈ Θ,使得 Ç Ò v θ 0(w ^ ,Û )< 0,我们将获得 V 一- [R θ φ 一个 < V 一- [R θ w ^为一个∈ (0 ,- 2 ç Ò v θ 0(W ,U )/ V a
直观地讲,结果表明,如果估算器是最佳的,则不可能仅通过向其添加一些噪声来改善它,就其与平均仅为零的估算器相结合(即零的无偏估算器)而言)。
不幸的是,很难描述所有零的无偏估计量。情况变得更简单,如果零本身是零的唯一无偏估计,因为任何统计满足Ç Ò v θ(w ^ ,0 )= 0。完整性描述了这种情况。