为什么我们需要一个估计量来保持一致?


15

我认为,我已经理解了一致估计量的数学定义。如果我错了纠正我:

Wn如果则 W n是的一致估计量θϵ>0

limnP(|Wnθ|>ϵ)=0,θΘ

其中,是参数空间。但我想了解估计量必须保持一致的必要性。为什么一个不一致的估计是不好的?你能给我一些例子吗?Θ

我接受R或python中的模拟。


3
不一致的估算器并不总是坏的。例如,一个不一致但无偏的估计量。请参阅Wikipedia关于“一致性估算器”的文章en.wikipedia.org/wiki/Consistent_estimator,尤其是“偏差与一致性”部分
-compbiostats

一致性大致上是估计量的最佳渐近行为。从长远来看,我们选择一个估算器,该估算器接近的真实值。由于这只是概率的收敛,因此该线程可能会有所帮助:stats.stackexchange.com/questions/134701/…θ
StubbornAtom

@StubbornAtom,我会小心地称这样一个一致的估计量为“最优”,因为该术语通常保留给在某种意义上有效的估计量。
Christoph Hanck

Answers:


22

如果估算器不一致,则它不会收敛到概率的真实值。换句话说,无论您有多少个数据点,估计数和真实值始终存在差异的可能性。这实际上是很糟糕的,因为即使您收集了大量数据,您的估算值也始终具有与真实值相差的正概率。实际上,您可以考虑这种情况,就好像您使用的是数量估算器一样,即使对所有人口进行调查(而不是对其进行抽样)也不会帮助您。ϵ>0


21

考虑n=10000来自标准柯西分布的 000个观测值,与具有1个自由度的Student t分布相同。这种分布的尾巴足够重,没有任何平均值。分布以其中位数 η = 0为中心η=0.

样本均值序列Aj=1ji=1jXi对于柯西分布的中心不一致。粗略地说,困难在于非常极端的观测值Xi(正值或负值)以足够的规律性发生,因此Aj不可能收敛到η=0.Aj不仅收敛慢,而且不收敛)吨过会聚。的分布Aj再次是标准柯西[证明])。

相反,在连续采样过程中的任何一步,大约一半的观测值Xi将位于η,任一侧因此样本中位数的序列Hj确实收敛于η.

下面的仿真说明了AjHj的收敛性不足。

set.seed(2019)  # for reproducibility
n = 10000;  x = rt(n, 1);  j = 1:n
a = cumsum(x)/j
h = numeric(n)
for (i in 1:n) {
  h[i] = median(x[1:i])  } 
par(mfrow=c(1,2))
 plot(j,a, type="l", ylim=c(-5,5), lwd=2,
    main="Trace of Sample Mean")
  abline(h=0, col="green2")
  k = j[abs(x)>1000] 
  abline(v=k, col="red", lty="dotted")
 plot(j,h, type="l", ylim=c(-5,5), lwd=2,
     main="Trace of Sample Median")
  abline(h=0, col="green2") 
par(mfrow=c(1,1))

在此处输入图片说明

这是步骤|Xi|>1000.您可以在左图中(垂直的红色虚线处)看到一些极端观测值对移动平均值的影响。

k = j[abs(x)>1000]
rbind(k, round(x[k]))
   [,1] [,2] [,3]  [,4] [,5]  [,6]   [,7]  [,8]
k   291  898 1293  1602 2547  5472   6079  9158
  -5440 2502 5421 -2231 1635 -2644 -10194 -3137

一致性在估计中很重要:从柯西人口抽样中,n = 10的样本均值n=10000观测值比仅一个观测值更好地估计中心η。相反,一致的样本中位数收敛到η,因此较大的样本产生更好的估计。


1
仔细检查一下,但您的模拟表明样本均值几乎可以肯定地(而不是概率)收敛到柯西中心(强一致性与弱一致性)的失败。
2016年

9

一个非常简单的示例就是一个过于简化的模型,该示例说明了考虑一致性的重要性,而我认为这并没有引起足够的重视。

作为一个理论示例,假设您想在某些数据上拟合线性回归模型,其中实际影响实际上是非线性的。这样一来,您就无法针对所有协变量组合的真实均值得出一致的预测,而可能会有更灵活的预测。换句话说,简化模型将具有无法通过使用更多数据来克服的缺点。


这未必是真实的,因为线性回归模型“总是适合”,在某种意义上说,。您可能会认为该模型很好,但是“错误”实际上是假设残差具有iid正态分布。yi=y^i+e^i
概率

8

@BruceET已经给出了很好的技术答案,但是我想补充一点。

统计学中的基本概念之一是,随着样本量的增加,我们可以得出有关基础分布的更精确的结论。您可以将其视为这样一种概念,即进行大量采样可以消除数据中的随机抖动,因此我们可以更好地了解底层结构。

这一脉定理的实例很丰富,但最知名的是大数定律,断言,如果我们有独立同分布的随机变量的家族(Xi)iN E[X1]<,则

1nk=1nXkE[X]   a.s.

现在,要要求估算器保持一致,就是要求它也遵循以下规则:由于其工作是估算未知参数,因此我们希望它收敛到该参数(请阅读:任意估算该参数)作为样本大小趋于无穷大。

等式

limnP(|Wnθ|>ϵ)=0,ϵ>0 θ Θ

Wnθ

现在,如果需要,您可以反过来查看:如果该条件失败,那么即使样本数量无限,也会有一个宽度为正的“走廊” [θ-εθ+ε] 周围 θ还有一个非零的概率,即使样本数量任意大,我们的估计量也会落在该范围之外。这显然违反了上述想法,因此一致性是估算者渴望和执行的非常自然的条件。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.