为什么对于给定的n,比例的标准误差最大为0.5?


10

当所讨论的比例为0.5时,对于给定的N,比例的标准误差将是最大的,并且该比例的标准误差从0.5开始越小。当查看比例的标准误差的方程式时,我可以看到为什么会这样,但是我无法进一步解释。

除了公式的数学性质之外,还有其他解释吗?如果是这样,为什么估计比例(对于给定的N)在接近0或1时为何不确定性较小?

Answers:


8

背景和术语

为了完全清楚我们在讨论什么,让我们建立一些概念和术语。一个很好的比例模型是二元骨灰盒:它包含银色(“成功”)或紫红色(“失败”)上色的球。balls中银球的比例为(但这不是我们将要讨论的“比例”)。 p

该骨灰盒提供了一种对伯努利审判进行建模的方法。要获得一种实现,请充分混合球并盲目地将其抽出,并观察其颜色。要获得其他实现,请首先通过返回抽出的球来重新构造盒子,然后将该过程重复预定的次数。实现的序列可以通过其成功计数X来概括。它是一个随机变量,其属性完全由n和决定。的分布称为二项式分布。(实验或“样本”)比例nXnpX(n,p)X/n

数字

这些数字是各种二项式比例的概率分布的示意图。最值得注意的是一个与无关的一致模式,其中随着从向下移动,分布变得更窄(条形相应地更高)。X/nnp1/2

的标准偏差是问题中提到的比例标准误差。对于任何给定的,此数量只能取决于。我们称之为。通过切换球的角色(将银色的角色称为“失败”而将紫红色的角色称为“成功”),很容易看到。因此,即情况必须很特殊。问题在于在从移到更极端的值(例如X/nnpse(p)se(p)=se(1p)p=1pp=1/2se(p)p1/20

知识理解

因为每个人都在他们的早期教育中就曾被展示过像这样的人物,所以每个人都“知道”绘图的宽度(以衡量必须随着远离而减小。但是这些知识实际上只是经验,而这个问题则需要更深入的理解。通过对二项分布进行仔细分析,例如300年前的亚伯拉罕·德·莫夫尔(Abraham de Moivre),可以获得这种理解。(它们在精神上类似于我在讨论中央极限定理时所介绍的那些。)但是,我认为,一些相对简单的考虑可能足以使宽度必须在附近最宽。se(p)p1/2p=1/2

简单直观的分析

显然,我们应该期望实验中成功的比例接近。标准错误涉及我们可以合理地假设实际结果会偏离预期的距离。假设在不失一般性的前提下,pX/np01/2X/nppn(1p)npnppXp×(1p)nX/np(1p)n/n=p(1p)

结局

p(1p)p=1/2p=0p=1

p(1p)Xp(1p)nXpn p(1p)nnX/np(1p)n/n=p(1p)n,X/n


3

考虑函数p(1-p)对于0 <= p <= 1。使用微积分,您可以看到在p = 1/2时它是最大值的1/4。如果您看到这是针对与平方的比例估计值的标准偏差为sqrt(p(1-p)/ n)的二项式,则p = 1/2为最大值。当p = 1或0时,标准误差为0,因为您将始终分别获得全1或全0。因此,当您接近0或1时,一个连续性参数说标准误差随着p接近0或1而接近0。实际上,当p接近0或1时标准误差单调减小。对于大的n,估计比例应该接近于实际值。比例。


3
p(1p)p=1/2

1
@whuber我回答了我的做法,因为我发现该公式对于理解为什么方差在p = 1/2时最大而在p接近0或1时非常小是至关重要的。也许最好说没有完全没有公式的解释。
Michael R. Chernick

1

n

由于比率必须在0到1之间,因此不确定性将受到这些界限的限制。除非平均比率正好在中间,否则这些界限之一将比另一个界限更具限制性。

pmin[p,1p]


是的-但另一个界限将受到更少的限制!为什么两个效果都不能抵消?
ub

@whuber我从对称性出发进行争论(即在简单的“大 ”情况下,对称的钟形曲线必须适合该间隔,因此其半角受到较紧的一侧约束)nmin[p,1p]
GeoMatt22 2013年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.