二项式随机变量样本均值的标准误


44

假设我正在运行一个可能有2个结果的实验​​,并且我假设2个结果的基本“真实”分布是参数和的二项式分布:。p B i n o m i a ln p ñpBinomial(n,p

我可以根据的方差形式 计算标准误差: 其中。因此,。对于标准错误,我得到:,但是我在某处看到。我做错了什么?ÑøÑpσ2X=Ñpqq=1-pσX=SEX=σXñ一世ñØ一世一种ñp

σX2=ñpq
q=1个-p SEX=σX=ñpq SEX=小号ËX=pq小号ËX=pqñ

本文对于了解平均值的影响
。influentialpoints.com/ training /…

从我的谷歌搜索看来,获得二项式分布的置信区间的密切相关的主题相当细微和复杂。特别是,看起来从此公式获得的置信区间(即“瓦尔德区间”(Wald Intervals ),请参阅en.wikipedia.org/wiki/Binomial_proportion_confidence_interval)表现得很差,应该避免。有关更多信息,请参见jstor.org/stable/2676784?seq=1#metadata_info_tab_contents
aquirdturtle

Answers:


58

似乎您以两种不同的方式两次使用了次-既是样本量,又是包含二项式随机变量的bernoulli试验的数量;为了消除任何歧义,我将使用k来指代后者。ñk

如果您有来自B i n o m i a lk p 分布的独立样本,则其样本均值的方差为n一世ñØ一世一种ķp

v一种[R1个ñ一世=1个ñX一世=1个ñ2一世=1个ñv一种[RX一世=ñv一种[RX一世ñ2=v一种[RX一世ñ=ķpqñ

其中¯ X是相同的平均。这是因为q=1个-pX¯

(1)v一种[RCX=C2v一种[RX对于任何随机变量和任何常数cXC

(2)独立随机变量之和的方差等于方差的总和

的标准误差是方差的平方根:X¯。因此,ķpqñ

  • ,得到的公式为:ķ=ñpq

  • 且二项式变量只是bernoulli试验时,您将获得在其他地方看到的公式:ķ=1个pqñ


3
bernoulli随机变量时,则v a rX = p q。当X具有基于n个具有成功概率p的试验的二项式随机变量时,则v a rX = n p qXvar(X)=pqXnpv一种[RX=ñpq
Macro

2
谢谢!你解除了我的困惑。抱歉,它太基础了,我仍在学习:-)
Frank

6
弗兰克(Frank)清楚地知道,我们使用的事实是对于任何常数c Var(cX)= c 2 Var(x)?由于该比例的样本估计值为X / n,因此我们有Var(X / n)= Var(X)/ n 2 = npq / n 2 = pq / n,而SEx是其平方根。我认为,如果我们阐明所有步骤,对于每个人来说都会更清楚。222
Michael Chernick 2012年

1
@MichaelChernick,我已经澄清了您提到的细节。根据问题描述,我认为弗兰克知道这些事实,但您说的对,对将来的读者来说,包含这些细节将更具教育意义,这是正确的。
2012年

2
Sol Lago-在这种情况下,k = 1。如果您掷硬币50次并计算成功次数,然后重复实验50次,则k = n = 50。掷硬币会导致1或0。这是伯努利rv
B_Miner 2014年

9

容易混淆两个二项式分布:

  • 成功次数的分布
  • 成功比例的分布

npq是成功次数,而npq / n = pq是成功率。这导致不同的标准误差公式。


6

我们可以通过以下方式查看它:

假设我们正在做一个实验,我们需要将无偏硬币扔次。实验的总结果为Y,它是各个投掷的总和(例如,头为1,头为0)。因此,对于本实验,Y = n i = 1 X i,其中X i是单个掷骰的结果。ñÿÿ=一世=1个ñX一世X一世

在此,每次抛掷的结果遵循伯努利分布,总体结果Y遵循二项式分布。X一世ÿ

完整的实验可以视为一个样本。因此,如果我们重复实验,我们可以获得另一个值,它将形成另一个样本。Y的所有可能值将构成完整的总体。ÿY

回到遵循伯努利分布的单次掷硬币的情况,方差由给出,其中p是正面(成功)的概率,q = 1 ppqpq=1p

现在,如果我们看一下方差,则V Y = V X i= V X i。但是,对于所有单个伯努利实验,V X i= p q。由于实验中有n次抛掷或Bernoulli试验,因此V Y = V X i= n p q。这意味着YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npq具有方差 n p qYnpq

现在,将样品比例由下式给出p = ÿ,表示“成功或成功的比例”。在这里,n是一个常数,因为我们计划对总体中的所有实验不进行抛硬币。p^=Ynn

因此,V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

因此,对于标准误差p(样本统计量)是p^pq/n


您可以通过在数学上加上美元来使用Latex排版,例如,$x$X
银鱼

注意,步骤确实值得证明!VX一世=VX一世
银鱼

在最后的推论中有错别字,V(Y / n)=(1 / n ^ 2)* V(Y)=(1 / n ^ 2)* npq = pq / n应该是正确的推论。
Tarashankar

抱歉,我在排版时介绍了这一点。希望现在排序。
银鱼

1
Xi

2

我认为最初的帖子在标准误差和标准偏差之间也有些混淆。标准差是分布方差的平方根;标准误差是样本估计平均值与该分布之间的标准偏差,即,如果您多次采样该样本,您将观察到的均值分布。前者是分布的固有属性;后者是衡量您对分布属性(均值)的估计质量的度量。当您进行N次Bernouilli试验的实验以估计成功的未知概率时,看到k次成功后您估计的p = k / N的不确定性是估计比例的标准误差sqrt(pq / N),其中q = 1 -p。真实分布的特征在于参数P,即成功的真实概率。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.