抛硬币时应该使用二项式CDF还是普通CDF?


11

硬币需要进行公平性测试。翻转50次后,出现30个头。假设硬币是公平的,那么在50次翻转中至少获得30个正面的概率是多少?

我的老师说,解决这个问题的正确方法是

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

但是,我采用了这样的二项式累积分布函数

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

我相信满足二项式分布的标准:单个事件是独立的,只有两种可能的结果(正面对反面),问题的概率恒定(0.5),并且试验次数固定为50然而,显然,这两种方法给出的答案不同,并且模拟支持我的答案(至少运行了几次;很明显,我不能保证您会得到相同的结果)。

我的老师是否认为正态分布曲线也是解决此问题的有效方法是错误的(决不是说正态分布是正态分布,而是n * pn *(1-p)都大于10),还是我误解了二项式分布?


5
具有对二项式使用正态近似的经验的人会有所不同:他们将应用(通常)连续性校正,如1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(这是一个R表达式),其值为0.1015,与二项式cdf非常接近。
ub

Answers:


10

这是胡扯和一站式解决方案的图示。

连续性校正

红色二项分布,在正常的近似黑色的浓度Ñ25 12.5 ,并且在蓝色对应于表面PÝ > 29.5 Ý Ñ25 12.5 一世ñ500.5ñ2512.5Pÿ>29.5ÿñ2512.5

PX=ķX一世ñ500.5Pķ-1个2<ÿ<ķ+1个2PX30Pÿ>29.5

Pÿ>29.50.1015459
1-pnorm(29.5,25,sqrt(12.5))
PX300.1013194

这称为连续性校正。它甚至可以计算“点概率”,例如PX=22

PX=22=50220.5220.5280.07882567P21.5<ÿ<22.50.2397501-0.16109940.07865066。

4

如果使用连续性校正,则正态分布会更接近二项式。使用此示例,我得到0.1015。由于这是家庭作业,因此我将留给您填写详细信息。


4

考虑一下。在离散二项式分布中,您具有各个数字的实际概率。如果不是连续法线,则需要一定范围的值。所以...如果您要从正常的二项式中逼近单个值的概率,比如说X,您将如何做呢?查看二项式分布的概率直方图,并在其上放置正态曲线。您实际上需要从X±0.5中进行选择,以捕获与正态近似下X的二项式概率相似的东西。

现在将其扩展到选择分布的尾部时。使用二项式方法时,您要选择整个值的概率(在您的情况下为30)以及所有更高的值。因此,当您进行连续时,必须确保将其捕获并选择少0.5,因此连续分布的截止值为29.5。


3
实际上,该问题表现出对问题的周到理解,似乎并没有在寻找常规作业问题的答案。尽管已标记为作业,但请考虑在此处进行例外处理。特别是,最好使用正态分布来近似离散分布(例如具有较大N的二项式和泊松分布),这在这里受到了很好的讨论,并且在这里受到极大欢迎。
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.