我必须掷骰子几次来自信地评估其公平性?


22

(事先对使用非专业语言而非统计语言的道歉。)

如果我想以合理的确定性来衡量将特定的物理六面模具的每一侧滚动到大约+/- 2%以内的几率,那么需要多少个示例模具卷?

即我需要掷骰子多少次,计算每个结果,以确保98%确保骰子掷出骰子的几率在14.6%-18.7%之内?(或一些类似的标准,其中大约98%的人会确保骰子的公平性在2%以内。)

(这是使用骰子的模拟游戏的现实世界关注点,希望确保某些骰子设计的滚动数字接近1/6的可能性可以接受。有人声称,许多常见的骰子设计被测量为滚动29%1)。每次将几个这样的骰子滚动1000次。)


1
这比找到二项式的置信区间要困难得多,因为您想控制所有概率。看看王秀英关于多项分布同时置信区间的论文《多元分析杂志》 2008年,第99期,第5期,第896-911页)。您可以在此博客文章中找到一些代码,代码还简要介绍了已完成的一些工作。
idnavid

1
请注意,如果您只是想检查是否在相当长的时间内滚动了1,这将大大简化问题。
丹尼斯·贾赫鲁丁

2
重要的是要注意,“置信区间”不会给您“正确的百分比可能性”。我怀疑您使用的是“ 98%肯定”一词的非常合理的常用用法,但是您必须随时知道有人提到“置信区间”与98%的可能性完全不同:link.springer.com/文章/10.3758%2Fs13423-013-0572-3
BrianH

1
@BrianH谢谢!我不仅指口语表达,还希望量化测试隐含的确定性。在我看来,以一种合理的方式说,我希望可以在一定的时间百分比内滚动某些骰子结果,对于我在其中滚动结果的可能性也将进行类似(但更复杂)的计算我滚动n次时有一定的误差幅度,这就是我认为我理解夏莫伊的回答(以及后续评论)所说的话。是?
德隆兹

1
@Dronz公平地说,这是您真正认为比实际情况要简单得多的事情之一。实际上,这非常棘手。以下是一些与其他地方相关的关键问题,可帮助您了解如何没有令人难以置信的直接答案:频繁出现的math.stackexchange.com/questions/1578932/…贝叶斯math.stackexchange.com/questions/1584833/…和乐趣:rpg.stackexchange.com/questions/70802/…–
BrianH,

Answers:


18

TL; DR:如果p = 1/6,并且您想知道n需要多大才能确保骰子公平(98%)(在2%以内),则n必须至少n n≥766


n为掷骰数,X为落在某一指定面上的掷骰数。然后,X遵循二项式(n,p)分布,其中p是获得该指定边的概率。

根据中心极限定理,我们知道

n(X/np)N(0,p(1p))

由于X/nn Bernoulli (p)随机变量的样本均值。因此,对于较大的n,可以将p置信区间构造为

Xn±Zp(1p)n

由于p是未知的,我们可以与样品平均取代它p = X / Ñ,并通过各种收敛定理,我们知道所得到的置信区间将渐近有效。这样我们得到了形式的置信区间p^=X/n

p^±Zp^(1p^)n

p = X / Ñ。我假设您知道Z分数是多少。例如,如果您需要95%的置信区间,则Z = 1.96。因此,对于给定的置信度α,我们有p^=X/nZZ=1.96α

p^±Zαp^(1p^)n

现在,让我们说你要置信区间是长度小于Cα,并想知道我们需要一个怎样的大样本,使这种情况。嗯,这是equivelant来问什么nα满足

Zαp^(1p^)nαCα2

然后解决以获得

nα(2ZαCα)2p^(1p^)

所以,插上你的价值观ZαCα,并估计p以获得估计ñ α。请注意,由于p未知,这只是一个估计,但是渐近(随着n变大),它应该是准确的。p^nαpn


3
谢谢。由于我几十年来没有做过大学式的数学运算,我能麻烦您插入数字,然后实际给我一次我需要掷骰子的整数吗?
德隆兹

9
p=1/6nnn766Cα

4
查看多项式分布可能会更有趣,因为现在我们分别测试每侧。这并未考虑到我们所掌握的有关该问题的所有信息。对于intiuitive解释一下stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm

5
我同意@Jan:这个答案没有解决这个问题。而且,由于六个测试是相互依存的,因此无法通过将其分别应用于所有六个面孔来轻易构造答案。
ub

3
这是一个很好的答案,但我完全同意@Jan,胡言乱语。这个问题值得基于卡方统计和多项式分布的答案。
卢卡斯奇格勒
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.