为一个说能影响骰子的通灵设计测试

假设我有一个朋友（我们称他为“乔治”），他说他可以用自己的思想来控制骰子的掷骰（即，使骰子更可能落在他正在考虑的特定数字上）。

我如何设计科学严谨的测试来确定他是否真的可以做到这一点？（当然，我真的不认为他可以，但是我希望他在测试开始之前就同意Amazing Randi风格的测试细节。）我想减少（很有可能）发布测试后的借口他会想出的。

这是我到目前为止的内容：

确定掷骰子的物理方法（骰子，振动杯，着陆面等）
定义一个“测试会话”，由X卷骰子组成。这个大小必须足够小，可以一次坐下，但是要足够大（可以确定）（经过分析），在95％-99％的置信度内骰子是公平的，还是偏向一方的
在所选骰子上运行Y次会话（不受George的影响），以此作为“对照”，以确保骰子自身显示“公平”结果
运行ž会议与乔治。在每次练习之前，请滚动一个单独的骰子以确定在整个会话期间George将“专注于”哪个数字。
编译并分析结果。
乔治为他的惨淡表现做了一些借口。

所以我对您的问题：

我的整体方法是否有缺陷或问题？乔治可能会反对吗？
我应该使用D6吗？还是D20？有关系吗？具有更多面的模具是否需要更多的轧辊才能产生类似的可信结果？还是相反？出于实际考虑，我宁愿少卷也不要多卷：)
X，Y和Z的合理值是多少？它们并非完全无关。如果我选择的X值仅允许一次会话具有95％的置信度，那么即使没有George的影响，每20个会话中有1个可能“失败”
如何为单个会话定义“成功”或“失败”？（我确实找到了这个问题涉及卡方检验的细节，所以我认为这是我的评估方法，但是合理的置信度阈值是多少？）
如何为整体测试定义“成功”或“失败”？乔治可能会凭借一次偶然的机会“赢得”单个比赛，但是要通过整个测试，他必须通过多少Z个比赛？

如果有什么不同，我可能会在MS Excel电子表格中分析这些结果。

probability experiment-design dice

— 布拉德
source

如果他只用头脑操纵骰子，那么有人应该扔骰子。我认为D6或D20之类的东西应该留给乔治。乔治说他可以做什么操纵？他是否说过可以提出自己希望的特定号码？如果是这样，那么成功将是该数字的实例，而失败将是其他任何东西。

— 约翰

@John-他只是声称他可以使这个数字比其他情况更频繁地出现，而不是它总是会出现这个数字。

— BradC 2011年

（最初在math.stackexchange.com/q/57624/14626上提出了此问题的版本）

— BradC 2011年

您对Michael Hardy和TonyK的数学答案都非常好。

— 约翰

我对低至95％甚至99％的置信度感到不满意；非同寻常的主张往往需要非同寻常的证据。或者将其放在更贝叶斯的语境中，我先前对他具有这种能力的信念是如此之低，以至于我需要大量荒谬的证据来有意义地改变我的后继信念。

— Michael McGowan

Answers:

我建议通过以下方式对此进行分析：

将乔治成功预测结果的每个角色视为成功，并将其他每个角色视为失败。然后，您可以轻松计算出乔治成功的概率以及95％或99％的置信区间。他是否声称自己可以随机掷骰子就可以预测结果“两次”？然后：

H0：p> = 1/3

H1：p <1/3

（假设6面模具）。

从那里开始，进行假设检验非常简单。另外，您可以很容易地计算先验功率（即使在Excel中也是如此）。选择一些卷（如10），然后制作一张可能成功的表格作为行（0-10）。然后，对于每一次成功，计算他获得很多成功的概率（如果他只是猜测，这就是我们所假设的）。另外，对于每个值，确定它是否会导致拒绝或接受空值。然后，要找到功效，您可以简单地合计将拒绝空值的所有概率。

— random_forest_fanatic
source

对于乔治来说，D20在相同的显着性水平下将需要更多的掷骰，以确保您是否需要运行卡方检验。我认为您不需要运行完整的卡方检验。您只需要检查骰子是否比“机会”更频繁地掷出“选择”数字。我只会使用二项式的cdf来计算滚动所选数字的p值，而不是机会 $\theta=\frac{1}{6}$ $X$

— 高带宽
source

随机分配选定的那边可能无关紧要，我只是担心A）考虑骰子上任何可能的真实偏差，以及B）确保任何一个异常会话（由于我所说的是真正的随机性，所以有十分之一）并不能证明他的心理能力。只要我的X（和置信度）足够高，大概6个会话，每个数字一个就足够了。

— BradC 2011年