为一个说能影响骰子的通灵设计测试


11

假设我有一个朋友(我们称他为“乔治”),他说他可以用自己的思想来控制骰子的掷骰(即,使骰子更可能落在他正在考虑的特定数字上)。

我如何设计科学严谨的测试来确定他是否真的可以做到这一点?(当然,我真的不认为他可以,但是我希望他在测试开始之前就同意Amazing Randi风格的测试细节。)我想减少(很有可能)发布测试后的借口他会想出的。

这是我到目前为止的内容:

  1. 确定掷骰子的物理方法(骰子,振动杯,着陆面等)

  2. 定义一个“测试会话”,由X卷骰子组成。这个大小必须足够小,可以一次坐下,但是要足够大(可以确定)(经过分析),在95%-99%的置信度内骰子是公平的,还是偏向一方的

  3. 在所选骰子上运行Y次会话(不受George的影响),以此作为“对照”,以确保骰子自身显示“公平”结果

  4. 运行ž会议与乔治。在每次练习之前,请滚动一个单独的骰子以确定在整个会话期间George将“专注于”哪个数字。

  5. 编译并分析结果。

  6. 乔治为他的惨淡表现做了一些借口。

所以我对您的问题:

  • 我的整体方法是否有缺陷或问题?乔治可能会反对吗?

  • 我应该使用D6吗?还是D20?有关系吗?具有更多面的模具是否需要更多的轧辊才能产生类似的可信结果?还是相反?出于实际考虑,我宁愿少卷也不要多卷:)

  • XYZ的合理值是多少?它们并非完全无关。如果我选择的X值仅允许一次会话具有95%的置信度,那么即使没有George的影响,每20个会话中有1个可能“失败”

  • 如何为单个会话定义“成功”或“失败”?(我确实找到了这个问题涉及卡方检验的细节,所以我认为这是我的评估方法,但是合理的置信度阈值是多少?)

  • 如何为整体测试定义“成功”或“失败”?乔治可能会凭借一次偶然的机会“赢得”单个比赛,但是要通过整个测试,他必须通过多少Z个比赛?

如果有什么不同,我可能会在MS Excel电子表格中分析这些结果。


如果他只用头脑操纵骰子,那么有人应该扔骰子。我认为D6或D20之类的东西应该留给乔治。乔治说他可以做什么操纵?他是否说过可以提出自己希望的特定号码?如果是这样,那么成功将是该数字的实例,而失败将是其他任何东西。
约翰

@John-他只是声称他可以使这个数字比其他情况更频繁地出现,而不是它总是会出现这个数字。
BradC 2011年

(最初在math.stackexchange.com/q/57624/14626上提出了此问题的版本)
BradC 2011年

您对Michael Hardy和TonyK的数学答案都非常好。
约翰

4
我对低至95%甚至99%的置信度感到不满意;非同寻常的主张往往需要非同寻常的证据。或者将其放在更贝叶斯的语境中,我先前对他具有这种能力的信念是如此之低,以至于我需要大量荒谬的证据来有意义地改变我的后继信念。
Michael McGowan

Answers:


2

我建议通过以下方式对此进行分析:

将乔治成功预测结果的每个角色视为成功,并将其他每个角色视为失败。然后,您可以轻松计算出乔治成功的概率以及95%或99%的置信区间。他是否声称自己可以随机掷骰子就可以预测结果“两次”?然后:

H0:p> = 1/3

H1:p <1/3

(假设6面模具)。

从那里开始,进行假设检验非常简单。另外,您可以很容易地计算先验功率(即使在Excel中也是如此)。选择一些卷(如10),然后制作一张可能成功的表格作为行(0-10)。然后,对于每一次成功,计算他获得很多成功的概率(如果他只是猜测,这就是我们所假设的)。另外,对于每个值,确定它是否会导致拒绝或接受空值。然后,要找到功效,您可以简单地合计将拒绝空值的所有概率。


1

对于乔治来说,D20在相同的显着性水平下将需要更多的掷骰,以确保您是否需要运行卡方检验。我认为您不需要运行完整的卡方检验。您只需要检查骰子是否比“机会”更频繁地掷出“选择”数字。我只会使用二项式cdf来计算滚动所选数字的p值,而不是机会θ=16X


随机分配选定的那边可能无关紧要,我只是担心A)考虑骰子上任何可能的真实偏差,以及B)确保任何一个异常会话(由于我所说的是真正的随机性,所以有十分之一)并不能证明他的心理能力。只要我的X(和置信度)足够高,大概6个会话,每个数字一个就足够了。
BradC 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.