假设我有一个朋友(我们称他为“乔治”),他说他可以用自己的思想来控制骰子的掷骰(即,使骰子更可能落在他正在考虑的特定数字上)。
我如何设计科学严谨的测试来确定他是否真的可以做到这一点?(当然,我真的不认为他可以,但是我希望他在测试开始之前就同意Amazing Randi风格的测试细节。)我想减少(很有可能)发布测试后的借口他会想出的。
这是我到目前为止的内容:
确定掷骰子的物理方法(骰子,振动杯,着陆面等)
定义一个“测试会话”,由X卷骰子组成。这个大小必须足够小,可以一次坐下,但是要足够大(可以确定)(经过分析),在95%-99%的置信度内骰子是公平的,还是偏向一方的
在所选骰子上运行Y次会话(不受George的影响),以此作为“对照”,以确保骰子自身显示“公平”结果
运行ž会议与乔治。在每次练习之前,请滚动一个单独的骰子以确定在整个会话期间George将“专注于”哪个数字。
编译并分析结果。
乔治为他的惨淡表现做了一些借口。
所以我对您的问题:
我的整体方法是否有缺陷或问题?乔治可能会反对吗?
我应该使用D6吗?还是D20?有关系吗?具有更多面的模具是否需要更多的轧辊才能产生类似的可信结果?还是相反?出于实际考虑,我宁愿少卷也不要多卷:)
X,Y和Z的合理值是多少?它们并非完全无关。如果我选择的X值仅允许一次会话具有95%的置信度,那么即使没有George的影响,每20个会话中有1个可能“失败”
如何为单个会话定义“成功”或“失败”?(我确实找到了这个问题涉及卡方检验的细节,所以我认为这是我的评估方法,但是合理的置信度阈值是多少?)
如何为整体测试定义“成功”或“失败”?乔治可能会凭借一次偶然的机会“赢得”单个比赛,但是要通过整个测试,他必须通过多少Z个比赛?
如果有什么不同,我可能会在MS Excel电子表格中分析这些结果。