假设我有一个朋友(我们称他为“乔治”),他说他可以用他的思想控制掷骰子(即,使骰子更有可能落在他正在考虑的特定数字上)。
我如何设计一个科学严谨的测试来确定他是否真的可以做到这一点?(我真的不认为他可以,当然,但我希望他在测试开始前同意测试的细节,Amazing Randi 风格。)我想减少(很可能)测试后的借口他会想出的。
这是我到目前为止所拥有的:
确定物理掷骰子技术(哪个骰子、摇杯、落地面等)
定义一个“测试会话”,由X掷骰子组成。这需要小到足以一次完成,但要大到足以在 95%-99% 的置信度内确定(经过分析)骰子是公平的还是偏向一侧
在所选骰子上运行Y会话(不受乔治的影响),作为“控制”以确保骰子自己显示“公平”结果
与乔治一起运行Z会话。在每个之前,掷一个单独的骰子来确定乔治在整个会话期间将“专注”的数字。
编译并分析结果。
乔治为自己糟糕的表现找了些借口。
所以我的问题是:
我的整体方法有任何缺陷或问题吗?乔治可能会反对什么?
我应该使用 D6 吗?还是D20?有关系吗?具有更多面的模具是否需要更多的滚动才能产生同样自信的结果?还是相反?出于实际考虑,我更喜欢更少的卷而不是更多:)
X、Y和Z的合理值是多少?它们并非完全无关;如果我选择的X值仅允许单个会话的 95% 置信度,那么即使没有 George 的影响,每 20 个会话中有 1 个可能“失败”
如何定义单个会话的“成功”或“失败”?(我确实发现这个问题涉及卡方检验的细节,所以我认为这是我的评估方法,但什么是合理的置信度阈值?)
如何定义整体测试的“成功”或“失败”?乔治可能完全有机会“赢得”一次测试,但他必须通过多少次Z测试才能通过整个测试?
我可能会在 MS Excel 电子表格中分析这些结果,如果这有什么不同的话。