可以对经常落在边缘的硬币进行公平的硬币测试吗?

机器算法验证 可能性
2022-03-02 18:26:06

如果你掷硬币得到 268 个正面和 98 个反面,你可以用几种方法计算硬币是公平的概率。一个简单的启发式观察很可能会得出这样的结论:这样的硬币是不公平的。我计算了 R 中的 p 值:

> coin <- pbinom(98, 366, 0.5)
> coin*2
[1] 2.214369e-19

该值小于 0.05,因此我们拒绝它是公平硬币的假设。

但是,如果你告诉你在审判期间同一枚硬币落在它的侧面 676 次怎么办?试探性地,您可能会得出相同的结论,但典型的公平硬币测试仍然有效吗?

这是一个图表来说明这个问题:

有哪些有效方法可以检验事件在阴影区域发生的概率相等的假设?

注意:图中有 629 个正向移动(413 个负向移动)。

生成数据的 R 代码:

require("quantmod")

ticker <- getSymbols("SLV")[,6]

change <- (ticker - lag(ticker, 24)) / lag(ticker, 24)  
change <- na.locf(change, na.rm=TRUE)   

# some other calculations

dens <- density(change)
plot(dens)

# some formatting stuff
2个回答

我很确定答案是肯定的,标准的二项式“公平硬币”测试仍然有效:如果您想测试多项分布的三个概率中的两个是否相同,但您对任何关于的假设不感兴趣第三个概率,您可以分析相应的两个结果的数量,就好像它们是从二项分布中得出的一样。

事实上,这似乎是一个关于充分统计和条件可能性的很好的练习:

您可以将其视为具有三个可能结果的多项分布,因此具有两个可估计参数(因为三个概率之和必须为 1)。但是您对“中间”结果的概率不感兴趣,因此您可以将其作为讨厌的参数,并将“顶部”和“底部”结果的数量之间的差异作为感兴趣的参数。

很容易证明(使用费雪-内曼分解定理)“顶部”和“底部”结果的数量一起形成了感兴趣参数的(二维)充分统计量,即“中间”结果的数量不'不提供有关感兴趣参数值的任何附加信息。“中间”结果的数量显然是令人讨厌的参数的充分统计数据。如果我们以后者为条件,我认为(没有正确检查)由此产生的条件可能性最终将与二项分布的可能性相同,即抛硬币问题。

如果你把它作为一个二项式问题(p,1-p),而不是一个多项式问题,你将只能描述过去。关于未来,你将无话可说。为什么?您对数据的重新组合暗示了您删除了中间的“边缘翻转”。

换句话说,您的“数据描述”概率“p”的正面结果和概率“1-p”的负面结果将不适用于下一次“硬币的二项式抛硬币”,因为在未来你真的有概率“x”、“y”和“(1-xy)”。

编辑(03/27/2011)================================

我添加了下图以帮助解释我在下面的评论。

在此处输入图像描述