我说的是超几何测试,但逻辑可能也适用于二项式测试(和其他类似测试)。
基本场景
我在一个骨灰盒中有个白球和黑球。我画了一个没有替换个球的样本。我得到个白球和个黑球。
零假设:白球和黑球被采样的概率相同。
替代假设:白球和黑球被采样的概率不同。
单尾超几何检验
由于没有替代品,因此获得个白球的概率由超几何分布给出。我可以通过将 k 到 0 范围内的所有概率相加来计算样本中获得或小于球的概率。换句话说,我可以计算,其中是由超几何函数给出的绘制当我使用 R 时,这里是这个计算的 R 代码。phyper(q=q, m=m, n=n, k=k)
同样,我可以计算获得个或更多球的概率:。在 R 它给出phyper(q=q-1, m=m, n=n, k=k, lower.tail = FALSE)
我的问题是...
如何获得双尾超几何检验的 p.value?
从wiki我读到了双尾二项式检验:
有两种方法可以定义两个尾 p 值。一种方法是将任一方向上的事件数量与预期值的总偏差大于或小于预期值的概率相加。[..] 第二种方法涉及计算与预期值的偏差与观察值一样不可能或更不可能的概率,即通过概率密度函数的比较
我认为这与我需要的非常相关,但我不太明白!