2 样本比例 z 检验与 Fisher 精确检验

机器算法验证 假设检验 部分 渔民精确测试
2022-03-29 00:05:54

我想评估从四分之一数据到下一个数据的拒绝申请和例外情况的比例差异。我的样本量一般不小(几百到几千),但比例可能在 1% 以下到 60% 之间,具体取决于具体的数据集。由于两个比较的比例不同,使用任何一个测试似乎都会产生相似的 p 值。但是,如果比例相对接近,则 z 检验和 Fisher 检验 p 值的差异更大。总体而言,任一测试下的显着性都趋于一致。基于我的数据和任何隐含的假设,在这种情况下是否更合适的测试?

我目前的研究似乎表明,Fisher 精确检验总是更好,因为它是精确检验,而 z 检验是渐近检验。这个对吗?如果是这种情况,为什么任何具有适当计算能力的人都会对 Fisher 精确检验的比例进行 z 检验?

1个回答

Fisher 精确检验通过使用给定数据集运行每个可能的场景并计算给定样本大小下可能成功的总数和可能失败的总数来提供更精确的 p 值,然后将这些总数转换为 p-价值。另请注意,可能的结果总数会增加一个阶乘。

正态近似值可以通过计算器计算,并且随着样本量变大更容易计算。随着样本量变大,正态近似值也变得更接近 Fisher 精确检验。