卡方/G 检验/Fisher 精确与重复

机器算法验证 假设检验 卡方检验 渔民精确测试
2022-04-08 20:27:13

我想使用 Fisher 精确或 G 检验/卡方(选择取决于特定情况下的观察次数)来测试重复的观察组之间和内部的物种频率差异。这是一些玩具数据

    1.1 1.2 1.3 2.1 2.2 2.3
spec1   1   2   1   3   5   4
spec2   4   4   6   0   1   1
spec3   10  12  9   9   10  10

第一行表示样本。样品 ID 的第一个数字代表一个重复组,第二个数字代表一个重复。这是为第一个物种折叠的数据集的示例。

spec1   1   2   1   3   5   4
others  14  16  15  9   11  11

比较组内的重复很容易,因为我们可以简单地执行一堆成对测试并应用一些多重比较 p 值调整,但是当我们比较不同组时如何处理重复呢?我们可以将它们组合成一个样本吗?

我知道这篇文章,但它没有答案。

1个回答

测试物种频率

我理解 OP 的第一个问题是“物种 1、2 和 3 在所有六列中的比例是否相同?” 我认为如果单元格计数足够高(这是另一个主题),则可以应用对行和列的独立性进行卡方检验。

什么时候可以合并计数数据?

我对这个主题的阅读表明,如果可以证明数据(重复)是同质的,则可以组合计数数据。Zar [1] 描述了通过异质性卡方组合多个拟合优度检验(第 22.6 节)或多个 2x2 列联表(第 23.4 节)该检验是通过分别计算每个重复的卡方统计量来执行的,然后将这些卡方统计量的总和与从合并数据中得出的卡方统计量进行比较。Zar 详细描述了这些步骤,此页面也是如此。

[1]:杰罗德·H·扎尔。1999. 生物统计分析,第 4 版。