对于不是 2x2 的列联表,Fisher 精确检验的最佳替代方法是什么?

数据挖掘 分类数据 相关性 卡方检验
2022-03-09 13:46:35

我是数据挖掘的新手。我试图找到两个分类变量之间的关联。由于超过 20% 的预期频率小于 5,我想使用 Fisher 精确检验,但事实证明它通常用于 2x2 列联表,但我的变量有两个以上的值。非常感谢现在对我来说最好的行动方案的建议。以下是我在搜索后找到的一些选项:

  1. 使用 Freeman-Halton 扩展对超过 2x2 的表进行 Fisher 精确检验。
  2. 合并多个属性值,以便我最终得到 2x2 列联表,然后使用 Fisher 精确检验。
  3. 合并多个属性值,以便我最终得到预期计数 > 5,然后使用卡方检验进行独立性。
  4. 使用 Crammer V 测试。

我想知道在这种情况下,当您的具有> 2 个可能值的分类变量最终少于 5 个预期计数时,标准做法是什么?

谢谢,

1个回答

Fisher 的精确检验可以很好地推广到任意维度的表格,并且适用于此处(Metha 和 Pathel,2012 年)

例如,您可以使用fisher.test内置函数在 R 中计算它。