Cramér 的 V 可以用作 McNemar 检验的效应量吗?

机器算法验证 重复测量 规模效应 mcnemar 测试 克莱默斯-v
2022-04-13 15:25:40

我正在使用 McNemar 的精确测试(使用 R 的“mcnemar.exact”函数)。我知道给出优势比或比例将是效应大小(McNemar 检验的效应大小)的充分衡量标准,但我被明确要求报告 Cramér's V。在这种(重复测量)情况下,Cramér's V 是否足够?

指向 R 代码的指针也将不胜感激。

如果有人需要更多详细信息:同一主题被测量两次,两种情况下的结果都是二元的。我对两次测量之间“真实”概率的差异感兴趣。计数相当小,例如:

           trial 2
trial 1  True  False
  True      9     10
  False     0      6
2个回答

Cramér 的与 McNemar 测试的测试结果不太相符。V

编辑:披露:下面引用的网页和 R 包是我的。

McNemar 检验最常见的效应量统计量可能是优势比,尽管可以使用Cohen (1988) 也使用了他称之为的统计量。gP

对于定义,从这里引用

考虑一个 2 x 2 表,其中是一致单元格, 是不一致单元格,优势比只是中的较大者,而科恩的adbc(b/c)(c/b)P(b/(b+c))(c/(b+c))gP0.5

Cohen (1988) 还统计量给出了解释(“小”、“中”、“大”)g因为与优势比单调相关,所以这些解释可以扩展到优势比(相同链接)。 编辑:效应量统计的解释总是与研究领域、具体实验和实际考虑相关。科恩的解释不应该被认为是普遍的。g

显然,计算 2 x 2 情况下的任何这些统计数据不需要太多编码。但是,如果将它们扩展到更大的表,数学就会变得棘手。在 R中,包中cohenG()函数rcompanion使这相对容易。

链接包括 R 代码。


参考:Cohen, J. 1988。行为科学的统计功效分析,第 2 版。劳特利奇。

在 2x2 表的上下文中,Cramer 的等效于 phi 系数。此外,phi 相当于分解 2x2 表时这对应的量级与 McNemar 的测试所测试的量级不同。所以,,我认为这不是一个好的选择。 V10

通过 McNemar 的检验,您正在比较两个边际比例(在您的情况下,)。展示完整的表格非常简单,因为它只有四个数字。但是,呈现这些比例以及从中得出的任何大小对您所在领域的人来说最有意义(例如,优势比)可能在心理上有所帮助。您甚至可以明确引用 McNemar 测试使用的单元格。例如: 76%36%

有 10 起人们改变主意的案例;在所有这些情况下,人们从真到假。