如何解释 Cochran-Mantel-Haenszel 检验?

机器算法验证 分类数据 解释 推理 列联表 渔民精确测试
2022-03-24 15:11:15

我正在测试由 C 分层的两个变量 A 和 B 的独立性。A 和 B 是二元变量,C 是分类变量(5 个值)。运行 Fisher 对 A 和 B 的精确测试(所有层组合),我得到:

##          (B)
##      (A) FALSE TRUE
##    FALSE  1841   85
##    TRUE    915   74

OR: 1.75 (1.25 --  2.44), p = 0.0007 *

其中 OR 是优势比(估计值和 95% 置信区间),*表示 p < 0.05。

对每个层(C)运行相同的测试,我得到:

C=1, OR: 2.31 (0.78 --  6.13), p = 0.0815
C=2, OR: 2.75 (1.21 --  6.15), p = 0.0088 *
C=3, OR: 0.94 (0.50 --  1.74), p = 0.8839
C=4, OR: 1.48 (0.77 --  2.89), p = 0.2196
C=5, OR: 3.38 (0.62 -- 34.11), p = 0.1731

最后,使用 A、B 和 C 运行Cochran-Mantel-Haenszel (CMH) 测试,我得到:

OR: 1.56 (1.12 --  2.18), p = 0.0089 *

CMH 检验的结果表明,A 和 B在每个层次上并不独立(p < 0.05);但是,大多数层内测试都不显着,这表明我们没有足够的证据来否定 A 和 B 在每个层都是独立的。

那么,什么结论是正确的呢?鉴于这些结果,如何报告结论?C是否可以被认为是一个混杂变量?

编辑:我对零假设进行了 Breslow-Day 检验,即各层的优势比相同,p 值为 0.1424。

1个回答

第一个测试告诉您,忽略C的 A 和 B 之间的优势比与1 不同。查看分层分析有助于您确定忽略 C 是否可以。

CMH 测试告诉您 A 和 B 之间的优势比(针对 C 进行调整)与 1 不同。它返回特定层的优势比的加权平均值,因此如果这些在某些层,它们可能会抵消并错误地告诉您 A 和 B 之间没有关联。所以我们必须测试是否假设 C 的所有水平的优势比相等(在总体水平)是合理的。交互的 Breslow-Day 检验正是这样做的,零假设所有层具有相同的优势比,这需要不等于一。该测试在 EpiR R 包中实现。Breslow-Day p 值为 0.14 意味着我们可以做出这个假设,因此调整后的优势比是合理的。<1>1

但这并不能帮助我们在 CMH 和 Fisher 精确(或 Pearson 的)测试之间做出决定。如果 Breslow-Day 检验显着,则需要报告特定层的优势比。既然不是,那你就需要问是否需要针对 C 进行调整。C 是否“混淆”了 A 和 B 之间的关联?我学到的启发式方法(不是统计测试)是检查未调整和调整后的优势比之间的比例差异是否超过 10%。这里,所以 CMH 是合适的。χ21.751.561.75=0.108