哪种交叉表分析测试:Boschloo 或 Barnard?

机器算法验证 卡方检验 统计能力 列联表 渔民精确测试
2022-01-21 11:45:18

我正在从 30 名患者的小型数据集中分析 2x2 表。我们正在回顾性地试图找到一些变量,这些变量可以提示选择哪种治疗方法。变量(obs 正常/奇怪)和治疗决策 (A/B) 具有特殊意义,因此数据如下所示:

Obs/Tr. Dec.ABnormal121325strange055121830

显然,一个单元格缺少排除卡方检验的条目,Fisher 的精确检验没有给出饱和的 p 值(但仍然 <10%)。所以我的第一个想法是找到一个更强大的测试,我在 博客这篇关于 Barnard's 和 Boschloos 测试的文章中读到,一般来说,有三种场景可以产生一个强大的测试:

  1. 列和行和固定 Fisher 的精确检验
  2. 列或(专有)行和固定巴纳德的精确检验
  3. 没有一个是固定 Boschloos 的精确测试

上面的文章指出,治疗 A 和治疗 B 的总和几乎是以前从未知道的,因此我们可以排除费舍尔精确检验。但是其他选择呢?如果控制我们有健康对照的地方,我们可以控制安慰剂组和真实组,我们可以控制哪些数字,所以人们会选择 2:巴纳德。就我而言,我不确定,因为一方面我们有一个类似的数学问题(观察水平的总和等于安慰剂/验证的总和),这导致巴纳德,但设计不同,因为我们无法控制天然橡胶 在采取导致 3:Boschloo 的样本之前观察正常/奇怪。

那么应该使用哪种测试,为什么?我当然想要高功率。

(我想知道的另一个问题是,如果在chisq.testr 的情况下使用它不会更好prop.test(x, alternative = "greater")?理论方面在这里解释。)

1个回答

术语“Barnard”测试或“Boschloo”测试可能有些混淆。Barnard 的精确检验是无条件检验,因为它不以两个边际为条件。因此,第二个和第三个子弹都是巴纳德的考验​​。我们应该改为:

  1. 两个边距都固定(超几何距离)→Fisher 精确检验
  2. 一个边距固定 (Double Binomial Dist'n)→Barnard 精确检验
  3. 没有固定边距 (Multinomial Dist'n)→Barnard 精确检验

Barnard 的精确检验包含两种类型的表格,因此我们通过适当地使用“二项式”或“多项式”模型来区分这两种表格。

通常,Barnard 的精确检验要么使用 Z 池(又名得分)统计数据来确定“作为或更极端”的表。请注意,最初的 Barnard 论文(1947 年)使用更复杂的方法来确定更极端的表(称为“CSM”)。Boschloo 的精确检验使用 Fisher 的 p 值来确定“极端”表。Boschloo 的检验比 Fisher 的精确检验更有效。

对于您的数据集,听起来两个边距都没有固定,因此建议使用 Boschloo 的精确测试和多项模型。我发现 Boschloo 的测试对于不平衡的保证金比率稍好一些(尽管通常非常类似于 Barnard 的 Z-pooled 统计量的精确测试)。但是,由于 Boschloo 的检验和多项式模型的计算量要大得多,您也可以使用二项式模型(为什么这仍然适用的原因有点复杂;简要总结一下,边距是一个近似辅助统计量,所以以保证金为条件是可以的)。有关确切测试和实施信息的更多详细信息,请使用 Exact R 包(https://cran.r-project.org/web/packages/Exact/Exact.pdf)。我是包的作者,它是博客上代码的更新版本。