二进制数据的配对 t 检验

机器算法验证 t检验 正态假设 威尔克森符号秩 配对比较 配对数据
2022-03-14 08:36:51

我有一个 n=170 的样本和两个二进制变量 (A,B),它们的值可以为 1 或 0,其中 1 被视为成功,0 被视为失败。我想知道的是这两个变量的均值是否相等。

为了弄清楚这一点,我生成了一个新变量,它采用这两个变量之间的差异,称为 C,因此 C = BA。然后,我使用 Shapiro-Wilk 检验计算 C 为正态分布的假设的 p 值,我发现 p 值为 0.96,因此我选择不拒绝这个假设。除了差异呈正态分布之外,我不担心配对 t 检验所需的其他假设。

问题: 在这种情况下我可以使用配对 t 检验,还是使用 Shapiro-Wilk 检验来检查二元数据的正态性是错误的,我应该改用 Wilcoxon 符号秩检验吗?

我更喜欢使用 t 检验,因为我相信它比 Wilcoxon 符号等级检验具有更高的功效,但是如果使用的检验是错误的,那么更高的功效几乎无关紧要。

干杯,

马丁

3个回答

如果我正确理解上下文,那么McNemar 的测试正是您想要的。它比较了在每个受试者中测量的两个二项式变量,类似于配对卡方检验。关键是你的数据是成对的——你已经测量了每个主题的两个不同的二项式结果,所以需要一个测试来解释这一点。

这里有几件事。

  1. 对于二项式数据,方差直接由均值决定,不是附加参数,因此无需进行 t 检验……正常的 z 检验效率略高。
  2. 对于二项式数据,正态近似(即 Wald 检验)通常会失败。有关更详细的讨论和模拟研究,请参见 Agresti 和 Coull,1998。 http://www.stat.ufl.edu/~aa/articles/agresti_coull_1998.pdf

他们给出了一些关于何时可以使用或不使用正态性假设的建议(与其他人一样)……通常越接近 p=.5,数据集越大,越好,越远从 0.5 你得到(朝向 p=0 或 p=1),或者数据越小,情况就越糟。

但是 Wilcoxon 符号秩检验对于这类数据很受欢迎。

您使用的是“平均”一词,但实际上您是在比较“比例”,因为您的变量是分类的。我会忽略正态性的任何问题,因为比例的抽样分布将是正常的(忽略一些病理情况,例如在这里不是问题的低样本量或接近的比例)。0100

我建议查看 wiki 上的二比例 z 检验:Common Statistical Tests在表格中搜索“二比例z检验”,了解相关检验及其有效条件。