何时非配对测试的 p 值高于配对测试?

机器算法验证 t检验 配对比较
2022-04-08 04:48:08

我在两种条件下确定了一组受试者中的一些参数,这样每个受试者都在两种条件下进行了测试。我想知道条件是否对参数有影响。我的设计显然是配对的。然而,这个实验之前的经验让我相信受试者的反应在每次测量期间都是独立的。因此,我假设受试者是独立的,而不是配对的。因此,我决定使用非配对 t 检验分析数据。但出于好奇,我还进行了配对 t 检验,结果如下:

配对 T 检验的 P 值为 0.08(无差异)。未配对 T 检验的 P 值为 0.04(显着差异)。

我很困惑,因为我认为通过消除受试者之间的变异性和增加功效,配对测试应该始终提供比非配对测试更低的 p 值(或在最坏的情况下相等)。

问题:

1) 配对测试何时可以产生比非配对测试更高的 p 值?我的结果在变异来源方面意味着什么?似乎将受试者配对不仅不会消除受试者之间的变异性,而是增加了某种新的变异性。

2)这个结果能告诉我一些关于我假设受试者是独立的吗?它可以使这个假设无效吗?

3) 总之,在分析过程中配对或不配对主题总是一个选择问题吗?或者当受试者在逻辑上配对时使用非配对测试在形式上是不正确的?

1个回答
  1. 正如@whuber 在上面的评论中所说,当测量值呈负相关时,未配对测试中的 p 值可能低于配对测试中的 p 值。这是一个存在差异的示例:

    library(MASS)
    s  <- matrix(c(1, -0.8, -0.8, 1), 2)
    df <- mvrnorm(n=100, mu=c(0, 0.3), Sigma=s, empirical=TRUE)
    t.test(df[,1], df[, 2], paired=FALSE)
    t.test(df[,1], df[, 2], paired=TRUE)
    

    第一个测试(未配对)给出 p=0.035,第二个给出 p=0.117。

  2. 是的,这是一个设计问题。本书章节对此进行了讨论:Keren, G. (2014)。主体间或主体内设计:方法论困境。A Handbook for Data Analysis in the Behavioral Sciences: Volume 1: Methodological Issues Volume 2: Statistical Issues , 257,您可以在 Google 书籍上阅读其中的一些内容。

  3. 嗯...我不确定。我会做一个模拟来找出对 I 类错误率的影响。这如何影响你的权力是一个单独的问题,我在这里没有研究过。稍微改编一下我之前的代码:

    paired   <- rep(NA, 1000)
    unpaired <- rep(NA, 1000)
    for(i in 1:1000){
          df          <- mvrnorm(n=100, mu=c(0, 0), Sigma=s, empirical=FALSE)
          unpaired[i] <- t.test(df[,1], df[, 2], paired=FALSE)$p.value
          paired[i]   <- t.test(df[,1], df[, 2], paired=TRUE )$p.value
    }
    
    sum(paired < 0.05)
    sum(unpaired < 0.05)
    

    结果:

    > sum(paired < 0.05)
    [1] 46
    > sum(unpaired < 0.05)
    [1] 137
    

看看那个。如果您将它们视为未配对,则您的 I 型错误率会飙升。您需要将它们视为配对以获得正确答案。我相信(我已经很长时间没有阅读它了)这是 Keren 在该章中谈到的问题之一。如果您要获得可能是负相关的数据(例如汤的量和某人吃的汉堡量),那么未配对的设计将具有更大的功能。