如标题所示,我有两组相同的数据。我使用 R 进行了配对 t 检验。
估计的差值(本质上为 0)的 p 值为 NaN。
我想知道这种情况下是否有理论上的 p 值。
如标题所示,我有两组相同的数据。我使用 R 进行了配对 t 检验。
估计的差值(本质上为 0)的 p 值为 NaN。
我想知道这种情况下是否有理论上的 p 值。
如果这两组数据是相同的,因为变量是在一组离散的值上定义的,那么 t 检验的假设是错误的,因为随机变量甚至不是连续的。
因此,任何正态理论计算都不会产生正确的 p 值。
我认为“正确”的 t 检验 p 值将是 NaN。
或者,考虑连续变量具有有限方差但差异具有方差 0 的退化情况。那么 t 统计量将为 0/0;我再次说那是“正确的”NaN。(编辑:该论点的更多细节在评论中)
但是,如果您(例如)假设差异有一些离散分布并得出似然比检验,或进行置换检验,您将得到(合法的)p 值 1,因为除了零差异之外的任何东西都会比全 0 差异“更极端”。
所以我认为 t 检验的合理 p 值实际上是 R 给你的,而如果你有离散变量并选择更合适的测试,合理的 p 值通常是 1。
配对 t 检验的原假设是两个配对样本的平均差等于零。
考虑到每一对都有相同的值,差异应始终等于 0,因此无法拒绝原假设。
这意味着 p-value = 1 或 NaN (0/0),但这并不意味着您应该得出任何结论。
p 值小于 0.05 将表明每个样本存在显着不同的平均值。