两组置换检验

数据挖掘 统计数据 测试 置换检验 假设检验
2022-02-17 15:41:44

我正在尝试使用置换检验来检验我的假设。

我想确保我正确理解排列的概念。

我有控制组和实验组。然后我将它们组合并从组合数据集中重新采样,随机计算所需的统计数据。这样做 N 次并将它们分布在直方图上,以查看我观察到的统计数据的位置。

在“数据科学家的实用统计”一书中,它说从组合数据(不替换)重新采样与我的案例对照组中的 groupA 相同的大小。那么既然我只有两组,其余的只是groupB(实验组)?

所以我的问题简单地说,当首先对两组使用置换测试时,你重新采样 groupA 的大小,然后休息自动成为 groupB 的重新采样?

1个回答

是的,您可以从整个人口中重新采样而无需替换NA与组关联的样本A,其余样本与组相关联B. 据我了解,您计算总人口的每个可能排列的统计数据,并测量实际统计数据在所有排列分布中的比较情况。

如果您的统计数据在所有可能排列的分布中不是极端的,那么很可能H0是真的。否则,如果您的统计数据是该分布的异常值,则很可能H0是假的。