我可以重新采样两个数据集然后执行 t 检验吗?

机器算法验证 t检验 重采样
2022-04-02 20:45:10

我有两个数据集,每个数据集有 35 个点。我知道两者都是从方差相等的正态分布中提取的。两个样本的 t 检验表明它们具有相同的均值,但 p 值接近我的 alpha。

  1. 知道它们是具有相等方差的正态分布,仅使用相对样本均值创建正态分布,从每个样本中抽取 1,000 个点,然后执行两个样本的 t 检验是否有意义?

  2. 这样做会很有成效吗,即我可以期待学到新的东西吗?

2个回答

不,您将确保自己最终拒绝对于足够大的样本量的相等性原假设(除非样本均值之间的差异很小,否则 1000 应该可以解决问题)。所有这一切都是为了确认您已经知道样本均值不同的观察结果。

但为什么?您的数据尽可能理想。它几乎满足了大二统计的所有假设。人们只写这类问题。

重采样让您面临模拟噪音,您可能会因为模拟错误而错误地拒绝/未能拒绝。统计显着性本身并不显着。