我有多组数据(20 多组)并测试它们具有相同均值的零假设。拒绝原假设后如何进行?选择具有相同均值的组的标准方法是什么?
常识说,在这种情况下,必须进行成对的 t 检验。很难相信没有更有效的发明。此外,成对测试还有很多不足之处,例如
- 没有明确的算法/协议可以将可能具有相同平均值的组与关闭的组分开。(目视检查可能对一个实验有用,但如果你必须用不同的数据重复这种分析数百次怎么办?)
- 即使使用这样的协议,在成对 t 检验的基础上选择可能具有相同均值的组也会导致错误累积。
另一方面,成对检验的优点是我们可以有效地检验两组的原假设:TOST 等价检验。
我们在找什么?
以下是对这个问题有意义的答案(在我看来):
- 一种将可能具有共同均值的组与其他组分开的方法。如果该方法基于成对比较(而不是批量测试),它可能包括一些聚类过程。
- 具有共同均值的组的等价检验,即确认原假设而不是不拒绝它的检验。
- 上述任务的等效贝叶斯程序。
- 关于在拒绝零假设后可以在 ANOVA 设置中完成的事情的其他建议(也许寻找具有共同均值的组的子集并不是唯一有趣的目标。)
重要的
- 鼓励参考教科书和研究论文。
- 数学和算法比代码更好
- 偏好可扩展的方法——可以用于大量组和多次(例如目视检查不会)。
相关问题
在 ANOVA 的事后测试中,“单步”和“多步”是什么意思?
关于成对比较的备注
由于多个用户(正确地)注意到对 20 组进行成对比较在计算上并不那么困难(它涉及比较),我想再次解释为什么这不能解决问题(的明显的求知欲)。
假设您已完成所有成对比较(t 检验和等价检验),现在您正盯着一个 20×20 的 p 值表。下一步你要怎么做?在某些情况下,边缘群体是显而易见的——但在这些情况下,我们并不真正需要统计数据。
在一般情况下,您需要一种算法来选择具有共同均值的组。此外,您不太可能仅基于成对比较来做到这一点:A 组可能与 B 和 C 没有统计学差异,但 B 和 C 之间可能不同。
蛮力方法将对组的所有可能组合进行 ANOVA F 检验,其中 m 从 2 运行到 k-1。这给我们留下了
测试,这看起来比测试。这当然是夸大其词,但它设定了上限并希望澄清,为什么我会怀疑存在一种标准方法来找到具有共同平均值的组子集。
多重比较
@SalMangiafico 让我注意到紧凑型字母显示方法。它似乎更像是一种可视化而不是推理技术,但它让我看到了这篇文章,其中包含一些相关的参考资料:
- Hochberg, Y., Tamhane, AC, 1987。多重比较程序。威利。
- Hsu, JC, 1996。多重比较:理论和方法。Chap-man&Hall。
- Shaffer, JP, 1995。多重假设检验。心理学年度回顾 46, 561–584。谢弗
我还不确定这些书是否包含我的问题的答案:似乎该领域处理的不仅仅是多重比较引入的错误,而不是我上面提出的问题。如果有知识的人可以在这里写信或推荐一个关于这个主题的简短评论,我们将不胜感激。