我正在使用 python 的 scipy.stats 库对我拥有的一些数据集(成对获取)应用一些统计测试,测试它们是否都来自同一个未知分布。
我没有太多的统计学背景,所以请原谅我以下问题。我正在查看文档,我有一些疑问。
- scipy.stats.mannwhitneyu:它返回一个“假设渐近正态分布的单边 p 值”。为什么假设是正态分布?这个测试不应该适用于任何基础分布吗?
- scipy.stats.ttest_ind:此测试假设总体具有相同的方差。在我的情况下,我可以计算样本方差,所以一旦我这样做了,我应该只在它不相差某个阈值(哪一个?)时才应用测试?有趣的是,这只是统计测试,仅拒绝了我的一些假设,而其他大多数假设拒绝了其中的 80%。
- 事实上,我想测试一个数据集的分布是否明显大于所有其他数据集的分布。我应该在这里使用单面测试还是双面测试?这听起来可能很愚蠢,但在单边测试的情况下,我如何测试一个分布明显大于而不是明显更小的分布?我在 scipy 文档中找不到任何关于此的内容。交换参数会产生相同的结果。