对于 ANOVA 或 t 检验,样本是否可能太大?

机器算法验证 方差分析 t检验 规模效应 大数据
2022-03-14 04:33:36

我有接近一百万个数据集,每当我进行平均比较检验(ANOVA 或 t 检验)时,我在 SPSS 上得到的显着性水平低于 0.0001。我担心我的样本太大了,当然当我比较平均值时,它会显示出显着不同。对于 ANOVA 或 t 检验,样本是否可能太大?

2个回答

不,对于 ANOVA 或 t 检验,样本不能太大。你几乎总是会得到统计上显着的结果,因为你有很大的权力;但是,这并不意味着您检测到错误的差异。事实上,无论你有多少案例,不存在的影响都不会变得显着。这是一个普遍的误解。

然而,强大的力量意味着您可能会发现在大小方面几乎毫无意义的差异。例如,也许你发现两个种族平均身高不同,但相差只有半毫米。

确保解释与您的统计测试相关的效应大小。在这种情况下,p 值的价值小于效应大小(通常是这样)!

建议您查看以下内容(所有内容都非常易读且非技术性)。
1. Anderson DR、Burnham KP、Thompson WL (2000) 零假设检验:问题、普遍性和替代方案。野生动物管理杂志 64:912-923。2. Gigerenzer G (2004) 无意识统计。社会经济学杂志 33:587-606。3. Johnson DH (1999) 统计显着性检验的重要性。野生动物管理杂志 63:763-772。