我可以说我的变量是“近似”正态分布的吗?

数据挖掘 机器学习 数据挖掘 分配
2022-02-21 12:14:19

我正在研究一个关于 50000 个观察值的变量,我应用了 cox 盒变换使其正常,但即使有变换,kolmogorov smirnof 和安德森宠儿测试告诉我,我的分布不正常,考虑到我拥有的 qqplot 和我可以说我的变量大致正常吗?我想使用参数测试,但所有测试都依赖于正态假设

在此处输入图像描述

在此处输入图像描述

2个回答

您的数据已经分箱。您应该进行卡方检验,以查看您的数据呈正态分布的假设是否正确。您可以参考这个问题来了解如何解决这个问题。

您将基线设置为具有数据集中均值和方差的正态分布。然后,您将测试正态分布与您的期望值之间的差异。

许多人会告诉您,正态性检验过于敏感,特别是考虑到大多数统计检验对于甚至严重偏离正态性都是稳健的。如果您非常担心,无论如何都要进行参数测试以及非参数测试,如果最终结果一致,请坚持使用参数测试。