我有一个数据集,我针对分配。该情节包括在下面。
我的统计数据至少可以说是生疏了(这意味着我现在所掌握的一点知识都已经生锈了!)显然正态分布并不适合——我的数据中的尾部比正态分布中的尾部更重。但相对于正态分布,数据似乎没有倾斜。
那么,哪种分布可能更合适?像 Box-Cox 这样的转变是否可以治愈以使其更适合?
编辑:
我的数据并不是严格意义上的正数,所以 Box-Cox 出局了……但可能还有另一种有效的转换。
编辑2:
我有越来越大的数据集,我需要看看数据集收敛到什么(如果有的话)。这是探索性分析,我宁愿找到适合数据的分布,也不愿将数据转换为分布。所有这些都是使用 SciPy 完成的,它将有偏峰度的渐近值报告为 -1,偏度报告为 0。
但我不知道如何使用这些信息来确定这可能是哪个分布,除了检查所有分布以查看哪些分布更好.
编辑3:
根据 gung 的评论,我根据均匀分布对其进行了检查:
果然,这要好得多,尽管尾部仍然有所不同。