在直方图中选择 bin 数量的方法

数据挖掘 统计数据 可视化
2022-02-08 19:45:20

选择直方图中的 bin 数量一直是让我思考很多的事情。根据选择的箱数,当时的图表看起来有很大不同,也可能导致不同的解释。

下面是平方根规则,我在大多数情况下将其用作选择箱数的拇指规则。

在此处发布此问题以听取其他意见。

data_pts = len(np.array(data))
bin_cnt = int(np.sqrt(data_pts))

plt.hist(data, bins=bin_cnt)
1个回答

另一种方法是来自天文时间序列分析研究的贝叶斯块。六、Scargle 等人的贝叶斯块表示

贝叶斯块是一种动态直方图方法,它优化几个可能的适应度函数中的一个来确定数据的最佳分箱,其中箱的宽度不一定是均匀的。

直方图的贝叶斯块