在可视化一维数据时,通常使用核密度估计技术来解释选择不当的 bin 宽度。
当我的一维数据集具有测量不确定性时,是否有标准方法来整合这些信息?
例如(如果我的理解很幼稚,请原谅我)KDE 将高斯轮廓与观测值的 delta 函数进行卷积。这个高斯核在每个位置之间共享,但是可以改变有执行此操作的标准方法吗?我希望用宽内核来反映不确定的值。
我已经在 Python 中简单地实现了这一点,但我不知道执行此操作的标准方法或函数。这种技术有什么问题吗?我确实注意到它给出了一些看起来很奇怪的图表!例如
在这种情况下,低值具有较大的不确定性,因此倾向于提供宽平坦的内核,而 KDE 会过度加权低(和不确定)值。