非对称分布的核密度估计

机器算法验证 可能性 分布 密度函数 内核平滑
2022-03-17 09:45:45

是从未知(但肯定是不对称的)概率分布中得出的观察结果。{x1,,xN}

我想通过使用 KDE 方法找到概率分布: 但是,我尝试使用高斯内核,但它表现不佳,因为它是对称的。因此,我看到一些关于 Gamma 和 Beta 内核的工作已经发布,尽管我不明白如何使用它们。

f^(x)=1Nhi=1NK(xxih)

我的问题是:假设基础分布的支持不在区间内,如何处理这种不对称情况?[0,1]

2个回答

首先,当您的数据不对称时,具有对称内核的 KDE 也可以很好地工作。否则,实际上它在实践中将完全没有用。

其次,如果您认为这是导致问题的原因,您是否考虑过重新调整数据以修复不对称性。例如,尝试转到可能是个好主意,因为众所周知这有助于解决许多问题。log(x)

唔。您可能需要一个随位置变化的内核宽度。

如果我正在查看 eCDF 中的问题,那么我可能会尝试使 CDF 的数值斜率与内核大小相关。

我认为,如果您要进行坐标变换,那么您需要对起点和终点有一个很好的了解。如果您非常了解目标分布,则不需要内核近似值。