什么是 Hellinger 距离以及何时使用它?

数据挖掘 机器学习 数据挖掘 文本挖掘 距离
2021-09-24 22:35:43

我有兴趣了解 Hellinger Distance 中真正发生的事情(简单来说)。此外,我还想知道我们可以使用海灵格距离的问题类型是什么?使用 Hellinger 距离有什么好处?

1个回答

海灵格距离是衡量两个概率分布之间差异的度量。它是欧几里得距离的概率模拟。

给定两个概率分布,PQ, Hellinger 距离定义为:

h(P,Q)=12PQ2

在量化两个概率分布之间的差异时很有用。例如,如果您估计服务的用户和非用户的分布。如果对于某些特征,这些组之间的 Hellinger 距离很小,那么这些特征在统计上对分割没有用处。