我知道Kullback-Leibler 散度和Kolmogorov-Smirnov 检验是不同的,应该在不同的场景中使用。但是它们在很多方面都很相似,并且给定两个分布,我们可以在 KS 检验下根据比特和 p 值计算它们的 KL 散度(还有其他指标,如Jensen-Shannon 散度和许多其他假设检验方法。但是让我们这里只谈KL散度和KS检验。)
我的问题是:在什么情况下,KS 检验会提供一个非常小的 p 值,但 KL 散度会给我们一个非常小的距离?它背后的直觉是什么?如果能有具体的例子就更好了。