测量两个经验分布之间的距离

机器算法验证 分布 距离函数
2022-03-29 23:16:24

这类似于 测量两个多元分布之间的“距离”问题,除了我想测量两个数据集之间的距离。我可以想象简单地计算平均值、标准差和其他汇总统计数据,然后以某种方式汇总每个分布的差异,但这在理论上似乎不太合理。

我想知道是否有一种普遍接受的方法来进行这种测量。

2个回答

我认为您的问题与我可以使用 Kolmogorov-Smirnov 比较两个经验分布吗?,为此通常使用 Kolmogorov-Smirnov 检验。KS 检验统计量是两个样本之间距离的自然度量。有关详细信息,请参阅Wikipedia 上的 Kolmogorov-Smirnov 测试

这个问题自然出现的统计领域是近似贝叶斯计算

您真正想要做的是将整个样本汇总为“信息丰富的”统计数据,以后可以使用合适的指标进行比较:这个问题一点也不小我什至会说它实际上是统计学中的“热门话题”之一。

不是该方法没有理论性,只是没有比较两个数据集的唯一方法。这通常取决于您的目标和模型。

如果您有一个模型并且可以为其识别足够的统计数据,那么通过比较两个样本的充分统计数据,您可以评估每个样本中包含的信息有多么不同。如果它们非常接近,则相关的 [似然函数] ( http://en.wikipedia.org/wiki/Likelihood_function) 将相似,因此对相应参数的推论也将相似。