计算数据点是否是更大分布的一部分
数据挖掘
分配
2022-03-15 04:31:54
1个回答
解决您的问题的一种方法是询问您的两个数据集(规则点和不规则点)是否来自同一分布?
kolmogorov-smirnof 检验是一种常用工具,用于将数字放在来自同一分布的两个数据集的“可能性”上。
python scipy有这个测试的实现。
请注意,此检验对每个分布均值周围的差异比对边缘周围的差异更敏感。从问题中图表的外观来看,在您的情况下这不是问题,因此测试应该可以工作。
这是对测试的非常简洁的解释
其它你可能感兴趣的问题
