测试一组数据点的 (x,y) 是否显着大于另一组数据点的 (x,y)

机器算法验证 假设检验
2022-04-11 08:55:59

什么是最适合测试蓝色点的(x,y)坐标分布与红色点的(x,y)坐标分布是否显着不同的统计测试。我也想知道这种差异的方向性。彩色数据点是带有标签的数据点,蓝色标签与红色标签不同。白色数据点只是未标记,因此很可能被忽略。

在此处输入图像描述

2个回答

测试两个一维分布函数是否不同的典型方法是使用基于统计量的 Kolmogorov-Smirnov 检验:

supx|F1(x)F2(x)|

问题是在更高的维度中,有种方法来定义分布函数。有许多关于高维 KS 测试的论文。下面是一个链接,该链接讨论了执行此类测试的一些有效方法。2d1

二维KS测试

鉴于图表中的样本量较小,Wilcoxon 秩和检验似乎适合比较红色组和蓝色组中的 y 值。