两样本置换 Kolmogorov-Smirnov 检验

机器算法验证 假设检验
2022-03-18 13:24:45

虽然使用 Pearson 卡方/Cressie-Read 类型测试更容易,但我想Pettitt & Stephens (1977 )(另请参见此处)。k

特别是正如该论文的作者所指出的那样,它可能对趋势替代品具有一定的力量。所以他们的单样本名义/分类 Kolmogorov-Smirnov 检验具有以下形式: 其中是类别顺序的排列,是观察到的和预期的频率(或等效地,类中的观察比例)这可以等效地写成: 我想把它扩展到使用随机化/排列程序的两个样本案例,例如:

Dn=supπsup1jk|i=1j(fexp,π(i)fobs,π(i))|
πf.,ii
Dn=12i=1k|fexp,ifobs,i|
Dn(r)=12i=1k|fgroup1,i(r)fgroup2,i(r)|,r=1,,R
其中表示基于排列计算的统计量的分类变量。如果原始统计量的值大于置换统计 .(r)rth95%

非常欢迎对此类程序的优点/缺点/有效性提出任何意见。谢谢。

1个回答

答案取决于数据生成过程的性质以及您想到的替代假设。

您的测试是一种未加权的卡方。由于缺乏权重,主要影响人口较少的类别的变化将难以检测。例如,对于位置的均匀偏移,您的测试将不如卡方测试强大,这主要是通过注意到一条尾巴中的几乎所有概率都转移到另一条尾巴来检测的。

例如,假设您的类别是索引的 ,并且您正在观察单位方差的正态变量但均值未知。例如,一个标准正态变量的 100 个观测值将主要占据类别,尽管您可以预期少数占据类别标准误差的巨大变化(的平均值变化),您的类 KD 检验的功效也只有大约 50%(当时)。[i,i+1)i213255/100=0.5α=0.05

很难想象这个检验会比卡方检验更强大的设置。如果您认为自己处于这种情况,请执行一些模拟以找出功率是什么以及它与标准替代测试的比较。