我想知道比较两个(或更多)离散分布的最有效方法是什么。
我知道可以使用 Kolmogorov-Smirnov 检验(如果针对离散 ecdfs 进行了校正)和/或卡方检验,并且可以比较其他汇总统计数据(均值/方差/偏度 &c),但还有更多像Cramér–von_Mises 测试一样强大的测试?整个离散分布不太可能存在太大偏差,因此我希望测试具有尽可能大的功效,如果分布是来自连续分布的样本,C-vM 最适合这种情况.
一些背景:
多台机器生成固定长度的字符串,并添加“尾部”(随机整数 - 比如说 0 到 250 - 特殊字符)。改变机器所处的环境可能(也可能不会)改变尾长分布。
在不同时间点从机器中获取所有字符串将给出特殊字符尾长度的时变分布。
我想知道我们是否可以测试随着时间的推移尾长分布是否有显着变化。