运行测试似乎是合适的,最后引用的文献开发了多个类别的测试统计量。不幸的是,这篇论文是付费的,但这里是测试统计数据的简要介绍(此处相关页面的屏幕截图)。
对于每个单独的组,我们可以计算;
- ns=Number of successes
- rs=Number of success runs
- s2s=Sample variance of success run lengths
- cs=(r2−1)(r+2)(r+3)/[2r(n−r−1)(n+1)]
- vs=cn(n−r)/[r(r+1)]
然后你为每个单独的组计算这个,测试统计量是每个的总和,并分布为和自由度。cs⋅s2sχ2∑vi
因此,假设我们有一个三个不同组的运行长度表,如下所示;
Data: 221331333121112112212112122
Length Group1 Group2 Group3
-----------------------------
1 5 4 0
2 2 3 1
3 1 0 1
-----------------------------
n_s 12 10 5
r_s 8 7 2
s_s 0.6 0.3 0.5
c_s 11.1 14.0 1.3
v_s 7.4 7.5 3.1
-----------------------------
x^2 = (0.6*11.1) + (0.3*14) + (0.5*1.3) = 11
DF = 7.4 + 7.5 + 3.1 = 18
评估检验统计量右侧的区域为 0.9,因此在这种情况下,我们要么无法拒绝运行分布是随机分布的原假设。虽然它与另一条尾巴相当接近,因此这是数据比您偶然预期的更分散的边缘证据(因为这是评估卡方分布的左尾的情况之一)。
奥布莱恩、彼得 C. 和彼得 J. 戴克。1985. 基于运行长度的运行测试。生物识别学 41 (1):237-244。
我已经在这个 dropbox 链接上发布了一个关于在 SPSS 中估计这个的代码片段。它包括此处的合成示例,以及复制 O'Brien & Dyck 论文中的表和统计信息的代码示例(在一组看起来像他们的合成数据上)。