让我们继续干掉百分之五的圣牛。
您(正确地)指出问题在于测试的旺盛力量。您可能希望将其重新校准为更相关的功率,例如更传统的 80% 值:
- 确定要检测的效应大小(例如,0.2% 偏移)
- 确定对你来说足够好的功率,以免它被压倒(例如,1−β=80%)
- 从现有的 Pearson 测试理论回溯,以确定使您的测试实用的水平。
假设您有 5 个概率相等的类别,,您的替代方案是。所以对于,。渐近分布是非中心卡方, (# categories-1) = 4 df 和非中心参数
有了这个的值很大足够接近。80%-tile 是p1=p2=p3=p4=p5=0.2p+δ/n−−√=(0.198,0.202,0.2,0.2,0.2)n=106δ=(−2,+2,0,0,0)k=
λ=∑jδ2j/pj=4/0.2+4/0.2=40
λN(μ=λ+k=44,σ2=2(k+2λ)=168)44+13⋅Φ−1(0.8)=44+13⋅0.84=54.91. 因此,您期望的测试水平是从 54.91 的逆尾 cdf:
所以这将是你应该的水平考虑测试您的数据,以便它有 80% 的能力来检测 0.2% 的差异。χ24Prob[χ24>54.91]=3.3⋅10−11
(请检查我的数学,这是一个荒谬的测试水平,但这就是你想要的大数据,不是吗?另一方面,如果你经常看到 Pearson在一对夫妇的范围内一百,这可能是一个完全有意义的关键价值来招待。)χ2
请记住,尽管 null 和替代的近似值可能在尾部效果不佳,请参阅此讨论。