我读过方差的卡方检验要求样本足够大。在这个答案:p-value and equivalence testing中,建议对小样本进行方差卡方检验。我查看了各种网站,但似乎没有找到这些信息。对(通常)运行方差卡方检验所需的样本量有什么见解?
建议用于方差卡方检验的样本量
如果您使用与 则所需的样本量取决于大于对您的重要性。假设您希望检测实际方差是否为或更大也就是说,您希望测试的“功效”为 90%。观察是否足够?
因为如果\,其中临界值的上尾切开概率
qchisq(.95, 99)
[1] 123.2252
的人群 中尝试几个大小为的正常样本,看看会发生什么。[平均值的值无关紧要;我使用了 200。] 大多数情况下,检验统计量的值低于(如图所示),但偶尔(未显示)结果超过这应该在 5% 的情况下发生。
set.seed(1234)
x = rnorm(100, 200, sqrt(64))
99*var(x)/64
[1] 99.87417
x = rnorm(100, 200, sqrt(64))
99*var(x)/64
[1] 105.4757
相反,如果那么在大多数情况下我们应该得到
set.seed(1235)
x = rnorm(100, 200, sqrt(100))
99*var(x)/64
[1] 170.5568
x = rnorm(100, 200, sqrt(100))
99*var(x)/64
[1] 185.5564
x = rnorm(100, 200, sqrt(100))
99*var(x)/64
[1] 155.7088
具有一百万个大小为的样本的模拟表明功率高于 90%所以就足够了。
set.seed(2021)
q.a = replicate( 10^6, 99*var(rnorm(100,200,sqrt(100))) /64 )
mean(q.a > c)
[1] 0.93268
2*sd(q.a > c)/1000
[1] 0.000501151
注: (1) 许多统计软件程序包括用于此类检验的“功效和样本量”程序。还有一些在线计算器(我没有审查过)。的 95% 置信区间有一个标准公式;您可以使用它来初步猜测需要什么。(3) 此外,仿真并不是真正需要的电源。也许您可以使用我所展示的内容在 R 中找到直接计算的功率。
即使对于非常小的样本量,该测试也“像广告一样工作”,但对正态性假设非常敏感(例如,它通常对峰度的变化敏感)。
它明显比 t 检验对正态性假设的水平更敏感,在这种情况下,大样本不会倾向于缓解问题。
因此,许多人倾向于避免基于正态的方差检验(卡方,尤其是 F)。
即使您确实有接近正态性,您对小样本量(一如既往)的大担忧通常也会与权力有关(当假设成立或几乎如此时,测试的工作原理就是它按照盒子上所说的那样 -在选定的显着性水平上测试假设——但可能仍然具有较差的功效)。
如果您确信您将拥有接近正态的总体分布(不要使用数据测试来决定这一点),并且您确实有想要检测的特定效果大小,以及您想要的特定功效效应量和特定显着性水平,您可以通过涉及非中心卡方分布的计算来计算样本量。或者可以使用模拟(实际上,模拟具有一些优势,因为您可以轻松地从假设中调查不同情况的影响)。
如果您的样本量很大(听起来不像),您可能会考虑引导测试。