我有两个正态分布,我想测试它们是否具有相同的标准差,我真的不在乎平均值。
我的想法是:对它们都进行去均值,然后使用Kolmogorov-Smirnov来测试分布是否不同,如果它们不同,那么标准偏差也应该不同。
我想知道我是否遗漏了什么,以及是否有更好的方法来做到这一点。
我有两个正态分布,我想测试它们是否具有相同的标准差,我真的不在乎平均值。
我的想法是:对它们都进行去均值,然后使用Kolmogorov-Smirnov来测试分布是否不同,如果它们不同,那么标准偏差也应该不同。
我想知道我是否遗漏了什么,以及是否有更好的方法来做到这一点。
1)您建议的方法不会具有实际 Kolmogorov-Smirnov-statistic 的零分布。您实际上可以执行该过程来计算检验统计量,但要找到 p 值,您必须找到结果检验统计量的分布(可能通过模拟),或者可能执行置换检验。
2)如果您知道它们是正常的,则方差相等的 F 检验(如评论中建议的 mark999)可能是要走的路,因为它将是似然比检验。如果分布可能是非正态分布,则该 F 检验可能会受到该假设失败的严重影响,您可能会转而查看 Levene 或 Brown-Forsythe(也在链接中提到),或其他一些相对不那么敏感的 -对方差相等的假设检验。
(如果样本量相等,则 F 检验的水平不会受到严重影响,尽管功效可能仍然相对较差。)
另一种方法可能是保留 F 统计量,但将其用作基于重采样的方法的基础,例如自举或置换测试。但是,如果您正在考虑这样一条路线,那么将其基于更强大的规模度量之一可能是明智的(因为异常值对功率的潜在影响) - 如果您有接近正常的数据,您可能会想选择一个在正常情况下效率相当好的(链接中提到的三个是,和二权中方差)。
您可能想根据您的问题中的一些术语和此处的回复搜索 CrossValidated - 您将能够找到一些额外的讨论和建议。
例如,一个这样的搜索出现了这个、这个和这个,其中最后一个包括Alan Forsythe 的这个答案。
Allingham 和 Rayner[1] 建议基于 Wald 检验的差异(而不是比率)进行检验,该检验在所考虑的重尾正态分布上比 F 检验具有更好的水平稳健性(通常几乎为在水平上与 Levene 一样好,但在保守方面犯了错误,而 Levene 往往会超过水平)在正常情况下具有良好的功率(在较大的样本量下略胜于 Levene,在非常小的样本量下通常不那么好)。如果两个样本量都高于 25 左右,则值得考虑进行此测试。
除了我提到的那些之外,这里的额外搜索将出现一两个其他可能性。
[1]: Allingham, D. & JCW Rayner (2012),
“Testing Equality of Variances for Multiple Univariate Normal Populations”,
Journal of Statistical Theory and Practice , 6 :3, 524-535 (这里
有 2011 年会议论文版本)