中值绝对偏差 (MAD)/SD 能否用于确定分布是否正态?
被认为是正态性的正式检验:如果 =(样本)中位数与中位数的绝对偏差且 = 标准差,那么您确实可以使用 (或其倒数)之类的度量作为检验统计量正态性检验。
但是请注意,这样的测试不能告诉您某些事情是正常的,只是 - 有时 - 不是。
为了使它成为一个测试,您所需要的只是各种样本大小的零下(即正态)比率分布的分布/百分位数表。例如,这可以通过模拟获得——尽管也可以通过分析获得。
它实际上与 Geary[1] 提出的一个旧的检验统计量很接近,它是平均偏差与标准偏差的比率,有时被称为 Geary许多检验统计量,因此有必要区分它们,他使用和后来的来表示平均偏差与标准偏差的比率)。
与 Shapiro-Wilk 测试相比, Geary 的测试在中小型样本中具有相当好的功效,适用于各种对称替代方案,在许多情况下都击败了它。在我的记忆中,它对后勤和拉普拉斯等较重的尾端案件具有相当好的能力。你的提案应该有一些相似的属性。
实际上,我认为针对拉普拉斯替代方案的正态性似然比检验将对应于查看中位数与标准差的平均偏差的比率(这将是第三个统计数据,比你的更像 Geary 的)。
[我的猜测是,Geary 的统计量在对抗逻辑替代方案时比你的更有能力,但你的测试统计量可能比 Laplace 更能与更尖峰和更重尾的替代方案竞争——我是一个替代方案的例子'希望它在基于两个独立标准法线乘积分布的位置尺度族方面做得特别好。它也可能在对抗具有低 df 的 t 分布之类的情况下表现得相当好。看看这样的猜测是否成立,以及它在其他情况下是否表现良好将会很有趣。]
然而,与一般替代方案相比,功率有时可能很差 - 例如,与广泛使用的方案相比,我们应该预期相对于轻尾、偏斜替代方案(至少中值绝对偏差与标准偏差具有相似总体比率的方案)的功率相对较低综合测试。但是,许多感兴趣的偏斜替代方案也是重尾的,因此与其中一些替代方案相比,它可能仍然表现得相当好。
它并不适用于所有情况,但如果您预期它应该具有相当好的功能的替代方案,它可能会很好地工作。
有许多论文调查了 Geary 的测试,但我不记得你提出的统计数据。我敢打赌它已经被看过了,但是我通过快速搜索没有找到任何关于它的论文。
我最接近的是 Gel 等人 [2],它讨论了基于标准偏差与中位数的平均偏差之比的测试(他们称之为 MAAD),这将是我为上述拉普拉斯替代方案建议的测试版本. 他们说,与基于 MAAD 的测试相比,MAD 对抗重尾替代品的能力较低(他们说这是由于 MAD 在正常情况下的方差较高),但他们没有提供更多细节(但是,他们确实说 MAD 更适合诊断显示,这与我下面的第 2 点有关)。除了简短的提及之外,我在功率比较方面没有发现任何其他内容。
这类测试的一大优势是它们的简单性。他们不需要专门的例程来计算统计数据,并且可以在小样本中手动计算,即使对于初学者也是如此。在 Geary 测试的情况下,有一个正态近似值(D'Agostino,1970 [3]) ;这里的中到大样本也可能存在合适的正态近似。在我们可能真正关心识别的情况下,它们也可以具有良好的功率,这可能使它们值得考虑——当然值得花一点时间更仔细地调查功率属性,并进行一些调查以找到任何以前的测试调查。
作为诊断工具。而不是一个正式的测试(它可能会回答一个我们已经知道答案的问题,而不是一个我们最好回答的问题),我们可以使用比率作为诊断——衡量我们可能离正常有多远(实际上是一种特定非正态性的原始“效应大小”)。
例如,如果我们特别关心我们的分布有多重尾,那么这种比率可能值得考虑作为这种情况的诊断措施,而不是计算诸如峰度之类的东西。
*(即在这种情况下具有相对较高的功率)
[1] Geary, RC 1935。“作为正态性检验的平均偏差与标准偏差的比率。” 生物计量学 27:310-332
[2] Gel, YR, Miao, W. 和 Gastwirth, JL (2007) 针对重尾替代品的正态性稳健定向测试。计算统计和数据分析 51, 2734-2746。
[3] D'Agostino, Ralph B. (1970),
“简单紧凑的正态性便携式测试:重新审视 Geary 的测试”
心理学公报,第 74 卷(2),8 月,138-140