R中的Jarque-Bera正态性检验

机器算法验证 r 假设检验 正态假设
2022-04-14 17:22:59

即使存在偏度和峰度,Jarque-Bera 正态性​​检验也具有显着的 p 值。这是否意味着测试推断数据分布大致正常?

1个回答

您可能误解了关于假设检验或拟合优度检验的某些内容,或者可能特别是关于“Jarque-Bera”检验*

请注意,当 p 值较小时,当偏度和峰度与正态下的预期值不同时,您会拒绝。

检验统计量的形式(来自 Bowman 和 Shenton论文的第 1 页):

n6S2+n24(K3)2,

在哪里S是样本偏度和K是样本峰度(即K3是“过度峰度”)

原假设是正态的,拒绝假设(因为 p 值显着)导致得出的结论是,数据来自的分布是非正态的。

该测试专门寻找与正常值不同的偏度和峰度(它对标准化偏差进行平方并将它们求和),并且在存在偏离正常值的偏度和峰度时往往很重要。

也就是说 - 当您通过此测试获得重要的测试统计数据时,这显然是因为样本偏度或峰度(或两者)与您期望从正态分布的样本中看到的不同。

但是请注意 - 测试所基于的渐近近似的出现速度非常慢(请参阅此答案底部附近的图像;另请参阅此处此处了解一些附加点)。如果不模拟测试统计量的分布,我不会依赖它,除非n比说 100 大很多。

以下是 n=30(模拟值)的正态样本中的联合分布示例:

在此处输入图像描述

- 如您所见,根本不接近二元正态。


*(测试的发展早于他们 1980 年的论文;它不应该以他们的名字命名。例如,D'Agostino & Pearson (1973),然后是 Bowman & Shenton (1975),后者讨论了更详细的相关问题(包括小样本中的缓慢收敛和联合分布的形状 - 尽管它们的图表似乎包含错误),但人们可以很容易地看到基于拟合优度测试的想法偏度和峰度比以前的论文更早出现。)