在 RI 中进行 Jarque Bera 测试得到以下结果:
jarque.bera.test(rnorm(85))
data: rnorm(85)
X-squared = 1.259, df = 2, p-value = 0.5329
这是否意味着丢弃正态假设(它是真的)的概率是 53.29%?
如果是这样,如果我使用正态分布中的随机数,为什么我会得到这个值?
在 RI 中进行 Jarque Bera 测试得到以下结果:
jarque.bera.test(rnorm(85))
data: rnorm(85)
X-squared = 1.259, df = 2, p-value = 0.5329
这是否意味着丢弃正态假设(它是真的)的概率是 53.29%?
如果是这样,如果我使用正态分布中的随机数,为什么我会得到这个值?
p 值 = 0.5329
这是否意味着丢弃正态性假设的概率
p 值不是“放弃假设的概率”。您应该查看 p 值的含义。相关维基百科页面的第一句话应该有帮助:
p 值是当原假设实际上为真时获得观察到的样本结果(或更极端的结果)的概率。
(注意:我已将上述链接修改为我写答案时的最新版本,因为文章的开头段落编辑不当,目前 - 2018 年 6 月 - 实际上是错误的。)
它接着说:
如果这个 p 值非常小,通常小于或等于先前选择的称为显着性水平的阈值(传统上为 5% 或 1% [1]),则表明观察到的数据与零值的假设不一致假设是真的
这与“放弃假设的概率”完全不同。
是 53.29%?
大约 53% 的 p 值与原假设非常一致。
(然而,这并不意味着数据被认为是随机样本的分布是正态的;它也与无限数量的非正态分布一致。)
您的数据来自正态分布,因此 Jarque-Bera 检验的原假设(即从中抽取样本的总体具有零偏斜和零超峰度)实际上是正确的。虽然我们通常将 Jarque-Bera 称为“正态性检验”,但还有其他分布也具有零偏斜和零超峰度(请参阅此答案以获取示例),因此 Jarque-Bera 检验无法将它们与正态区分开来分配。
一个p值是
假设原假设为真,得到结果与观察结果一样或更极端的概率。这不是拒绝原假设的概率。
我希望这涉及您问题的“这是否意味着……”方面。如果我们看到一个非常小的p值,比如 0.001,这意味着我们观察到的结果将非常不可能,如果是真的(确实,非常令人惊讶 - 比这更极端的事情我们只期望在 1000 次中发生 1 次)。这使我们怀疑是不正确的。相反,高p值一点也不奇怪,尽管这不是积极支持的证据它当然不放陷入怀疑。一般来说,我们认为低p值作为反对的证据,并且较低的p值构成更强的证据。什么会导致我们拒绝 ? 通常设置一个显着性水平,通常为 5%,然后拒绝如果我们观察到低于显着性水平的p值。在你的情况下,我们不会拒绝在任何合理的重要性水平。
什么时候是的,p值将在 0 和 1 之间具有连续均匀分布,由于 pdf 的形状,也称为矩形分布。这不仅适用于 Jarque-Bera 检验,而且并非对所有假设检验都完全正确(考虑离散分布的检验,例如二项式比例检验或泊松均值检验)“ p值同样可能介于 0 到 1 之间”通常是考虑 null 下的p值的好方法。
NB 来解决一个常见的误解:仅仅因为 null 是真的并不意味着我们应该期望p值很高!它有 50% 的机会高于 0.5,有 50% 的机会低于。如果您将显着性水平设置为 5% - 也就是说,您将拒绝如果您获得的p值低于 0.05 - 那么请注意,即使 null 为真,这种情况也有 5% 的时间发生(这就是为什么您的显着性水平将与您的 I 类错误的概率相同)。但也有 5% 的机会介于 0.95 和 1 之间,或介于 0.32 和 0.37 之间,或介于 0.64 和 0.69 之间。我希望这涵盖了您查询的“为什么我得到这个 p 值”方面。
警告:我在这里描述了 Jarque-Bera 测试运行良好的理想情况。该测试依赖于正态分布的样本偏度和样本峰度 - 中心极限定理保证这在大样本量中渐近正确,但这种近似在较小的样本量中不是很好。事实上你的太小了 - 因此在 null 下报告的p值不是很均匀分布。但是,如果您rnorm(1000)
改为使用,我的描述将是准确的。
当您提到“放弃正态性假设的概率(它是真的)”时,您似乎在考虑 I 类错误率。但是您不能仅从一个样本中看到这一点,您需要考虑在许多样本中做出错误决定的可能性。了解错误率如何工作的一个好方法是通过模拟。继续运行相同的 R 代码,您将不断获得不同的p值。制作这些p值的直方图,只要您选择了足够大的让 Jarque-Bera 测试正常工作。如果您将显着性水平设置为 5%,您会发现,从长远来看,即使它是真的(当p < 0.05 时在您的模拟中发生)约 5时,您也会犯拒绝原假设的第一类错误% 的时间。如果您想将 I 类错误率降低到 1%,请将显着性水平设置为 1%。您甚至可以将其设置得更低。这样做的问题是,当原假设为假时,您更难以拒绝原假设,因此您正在增加 II 型错误率。
此外,如果您确实想对低至 85 的样本量应用 Jarque-Bera 检验,我之前对小样本量的警告适用。由于报告的基于渐近分布的 p 值不会在零值下均匀分布,因此p < 0.05 不会出现 5% 的时间。所以你不能仅仅通过拒绝就达到 5% 的 I 类错误率如果报告的p < 0.05!相反,您必须根据模拟结果调整临界值,如 Thadewald、T 和 H. Buning,2004 年,Jarque-Bera 测试及其竞争对手测试正态性的第 4.1 节中所做的那样 - 功率比较,讨论论文经济学2004/9,柏林自由大学商业与经济学院。
In your simulation you only considered normally distributed data; what if you simulate data that isn't normal instead? In this case we should reject the null hypothesis but you will find you don't always get a p value below 0.05 (or whatever significance level you set) so the Jarque-Bera test results do not give you sufficient evidence to reject. The more powerful the test, the better it is at telling you to reject 在这个情况下。你会发现你可以通过增加样本量来提高测试的能力(而当 null 为真时,改变样本量对p值的矩形分布没有影响 - 试试吧! - 当数据不是t 从正常总体中提取,您会发现随着样本量的增加,低p值变得越来越可能)。如果您的数据更明显地偏离正态性,则测试的功效也会更高 - 看看当您从具有更极端偏斜和峰度的分布中采样时会发生什么。有可供选择的正态性检验,它们对不同类型的偏离正态性具有不同的能力。
最后一句警告。请注意,在许多实际情况下,我们根本不想运行正态性检验。但是,有时正态性检验可能很有用 - 例如,如果您持怀疑态度并想检查统计软件生成的“随机正态偏差”是否真正正常。但是,您应该会发现rnorm
in 的功能R
很好!
其他答案很详细,但概念很重。由于 p 值具有数学推导,因此列出其背后的数学可能会加强理解。
统计量是数据的任何函数。通常我们假设观察到的数据是随机变量或随机变量序列的实现。因此,统计量也是随机变量。调用数据, 并使用表示一个特定的观察(在这种情况下,一个数据集)。调用统计并使用表示从特定的统计量计算的值.
这样我们可以参考“统计的事件看重”并为其附加一个概率。许多统计数据很有趣,因为它们描述了数据的复杂方面,但遵循众所周知的概率分布。
Jarque-Bera 检验建立在统计数据之上它有两个特殊属性:
- 大当且仅当偏度或峰度,或两者都很大。
- 如果服从正态分布且样本量大,近似服从具有两个自由度的卡方分布。
我们知道,在具有两个自由度的卡方分布中,较大的值不太可能:. 因此,如果我们观察到一个大或一个大,我们也观察到一个大的,这意味着,如果数据是正态分布的,我们观察到了一个非常不可能的事件。因此,如果我们观察到一个很大的,要么我们观察到一个非常罕见的事件,要么。
值定义为p。
如果很大,很小,因为 s 不太可能。我们通过选择一个像 0.05 这样的小值来进行假设检验,低于该值的 “太小”以至于我们无法相信它确实是从卡方分布中抽取的,因此一定不是正态分布的。
但是,对于大的p 值,这说明了什么?绝对没有。可能是所以。但也可能是和遵循其他分布。只是没有办法告诉。这就是为什么“接受”的假设永远不正确的原因。我们只能拒绝它。
您必须阅读有关假设检验和Jarque-Bera检验的信息。您似乎不了解其中一个或两个概念。
JB 检验的原假设是您的样本来自正态分布。检验 p 值反映接受原假设的概率。如果它太低,那么你拒绝它。您必须设置置信水平,例如,然后如果 p 值低于此 ,则拒绝 null 。在您的情况下,p 值超过 50%,这太高而无法拒绝空值。请注意,假设检验永远不会告诉您接受零值,它可能只会告诉您拒绝或不拒绝它。
因此,您的测试告诉您它不能拒绝样本来自正态分布的假设。我想这是一个预期的结果。