机器算法验证 - 为什么我在 R 中做 Jarque-Bera 检验会得到这个 p 值？ - 吾爱随笔录

为什么我在 R 中做 Jarque-Bera 检验会得到这个 p 值？

机器算法验证假设检验统计学意义 p 值拟合优度

2022-03-27 10:23:30

在 RI 中进行 Jarque Bera 测试得到以下结果：

jarque.bera.test(rnorm(85))

data:  rnorm(85)

X-squared = 1.259, df = 2, p-value = 0.5329

这是否意味着丢弃正态假设（它是真的）的概率是 53.29%？

如果是这样，如果我使用正态分布中的随机数，为什么我会得到这个值？

4个回答

p 值 = 0.5329

这是否意味着丢弃正态性假设的概率

p 值不是“放弃假设的概率”。您应该查看 p 值的含义。相关维基百科页面的第一句话应该有帮助：

p 值是当原假设实际上为真时获得观察到的样本结果（或更极端的结果）的概率。

（注意：我已将上述链接修改为我写答案时的最新版本，因为文章的开头段落编辑不当，目前 - 2018 年 6 月 - 实际上是错误的。）

它接着说：

如果这个 p 值非常小，通常小于或等于先前选择的称为显着性水平的阈值（传统上为 5% 或 1% [1]），则表明观察到的数据与零值的假设不一致假设是真的

这与“放弃假设的概率”完全不同。

是 53.29%？

大约 53% 的 p 值与原假设非常一致。

（然而，这并不意味着数据被认为是随机样本的分布是正态的；它也与无限数量的非正态分布一致。）

您的数据来自正态分布，因此 Jarque-Bera 检验的原假设（即从中抽取样本的总体具有零偏斜和零超峰度）实际上是正确的。虽然我们通常将 Jarque-Bera 称为“正态性检验”，但还有其他分布也具有零偏斜和零超峰度（请参阅此答案以获取示例），因此 Jarque-Bera 检验无法将它们与正态区分开来分配。

一个p值是

假设原假设为真，得到结果与观察结果一样或更极端的概率。这不是拒绝原假设的概率。

我希望这涉及您问题的“这是否意味着……”方面。如果我们看到一个非常小的p值，比如 0.001，这意味着我们观察到的结果将非常不可能，如果 $H_0$ 是真的（确实，非常令人惊讶 - 比这更极端的事情我们只期望在 1000 次中发生 1 次）。这使我们怀疑 $H_0$ 是不正确的。相反，高p值一点也不奇怪，尽管这不是积极支持的证据 $H_0$ 它当然不放 $H_0$ 陷入怀疑。一般来说，我们认为低p值作为反对的证据 $H_0$ ，并且较低的p值构成更强的证据。什么会导致我们拒绝 $H_0$ ? 通常设置一个显着性水平，通常为 5%，然后拒绝 $H_0$ 如果我们观察到低于显着性水平的p值。在你的情况下，我们不会拒绝 $H_0$ 在任何合理的重要性水平。

什么时候 $H_0$ 是的，p值将在 0 和 1 之间具有连续均匀分布，由于 pdf 的形状，也称为矩形分布。这不仅适用于 Jarque-Bera 检验，而且并非对所有假设检验都完全正确（考虑离散分布的检验，例如二项式比例检验或泊松均值检验）“ p值同样可能介于 0 到 1 之间”通常是考虑 null 下的p值的好方法。

NB 来解决一个常见的误解：仅仅因为 null 是真的并不意味着我们应该期望p值很高！它有 50% 的机会高于 0.5，有 50% 的机会低于。如果您将显着性水平设置为 5% - 也就是说，您将拒绝 $H_0$ 如果您获得的p值低于 0.05 - 那么请注意，即使 null 为真，这种情况也有 5% 的时间发生（这就是为什么您的显着性水平将与您的 I 类错误的概率相同）。但也有 5% 的机会介于 0.95 和 1 之间，或介于 0.32 和 0.37 之间，或介于 0.64 和 0.69 之间。我希望这涵盖了您查询的“为什么我得到这个 p 值”方面。

警告：我在这里描述了 Jarque-Bera 测试运行良好的理想情况。该测试依赖于正态分布的样本偏度和样本峰度 - 中心极限定理保证这在大样本量中渐近正确，但这种近似在较小的样本量中不是很好。事实上你的 $n=85$ 太小了 - 因此在 null 下报告的p值不是很均匀分布。但是，如果您rnorm(1000)改为使用，我的描述将是准确的。

当您提到“放弃正态性假设的概率（它是真的）”时，您似乎在考虑 I 类错误率。但是您不能仅从一个样本中看到这一点，您需要考虑在许多样本中做出错误决定的可能性。了解错误率如何工作的一个好方法是通过模拟。继续运行相同的 R 代码，您将不断获得不同的p值。制作这些p值的直方图，只要您选择了足够大的 $n$ 让 Jarque-Bera 测试正常工作。如果您将显着性水平设置为 5%，您会发现，从长远来看，即使它是真的（当p < 0.05 时在您的模拟中发生）约 5时，您也会犯拒绝原假设的第一类错误％的时间。如果您想将 I 类错误率降低到 1%，请将显着性水平设置为 1%。您甚至可以将其设置得更低。这样做的问题是，当原假设为假时，您更难以拒绝原假设，因此您正在增加 II 型错误率。

此外，如果您确实想对低至 85 的样本量应用 Jarque-Bera 检验，我之前对小样本量的警告适用。由于报告的基于渐近分布的 p 值不会在零值下均匀分布，因此p < 0.05 不会出现 5% 的时间。所以你不能仅仅通过拒绝就达到 5% 的 I 类错误率 $H_0$ 如果报告的p < 0.05！相反，您必须根据模拟结果调整临界值，如 Thadewald、T 和 H. Buning，2004 年，Jarque-Bera 测试及其竞争对手测试正态性的第 4.1 节中所做的那样 - 功率比较，讨论论文经济学2004/9，柏林自由大学商业与经济学院。

In your simulation you only considered normally distributed data; what if you simulate data that isn't normal instead? In this case we should reject the null hypothesis but you will find you don't always get a p value below 0.05 (or whatever significance level you set) so the Jarque-Bera test results do not give you sufficient evidence to reject. The more powerful the test, the better it is at telling you to reject $H_0$ 在这个情况下。你会发现你可以通过增加样本量来提高测试的能力（而当 null 为真时，改变样本量对p值的矩形分布没有影响 - 试试吧！ - 当数据不是t 从正常总体中提取，您会发现随着样本量的增加，低p值变得越来越可能）。如果您的数据更明显地偏离正态性，则测试的功效也会更高 - 看看当您从具有更极端偏斜和峰度的分布中采样时会发生什么。有可供选择的正态性检验，它们对不同类型的偏离正态性具有不同的能力。

最后一句警告。请注意，在许多实际情况下，我们根本不想运行正态性检验。但是，有时正态性检验可能很有用 - 例如，如果您持怀疑态度并想检查统计软件生成的“随机正态偏差”是否真正正常。但是，您应该会发现rnormin 的功能R很好！

其他答案很详细，但概念很重。由于 p 值具有数学推导，因此列出其背后的数学可能会加强理解。

定义

统计量是数据的任何函数。通常我们假设观察到的数据是随机变量或随机变量序列的实现。因此，统计量也是随机变量。调用数据 $X$ , 并使用 $x$ 表示一个特定的观察 $X$ （在这种情况下，一个数据集）。调用统计 $T$ 并使用 $t$ 表示从特定的统计量计算的值 $x$ .

这样我们可以参考“统计的事件 $T$ 看重 $t$ ”并为其附加一个概率。许多统计数据很有趣，因为它们描述了数据的复杂方面，但遵循众所周知的概率分布。

雅克-贝拉测试

Jarque-Bera 检验建立在统计数据之上 $T$ 它有两个特殊属性：

$t$ 大当且仅当偏度 $s$ 或峰度 $k$ ，或两者都很大。

如果 $X$ 服从正态分布且样本量大， $T$ 近似服从具有两个自由度的卡方分布。

我们知道，在具有两个自由度的卡方分布中，较大的值不太可能： $\lim_{t \rightarrow \infty} \operatorname{Pr}{\left( T \leq t\, |\, X \sim N \, \right)} = 0$ . 因此，如果我们观察到一个大或一个大，我们也观察到一个大的，这意味着，如果数据是正态分布的，我们观察到了一个非常不可能的事件。因此，如果我们观察到一个很大的，要么我们观察到一个非常罕见的事件，要么。 $s$ $k$ $t$ $t$ $X \not\sim N$

值定义为p。 $p$ $p \equiv \operatorname{Pr}{\left( T > t\, |\, X \sim N \, \right)}$

如果很大，很小，因为 s 不太可能。我们通过选择一个像 0.05 这样的小值来进行假设检验，低于该值的 “太小”以至于我们无法相信它确实是从卡方分布中抽取的，因此一定不是正态分布的。 $t$ $p$ $t$ $X \sim N$ $p$ $X$

但是，对于大的p 值，这说明了什么？绝对没有。可能是所以。但也可能是和遵循其他分布。只是没有办法告诉。这就是为什么“接受”的假设永远不正确的原因。我们只能拒绝它。 $X \sim N$ $T \sim \chi^2_2$ $X \not\sim N$ $T$ $X \sim N$

您必须阅读有关假设检验和Jarque-Bera检验的信息。您似乎不了解其中一个或两个概念。

JB 检验的原假设是您的样本来自正态分布。检验 p 值反映接受原假设的概率。如果它太低，那么你拒绝它。您必须设置置信水平，例如，然后如果 p 值低于此，则拒绝 null 。在您的情况下，p 值超过 50%，这太高而无法拒绝空值。请注意，假设检验永远不会告诉您接受零值，它可能只会告诉您拒绝或不拒绝它。 $\alpha=5\%$ $\alpha$

因此，您的测试告诉您它不能拒绝样本来自正态分布的假设。我想这是一个预期的结果。

其它你可能感兴趣的问题

上一篇如何计算 R 中优势比的 p.value？下一篇为什么方差是X-是X−Y等于方差的总和，当X, YX,Y是独立的吗？