QQ剧情解读

机器算法验证 r 数据可视化 解释 QQ图
2022-03-10 03:41:48

考虑以下代码和输出:

  par(mfrow=c(3,2))
  # generate random data from weibull distribution
  x = rweibull(20, 8, 2)
  # Quantile-Quantile Plot for different distributions
  qqPlot(x, "log-normal")
  qqPlot(x, "normal")
  qqPlot(x, "exponential", DB = TRUE)
  qqPlot(x, "cauchy")
  qqPlot(x, "weibull")
  qqPlot(x, "logistic")

在此处输入图像描述

似乎对数正态的 QQ 图与威布尔的 QQ 图几乎相同。我们如何区分它们?此外,如果这些点位于两条外部黑线定义的区域内,这是否表明它们遵循指定的分布?

2个回答

这里有几件事要说:

  1. 数正态的 CDF 的形状与Weibull的 CDF 的形状足够相似,使得它们比 Weibull 和其他之间的相似度更难区分。
  2. 外面的黑线形成一个置信带推理中置信带的使用与频率统计推理的任何其他标准形式相同。也就是说,当值落在带内时,我们不能拒绝假设分布是正确分布的原假设。这与说我们知道假设的分布是正确的分布不同。(请注意,这是我在这里的另一个答案中讨论的一个很好的例子,即假设检验的费舍尔观点比内曼 - 皮尔逊更可取。)
  3. 您需要更多数据;您的N这里只有20。

似乎对数正态的 QQ 图与威布尔的 QQ 图几乎相同。

是的。

我们如何区分它们?

在那个样本量下,你可能做不到。

此外,如果这些点位于两条外部黑线定义的区域内,这是否表明它们遵循指定的分布?

不,这仅表明您无法判断数据的分布与该分布不同。这是缺乏差异的证据,而不是缺乏差异的证据。

您几乎可以肯定,数据来自与您考虑过的分布不同的分布(为什么它会完全来自其中任何一个?)。