“逆”QQ剧情?

机器算法验证 非参数 参考 描述性统计 QQ图
2022-03-24 07:57:29

假设我们有两个实值随机变量X,Y. cdfXcdfY是相应的累积分布函数。我们有兴趣以图形方式比较XY.

如果我们绘制点集

(cdfX1(z),cdfY1(z))
对于一些z[0,1],得到的图称为QQ 图如果cdfX=cdfY,则 QQ 图位于x=y line图上。

QQ图很有用,但如果X或者Y有一些不同的极值,该图可能在视觉上有些误导。例如,假设X是从标准正态分布中抽取的超过 1000 个样本的均匀分布。 Y以相同的方式生成,具有独立的样本。这是一个对应的QQ图;请注意,右上角和左下角的点偏离虚线x=y line. 在此处输入图像描述 尽管极值点不同,但它们的数量并不多。为了显示大多数点的对齐方式,我们可以改为绘制

(z,cdfY(cdfX1(z)))
这里是对应的“逆QQ图”;因为大多数点对齐得很好,所以分布相似(无论如何对我来说)在视觉上更明显。 在此处输入图像描述

我以前没有遇到过“逆 QQ 图”,但它很自然,它可能是一个标准工具。这个情节有名字吗?

1个回答

你重新发现了 PP 图。有关介绍,请参见此处

我将从一个文本中添加一个略显滑稽的评论,大意是如果你想成为或看起来对适合度持乐观态度,你使用 PP 图,而如果你想(出现)悲观,你使用QQ剧情。

你的例子就是一个很好的例子。PP 图原则上必然锚定在 [0, 0] 和 [1, 1] 处,但尾巴甚至会略微摇摆,QQ 图非常明确地显示它们。无论是通过异常值、曲率还是分组,都非常糟糕,QQ 情节毫无节制地讲述了坏消息。

尽管如此,我猜 PP 图的使用较少,因为您必须做更多的工作才能将它们与原始数据相关联。

编辑我想到的报价:

有点夸张,有人可能会说应该应用样本 df Fn(或者,同样,幸存者函数1Fn) 和 PP 图,如果你想直观地证明一个假设是正确的。每当对建模采取批评态度时,其他工具都是可取的。

赖斯,R.-D。和 Thomas, M. 2007。极值的统计分析:在保险、金融、水文和其他领域的应用。巴塞尔:Birkhäuser,第 63 页。(2001 年第 2 版第 67 页和 1997 年第 1 版第 57 页中的措辞几乎相同)