Wilk, MB 和 Gnanadesikan, R. 1968。数据分析的概率绘图方法。
生物计量学55:1-17。Jstor 链接(如果您有权访问)
这篇论文,在我写作的时候,已经快 50 年了,但仍然感觉新鲜和创新。使用丰富多样的有趣和实质性的例子,作者统一和扩展了使用 QQ(分位数-分位数)和 PP(概率-概率)图的框架绘制和比较分布的各种想法。这里的分布泛指在他们的分析中出现的任何数据集或数字(残差、对比等)。
这些图的特定版本可以追溯到几十年前,最明显的是正态概率或正态分数图。在这些术语中,它们是分位数 - 分位数图,即观察到的分位数与来自正态(高斯)分布的相同大小样本的预期或理论分位数的图。但作者谦虚而自信地表明,相同的想法可以很容易地扩展——实际上可以使用现代计算——用于检查其他类型的分位数并自动绘制结果。
两位作者当时都在贝尔电话实验室工作,享有最先进的计算设施,甚至许多大学和研究机构也花了十年左右的时间才赶上。即使是现在,本文中的想法也值得更广泛地应用。这是一个罕见的介绍性文本或课程,其中包含除正常 QQ 情节之外的任何这些想法。当引入分布图时,直方图和箱线图(每一个通常都非常有用,但每个都笨拙且在几个方面受到限制)仍然是主要的主要内容。
就个人而言,尽管这篇论文的主要思想在我职业生涯的大部分时间里都很熟悉,但我喜欢每隔几年左右重读一次。一个很好的理由是对作者提出简单但强大的想法并通过严肃的例子产生良好效果的方式感到高兴。另一个很好的理由是,这篇论文简洁明了,没有丝毫夸张的痕迹,暗示了主要思想的扩展。我不止一次地重新发现了在侧面提示和进一步评论中明确涵盖的主要思想的曲折。
这不仅仅是针对那些对统计图形特别感兴趣的人的论文,尽管在我看来,这应该包括所有对任何类型的统计感兴趣的人。它提倡思考分布的方式,这些方式实际上有助于培养任何人的统计技能和洞察力。