这部分是品味和惯例的问题,但理论、对目标的关注以及一点点认知神经科学 [参见参考资料] 可以提供一些指导。
因为 pdf 和 cdf 传达相同的信息,所以它们之间的区别在于它们是如何做到的:pdf 表示具有面积的概率,而 cdf 表示具有(垂直)距离的概率。研究表明,人们比较距离比比较区域更快、更准确,而且他们系统地错误估计了区域。因此,如果您的目的是提供一个用于读取概率的图形工具,您应该倾向于使用 cdf。
Pdfs 和 cdfs 也表示概率密度:前者用高度表示,而后者用斜率表示密度。现在情况发生了逆转,因为人们对坡度的估计不佳(这是角度的正切;我们倾向于看到角度本身)。密度擅长传达有关模式、尾部重量和间隙的信息。在这种情况下以及需要强调概率分布的局部细节的任何其他地方,都倾向于使用 pdf。
有时 pdf 或 cdf 会提供有用的理论信息。它的值(或更确切地说是其倒数)涉及分位数、极值和等级统计的标准误差公式。在这种情况下显示 pdf 而不是 cdf。当研究非参数设置中的多元相关性时,例如使用copulas,cdf 被证明更有用(可能是因为它是将连续概率定律转换为统一概率定律的函数)。
pdf 或 cdf 可以与特定的统计测试密切相关。Kolmogorov-Smirnov 检验(和 KS 统计量)在cdf 周围的垂直缓冲区方面具有简单的图形表示;就pdf(我知道的)而言,它没有简单的图形表示。
ccdf(互补 cdf)用于关注幸存者和罕见事件的特殊应用程序。它的使用往往是按惯例确定的。
参考
WS 克利夫兰 (1994)。图形数据的元素。美国新泽西州萨米特:霍巴特出版社。国际标准书号 0-9634884-1-4
BD 凹痕 (1999)。制图:专题地图设计第 5 版。美国马萨诸塞州波士顿:WCB McGraw-Hill。
AM MacEachren (2004)。地图的工作原理。美国纽约州纽约:吉尔福德出版社。国际标准书号 1-57230-040-X