Wolfram Mathworld 是否会错误地描述具有概率密度函数的离散概率分布?

机器算法验证 可能性 数理统计 术语 密度函数
2022-02-02 00:53:17

通常使用概率质量函数 (PMF) 来描述离散变量上的概率分布:

在处理连续随机变量时,我们使用概率密度函数 (PDF) 而不是概率质量函数来描述概率分布。

——Goodfellow、Bengio 和 Courville 的深度学习

然而,Wolfram Mathworld使用 PDF 来描述离散变量的概率分布:

在此处输入图像描述

这是一个错误吗?还是没关系?

2个回答

这不是一个错误

在概率的正式处理中,通过测度理论,概率密度函数是感兴趣的概率测度的导数,相对于“主导测度”(也称为“参考测度”)采取。对于整数上的离散分布,概率质量函数是关于计数度量的密度函数。由于概率质量函数是一种特定类型的概率密度函数,因此有时您会发现类似这样的参考资料将其称为密度函数,并且以这种方式提及它并没有错。

在关于概率和统计的普通论述中,人们经常避免使用这个术语,并在“质量函数”(用于离散随机变量)和“密度函数”(用于连续随机变量)之间进行区分,以区分离散分布和连续分布。在其他情况下,当人们陈述概率的整体方面时,通常最好忽略这种区别并将两者都称为“密度函数”。

除了在测度论方面更有理论性的答案外,在统计编程中不区分 pmfs 和 pdfs 也很方便。例如,R 具有丰富的内置发行版。对于每个分布,它有 4 个函数。例如,对于正态分布(来自帮助文件):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

R 用户很快就习惯了d,p,q,r前缀。如果你不得不为二项分布做一些诸如 dropd和 use之类的事情,那会很烦人。m相反,一切都如 R 用户所期望的那样:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.