一般概率分布的符号和含义

机器算法验证 可能性 假设检验 分布 随机变量 符号
2022-03-25 10:00:50

当没有具体说明概率分布的含义和符号时,我有两个问题。例如,一些论文直接使用如下符号(第 2 页)进入他们的方法:

两样本检验的目标是评估两个样本是否,表示为SPPSQQ, 来自相同的分布。

这是另一个示例(第 1 页):

给定两组来自未知分布的独立样本PQ,两样本检验决定是否拒绝原假设P=Q.

第三个示例的符号略有不同(第 2 页):

给定一个序列d维观察{x1,...,xt,...}, 和xiRd,我们的目标是检测一个变化点的存在,使得在变化点之前,样本是来自分布的独立同分布的 P,而在变化点之后,样本是来自不同分布的独立同分布Q.

  1. 在这种情况下是P(和Q) 应该是 CDF 吗?PDF?
  2. 这些情况的典型符号是什么,只是一个斜体大写字母或黑板粗体,如P(和Q)?

在描述未知概率分布时,似乎会出现这种情况。

1个回答

“概率分布”可以通过其 CDF 或相应的概率度量来唯一地描述。相反,密度函数通常不是概率分布的唯一描述,因此它通常不会用于说明分布的相等性。 不幸的是,这类问题没有标准的符号,而且不同领域的用法也有很大差异,所以你真的只需要在他们的上下文中阅读这些陈述,以确保你正确地解释了作者。问题是由于分布等价的断言已经被如此明确地指定,以至于一些作者会在符号上玩得有点“快速和松散”,并且实际上可能使用不严格正确的符号,但你应该预料到无论如何要了解他们的意图。(例如,您可能偶尔会看到作者对“分布”和密度函数使用相同的符号。)

当使用大写字母时PQ这通常(但不总是)是对 CDF 的引用,而黑板上的粗体字母PQ通常(但不总是)是概率测度的参考。在没有一些相反的上下文线索的情况下,我通常会这样解释它们,但由于这些陈述没有标准符号,你真的只需要阅读全文,甚至可能需要关于作者在符号中所指的确切内容的有根据的猜测。祝你好运!


对于连续随机变量(由 Lebesgue 测度主导),密度函数可以在任何可数的点集上改变而不改变分布。对于离散随机变量(由计数测量主导),质量函数是分布的唯一表示。