概率符号和磷( z; d, w )P(z;d,w)磷( z| d, w )P(z|d,w)

机器算法验证 可能性 符号
2022-01-15 23:57:27

许多书籍和论文中常用在含义上有什么区别?P(z;d,w)P(z|d,w)

4个回答

f(x;θ)是随机变量在点处的密度,其中是分布的参数。在点是随机变量时才有意义。是给定的条件分布是随机变量时才有意义。当您深入阅读本书并查看贝叶斯分析时,这将变得更加清晰。Xxθf(x,θ)XΘ(x,θ)Θf(x|θ)XΘΘ

f(x;θ)相同,只是意味着是固定参数,函数的函数。,OTOH,是函数族(或集合)的元素,其中元素由索引。一个微妙的区别,也许,但一个重要的区别,特别是。当需要根据已知数据时;此时,变化而是固定的,从而产生“似然函数”。的使用在统计学家中更为常见,而f(x|θ)θfxf(x,Θ)Θθxθx;数学家之间。

我相信这是可能性范式的起源(虽然我没有检查过下面的实际历史正确性,但这是理解它是如何产生的一种合理的方式)。

假设在回归设置中,您将有一个分布:

p(Y|x,β)

这意味着:如果您知道(有条件地)Yxβ

如果要估计 beta,则需要最大化似然性:

L(β;y,x)=p(Y|x,β)

本质上,您现在将表达式视为 beta 的函数,但除此之外,没有区别(对于您可以正确推导的数学正确表达式,这是必要的 - - 尽管实际上没有人打扰)。p(Y|x,β)

然后,在贝叶斯设置中,参数和其他变量之间的差异很快就会消失,所以你开始混合使用这两种表示法。

因此,本质上:没有实际区别:它们都表示左侧事物的条件分布,以右侧事物为条件。

尽管并非总是如此,但通常在不是随机变量时使用(这并不是说它们必然是已知的)。的值为条件不是随机变量时使用这种表示法是令人困惑的(并且悲惨地很常见)。P(z;d,w)d,wP(z|d,w)d,wd,w

正如@Nick Sabbe 指出的那样,是观察数据的采样分布的常用符号。一些常客会使用这种表示法,但坚持认为不是随机变量,这是 IMO 的滥用。但他们在那里没有垄断地位;我已经看到贝叶斯也这样做了,在条件句的末尾添加了固定的超参数。p(y|X,Θ)yΘ