为什么密度函数有时用条件表示法编写?

机器算法验证 条件概率 密度函数 符号
2022-02-17 16:48:52

我一直看到密度函数不是由条件符号写成的条件明确产生的:例如,对于高斯的密度,为什么要写: N(μ,σ)

f(x|μ,σ)=12πσ2exp(xμ)22σ2

代替

f(x)=12πσ2exp(xμ)22σ2

这样做纯粹是为了明确参数值是什么,或者(我希望)是否有与条件概率相关的含义?

2个回答
  • 在贝叶斯上下文中,参数随机变量,因此在该上下文中,密度实际上是的条件密度。在这种情况下,符号是非常自然的。X(μ,σ)
  • 在贝叶斯上下文之外,这只是一种明确密度取决于参数的方法(这里我是通俗地使用这个词,而不是概率地使用这个词)。有些人使用来达到同样的效果。fμ,σ(x)f(x;μ,σ)
  • 后一点在似然函数的上下文中可能很重要。给定一些数据 ,似然函数是参数 的函数。可能性有时写为,或者当数据被理解为给定时令人困惑的是,在连续分布的情况下,似然函数定义为参数对应的密度值,在数据处进行评估,即θxL(θx)L(θ;x)L(θ)xθxL(θ;x):=fθ(x)L(θ;x)=f(x)会令人困惑,因为左侧是的函数,而右侧表面上似乎不依赖于虽然我更喜欢写,但有些人可能会写θθL(θ;x):=fθ(x)L(θ;x):=f(xθ)
  • 我并没有真正看到不同作者之间的符号一致性有多大,尽管如果我错了,有人比我读得更深,可以纠正我。

这种表示法经常在 MLE 上下文中使用,以将其与似然函数和以数据为条件的参数估计区分开来。

在 MLE 中,您可以执行以下操作:

μ^,σ^|X=argmaxμ,σL(X|μ,σ)
L(X|μ,σ)=if(xiX|μ,σ)

所以,这个符号强调你使用 PDFf(.)以候选参数集为条件的数据集,以获得似然函数L. 然后你选择最大化可能性的集合作为你的解决方案μ^,σ^. 因此,解决方案真正以数据集为条件X,而似然度取决于候选参数集μ,σ. 这就是为什么这个符号有利于教学目的,以显示条件如何在左侧和右侧“翻转”。