机器算法验证 - 为什么密度函数有时用条件表示法编写？ - 吾爱随笔录

为什么密度函数有时用条件表示法编写？

机器算法验证条件概率密度函数符号

2022-02-17 16:48:52

我一直看到密度函数不是由条件符号写成的条件明确产生的：例如，对于高斯的密度，为什么要写： $N(\mu,\sigma)$

f (x | μ, σ) = \frac{1}{\sqrt{2 π σ^{2}}} \exp - \frac{(x - μ)^{2}}{2 σ^{2}}

$f(x| \mu, \sigma)=\frac{1}{\sqrt{2\pi \sigma^2}}\exp{-\frac{(x-\mu)^2}{2\sigma^2}}$

代替

f (x) = \frac{1}{\sqrt{2 π σ^{2}}} \exp - \frac{(x - μ)^{2}}{2 σ^{2}}

$f(x)=\frac{1}{\sqrt{2\pi \sigma^2}}\exp{-\frac{(x-\mu)^2}{2\sigma^2}}$

这样做纯粹是为了明确参数值是什么，或者（我希望）是否有与条件概率相关的含义？

2个回答

在贝叶斯上下文中，参数是随机变量，因此在该上下文中，密度实际上是的条件密度。在这种情况下，符号是非常自然的。 $X \mid (\mu, \sigma)$
在贝叶斯上下文之外，这只是一种明确密度取决于参数的方法（这里我是通俗地使用这个词，而不是概率地使用这个词）。有些人使用或来达到同样的效果。 $f_{\mu, \sigma}(x)$ $f(x; \mu, \sigma)$
后一点在似然函数的上下文中可能很重要。给定一些数据，似然函数是参数的函数。可能性有时写为或，或者当数据被理解为给定时令人困惑的是，在连续分布的情况下，似然函数定义为参数对应的密度值，在数据处进行评估，即。写 $\theta$ $x$ $L(\theta \mid x)$ $L(\theta ; x)$ $L(\theta)$ $x$ $\theta$ $x$ $L(\theta; x) := f_\theta(x)$ $L(\theta; x) = f(x)$ 会令人困惑，因为左侧是的函数，而右侧表面上似乎不依赖于。虽然我更喜欢写，但有些人可能会写。 $\theta$ $\theta$ $L(\theta; x) := f_\theta(x)$ $L(\theta; x) := f(x \mid \theta)$
我并没有真正看到不同作者之间的符号一致性有多大，尽管如果我错了，有人比我读得更深，可以纠正我。

这种表示法经常在 MLE 上下文中使用，以将其与似然函数和以数据为条件的参数估计区分开来。

在 MLE 中，您可以执行以下操作：

\hat{μ}, \hat{σ} | X = \underset{μ, σ}{argmax} L (X | μ, σ)

$\hat\mu,\hat\sigma|X= \underset{\mu,\sigma}{\operatorname{argmax}} \mathcal L(X|\mu,\sigma)$

L (X | μ, σ) = \prod_{i} f (x_{i} \in X | μ, σ)

$\mathcal L(X|\mu,\sigma)=\prod_i f(x_i\in X|\mu,\sigma)$

所以，这个符号强调你使用 PDF $f(.)$ 以候选参数集为条件的数据集，以获得似然函数 $\mathcal L$ . 然后你选择最大化可能性的集合作为你的解决方案 $\hat\mu,\hat\sigma$ . 因此，解决方案真正以数据集为条件 $X$ ，而似然度取决于候选参数集 $\mu,\sigma$ . 这就是为什么这个符号有利于教学目的，以显示条件如何在左侧和右侧“翻转”。

其它你可能感兴趣的问题

上一篇寻找荟萃分析的良好介绍性治疗下一篇支持向量机是否处理不平衡的数据集？