说,取决于。严格来说,
如果和都是随机变量,我们可以写为;
但是,如果是一个随机变量,而是一个参数,我们必须写为。
我多次注意到机器学习社区似乎忽略了差异并滥用了这些术语。
例如,在著名的 LDA 模型中,是 Dirichlet 参数而不是随机变量。
不应该是吗?我看到很多人,包括 LDA 论文的原作者,都把它写成。
说,取决于。严格来说,
如果和都是随机变量,我们可以写为;
但是,如果是一个随机变量,而是一个参数,我们必须写为。
我多次注意到机器学习社区似乎忽略了差异并滥用了这些术语。
例如,在著名的 LDA 模型中,是 Dirichlet 参数而不是随机变量。
不应该是吗?我看到很多人,包括 LDA 论文的原作者,都把它写成。
我认为这更多是关于贝叶斯/非贝叶斯统计,而不是机器学习与统计。
在贝叶斯统计中,参数也被建模为随机变量。如果您有的联合分布,则无论和的物理解释如何,都是条件分布。如果只考虑固定 s 或者不考虑 \alpha 上的概率分布 X和的计算完全相同. 此外,人们可以在任何时候决定将具有固定值上存在先验分布的模型. 至少对我来说,给定分布的符号在这一点上应该改变似乎很奇怪因此一些贝叶斯主义者更喜欢使用条件符号,即使人们还没有(还没有?)费心将所有参数定义为随机变量。
关于是否可以将写为的争论也出现在 Andrew Gelman 的博客文章Misunderstanding the -value的评论中。例如,Larry Wasserman 的观点是,当没有来自关节的条件作用时,是不允许的,而 Andrew Gelman 则持相反的观点。