机器学习社区是否滥用“条件化”和“参数化”?

机器算法验证 机器学习 术语
2022-02-06 23:12:09

说,取决于严格来说,Xα

  • 如果都是随机变量,我们可以写为Xαp(Xα)

  • 但是,如果是一个随机变量,而是一个参数,我们必须写为Xαp(X;α)

我多次注意到机器学习社区似乎忽略了差异并滥用了这些术语。

例如,在著名的 LDA 模型中,是 Dirichlet 参数而不是随机变量。α

在此处输入图像描述

不应该是吗?我看到很多人,包括 LDA 论文的原作者,都把它写成p(θ;α)p(θα)

1个回答

我认为这更多是关于贝叶斯/非贝叶斯统计,而不是机器学习与统计。

在贝叶斯统计中,参数也被建模为随机变量。如果您有的联合分布,则无论的物理解释如何,都是条件分布。如果只考虑固定 s 或者不考虑 \alpha 上的概率分布 X的计算完全相同. 此外,人们可以在任何时候决定将具有固定值上存在先验分布的模型X,αp(Xα)Xαααp(X;α)p(Xα)p(α)αα. 至少对我来说,给定分布的符号在这一点上应该改变似乎很奇怪因此一些贝叶斯主义者更喜欢使用条件符号,即使人们还没有(还没有?)费心将所有参数定义为随机变量。α

关于是否可以将写为的争论也出现在 Andrew Gelman 的博客文章Misunderstanding the -value的评论中。例如,Larry Wasserman 的观点是,当没有来自关节的条件作用时,是不允许的,而 Andrew Gelman 则持相反的观点。p(X;α)p(Xα)p