从我读过的内容和对我在这里提出的其他问题的回答来看,许多所谓的频率论方法在数学上对应(我不在乎它们是否在哲学上对应,我只关心它是否在数学上对应)所谓的特殊情况贝叶斯方法(对于那些反对这一点的人,请参阅本问题底部的注释)。这个对相关问题(不是我的)的回答支持这个结论:
大多数频率学方法都有一个贝叶斯等价物,在大多数情况下会给出基本相同的结果。
请注意,在下文中,数学上相同意味着给出相同的结果。如果你描述了两种可以被证明总是给出相同结果的方法是“不同的”,那是你的权利,但这是一种哲学判断,不是数学判断,也不是实际判断。
然而,许多自称为“贝叶斯”的人似乎在任何情况下都拒绝使用最大似然估计,即使它是(数学上)贝叶斯方法的一个特例,因为它是一种“频率论方法”。显然,与常客相比,贝叶斯主义者也使用有限/有限数量的分布,即使从贝叶斯的角度来看,这些分布在数学上也是正确的。
问题:贝叶斯主义者何时以及为什么拒绝从贝叶斯观点来看数学上正确的方法?这有什么不是“哲学”的理由吗?
背景/上下文:以下是对我在 CrossValidated 上一个问题的回答和评论的引用:
贝叶斯与常客辩论的数学基础非常简单。在贝叶斯统计中,未知参数被视为随机变量;在频率统计中,它被视为一个固定元素......
从上面我可以得出结论,(从数学上讲)贝叶斯方法比频率论方法更普遍,因为频率论模型满足所有与贝叶斯模型相同的数学假设,但反之则不然。然而,同样的答案认为我从上面得出的结论是不正确的(下面的重点是我的):
尽管常数是随机变量的特例,但我会犹豫得出贝叶斯主义更普遍的结论。通过简单地将随机变量折叠为常数,您不会从贝叶斯结果中获得常客结果。区别就更深了……
进入个人喜好......我不喜欢贝叶斯统计使用相当有限的可用分布子集。
另一位用户在他们的回答中表示相反,贝叶斯方法更通用,尽管奇怪的是,我能找到的最佳理由是在之前的回答中,这是由受过常客训练的人给出的。
数学上的结果是,频率论者认为概率的基本方程只有时适用,而贝叶斯论者认为它们总是适用。所以他们认为相同的方程是正确的,但它们的普遍性不同......贝叶斯比频率论更普遍。由于任何事实都可能存在不确定性,因此可以为任何事实分配概率。特别是,如果您正在处理的事实与现实世界的频率相关(作为您正在预测的事物或数据的一部分),那么贝叶斯方法可以像对待任何其他现实世界的事实一样考虑和使用它们。因此,频率论者认为他们的方法适用于贝叶斯的任何问题也可以自然地解决。
从以上答案中,我的印象是,常用的贝叶斯术语至少有两种不同的定义。第一个我称之为“数学贝叶斯”,它包含所有统计方法,因为它包括常数 RV 和非常数 RV 的参数。然后是“文化贝叶斯”,它拒绝一些“数学贝叶斯”方法,因为这些方法是“频率主义者”(即出于个人敌意,有时将参数建模为常数或频率)。上述问题的另一个答案似乎也支持这个猜想:
还值得注意的是,两个阵营使用的模型之间存在很多分歧,这些分歧更多地与已经完成的事情相关,而不是与可以完成的事情相关(即一个阵营传统上使用的许多模型可以被另一个阵营证明是合理的)。
所以我想另一种表达我的问题的方式如下:如果文化贝叶斯主义者拒绝许多数学贝叶斯方法,为什么他们称自己为贝叶斯主义者?为什么他们拒绝这些数学贝叶斯方法?对于最经常使用这些特定方法的人来说,这是个人仇恨吗?
编辑:如果两个对象具有相同的属性,则它们在数学意义上是等效的,无论它们是如何构造的。例如,我可以想到至少五种不同的方式来构建虚数单位. 然而,关于虚数的研究,至少有五种不同的“思想流派”。事实上,我相信只有一个,那就是研究它们的特性的那群人。对于那些反对使用最大似然获得点估计与使用最大先验和统一先验获得点估计不同的人来说,因为所涉及的计算不同,我承认它们在哲学意义上是不同的,但是如果它们总是给出相同的估计值,它们在数学上是等价的,因为它们具有相同的属性。也许哲学上的差异与您个人有关,但与这个问题无关。
注意:这个问题最初对具有统一先验的 MLE 估计和 MAP 估计进行了错误的表征。