贝叶斯分析的缺点是什么?

机器算法验证 贝叶斯
2022-01-20 10:42:28

在任何情况下使用贝叶斯统计方法有哪些实际反对意见?不,我不是指通常对优先选择的吹毛求疵。如果没有答案,我会很高兴。

4个回答

我会给你一个答案。实际上有四个缺点。请注意,这些实际上都不是反对常客分析的反对意见,但使用贝叶斯框架也有缺点:

  1. 优先选择。出于某种原因,这是通常的吹毛求疵,尽管在我的情况下,这不是通常的“先验是主观的!” 但是,在许多情况下,提出一个合理且实际上代表了您总结先验的最佳尝试的先验是大量的工作。例如,我论文的整个目标可以概括为“估计先验”。
  2. 它是计算密集型的。特别是对于涉及许多变量的模型。对于估计有许多变量的大型数据集,它的计算量可能非常高,尤其是在某些情况下,数据不能轻易地被扔到集群等上。解决这个问题的一些方法,比如增强数据而不是 MCMC,在理论上有点挑战性,至少对我来说是这样。
  3. 后验分布更难纳入荟萃分析,除非提供了分布的常客参数描述。
  4. 根据分析的目的是什么期刊,一般使用贝叶斯,或者您选择的先验,可以为您的论文提供更多点,让审稿人可以深入研究它。其中一些是合理的审稿人反对意见,但有些只是源于贝叶斯的性质以及某些领域的人们对它的熟悉程度。

这些都不应该阻止你。事实上,这些事情都没有阻止我,希望进行贝叶斯分析将有助于解决至少第 4 个问题。

我倾向于贝叶斯主义者,但在实践中通常是常客。这样做的原因通常是对我感兴趣的问题类型正确执行完整的贝叶斯分析(而不是例如 MAP 解决方案)是棘手的并且计算量很大。通常需要完整的贝叶斯分析才能真正看到这种方法相对于常客等价物的好处。

对我来说,权衡基本上是在概念上优雅且易于理解但在实践中难以实施的贝叶斯方法和概念上笨拙和微妙的常客方法之间进行选择(尝试解释如何准确解释假设检验或为什么真实值在 95% 的置信区间内的概率不是 95%),但它非常适合易于实施的“食谱”解决方案。

课程用马。

从纯粹实用的角度来看,我不喜欢需要大量计算的方法(我想到的是 Gibbs 采样器和 MCMC,它们经常在贝叶斯框架中使用,但这也适用于频率分析中的引导技术)。原因是任何类型的调试(测试实现,查看假设的鲁棒性)本身都需要一堆蒙特卡罗模拟,你很快就会陷入计算困境。我更喜欢底层分析技术是快速和确定性的,即使它们只是近似的。

当然,这纯粹是一个实际的反对意见:给定无限的计算资源,这个反对意见就会消失。它只适用于贝叶斯方法的一个子集。考虑到我的工作流程,这也是一种偏好。

有时有一个简单而自然的“经典”解决方案可以解决问题,在这种情况下,一种花哨的贝叶斯方法(尤其是使用 MCMC)将是矫枉过正。

此外,在变量选择类型的问题中,考虑诸如惩罚可能性之类的东西可能更直接和清晰;模型上可能存在提供等效贝叶斯方法的先验,但是先验如何对应于最终性能可能不如惩罚和性能之间的关系那么清楚。

最后,MCMC 方法通常需要专家来评估收敛/混合和理解结果。