客观与主观贝叶斯范式

机器算法验证 贝叶斯 解释 方法
2022-02-01 05:03:08

客观贝叶斯范式和主观贝叶斯范式有什么区别?
他们对哪些对象或程序有不同的定义或解释?
他们选择的方法有什么不同吗?

1个回答

这是一个非常令人困惑的话题,主要是因为在这些讨论中,“主观主义”的概念通常有两种不同的使用方式。 更令人困惑的是,有一类“主观主义”植根于专家的事先启发,而这种特殊的变化必须仔细地融入范式的哲学分类中。我将尝试通过列出一些通常解释“主观主义”的不同方式来澄清这个问题,然后列出贝叶斯主义者之间的广泛共识领域,以及哲学和实践方法存在分歧的领域。我预计会有其他人不同意我对此的看法,但我希望这为清晰的讨论提供了一个良好的起点。


弱主观主义:在这种解释中,“主观”一词的含义较弱,仅意味着概率封装了主体的理性信念。(有些人,比如我自己,更喜欢用“认知”这个词来表达这个概念,因为它实际上并不需要更强意义上的主观性。)

强主观主义:在这种解释中,“主观”一词是在其更强的意义上使用的,意味着弱主观主义成立,此外,主体的信念缺乏任何外部“客观”理由(即,两个或多个不同的主体都可以持有不同的信念,并且没有人会比其他人或多或少地被认为是错误的)。


在贝叶斯分析中,通常情况下,所选择的抽样分布具有植根于对抽样机制的某种理解的客观理由。然而,除了样本数据之外,很少有任何与参数有关的可用信息。这产生了贝叶斯统计中的三种广泛范式,它们对应于确定先验分布的不同方式。

主观贝叶斯范式:该范式与弱主观主义一致,并进一步认为任何一组概率信念都同样有效。只要主体对新数据使用贝叶斯更新,使用任何先验都是合法的。在这种范式下,先验不需要任何客观的理由。在这个范例中,重点是披露先前使用的数据,然后显示它如何使用新数据进行更新。在这种方法中,通常包括在一系列先验信念下显示后验信念的敏感性分析。

客观贝叶斯范式:这种范式也同意弱主观主义,但更喜欢额外限制先前的信念(在包含任何数据之前),以便它们在客观上对参数“无信息”。在这个范例中,先验应该准确地反映在数据之外缺乏与参数有关的可用信息。这通常需要采用一些关于如何设置先验的理论(例如,Jeffrey's、Jaynes、Bernardo 参考先验等)。这种范式认为,如果一组概率信念是基于客观的先验信念,那么它是首选的。对感兴趣的问题中的参数进行确定且不提供信息。它同意任何一组概率信念都与贝叶斯分析的合理性标准一致,但认为基于“坏”先验(关于未知参数的信息太丰富)的信念比基于“好”先验的信念更差。在这个范式中,先验是从一些信息不足的类中选择的,然后用新数据进行更新以产生对该问题的客观答案。

专家先验贝叶斯范式:这种方法通常被视为主观范式的一部分,通常不会单独识别,但我认为它是一个单独的范式,因为它具有每种观点的元素。该范式与弱主观主义一致,但与客观贝叶斯范式一样,它并不认为所有先验都同样有效。该范式将当前的“先验”视为先前生活经历的后验,因此将主题专家的先验信念视为优于非专家的先验信念。它还认识到,这些信念可能是基于尚未系统记录的数据,而不是基于概率论的系统使用,因此不可能将这些现有的专家先验分解为原始的非信息性先验和数据这位专家观察到的。(事实上​​,在没有系统地使用概率论的情况下,目前的专家“先验”可能甚至与贝叶斯更新不一致。)在这种范式中,专家目前的“主观”意见被视为对主题知识的有价值的封装,它被视为原始先验。在这种范式中,分析师试图通过先验信念的一些测试来引出专家先验,然后将先验公式化为最适合该专家信念(注意确保专家信念没有被当前知识污染)数据)。因此,专家的“主观”信念被视为来自先前数据的主题知识的“客观”封装。) 在这种范式中,专家当前的“主观”意见被视为对主题知识的有价值的封装,被视为原始先验。在这种范式中,分析师试图通过先验信念的一些测试来引出专家先验,然后将先验公式化为最适合该专家信念(注意确保专家信念没有被当前知识污染)数据)。因此,专家的“主观”信念被视为来自先前数据的主题知识的“客观”封装。) 在这种范式中,专家当前的“主观”意见被视为对主题知识的有价值的封装,被视为原始先验。在这种范式中,分析师试图通过先验信念的一些测试来引出专家先验,然后将先验公式化为最适合该专家信念(注意确保专家信念没有被当前知识污染)数据)。因此,专家的“主观”信念被视为来自先前数据的主题知识的“客观”封装。然后将先验公式化为最适合该专家信念(注意确保专家信念没有被当前数据的知识污染)。因此,专家的“主观”信念被视为来自先前数据的主题知识的“客观”封装。然后将先验公式化为最适合该专家信念(注意确保专家信念没有被当前数据的知识污染)。因此,专家的“主观”信念被视为来自先前数据的主题知识的“客观”封装。

方法上的差异:就方法而言,客观贝叶斯范式与主观范式的不同之处在于前者限制了可允许的先验(可以是唯一的先验,也可以是极少数类似的先验),而后者不限制可允许的先验。先验。在客观贝叶斯方法中,先验受到表示“非信息性”先验的理论的约束。专家先验范式采用不同的方法,而是识别一个或多个专家,并引出他们的先验信念


一旦我们理解了贝叶斯统计中不同范式的这些不同含义,我们就可以列出一些广泛一致的领域,以及存在分歧的领域。实际上,尽管方法上存在差异,但对基本理论的一致意见比通常所理解的要多。

关于弱主观主义的广泛共识:贝叶斯统计中有大量文献表明概率的“公理”可以从与理性决策相关的初步需求中推导出来。这包括与动态信念一致性有关的论点(例如,参见Epstein 和 Le Breton 1993)、诉诸荷兰书定理的论点(例如,参见Lehmann 1955Hajek 2009)。所有这些范式的贝叶斯主义者普遍同意概率应该被认知地解释为指代一个主体的信念,受到概率公理中固有的理性约束的约束。我们同意人们应该使用概率规则来约束一个人对不确定性的信念是理性的。这意味着关于不确定性的信念需要在面对新数据时进行贝叶斯更新,但它不会施加任何进一步的约束(即,没有更多约束,它并没有说任何先验优于任何其他先验)。以上三个范式都同意这一点。

人们一致认为,后验倾向于与更多数据收敛:贝叶斯统计中有许多一致性定理表明,如果你有两个人具有相同的似然函数,但先验不同,那么他们的后验信念会随着你获得更多数据而收敛和更多数据。 这意味着对于大量数据,先验并不重要。这些是不可否认的概率定理,以上三个范式都同意这一点。出于这个原因,人们普遍认为,对于大量数据,这三种范式中的任何一种都可能给出相似的结果。因此,当我们只有少量数据时,范式的差异是最重要的。

广泛同意,如果您想使用它们,则可以使用大致“客观”的先验规则贝叶斯统计中有大量文献展示了如何开发“非信息性”先验,这些先验大致由抽样问题确定,并大致概括了对所讨论参数缺乏太多了解的情况。我说“大致”是因为这里有几个相互竞争的理论有时对应但有时略有不同(例如,Jeffrey's、Jaynes、参考先验、不精确先验的 Walley 类等),并且还可能出现一些棘手的悖论。这里最困难的问题是很难为可以进行非线性变换的连续参数制作“无信息性”先验(因为“无信息性”理想情况下应该对变换保持不变)。同样,这些是概率定理,所有范式都同意它们的内容。客观贝叶斯主义者倾向于认为该理论足够好,可以提供更好的先验,而主观贝叶斯主义者和专家先验贝叶斯主义者倾向于认为该理论不足以确定这些先验的优越性。换句话说,人们普遍认为这些客观规则存在并且可以使用,但对于它们的好坏存在分歧。

对于单一答案的重要性存在分歧:客观贝叶斯主义者的动机是,具有固定数据和固定似然函数的统计问题应该导致唯一确定的后验信念(或至少少量允许的后验信念)变化很小)。这种偏好通常是更广泛偏好的一部分,即当应用于固定的客观条件集时,科学程序会产生独特的答案。相反,主观贝叶斯主义者和专家先验贝叶斯主义者都认为这并不是特别重要,而且他们普遍认为,这种对唯一确定的后验的关注实际上是一种误导。

人们普遍认为公众并不熟悉贝叶斯后验:所有范式都同意公众并不熟悉贝叶斯分析如何从先验过渡到后验的基本机制。客观贝叶斯主义者有时担心为后验给出多个允许的答案会使人们感到困惑。主观贝叶斯主义者担心,不能给出一个以上的后验答案会误导人们。


值得注意的是,这里对“主观主义”的混淆源于认识论中“主观主义”和“内在主义”之间普遍错误的二分法的一个特定实例(例如,参见Piekoff)。在尝试解释概率时,许多用户犯了一个错误,即认为任何对偶然概率理论的拒绝都必然导致在此处指定的更强意义上的“主观”解释。要正确理解概率解释,最好理解主观主义-内在主义二分法的一般问题,并因此认识到存在客观的认知解释。

该结果需要一些广泛的规律性条件(例如,两个受试者都有先验支持,包括真实参数值),但它的应用范围非常广泛。