这是一个关于术语的问题。“模糊先验”是否与非信息性先验相同,或者两者之间有什么区别?我的印象是它们是相同的(从一起查找模糊和非信息性),但我不能确定。
模糊先验与非信息性先验相同吗?
格尔曼等人。(2003) 说:
长期以来,人们一直希望能够保证在后验分布中发挥最小作用的先验分布。这种分布有时被称为“参考先验分布”,先验密度被描述为模糊、平坦或无信息。[强调来自原文]
基于我对 Gelman 等人对 Jeffreys 的讨论的阅读。(2003, p.62ff,对于真正的非信息性先验的存在没有达成共识,并且足够模糊/平坦/扩散的先验就足够了。
他们提出的一些观点:
- 任何先验都包括信息,包括声明没有已知信息的先验。
- 例如,如果我们知道我们对所讨论的参数一无所知,那么我们就对它有所了解。
- 在大多数应用环境中,当足够模糊的先验就足够时,真正的非信息性先验没有明显的优势,并且在许多情况下,使用共轭先验的模糊参数化具有优势 - 例如找到合适的先验。
- Jeffreys 原则可用于构建在单变量模型中最小化 Fisher 信息内容的先验,但对于多变量情况没有类似物
- 在比较模型时,Jeffreys 的先验会随着可能性的分布而变化,因此先验也必须改变
- 关于是否存在非信息性先验通常存在很多争论(因为 1,但也请参阅 Gelman 等人的第 66 页的讨论和参考资料,了解这场争论的历史)。
请注意,这是社区 wiki - 基本理论在我的理解范围内,我将不胜感激对这个答案的贡献。
绝对不是,尽管它们经常互换使用。上的模糊先验(相对不知情,并不真正偏爱某些值而不是其他值)上产生非常丰富的先验信息。这至少是 Jeffreys 之前的动机的一部分,它最初被构建为尽可能不提供信息。
模糊的先验也可以对你的模型做一些非常糟糕的事情。现在经典的例子是使用作为 先验。
在这种情况下,不正确的限制先验给出了不正确的后验。一种流行的替代方法是使非常小,这导致在上看起来几乎一致的先验。但这也导致后验几乎不正确,模型拟合和推理受到影响。有关分层模型中方差参数的完整说明,请参阅 Gelman 的先验分布。
编辑:@csgillespie(正确!)指出我还没有完全回答你的问题。在我看来,非信息先验是模糊的,因为它并不特别偏爱参数空间的一个区域而不是另一个区域,但这样做不应该诱导其他参数的信息先验。因此,非信息性先验是模糊的,但模糊先验不一定是非信息性的。这发挥作用的一个例子是贝叶斯变量选择。对变量包含概率的“模糊”先验实际上可以在模型中包含的变量总数上得出一个非常有用的先验信息!
在我看来,寻找真正无信息的先验是不切实际的(尽管许多人不同意);最好使用所谓的“弱”信息先验(我想,这在某种意义上通常是模糊的)。真的,我们多久对所讨论的参数一无所知?
Lambert 等人 (2005) 提出了一个问题“Vague 有多模糊?使用 WinBUGS 在 MCMC 中使用模糊先验分布的影响的模拟研究”。他们写道:“我们不提倡使用术语非信息性先验分布,因为我们认为所有先验都贡献了一些信息”。我倾向于同意,但我绝对不是贝叶斯统计方面的专家。
我怀疑“模糊先验”用于表示已知编码一些关于参数真实值的少量但非零知识的先验,而“非信息性先验”将用于表示完全无知关于该参数的值。它可能会被用来表明分析并不完全客观。
例如,对于非信息性先验将是统一的参数,一个非常宽泛的高斯可能是一个模糊的先验。高斯在感兴趣的尺度上几乎是平坦的,但仍然会比任何其他值更偏爱一个特定的值(但它可能使问题在数学上更容易处理)。