贝叶斯统计中先验的“有效样本量”是多少?

机器算法验证 贝叶斯 事先的
2022-03-11 05:48:01

在贝叶斯统计中,先验“有效样本量”的数学定义是什么?您能否提供众所周知的共轭先验类别的“有效样本量”是多少?这个概念是否可以推广到非共轭模型?为什么先验的“有效样本量”的想法很重要?

编辑赏金:这个问题非常重要,值得一个完整的、规范的答案,有更多的例子和适当的解释(试图解决上面列出的问题)。

2个回答

这是一个具有 beta 先验分布和二项似然的示例。

假设正面概率的先验分布θ一枚硬币是Beta(10,10)然后n=100抛硬币收益 x=47头。那么后验分布θBeta(10+x,10+100x)Beta(57,63).

这是贝叶斯定理的结果,乘以先验f(θ)很可能g(x|θ)去后面h(θ|x):

f(θ)×g(x|θ)θ101(1θ)101×θx(1θ)nxh(θ|x)θ(10+x)1(1θ)(10+100x)1θ571(1θ)631.

可以说,先验分布“有效地”等同于先验知识20掷硬币产生 10 个正面。

注意:在显示的贝叶斯定理关系中,使用符号(阅读“与”成比例),而不是=,认识到我们正在展示先验、似然和后验的核(没有规范常数的密度函数)。因为先验和似然是“共轭的”(在数学上兼容),我们可以将右边的表达式识别为Beta(57,63).

先前有效样本量 (ESS) 没有单一定义。了解先验对后验参数的影响是一种启发式方法。Prior ESS 告诉您,您选择的prior 相当于拥有一个额外的nE数据点。

用共轭先验证明先验 ESS 很简单。当您有非共轭先验时,情况会更加复杂。

共轭先验

Beta-二项式示例

假设你有一个二项式随机变量,Y你想估计成功的概率,θ. 你观察y成功和ny失败。假设一个Beta(α,β)为了θ.

YBinom(n,θ),
θBeta(α,β), and 
θ|YBeta(α+y,β+ny)

如果先验没有为后验提供信息,我们将仅使用数据来通知后验:θ|yBeta(y,ny). 如果我们将此分布的参数与一般情况进行比较,我们会看到β正在增加n在后面。先验有效样本量为β.

非共轭情况

当先验和似然不共轭时,我们无法准确看到先验参数如何与似然相互作用以形成后验参数。Morita et all (2008)将概念从共轭分布推广到一般分布。我会给出这个概念,但你可以参考那篇论文来了解所有细节。

您可以使用以下算法找到先前的 ESS:

  1. 选择您的先前分布。计算先验参数的信息矩阵。
  2. 确定 (1) 的非信息性替代方案。前任:θNormal(μ=0,σ2=10e5)
  3. 取一个序列m=0,,M并使用大小数据集获取每个先验 (2) 的后验m. 计算信息矩阵。
  4. 之前的 ESS 大小相同,mo,它最小化了(1)的先验信息和(3)的后验信息之间的距离。