层次 Gamma-Poisson 模型的超先验密度

机器算法验证 泊松分布 伽马分布 分层贝叶斯 超参数
2022-03-24 23:08:15

在数据的层次模型中y在哪里

yPoisson(λ)
λGamma(α,β)
在实践中,选择值似乎是典型的(α,β)使得 gamma 分布的均值和方差与数据的均值和方差大致匹配y(例如,Clayton 和 Kaldor,1987 年“疾病映射的年龄标准化相对风险的经验贝叶斯估计”,Biometrics)。显然,这只是一个临时解决方案,因为它会夸大研究人员对参数的信心(α,β)即使基础数据生成过程保持不变,已实现数据的微小波动也可能对伽马密度产生重大影响。

此外,在贝叶斯数据分析(第 2 版)中,格尔曼写道,这种方法“草率”;在这本书和这篇论文中(从第 3232 页开始),他反而建议一些超先验密度p(α,β)应该以类似于大鼠肿瘤示例的方式选择(从第 130 页开始)。

虽然很明显任何p(α,β)只要它产生有限的后验密度是可以接受的,我还没有找到研究人员过去用于这个问题的任何超先验密度的例子。如果有人能指出我使用超先验密度来估计 Poisson-Gamma 模型的书籍或文章,我将不胜感激。理想情况下,我对p(α,β)这是相对平坦的,并且将由大鼠肿瘤示例中的数据主导,或者讨论比较几种替代规格以及与每种规格相关的权衡。

1个回答

并没有真正回答这个问题,因为我不是向您指出使用超先验的书籍或文章,而是描述并链接到有关 Gamma 参数先验的内容。

首先,注意 Poisson-Gamma 模型领先,当λ被整合到带有参数的负二项分布αβ/(1+β). 第二个参数在范围内(0,1). 如果您希望不提供信息,请在 Jeffreys 之前p=β/(1+β)可能是合适的。你可以把先验直接放在p或通过变量的变化来获得:

p(β)β1/2(1+β)1

或者,您可以注意到β是 Gamma 分布的尺度参数,通常是尺度参数的 Jeffreys 先验β1/β. 人们可能会觉得奇怪的是,杰弗里家族之前β两种模型不同,但模型本身并不等价;一是为了分配y|α,β另一个是分配λ|α,β. 支持前者的一个论点是,假设没有聚类,数据确实是分布的 负二项式(α,p), 所以把先验直接放在αp是要做的事情。OTOH,例如,如果您在数据中有集群,其中每个集群中的观察具有相同的λ,你真的需要建模λ不知何故,所以对待β因为 Gamma 分布的尺度参数似乎更合适。(我对一个可能有争议的话题的看法。)

第一个参数也可以通过 Jeffreys 先验来解决。如果我们使用通用技术为每个参数独立开发 Jeffreys 先验,然后形成联合(非 Jeffreys)先验作为两个单参数先验的乘积,我们得到形状参数的先验α伽玛分布:

p(α)PG(1,α)

其中 polygamma 函数PG(1,α)=i=0(i+α)2. 尴尬,但可以截断。您可以将其与上述任一 Jeffreys 先验结合起来,以获得无信息的联合先验分布。将其与1/βGamma 比例参数的先验会导致 Gamma 参数的参考先验。

如果我们想走完全杰弗里斯路线,为伽玛参数形成真正的杰弗里斯先验,我们会得到:

p(α,β)αPG(1,α)1/β

然而,多维参数的 Jeffreys 先验通常具有较差的属性以及较差的收敛特性(参见讲座链接)。我不知道 Gamma 是否属于这种情况,但测试会提供一些有用的信息。

有关 Gamma 的先验的更多信息,请参阅Yang 和 Berger的A Catalog of Non-Informative Priors 的第 13-14 页。许多其他发行版也在那里。有关 Jeffreys 和参考先验的概述,这里有一些讲义