并没有真正回答这个问题,因为我不是向您指出使用超先验的书籍或文章,而是描述并链接到有关 Gamma 参数先验的内容。
首先,注意 Poisson-Gamma 模型领先,当λ被整合到带有参数的负二项分布α和β/(1+β). 第二个参数在范围内(0,1). 如果您希望不提供信息,请在 Jeffreys 之前p=β/(1+β)可能是合适的。你可以把先验直接放在p或通过变量的变化来获得:
p(β)∝β−1/2(1+β)−1
或者,您可以注意到β是 Gamma 分布的尺度参数,通常是尺度参数的 Jeffreys 先验β是1/β. 人们可能会觉得奇怪的是,杰弗里家族之前β两种模型不同,但模型本身并不等价;一是为了分配y|α,β另一个是分配λ|α,β. 支持前者的一个论点是,假设没有聚类,数据确实是分布的 负二项式(α,p), 所以把先验直接放在α和p是要做的事情。OTOH,例如,如果您在数据中有集群,其中每个集群中的观察具有相同的λ,你真的需要建模λ不知何故,所以对待β因为 Gamma 分布的尺度参数似乎更合适。(我对一个可能有争议的话题的看法。)
第一个参数也可以通过 Jeffreys 先验来解决。如果我们使用通用技术为每个参数独立开发 Jeffreys 先验,然后形成联合(非 Jeffreys)先验作为两个单参数先验的乘积,我们得到形状参数的先验α伽玛分布:
p(α)∝PG(1,α)−−−−−−−√
其中 polygamma 函数PG(1,α)=∑∞i=0(i+α)−2. 尴尬,但可以截断。您可以将其与上述任一 Jeffreys 先验结合起来,以获得无信息的联合先验分布。将其与1/βGamma 比例参数的先验会导致 Gamma 参数的参考先验。
如果我们想走完全杰弗里斯路线,为伽玛参数形成真正的杰弗里斯先验,我们会得到:
p(α,β)∝αPG(1,α)−1−−−−−−−−−−−−√/β
然而,多维参数的 Jeffreys 先验通常具有较差的属性以及较差的收敛特性(参见讲座链接)。我不知道 Gamma 是否属于这种情况,但测试会提供一些有用的信息。
有关 Gamma 的先验的更多信息,请参阅Yang 和 Berger的A Catalog of Non-Informative Priors 的第 13-14 页。许多其他发行版也在那里。有关 Jeffreys 和参考先验的概述,这里有一些讲义。