具有固定 K/置信度/样本大小的 beta 分布更新规则

机器算法验证 贝叶斯 贝塔分布 分层贝叶斯 β-二项分布
2022-03-28 19:47:40

通常你有一个带有形状参数的 beta 分布ab. 这个分布的平均值是a/(a+b)样本量或置信度(或 K)为a+b.

现在,如果您进行一些试验,假设 N 个正面结果和 M 个负面结果,您最终会得到一个后验分布,即Beta(a+N, b+M). 所以,现在你的意思是a+Na+N+b+M样本量/置信度/K为a+N+b+M.

现在,我的问题是:如果您想保持 K / 置信水平固定怎么办?所以假设K应该总是10。所以Beta(5,5)很好,原样Beta(9,1), 或者Beta(1.23,8.77).

换句话说:在这种情况下,我希望后验的平均值能够改变以反映在新数据中发现的证据,但置信水平应该保持不变(而不是一直增加)。

这种情况是否也有简单的更新规则?

2个回答

我看过书了。在我看来,这种“先验样本量”术语的基本原理如下。我们有通常的模型X1,,Xn条件独立同分布,给定Θ=θ, 有分布X1Θ=θBer(θ). 假设先验 ΘBeta(a,b). 先验平均值只是E[Θ]=a/(a+b)=:μ. 如果ab是大于的整数1,解释这个先验的一种方法是假设我们从一个U[0,1]先验和观察a1成功和b1伯努利实验的失败。根据贝叶斯定理,Θ因为这个gedanken实验是准确的Beta(a,b). 因此,我们可以建议性地定义先验样本量 ν:=a+b2. 我们从 beta 分布的性质知道,一个更大的ν会给我们一个更集中的分布。现在,要回答你的问题,你想做的事情似乎是不可能的:你观察到的数据越多,你的后验不确定性就越小Θ. 的后部ΘBeta(c,d), 和c=a+i=1nxi, 和d=b+ni=1nxi. 因此,c+d线性增长n.

我喜欢 Zen 的回答,并想补充一下,以澄清问题中的一些误解。 “置信度”或“样本量”不能有意义地应用于后验分布只有可能性才有“样本量”的概念。这就是 Zen 的观点背后的动机,即自信应该是a+b2.

通常,将指数族分布的可能性映射到置信度的唯一方法是对其自然参数进行线性变换(对于 Beta 分布,这些参数是a1,b1) 到正实线。

(例如,一个灯在两个头翻转时亮起,另一个灯在两个尾巴翻转时亮起。因此,单个样本可能会引起这样的可能性a或者b上升超过 1。)

要回答您的问题:进行整个贝叶斯推理以得出诱导似然的自然参数(Δa,Δb在您的情况下),然后将它们缩放到您想要的“信心”,如果它超过它。缩放后,您可以将您的可能性与您的先验结合起来。

对我来说,这种缩放是有意义的:你是说你拥有的证据在某个点之后饱和。(如果有人有任何参考资料,我对这个主题很感兴趣。)