贝叶斯意义上的复合分布与作为随机和的复合分布

机器算法验证 分布 贝叶斯 复合分布
2022-04-10 03:14:52

我试图理清术语“复合分布”的两种不同用法并找出关系。

我写的关于复合分布的维基百科文章将复合分布定义为无限混合,即如果p(x|a)是 F 型分布,并且p(a|b)是 G 类型的分布,则p(x|b)=ap(x|a)p(a|b)da是由 F 与 G 复合产生的复合分布。这是贝叶斯统计中先验和后验预测分布的分布。

然而,术语“复合分布”具有随机和的另一个含义,即变量的数量是随机的 iid 变量的总和。

两者有什么关系?对于第一个定义,我是否正确使用了“复合分布”?

1个回答

事实上,复合一词在统计中被这两种定义所覆盖。我更喜欢将后一种情况描述为“随机变量的随机总和”而不是复合分布,而将前者描述为“连续混合”分布,但术语复合也被使用并且两者都通用。

我知道的两种复合类型之间的唯一关系是伯努利随机变量。如果随机和中的和数是伯努利,那么和的分布是0如果伯努利是0X1如果伯努利是1. 这等效地写成

Y=dZ1X1=di=1Z1X1. 现在的分布Y在评估总和后具有零膨胀分布,其中零膨胀是Pr(Z1=0). 这与您“复合”的分布相同,因为上面的产品表示可以解释为比例混合,您可以在分布的比例参数给出的值之间混合这里的边际分布需要复利。在这种情况下,复合不是积分而是有限和。0X1