我试图理清术语“复合分布”的两种不同用法并找出关系。
我写的关于复合分布的维基百科文章将复合分布定义为无限混合,即如果是 F 型分布,并且是 G 类型的分布,则是由 F 与 G 复合产生的复合分布。这是贝叶斯统计中先验和后验预测分布的分布。
然而,术语“复合分布”具有随机和的另一个含义,即变量的数量是随机的 iid 变量的总和。
两者有什么关系?对于第一个定义,我是否正确使用了“复合分布”?
我试图理清术语“复合分布”的两种不同用法并找出关系。
我写的关于复合分布的维基百科文章将复合分布定义为无限混合,即如果是 F 型分布,并且是 G 类型的分布,则是由 F 与 G 复合产生的复合分布。这是贝叶斯统计中先验和后验预测分布的分布。
然而,术语“复合分布”具有随机和的另一个含义,即变量的数量是随机的 iid 变量的总和。
两者有什么关系?对于第一个定义,我是否正确使用了“复合分布”?
事实上,复合一词在统计中被这两种定义所覆盖。我更喜欢将后一种情况描述为“随机变量的随机总和”而不是复合分布,而将前者描述为“连续混合”分布,但术语复合也被使用并且两者都通用。
我知道的两种复合类型之间的唯一关系是伯努利随机变量。如果随机和中的和数是伯努利,那么和的分布是如果伯努利是和如果伯努利是. 这等效地写成
现在的分布在评估总和后具有零膨胀分布,其中零膨胀是. 这与您“复合”的分布相同,因为上面的产品表示可以解释为比例混合,您可以在分布的比例参数给出的值之间混合。这里的边际分布需要复利。在这种情况下,复合不是积分而是有限和。