由于 beta 分布在形式上与二项式相似,为什么我们需要 beta 分布?

机器算法验证 贝叶斯 数理统计 二项分布 贝塔分布
2022-03-08 15:37:45

看起来二项分布在形式上与 beta 分布非常相似,我可以重新参数化任一 pdf 上的常数以使它们看起来相同。那么,为什么我们需要 beta 发行版呢?是为了特定目的吗?谢谢!

1个回答

它们是相关的,但实际上在形式上并不如此相似。

在 beta 中,变量(及其补码)被提升到某个幂,但在二项式中,变量幂(并且它也出现在二项式系数中)。

虽然函数形式看起来确实有些相似(一个中的术语与另一个中的术语相对应),但表示参数的变量和每个中的随机变量是不同的。这很重要;这就是为什么它们实际上根本不是一回事。

二项分布通常用于counts,或以缩放形式用于基于计数的比例(尽管您可以在纯粹实用的基础上将其用于其他有界离散随机变量)。它是离散的。

beta 分布是连续的,因此通常不用于计数。


例如,比较这两个函数:

y=bx,x=0,1,2,3,...y=xa,0<x<1.

这两个函数都是由相同形式的表达式定义的(某种形式的cd),但是变量和常量的角色互换了,域也不同。beta 和二项式之间的关系就像这两个函数之间的关系。

- 总结:不同的形式,不同的领域

这是一个简单的 beta 分布示例,beta(1,1). 哪个二项分布做同样的工作?

在此处输入图像描述

或者考虑一个beta(2,1); 很难找到看起来相似的二项式。这是一个尝试:

在此处输入图像描述

整个 beta pdf 位于二项式 pf 的前两个绿色尖峰之间,尽管它们不能真正显示在同一个图上,因为 y 轴测量不同的东西。

虽然从某种意义上说它们都是左倾斜的形状有点相似,但它们确实完全不同,并且用于不同的事物。

--

这是一个挑战:

为了X1beta(1,1)和一个X2beta(3,2),找到可以同时合理准确地(比如说在c=(0.95,1.05) 乘以具有相同均值和方差或均值和范围(您选择)的正确概率(给或取),但也近似地再现了处于这三个子区间的概率:(a)(1/π,1/e), (b)(exp(12),2/π), 和 (c)(exp(3),1/π2)


beta 用于做很多事情,包括模型连续比例,作为先验p二项式的参数,它是均匀顺序统计的分布(并且可以用于推导其他连续分布的顺序统计分布,用作二项式的混合分布p(产生 beta 二项分布),在项目管理中对任务完成时间进行建模,以及许多其他事情。