Gamma分布不同的推导

机器算法验证 分布 伽马分布 直觉
2022-03-20 07:40:52

根据此链接 - http://cnx.org/contents/2d28fe6a-5000-454e-a2b9-6fbca9e9b56c@3/THE_GAMMA_AND_CHI-SQUARE_DISTR个事件 的等待时间是伽马分布的。此外,我们知道,如果我们对态随机变量进行平方,我们会得到一个 gamma rv(一种特殊情况,即卡方)。显然,两条不相关的路径将我们引向了相同的分布。kn

但它们真的没有关系吗?个事件的等待时间是否以某种直观的方式法线的平方和)?当通过不相关的路径遇到相同的分布时,甚至应该期望找到这样的连接吗?kn

1个回答

好吧,一方面,我们不能通过假设一个离散的非负整数变量来推导伽马分布,然后说现在,突然间让我们删除事件的整数计数的概念并允许所有实数。例如,不存在像掷六面骰子并得到π而不是从 1 到 6 的整数。具体而言,不能说伽玛函数是广义阶乘而不必担心矛盾,因为这将“本末倒置”。但是,可以说阶乘是伽马函数的一种特殊情况,它丢弃了负实数,只考虑了非负整数。所以思想实验错误就像说伽马分布是广义指数分布,更准确地说指数分布是伽马分布的退化情况。

为了清楚地说明这一点,请考虑我们不会将称为二次方程。它是一个线性方程。当然,它是二次的退化或平凡的情况,即对于线性方程缺少的是平方项,即线性方程与二次方程的形式不同,因为它缺少二次项。但是,线性方程也缺少三次项,即y=bx+cy=ax2+bx+ca=0xπ项和任何其他需要考虑的非线性函数,例如,将线性方程称为二次方程仅在超限数量的其他可能的假想情况中的一种情况下为真。因此,指数分布不仅可以作为退化或平凡的伽马分布(如)出现,而且在无数其他情况下也可以出现。所以不得不说伽玛分布是指数分布的大量推广之一,例如,参见广义指数分布x0=1

你问的危险是什么?一方面,草率的思考会导致错误,其中有很多错误,包括上面提到的“推导”,即伽马分布来自泊松分布。让我明确一点,事实并非如此。相反,泊松分布是伽马分布的一个特例另一个例子是在检查尾部重量时出现的。比较尾部重量的正确方法是对比所谓的“生存”函数(更准确地称为互补累积分布函数,ccdf's,,当连续时),并且给出了正确的程序作为示例哪个有较重的尾巴,对数正态或伽马1F(x). 现在,当我们放任不管的归纳冲动时,就会犯错误,例如,将各种尾重分类为组,其中一组是“指数尾重”的函数。该错误(将 L'Hôpital 规则应用于非不确定形式)在整个文献中都有重复,并在一篇文章的相对尾重附录部分中记录为错误,该部分涉及“对于连续函数,通过生存的 pdf 二进制比较函数比率避免错误归因,例如,将 GD(原文如此,伽马分布)分类为具有 ED(原文如此, 指数分布)末端尾,而事实上,指数的尾重在 GD 尾重范围内......”和“......即使两个函数处于相同的尾重类别,它们的重度范围可能不会重叠,这似乎违反直觉,但再次暗示只有二元尾重比较才有意义。”

最后,我们已经说过伽马分布不是从泊松分布产生的,那么,伽马分布是从什么产生的呢?有一点应该很清楚,它不是由 Erlang 分布产生的,尽管有错误的说法,例如,看到这个错误,这是使用不加批判的归纳思维的又一次尝试。相反,它可能来自gamma Lévy 过程,其中方法的不同之处在于 Lévy 过程以实数变量处理(即,不是整数)开始,并且没有声称它必须仅在该上下文中出现.

下一个问题与卡方分布有关,并且 OP 链接中的处理再次不足。与 OP 链接的文本不同,卡方实现,自由度,可以是任何正实数。因此,连续变量的伽马分布和卡方分布之间存在实际关系。因此,理解对应于一个整数正态分布实际上并不是卡方的推导,只是它的一个示例特殊情况应用。也就是说,在 OP 的链接中:νv

“现在让我们考虑在统计中发挥重要作用的伽马分布的特殊情况。假设 X 具有的伽马分布,其中是一个正整数。”θ=2α=r/2r

如果我们删除不必要的,并要求,那么上面的替换会产生比卡方整数df更一般的推导。然而,反面是不正确的,即卡方不提供伽马分布的推导,因为参数的数量从设置减少了 1 ,并且推广卡方并不仅仅意味着伽马分布但还有其他事情,例如,请参阅广义卡方分布rZ+rR+θ=2

最后一个问题是我们是否应该期望分布通过替代路径相关,答案是肯定的,我们应该。例如,请参阅此答案,该答案显示了分布之间的一般相互关系如何,以及具体而言,伽马分布如何与其他分布相关。