使用 Riemann-Stieltjes 积分计算离散 RV 期望的示例?

机器算法验证 期望值 混合分布 不可缺少的
2022-03-08 08:19:05

Riemann-Stieltjes 积分表示法用于一些概率文本中的期望表达式。基本上,dF(x) 出现在积分中,而不是 f(x)dx 出现在积分中,因为 CDF F(x) 对于离散分布可能不可微。

我听到的这样做的动机通常是提供一个统一的期望定义,而不是用离散的情况和连续的情况来对待它。它还应该使考虑离散和连续的混合变得更容易。但是我从未见过使用黎曼-斯蒂尔切斯积分计算离散分布(或点质量和连续分布的混合分布)的期望的示例。

有人可以提供两者或任何一个的例子吗?谢谢!

1个回答

由于您听起来好像对积分做的不多,因此我将以非常基本(并且略显手波)的方式讨论这个问题,以传达所发生的事情。但是,您可能希望从提醒开始,查看 Stieltjes 积分的定义,例如MathworldWikipedia正确地进行积分涉及考虑定义中的限制,并且在其他情况不明显的情况下,这确实是您需要做的。

如果分布是纯离散的,那么dF是 0,除了在跳跃处,它所在的地方p(x)- 所以对于离散情况,积分实际上是通常的总和。

举个例子,考虑一个伯努利(0.4)。

![在此处输入图像描述

所以对于这个例子,E(X)=xdF=xxp(x). (这不仅仅是“它们的价值相等”,而是“那些东西是表达同一事物的不同方式”;我可能应该使用更合适的符号。)

所以在这里dF0无处不在,但在x=0(在哪里dF0.6) 和x=1(它在哪里0.4)。所以这个表达式只是00.6+10.4.

虽然统一离散和连续公式很简洁,但我并不真正想到它的大部分价值。我认为它更有价值,因为它适用于既没有离散随机变量也没有连续随机变量的情况——在很多情况下,你会遇到实际数据,所以这不是一些深奥的理论问题。拥有可以平滑地处理那些“既不离散也不连续”的情况以及同时处理离散和连续的特殊情况的符号,这就是有一些真正好处的地方。

举一个很好的简单案例,例如,给定月份和位置的每日降雨量分布,可能建模为以下概率的混合0.6零雨,非零雨量为对数正态(μ,σ2)(在哪里μ=1.384,和σ=1.823)(可能被称为“零膨胀对数正态”模型)

在此处输入图像描述

那么在这种情况下,一个积分,例如期望的积分,E(X)=xdF可以很容易地处理,因为它在跳跃之前和跳跃时就像离散定义一样工作(只添加x.p(x)在跳跃处,结果是添加0到积分,因为所有0.6概率在x=0) 然后在这种情况下,上面的任何地方0(因为这个函数足够好,Stieltjes 和普通的黎曼是一样的)其余的就像一个黎曼积分xf(x)多于0,只要我们记住dF小于对数正态(以上0你可以看到F相对于纯对数正态 cdf 被“压扁”),准确地考虑了概率(0.4)的超过0这里。

当然,这不仅仅适用于g(x)=x; 我只是举一些简单的案例来展示一下正在发生的事情。(whuber 在评论中指出了一个很好的例子,他对一个非简单问题进行了 MGF 计算,其中分布最终成为混合分布)

即使只有这些非常好的函数(你可以像黎曼一样对待它们,它们是连续的,这是 Stieltjes 涵盖的案例的一个子集),在这种混合中存在无限的案例(而不仅仅是“离散”或“连续” ) 可以通过这个符号来处理。

Advanced Theory of Statistics(Kendall 和 Stuart——或者在最近的版本中,Stuart 和 Ord)是一个有用的参考,它广泛使用这个积分来显示或讨论各种结果。不要让标题吓到你,这是一本非常易读的书。

因此,如果您(例如)在查看 Chebyshev 不等式的同时使用积分,您不仅仅是在同时进行离散情况和连续情况......您正在涵盖 Stieltjes 积分适用于的任何分布- 所以如果你想知道切比雪夫会发生什么,如果你有一个分布,比如降雨一,瞧,这一切都由同样的发展来处理。如果明天,你的朋友出现了一个零一膨胀的测试版,那么你也已经涵盖了。等等 ...

[如果您遇到无法立即了解积分含义的情况,请返回定义并遵循它。]

(这个很好的积分可以用能够处理更广泛情况的东西代替——出于统计目的,通常是LebesgueLesbesgue-Stieltjes积分)