比较两个高斯样本的最大值

机器算法验证 样本 极值
2022-03-23 01:51:46

假设都是正态分布的,其中其中考虑次独立绘制作为的抽签的样本最大值大于的最大值的概率是多少?XYXN(0,1)YN(c,1),c>0nXYn,YX

1个回答

我找到了答案,主要归功于 whuber 的评论。的样本最大值的缩放版本都是 Gumbel 分布的 [来源 1],两个 Gumbel 之间的区别是逻辑 [来源 2]。具体来说,我们有MyMxYXMyMx

2lnn (MyMxc)dL(0,1),

其中且尺度(标准差的逻辑分布根据通常的近似,我们有L(0,1)01

(MyMx)L(c,12lnn).
使用逻辑分布的 cdf [来源 2],我们得到

P(My>Mx)exp(2lnn×c)1+exp(2lnn×c).

这个近似公式意味着确实收敛到,但速度非常(!)慢。例如,如果等于 100 万且,则概率仅为 %。P(My>Mx)1nc=0.162.84

参考:

来源 1 - http://sfb649.wiwi.hu-berlin.de/fedc_homepage/xplore/tutorials/sfehtmlnode90.html

来源 2 - http://en.wikipedia.org/wiki/Logistic_distribution